WikiEdge:ArXiv速递/2025-04-16:修订间差异
Created page by Carole |
Updated page by Carole |
||
第7行: | 第7行: | ||
*'''原文链接''':http://arxiv.org/abs/2504.11826v1 | *'''原文链接''':http://arxiv.org/abs/2504.11826v1 | ||
'''中文摘要''':性能基准测试是[[软件工程]]中的常见实践,尤其在构建大规模、分布式和[[数据密集型系统]]时。虽然[[云环境]]为运行基准测试提供了诸多优势,但经常有报告指出重复测试的结果可能存在显著差异——这使得难以对实际性能得出可靠结论。本文通过[[实证研究]]量化了[[云性能]]波动对基准测试结果的影响,重点关注[[流处理]]应用这一具有代表性的数据密集型、性能关键型系统。在一项持续三个多月的[[纵向研究]]中,我们重复执行了[[Dynatrace]]研发中使用的应用基准测试,从而能够评估性能波动的多个维度(特别是时间效应相关因素)。通过约591小时的实验,在[[AWS]]上部署789个[[Kubernetes]]集群并执行2366次基准测试,这可能是同类研究中规模最大且唯一从[[端到端]](即应用基准测试视角)探讨性能的研究。我们的研究证实性能波动确实存在,但其程度低于通常假设([[变异系数]]<3.7%)。与相关研究不同,我们发现性能确实呈现[[日周期]]和[[周周期]]模式,尽管波动幅度较小(≤2.5%)。跨多次测试重复使用基准测试[[基础设施]]仅会导致结果准确度轻微下降(≤2.5个百分点)。这些关键发现在不同[[云区域]]和采用不同[[处理器架构]]的机器类型中均保持一致。我们得出结论:对于关注检测显著性能差异(例如>5%)的工程师和研究人员而言... | '''中文摘要''':性能基准测试是[[软件工程]]中的常见实践,尤其在构建大规模、分布式和[[数据密集型系统]]时。虽然[[云环境]]为运行基准测试提供了诸多优势,但经常有报告指出重复测试的结果可能存在显著差异——这使得难以对实际性能得出可靠结论。本文通过[[实证研究]]量化了[[云性能]]波动对基准测试结果的影响,重点关注[[流处理]]应用这一具有代表性的数据密集型、性能关键型系统。在一项持续三个多月的[[纵向研究]]中,我们重复执行了[[Dynatrace]]研发中使用的应用基准测试,从而能够评估性能波动的多个维度(特别是时间效应相关因素)。通过约591小时的实验,在[[AWS]]上部署789个[[Kubernetes]]集群并执行2366次基准测试,这可能是同类研究中规模最大且唯一从[[端到端]](即应用基准测试视角)探讨性能的研究。我们的研究证实性能波动确实存在,但其程度低于通常假设([[变异系数]]<3.7%)。与相关研究不同,我们发现性能确实呈现[[日周期]]和[[周周期]]模式,尽管波动幅度较小(≤2.5%)。跨多次测试重复使用基准测试[[基础设施]]仅会导致结果准确度轻微下降(≤2.5个百分点)。这些关键发现在不同[[云区域]]和采用不同[[处理器架构]]的机器类型中均保持一致。我们得出结论:对于关注检测显著性能差异(例如>5%)的工程师和研究人员而言... | ||
== 摘要 == | |||
* '''原文标题''':Dependency Dilemmas: A Comparative Study of Independent and Dependent Artifacts in Maven Central Ecosystem | |||
* '''中文标题''':依赖困境:Maven中央生态系统中独立与依赖构件的对比研究 | |||
* '''发布日期''':2025-04-16 17:15:58+00:00 | |||
* '''作者''':Mehedi Hasan Shanto, Muhammad Asaduzzaman, Manishankar Mondal, Shaiful Chowdhury | |||
* '''分类''':cs.SE | |||
*'''原文链接''':http://arxiv.org/abs/2504.12261v1 | |||
'''中文摘要''':[[Maven Central]]生态系统构成了[[Java]]依赖管理的核心,承载着在采用率、安全性和生态系统角色上差异显著的构件。构件复用是[[软件开发]]的基础,而[[Maven Central]]等生态系统促进了这一过程。然而,先前研究主要分析了具有大量依赖的热门构件,对无传入依赖的独立构件缺乏探索。本研究分析了658,078个构件(其中635,003个至少有一个发布版本),发现93,101个构件(15.4%)为独立构件(入度=0),其余归类为依赖构件。通过[[PageRank]]和出度中心性分析发现,独立构件对生态系统至关重要。针对18项指标的进一步分析揭示了独立构件相较于依赖构件的优势与可比性:流行度相当(25.58 vs. 7.30)、漏洞更少(60个[[CVE]] vs. 179个[[CVE]])且无传播漏洞。这些结果表明,独立构件显著影响生态系统,为开发者提供了安全、自包含的传统依赖替代方案。研究发现独立构件可能是依赖关系的有利选择,但存在可维护性问题。因此开发者应审慎引入独立构件,而构件维护者应优先关注此类构件,以降低传递性漏洞传播风险并提升软件可持续性。 |
2025年4月17日 (四) 07:49的版本
摘要
- 原文标题:When Should I Run My Application Benchmark?: Studying Cloud Performance Variability for the Case of Stream Processing Applications
- 中文标题:何时运行应用程序基准测试?——针对流处理应用的云性能变异性研究
- 发布日期:2025-04-16 07:22:44+00:00
- 作者:Sören Henning, Adriano Vogel, Esteban Perez-Wohlfeil, Otmar Ertl, Rick Rabiser
- 分类:cs.SE, cs.DC, cs.PF
- 原文链接:http://arxiv.org/abs/2504.11826v1
中文摘要:性能基准测试是软件工程中的常见实践,尤其在构建大规模、分布式和数据密集型系统时。虽然云环境为运行基准测试提供了诸多优势,但经常有报告指出重复测试的结果可能存在显著差异——这使得难以对实际性能得出可靠结论。本文通过实证研究量化了云性能波动对基准测试结果的影响,重点关注流处理应用这一具有代表性的数据密集型、性能关键型系统。在一项持续三个多月的纵向研究中,我们重复执行了Dynatrace研发中使用的应用基准测试,从而能够评估性能波动的多个维度(特别是时间效应相关因素)。通过约591小时的实验,在AWS上部署789个Kubernetes集群并执行2366次基准测试,这可能是同类研究中规模最大且唯一从端到端(即应用基准测试视角)探讨性能的研究。我们的研究证实性能波动确实存在,但其程度低于通常假设(变异系数<3.7%)。与相关研究不同,我们发现性能确实呈现日周期和周周期模式,尽管波动幅度较小(≤2.5%)。跨多次测试重复使用基准测试基础设施仅会导致结果准确度轻微下降(≤2.5个百分点)。这些关键发现在不同云区域和采用不同处理器架构的机器类型中均保持一致。我们得出结论:对于关注检测显著性能差异(例如>5%)的工程师和研究人员而言...
摘要
- 原文标题:Dependency Dilemmas: A Comparative Study of Independent and Dependent Artifacts in Maven Central Ecosystem
- 中文标题:依赖困境:Maven中央生态系统中独立与依赖构件的对比研究
- 发布日期:2025-04-16 17:15:58+00:00
- 作者:Mehedi Hasan Shanto, Muhammad Asaduzzaman, Manishankar Mondal, Shaiful Chowdhury
- 分类:cs.SE
- 原文链接:http://arxiv.org/abs/2504.12261v1
中文摘要:Maven Central生态系统构成了Java依赖管理的核心,承载着在采用率、安全性和生态系统角色上差异显著的构件。构件复用是软件开发的基础,而Maven Central等生态系统促进了这一过程。然而,先前研究主要分析了具有大量依赖的热门构件,对无传入依赖的独立构件缺乏探索。本研究分析了658,078个构件(其中635,003个至少有一个发布版本),发现93,101个构件(15.4%)为独立构件(入度=0),其余归类为依赖构件。通过PageRank和出度中心性分析发现,独立构件对生态系统至关重要。针对18项指标的进一步分析揭示了独立构件相较于依赖构件的优势与可比性:流行度相当(25.58 vs. 7.30)、漏洞更少(60个CVE vs. 179个CVE)且无传播漏洞。这些结果表明,独立构件显著影响生态系统,为开发者提供了安全、自包含的传统依赖替代方案。研究发现独立构件可能是依赖关系的有利选择,但存在可维护性问题。因此开发者应审慎引入独立构件,而构件维护者应优先关注此类构件,以降低传递性漏洞传播风险并提升软件可持续性。