WikiEdge:ArXiv速递/2025-03-18:修订间差异
Created page by Carole |
Updated page by Carole |
||
第7行: | 第7行: | ||
*'''原文链接''':http://arxiv.org/abs/2503.14201v1 | *'''原文链接''':http://arxiv.org/abs/2503.14201v1 | ||
'''中文摘要''':基于[[深度学习]](DL)的代码补全工具通过实现高级代码生成,彻底改变了[[软件开发]]。这些工具利用从大量代码库中训练的模型,捕捉通用的编码模式。然而,针对特定组织或开发者微调这些模型以提升其在这些主体上的性能的影响尚未被探索。在本研究中,我们通过提供坚实的实证证据填补了这一空白。具体而言,我们考虑了来自两个组织([[Apache]] 和 [[Spring]])的 136 名开发者、两种模型架构([[T5]] 和 [[Code Llama]])以及三种模型规模(6000 万、7.5 亿和 70 亿可训练参数)。T5 模型(6000 万、7.5 亿)在超过 2000 个开源项目上进行了预训练和微调,排除了目标组织的数据,并与在组织和开发者特定数据集上微调的版本进行了比较。对于 Code Llama 模型(70 亿),我们比较了在线公开的预训练模型与通过参数高效微调在组织和开发者特定数据集上微调的同一模型的性能。我们的结果表明,组织和开发者特定的额外微调都能提升预测能力,其中前者表现尤为突出。这一发现在(i)两个目标组织(即 Apache 和 Spring)和(ii)完全不同的模型规模(从 6000 万到 70 亿可训练参数)中具有普遍性。最后,我们展示了在组织特定数据集上微调的 DL 模型能够达到与预训练代码模型相同的补全性能,而后者规模约为前者的 10 倍,从而在部署和推理成本上实现了显著节省(例如,需要更小的[[GPU]])。 | '''中文摘要''':基于[[深度学习]](DL)的代码补全工具通过实现高级代码生成,彻底改变了[[软件开发]]。这些工具利用从大量代码库中训练的模型,捕捉通用的编码模式。然而,针对特定组织或开发者微调这些模型以提升其在这些主体上的性能的影响尚未被探索。在本研究中,我们通过提供坚实的实证证据填补了这一空白。具体而言,我们考虑了来自两个组织([[Apache]] 和 [[Spring]])的 136 名开发者、两种模型架构([[T5]] 和 [[Code Llama]])以及三种模型规模(6000 万、7.5 亿和 70 亿可训练参数)。T5 模型(6000 万、7.5 亿)在超过 2000 个开源项目上进行了预训练和微调,排除了目标组织的数据,并与在组织和开发者特定数据集上微调的版本进行了比较。对于 Code Llama 模型(70 亿),我们比较了在线公开的预训练模型与通过参数高效微调在组织和开发者特定数据集上微调的同一模型的性能。我们的结果表明,组织和开发者特定的额外微调都能提升预测能力,其中前者表现尤为突出。这一发现在(i)两个目标组织(即 Apache 和 Spring)和(ii)完全不同的模型规模(从 6000 万到 70 亿可训练参数)中具有普遍性。最后,我们展示了在组织特定数据集上微调的 DL 模型能够达到与预训练代码模型相同的补全性能,而后者规模约为前者的 10 倍,从而在部署和推理成本上实现了显著节省(例如,需要更小的[[GPU]])。 | ||
== 摘要 == | |||
* '''原文标题''':An Assessment of the UK Government Clean Energy Strategy for the Year 2030 | |||
* '''中文标题''':英国政府2030年清洁能源战略评估 | |||
* '''发布日期''':2025-03-18 14:48:06+00:00 | |||
* '''作者''':Anthony D. Stephens, David R. Walwyn | |||
* '''分类''':eess.SY, cs.SY | |||
*'''原文链接''':http://arxiv.org/abs/2503.14309v1 | |||
'''中文摘要''':2024年,[[英国政府]]就其[[能源系统]]脱碳计划发布了两项引人注目的声明:承诺投入220亿英镑在[[蒂赛德]]和[[默西塞德]]建立[[碳捕集与封存]]中心,并发布了《[[清洁电力2030行动计划]]》。本文质疑这两项计划的有效性,认为它们未能充分考虑[[风能]]和[[太阳能发电]]高度波动性的影响。通过使用考虑这些波动性的未来英国电力系统动态模型,研究表明《清洁电力2030行动计划》高估了风能和太阳能在电力系统中脱碳的能力,尤其是在其规模相对于电力系统需求增加时。更重要的是,动态模型显示,大部分可实现的脱碳效果来自于将[[风力发电]]从目前的约10吉瓦增加到约20吉瓦。将风力发电仅增加到20吉瓦,而不是行动计划中提议的30吉瓦,可以将提议的成本减半,节省约1200亿英镑,而在脱碳效果上几乎没有损失。此外,动态模型显示,英国7.5天的[[天然气储存]]能力与其大陆邻国认为必要的储存能力相比显得严重不足。本文还表达了对2008年《[[气候变化法案]]》的担忧,该法案要求英国实现任意的脱碳目标,导致政府顾问提出了一些未经证实且因此具有高度风险的[[技术解决方案]]。 |
2025年3月19日 (三) 05:51的版本
摘要
- 原文标题:Why Personalizing Deep Learning-Based Code Completion Tools Matters
- 中文标题:为什么个性化基于深度学习的代码补全工具很重要
- 发布日期:2025-03-18 12:26:06+00:00
- 作者:Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
- 分类:cs.SE
- 原文链接:http://arxiv.org/abs/2503.14201v1
中文摘要:基于深度学习(DL)的代码补全工具通过实现高级代码生成,彻底改变了软件开发。这些工具利用从大量代码库中训练的模型,捕捉通用的编码模式。然而,针对特定组织或开发者微调这些模型以提升其在这些主体上的性能的影响尚未被探索。在本研究中,我们通过提供坚实的实证证据填补了这一空白。具体而言,我们考虑了来自两个组织(Apache 和 Spring)的 136 名开发者、两种模型架构(T5 和 Code Llama)以及三种模型规模(6000 万、7.5 亿和 70 亿可训练参数)。T5 模型(6000 万、7.5 亿)在超过 2000 个开源项目上进行了预训练和微调,排除了目标组织的数据,并与在组织和开发者特定数据集上微调的版本进行了比较。对于 Code Llama 模型(70 亿),我们比较了在线公开的预训练模型与通过参数高效微调在组织和开发者特定数据集上微调的同一模型的性能。我们的结果表明,组织和开发者特定的额外微调都能提升预测能力,其中前者表现尤为突出。这一发现在(i)两个目标组织(即 Apache 和 Spring)和(ii)完全不同的模型规模(从 6000 万到 70 亿可训练参数)中具有普遍性。最后,我们展示了在组织特定数据集上微调的 DL 模型能够达到与预训练代码模型相同的补全性能,而后者规模约为前者的 10 倍,从而在部署和推理成本上实现了显著节省(例如,需要更小的GPU)。
摘要
- 原文标题:An Assessment of the UK Government Clean Energy Strategy for the Year 2030
- 中文标题:英国政府2030年清洁能源战略评估
- 发布日期:2025-03-18 14:48:06+00:00
- 作者:Anthony D. Stephens, David R. Walwyn
- 分类:eess.SY, cs.SY
- 原文链接:http://arxiv.org/abs/2503.14309v1
中文摘要:2024年,英国政府就其能源系统脱碳计划发布了两项引人注目的声明:承诺投入220亿英镑在蒂赛德和默西塞德建立碳捕集与封存中心,并发布了《清洁电力2030行动计划》。本文质疑这两项计划的有效性,认为它们未能充分考虑风能和太阳能发电高度波动性的影响。通过使用考虑这些波动性的未来英国电力系统动态模型,研究表明《清洁电力2030行动计划》高估了风能和太阳能在电力系统中脱碳的能力,尤其是在其规模相对于电力系统需求增加时。更重要的是,动态模型显示,大部分可实现的脱碳效果来自于将风力发电从目前的约10吉瓦增加到约20吉瓦。将风力发电仅增加到20吉瓦,而不是行动计划中提议的30吉瓦,可以将提议的成本减半,节省约1200亿英镑,而在脱碳效果上几乎没有损失。此外,动态模型显示,英国7.5天的天然气储存能力与其大陆邻国认为必要的储存能力相比显得严重不足。本文还表达了对2008年《气候变化法案》的担忧,该法案要求英国实现任意的脱碳目标,导致政府顾问提出了一些未经证实且因此具有高度风险的技术解决方案。