WikiEdge:ArXiv速递/2025-03-18

来自WikiEdge
Carole留言 | 贡献2025年3月19日 (三) 05:56的版本 (Updated page by Carole)
跳转到导航 跳转到搜索

摘要

  • 原文标题:Why Personalizing Deep Learning-Based Code Completion Tools Matters
  • 中文标题:为什么个性化基于深度学习的代码补全工具很重要
  • 发布日期:2025-03-18 12:26:06+00:00
  • 作者:Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
  • 分类:cs.SE
  • 原文链接http://arxiv.org/abs/2503.14201v1

中文摘要:基于深度学习(DL)的代码补全工具通过实现高级代码生成,彻底改变了软件开发。这些工具利用从大量代码库中训练的模型,捕捉通用的编码模式。然而,针对特定组织或开发者微调这些模型以提升其在这些主体上的性能的影响尚未被探索。在本研究中,我们通过提供坚实的实证证据填补了这一空白。具体而言,我们考虑了来自两个组织(ApacheSpring)的 136 名开发者、两种模型架构(T5Code Llama)以及三种模型规模(6000 万、7.5 亿和 70 亿可训练参数)。T5 模型(6000 万、7.5 亿)在超过 2000 个开源项目上进行了预训练和微调,排除了目标组织的数据,并与在组织和开发者特定数据集上微调的版本进行了比较。对于 Code Llama 模型(70 亿),我们比较了在线公开的预训练模型与通过参数高效微调在组织和开发者特定数据集上微调的同一模型的性能。我们的结果表明,组织和开发者特定的额外微调都能提升预测能力,其中前者表现尤为突出。这一发现在(i)两个目标组织(即 Apache 和 Spring)和(ii)完全不同的模型规模(从 6000 万到 70 亿可训练参数)中具有普遍性。最后,我们展示了在组织特定数据集上微调的 DL 模型能够达到与预训练代码模型相同的补全性能,而后者规模约为前者的 10 倍,从而在部署和推理成本上实现了显著节省(例如,需要更小的GPU)。

摘要

  • 原文标题:An Assessment of the UK Government Clean Energy Strategy for the Year 2030
  • 中文标题:英国政府2030年清洁能源战略评估
  • 发布日期:2025-03-18 14:48:06+00:00
  • 作者:Anthony D. Stephens, David R. Walwyn
  • 分类:eess.SY, cs.SY
  • 原文链接http://arxiv.org/abs/2503.14309v1

中文摘要:2024年,英国政府就其能源系统脱碳计划发布了两项引人注目的声明:承诺投入220亿英镑在蒂赛德默西塞德建立碳捕集与封存中心,并发布了《清洁电力2030行动计划》。本文质疑这两项计划的有效性,认为它们未能充分考虑风能太阳能发电高度波动性的影响。通过使用考虑这些波动性的未来英国电力系统动态模型,研究表明《清洁电力2030行动计划》高估了风能和太阳能在电力系统中脱碳的能力,尤其是在其规模相对于电力系统需求增加时。更重要的是,动态模型显示,大部分可实现的脱碳效果来自于将风力发电从目前的约10吉瓦增加到约20吉瓦。将风力发电仅增加到20吉瓦,而不是行动计划中提议的30吉瓦,可以将提议的成本减半,节省约1200亿英镑,而在脱碳效果上几乎没有损失。此外,动态模型显示,英国7.5天的天然气储存能力与其大陆邻国认为必要的储存能力相比显得严重不足。本文还表达了对2008年《气候变化法案》的担忧,该法案要求英国实现任意的脱碳目标,导致政府顾问提出了一些未经证实且因此具有高度风险的技术解决方案

摘要

  • 原文标题:Shock with Confidence: Formal Proofs of Correctness for Hyperbolic Partial Differential Equation Solvers
  • 中文标题:置信冲击:双曲偏微分方程求解器的形式化正确性证明
  • 发布日期:2025-03-18 04:08:07+00:00
  • 作者:Jonathan Gorard, Ammar Hakim
  • 分类:cs.LO, cs.NA, math.NA, physics.comp-ph
  • 原文链接http://arxiv.org/abs/2503.13877v1

中文摘要:一阶双曲偏微分方程(PDEs)系统在计算物理学中无处不在,常用于流体湍流冲击波电磁相互作用甚至广义相对论现象的模拟。这些方程在非线性情况下通常难以数值求解,因为它们即使在初始数据平滑的情况下也容易形成不连续性,这可能导致数值算法变得不稳定、违反守恒定律或收敛到物理上不正确的解。在本文中,我们介绍了一种新的形式化验证流程,用于在Racket中构建此类算法,允许用户为指定的方程系统构建定制的双曲PDE求解器,生成可验证实现该求解器的低级C代码,并生成关于实现的各种数学和物理正确性属性的形式化证明,包括L^2稳定性通量守恒和物理有效性。我们概述了如何使用一个完全尊重浮点算术代数结构的自定义定理证明自动微分框架生成这些正确性证明,并展示了生成的C代码如何用于运行独立模拟或集成到更大的计算多物理框架(如Gkeyll)中。