WikiEdge:ArXiv速递/2025-03-18:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
Carole留言 | 贡献
Updated page by Carole
Carole留言 | 贡献
Updated page by Carole
第52行: 第52行:
*'''原文链接''':http://arxiv.org/abs/2503.14452v1
*'''原文链接''':http://arxiv.org/abs/2503.14452v1
'''中文摘要''':我们展示了从[[阿塔卡马宇宙学望远镜]]([[ACT]])数据生成的第六版数据发布([[DR6]])图中测量的[[宇宙微波背景]]([[CMB]])各向异性的温度和极化功率谱。这些数据覆盖了19,000平方度的天空,中心频率为98、150和220 GHz,极化白噪声水平比[[普朗克]]([[Planck]])低三倍。我们发现,ACT在10,000平方度范围内估计的角功率谱,并在TT、TE和EE中测量到角分钟尺度,能够很好地由CMB和前景的总和拟合,其中CMB谱由$\Lambda$CDM模型描述。将ACT与更大尺度的普朗克数据结合,联合P-ACT数据集为宇宙的成分、膨胀率和初始条件提供了严格的限制。我们发现,无论是普朗克功率谱还是ACT与[[WMAP]]数据结合,以及联合P-ACT数据集中的温度或极化,都具有相似的约束能力,并且结果一致。当结合ACT和普朗克的CMB透镜效应以及[[暗能量光谱仪]]([[DESI Y1]])的[[重子声学振荡]]数据时,我们测量到的重子密度为$\Omega_b h^2=0.0226\pm0.0001$,冷暗物质密度为$\Omega_c h^2=0.118\pm0.001$,[[哈勃常数]]为$H_0=68.22\pm0.36$ km/s/Mpc,谱指数为$n_s=0.974\pm0.003$,密度涨落幅度为$\sigma_8=0.813\pm0.005$。我们在功率谱中没有发现过量的透镜效应,也没有发现空间平坦性的偏离。[[Sunyaev-Zel'dovich效应]]([[SZ]])各向异性的贡献在高显著性下被检测到;我们发现与基线SZ模板谱相比,小尺度功率受到抑制的倾斜证据,这与带有反馈的流体动力学模拟一致。
'''中文摘要''':我们展示了从[[阿塔卡马宇宙学望远镜]]([[ACT]])数据生成的第六版数据发布([[DR6]])图中测量的[[宇宙微波背景]]([[CMB]])各向异性的温度和极化功率谱。这些数据覆盖了19,000平方度的天空,中心频率为98、150和220 GHz,极化白噪声水平比[[普朗克]]([[Planck]])低三倍。我们发现,ACT在10,000平方度范围内估计的角功率谱,并在TT、TE和EE中测量到角分钟尺度,能够很好地由CMB和前景的总和拟合,其中CMB谱由$\Lambda$CDM模型描述。将ACT与更大尺度的普朗克数据结合,联合P-ACT数据集为宇宙的成分、膨胀率和初始条件提供了严格的限制。我们发现,无论是普朗克功率谱还是ACT与[[WMAP]]数据结合,以及联合P-ACT数据集中的温度或极化,都具有相似的约束能力,并且结果一致。当结合ACT和普朗克的CMB透镜效应以及[[暗能量光谱仪]]([[DESI Y1]])的[[重子声学振荡]]数据时,我们测量到的重子密度为$\Omega_b h^2=0.0226\pm0.0001$,冷暗物质密度为$\Omega_c h^2=0.118\pm0.001$,[[哈勃常数]]为$H_0=68.22\pm0.36$ km/s/Mpc,谱指数为$n_s=0.974\pm0.003$,密度涨落幅度为$\sigma_8=0.813\pm0.005$。我们在功率谱中没有发现过量的透镜效应,也没有发现空间平坦性的偏离。[[Sunyaev-Zel'dovich效应]]([[SZ]])各向异性的贡献在高显著性下被检测到;我们发现与基线SZ模板谱相比,小尺度功率受到抑制的倾斜证据,这与带有反馈的流体动力学模拟一致。
== 摘要 ==
* '''原文标题''':BurTorch: Revisiting Training from First Principles by Coupling Autodiff, Math Optimization, and Systems
* '''中文标题''':BurTorch:通过耦合自动微分、数学优化和系统重新审视从第一性原理出发的训练
* '''发布日期''':2025-03-18 00:52:12+00:00
* '''作者''':Konstantin Burlachenko, Peter Richtárik
* '''分类''':cs.LG, cs.MS, 65Y10, I.2.6; I.2.8; C.1.3; C.5.3; G.4; C.3
*'''原文链接''':http://arxiv.org/abs/2503.13795v1
'''中文摘要''':在这项工作中,我们介绍了[[BurTorch]],这是一个紧凑的高性能框架,旨在通过极其高效的基于[[CPU]]的反向传播([[Rumelhart]]等,1986;[[Linnainmaa]],1970)实现来优化单节点工作站上的[[深度学习]]([[DL]])训练。尽管现代[[DL]]框架内部依赖于类似编译器的优化,但[[BurTorch]]采取了不同的路径。它采用了极简设计,并证明在这些情况下,经典的编译编程语言可以在[[DL]]研究中发挥重要作用。通过消除大型框架的开销并做出高效的实现选择,[[BurTorch]]在[[CPU]]上计算$\nabla f(x)$时实现了性能和内存效率的数量级提升。[[BurTorch]]的紧凑代码库旨在同时实现两个关键目标。首先,它提供了类似于基于脚本的编程环境的用户体验。其次,它显著减少了运行时开销。在大型[[DL]]框架中,相对较小的计算图$f(x)$的主要内存开销来源是功能繁重的实现。我们将[[BurTorch]]与广泛使用的[[DL]]框架的执行模式进行了基准测试:[[JAX]]([[Bradbury]]等,2018)、[[PyTorch]]([[Paszke]]等,2019)、[[TensorFlow]]([[Abadi]]等,2016);以及几个独立的库:[[Autograd]]([[Maclaurin]]等,2015)、[[Micrograd]]([[Karpathy]],2020)、[[Apple MLX]]([[Hannun]]等,2023)。对于小型计算图,[[BurTorch]]在运行时间上比最佳实践解决方案快多达$\times 2000$倍,并将内存消耗减少多达$\times 3500$倍。对于一个小型化的[[GPT-3]]模型([[Brown]]等,2020),[[BurTorch]]相比[[PyTorch]]实现了高达$\times 20$的加速,并将内存减少多达$\times 80$倍。

2025年3月19日 (三) 20:59的版本

摘要

  • 原文标题:Why Personalizing Deep Learning-Based Code Completion Tools Matters
  • 中文标题:为什么个性化基于深度学习的代码补全工具很重要
  • 发布日期:2025-03-18 12:26:06+00:00
  • 作者:Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
  • 分类:cs.SE
  • 原文链接http://arxiv.org/abs/2503.14201v1

中文摘要:基于深度学习(DL)的代码补全工具通过实现高级代码生成,彻底改变了软件开发。这些工具利用从大量代码库中训练的模型,捕捉通用的编码模式。然而,针对特定组织或开发者微调这些模型以提升其在这些主体上的性能的影响尚未被探索。在本研究中,我们通过提供坚实的实证证据填补了这一空白。具体而言,我们考虑了来自两个组织(ApacheSpring)的 136 名开发者、两种模型架构(T5Code Llama)以及三种模型规模(6000 万、7.5 亿和 70 亿可训练参数)。T5 模型(6000 万、7.5 亿)在超过 2000 个开源项目上进行了预训练和微调,排除了目标组织的数据,并与在组织和开发者特定数据集上微调的版本进行了比较。对于 Code Llama 模型(70 亿),我们比较了在线公开的预训练模型与通过参数高效微调在组织和开发者特定数据集上微调的同一模型的性能。我们的结果表明,组织和开发者特定的额外微调都能提升预测能力,其中前者表现尤为突出。这一发现在(i)两个目标组织(即 Apache 和 Spring)和(ii)完全不同的模型规模(从 6000 万到 70 亿可训练参数)中具有普遍性。最后,我们展示了在组织特定数据集上微调的 DL 模型能够达到与预训练代码模型相同的补全性能,而后者规模约为前者的 10 倍,从而在部署和推理成本上实现了显著节省(例如,需要更小的GPU)。

摘要

  • 原文标题:An Assessment of the UK Government Clean Energy Strategy for the Year 2030
  • 中文标题:英国政府2030年清洁能源战略评估
  • 发布日期:2025-03-18 14:48:06+00:00
  • 作者:Anthony D. Stephens, David R. Walwyn
  • 分类:eess.SY, cs.SY
  • 原文链接http://arxiv.org/abs/2503.14309v1

中文摘要:2024年,英国政府就其能源系统脱碳计划发布了两项引人注目的声明:承诺投入220亿英镑在蒂赛德默西塞德建立碳捕集与封存中心,并发布了《清洁电力2030行动计划》。本文质疑这两项计划的有效性,认为它们未能充分考虑风能太阳能发电高度波动性的影响。通过使用考虑这些波动性的未来英国电力系统动态模型,研究表明《清洁电力2030行动计划》高估了风能和太阳能在电力系统中脱碳的能力,尤其是在其规模相对于电力系统需求增加时。更重要的是,动态模型显示,大部分可实现的脱碳效果来自于将风力发电从目前的约10吉瓦增加到约20吉瓦。将风力发电仅增加到20吉瓦,而不是行动计划中提议的30吉瓦,可以将提议的成本减半,节省约1200亿英镑,而在脱碳效果上几乎没有损失。此外,动态模型显示,英国7.5天的天然气储存能力与其大陆邻国认为必要的储存能力相比显得严重不足。本文还表达了对2008年《气候变化法案》的担忧,该法案要求英国实现任意的脱碳目标,导致政府顾问提出了一些未经证实且因此具有高度风险的技术解决方案

摘要

  • 原文标题:Shock with Confidence: Formal Proofs of Correctness for Hyperbolic Partial Differential Equation Solvers
  • 中文标题:置信冲击:双曲偏微分方程求解器的形式化正确性证明
  • 发布日期:2025-03-18 04:08:07+00:00
  • 作者:Jonathan Gorard, Ammar Hakim
  • 分类:cs.LO, cs.NA, math.NA, physics.comp-ph
  • 原文链接http://arxiv.org/abs/2503.13877v1

中文摘要:一阶双曲偏微分方程(PDEs)系统在计算物理学中无处不在,常用于流体湍流冲击波电磁相互作用甚至广义相对论现象的模拟。这些方程在非线性情况下通常难以数值求解,因为它们即使在初始数据平滑的情况下也容易形成不连续性,这可能导致数值算法变得不稳定、违反守恒定律或收敛到物理上不正确的解。在本文中,我们介绍了一种新的形式化验证流程,用于在Racket中构建此类算法,允许用户为指定的方程系统构建定制的双曲PDE求解器,生成可验证实现该求解器的低级C代码,并生成关于实现的各种数学和物理正确性属性的形式化证明,包括L^2稳定性通量守恒和物理有效性。我们概述了如何使用一个完全尊重浮点算术代数结构的自定义定理证明自动微分框架生成这些正确性证明,并展示了生成的C代码如何用于运行独立模拟或集成到更大的计算多物理框架(如Gkeyll)中。

摘要

  • 原文标题:Multi-Parameter Analysis of Li-ion Battery Degradation: Integrating Optical Fiber Sensing with Differential State of Health Metrics
  • 中文标题:锂离子电池退化的多参数分析:集成光纤传感与差分健康状态指标
  • 发布日期:2025-03-18 15:01:30+00:00
  • 作者:Idris Temitope Bello, Hassan Raza, Madithedu Muneeswara, Neha Tewari, Yin Nee Cheung, Tobi Alabi Michael, Ridwan Taiwo, Fiske Lin
  • 分类:physics.app-ph
  • 原文链接http://arxiv.org/abs/2503.14327v1

中文摘要锂离子电池(LiBs)的可靠性和安全性在储能行业中备受关注。然而,由于循环过程中可用的定量指标有限,实时监测其退化仍然具有挑战性。本研究通过采用一种新颖的方法,结合外部光纤传感和先进的数据分析技术,全面评估电池健康状况,解决了这一局限性。我们设计了一种非侵入式光学传感平台,使用串联的聚合物硅基光纤布拉格光栅(FBG)传感器,将其固定在商用锂离子纽扣电池的外表面,实现了在600次循环中对设备级体积变化和热事件的同步实时监测。我们的分析结合了差分技术,基于容量、应变和温度随电压的变化来估计电池的健康状态(SOH)。此外,我们实现并比较了三种深度学习模型——长短期记忆(LSTM)、门控循环单元(GRU)和人工神经网络(ANN)——以预测电池在循环中的SOH。我们能够捕捉到连续和突发的退化事件,并通过差分分析和新的SOH指标,提供了对电池整个生命周期行为的独特见解,这些指标与传统测量方法具有高度相关性。这种结合先进传感技术、创新数据分析和深度学习方法的多参数方法,对电池诊断做出了重要贡献,可能提高可靠性评估、增强安全标准,并加速更可持续储能解决方案的开发。

摘要

  • 原文标题:The Atacama Cosmology Telescope: DR6 Constraints on Extended Cosmological Models
  • 中文标题:阿塔卡马宇宙学望远镜:DR6 对扩展宇宙学模型的约束
  • 发布日期:2025-03-18 17:30:26+00:00
  • 作者:Erminia Calabrese, J. Colin Hill, Hidde T. Jense, Adrien La Posta, Irene Abril-Cabezas, Graeme E. Addison, Peter A. R. Ade, Simone Aiola, Tommy Alford, David Alonso, Mandana Amiri, Rui An, Zachary Atkins, Jason E. Austermann, Eleonora Barbavara, Nicola Barbieri, Nicholas Battaglia, Elia Stefano Battistelli, James A. Beall, Rachel Bean, Ali Beheshti, Benjamin Beringue, Tanay Bhandarkar, Emily Biermann, Boris Bolliet, J Richard Bond, Valentina Capalbo, Felipe Carrero, Stephen Chen, Grace Chesmore, Hsiao-mei Cho, Steve K. Choi, Susan E. Clark, Nicholas F. Cothard, Kevin Coughlin, William Coulton, Devin Crichton, Kevin T. Crowley, Omar Darwish, Mark J. Devlin, Simon Dicker, Cody J. Duell, Shannon M. Duff, Adriaan J. Duivenvoorden, Jo Dunkley, Rolando Dunner, Carmen Embil Villagra, Max Fankhanel, Gerrit S. Farren, Simone Ferraro, Allen Foster, Rodrigo Freundt, Brittany Fuzia, Patricio A. Gallardo, Xavier Garrido, Martina Gerbino, Serena Giardiello, Ajay Gill, Jahmour Givans, Vera Gluscevic, Samuel Goldstein, Joseph E. Golec, Yulin Gong, Yilun Guan, Mark Halpern, Ian Harrison, Matthew Hasselfield, Adam He, Erin Healy, Shawn Henderson, Brandon Hensley, Carlos Hervías-Caimapo, Gene C. Hilton, Matt Hilton, Adam D. Hincks, Renée Hložek, Shuay-Pwu Patty Ho, John Hood, Erika Hornecker, Zachary B. Huber, Johannes Hubmayr, Kevin M. Huffenberger, John P. Hughes, Margaret Ikape, Kent Irwin, Giovanni Isopi, Neha Joshi, Ben Keller, Joshua Kim, Kenda Knowles, Brian J. Koopman, Arthur Kosowsky, Darby Kramer, Aleksandra Kusiak, Alex Lague, Victoria Lakey, Massimiliano Lattanzi, Eunseong Lee, Yaqiong Li, Zack Li, Michele Limon, Martine Lokken, Thibaut Louis, Marius Lungu, Niall MacCrann, Amanda MacInnis, Mathew S. Madhavacheril, Diego Maldonado, Felipe Maldonado, Maya Mallaby-Kay, Gabriela A. Marques, Joshiwa van Marrewijk, Fiona McCarthy, Jeff McMahon, Yogesh Mehta, Felipe Menanteau, Kavilan Moodley, Thomas W. Morris, Tony Mroczkowski, Sigurd Naess, Toshiya Namikawa, Federico Nati, Simran K. Nerval, Laura Newburgh, Andrina Nicola, Michael D. Niemack, Michael R. Nolta, John Orlowski-Scherer, Luca Pagano, Lyman A. Page, Shivam Pandey, Bruce Partridge, Karen Perez Sarmiento, Heather Prince, Roberto Puddu, Frank J. Qu, Damien C. Ragavan, Bernardita Ried Guachalla, Keir K. Rogers, Felipe Rojas, Tai Sakuma, Emmanuel Schaan, Benjamin L. Schmitt, Neelima Sehgal, Shabbir Shaikh, Blake D. Sherwin, Carlos Sierra, Jon Sievers, Cristóbal Sifón, Sara Simon, Rita Sonka, David N. Spergel, Suzanne T. Staggs, Emilie Storer, Kristen Surrao, Eric R. Switzer, Niklas Tampier, Leander Thiele, Robert Thornton, Hy Trac, Carole Tucker, Joel Ullom, Leila R. Vale, Alexander Van Engelen, Jeff Van Lanen, Cristian Vargas, Eve M. Vavagiakis, Kasey Wagoner, Yuhan Wang, Lukas Wenzl, Edward J. Wollack, Kaiwen Zheng
  • 分类:astro-ph.CO, gr-qc, hep-ph
  • 原文链接http://arxiv.org/abs/2503.14454v1

中文摘要:我们使用来自阿塔卡马宇宙学望远镜ACT)数据发布6(DR6)的新宇宙微波背景CMB)原始温度和极化各向异性测量数据,测试标准宇宙学模型的基本假设,并对其扩展模型设置约束。我们仅从ACT DR6功率谱中推导出约束条件,同时也结合了普朗克Planck)的遗留数据。为了打破几何简并性,我们纳入了ACT普朗克CMB透镜数据以及DESI第一年的重子声学振荡数据,并进一步为影响晚期膨胀历史的模型添加了Pantheon+超新星测量数据。我们验证了原始扰动的近尺度不变性(谱指数运行$d n_s/d\ln k = 0.0062 \pm 0.0052$)和绝热性。中微子性质与标准模型的预测一致:我们没有发现新的自由流动的轻相对论性粒子的证据($N_{\rm eff} = 2.86 \pm 0.13$,结合外部BBN数据后为$N_{\rm eff} = 2.89 \pm 0.11$),也没有发现非零中微子质量($\sum m_\nu < 0.082$ eV,95%置信水平)或中微子自相互作用的证据。我们同样没有发现自相互作用的暗辐射($N_{\rm idr} < 0.134$)、早期宇宙基本常数的变化、早期暗能量、原始磁场或修正复合的证据。我们的数据与标准BBNFIRAS推断的CMB温度、碰撞暗物质成分(仅允许一小部分作为类轴子粒子)、宇宙学常数以及广义相对论预测的晚期增长率一致。我们没有发现统计上显著偏离基线$\Lambda$CDM模型的偏好。总体而言,旨在增加哈勃常数或减少从原始CMB推断的密度波动幅度的模型并未得到我们数据的支持。

摘要

  • 原文标题:The Atacama Cosmology Telescope: DR6 Power Spectra, Likelihoods and $Λ$CDM Parameters
  • 中文标题:阿塔卡马宇宙学望远镜:DR6功率谱、似然函数和$Λ$CDM参数
  • 发布日期:2025-03-18 17:30:16+00:00
  • 作者:Thibaut Louis, Adrien La Posta, Zachary Atkins, Hidde T. Jense, Irene Abril-Cabezas, Graeme E. Addison, Peter A. R. Ade, Simone Aiola, Tommy Alford, David Alonso, Mandana Amiri, Rui An, Jason E. Austermann, Eleonora Barbavara, Nicholas Battaglia, Elia Stefano Battistelli, James A. Beall, Rachel Bean, Ali Beheshti, Benjamin Beringue, Tanay Bhandarkar, Emily Biermann, Boris Bolliet, J Richard Bond, Erminia Calabrese, Valentina Capalbo, Felipe Carrero, Stephen Chen, Grace Chesmore, Hsiao-mei Cho, Steve K. Choi, Susan E. Clark, Nicholas F. Cothard, Kevin Coughlin, William Coulton, Devin Crichton, Kevin T. Crowley, Omar Darwish, Mark J. Devlin, Simon Dicker, Cody J. Duell, Shannon M. Duff, Adriaan J. Duivenvoorden, Jo Dunkley, Rolando Dunner, Carmen Embil Villagra, Max Fankhanel, Gerrit S. Farren, Simone Ferraro, Allen Foster, Rodrigo Freundt, Brittany Fuzia, Patricio A. Gallardo, Xavier Garrido, Martina Gerbino, Serena Giardiello, Ajay Gill, Jahmour Givans, Vera Gluscevic, Samuel Goldstein, Joseph E. Golec, Yulin Gong, Yilun Guan, Mark Halpern, Ian Harrison, Matthew Hasselfield, Erin Healy, Shawn Henderson, Brandon Hensley, Carlos Hervías-Caimapo, J. Colin Hill, Gene C. Hilton, Matt Hilton, Adam D. Hincks, Renée Hložek, Shuay-Pwu Patty Ho, John Hood, Erika Hornecker, Zachary B. Huber, Johannes Hubmayr, Kevin M. Huffenberger, John P. Hughes, Margaret Ikape, Kent Irwin, Giovanni Isopi, Neha Joshi, Ben Keller, Joshua Kim, Kenda Knowles, Brian J. Koopman, Arthur Kosowsky, Darby Kramer, Aleksandra Kusiak, Alex Lague, Victoria Lakey, Eunseong Lee, Yaqiong Li, Zack Li, Michele Limon, Martine Lokken, Marius Lungu, Niall MacCrann, Amanda MacInnis, Mathew S. Madhavacheril, Diego Maldonado, Felipe Maldonado, Maya Mallaby-Kay, Gabriela A. Marques, Joshiwa van Marrewijk, Fiona McCarthy, Jeff McMahon, Yogesh Mehta, Felipe Menanteau, Kavilan Moodley, Thomas W. Morris, Tony Mroczkowski, Sigurd Naess, Toshiya Namikawa, Federico Nati, Simran K. Nerval, Laura Newburgh, Andrina Nicola, Michael D. Niemack, Michael R. Nolta, John Orlowski-Scherer, Luca Pagano, Lyman A. Page, Shivam Pandey, Bruce Partridge, Karen Perez Sarmiento, Heather Prince, Roberto Puddu, Frank J. Qu, Damien C. Ragavan, Bernardita Ried Guachalla, Keir K. Rogers, Felipe Rojas, Tai Sakuma, Emmanuel Schaan, Benjamin L. Schmitt, Neelima Sehgal, Shabbir Shaikh, Blake D. Sherwin, Carlos Sierra, Jon Sievers, Cristóbal Sifón, Sara Simon, Rita Sonka, David N. Spergel, Suzanne T. Staggs, Emilie Storer, Kristen Surrao, Eric R. Switzer, Niklas Tampier, Robert Thornton, Hy Trac, Carole Tucker, Joel Ullom, Leila R. Vale, Alexander Van Engelen, Jeff Van Lanen, Cristian Vargas, Eve M. Vavagiakis, Kasey Wagoner, Yuhan Wang, Lukas Wenzl, Edward J. Wollack, Kaiwen Zheng
  • 分类:astro-ph.CO, hep-ph
  • 原文链接http://arxiv.org/abs/2503.14452v1

中文摘要:我们展示了从阿塔卡马宇宙学望远镜ACT)数据生成的第六版数据发布(DR6)图中测量的宇宙微波背景CMB)各向异性的温度和极化功率谱。这些数据覆盖了19,000平方度的天空,中心频率为98、150和220 GHz,极化白噪声水平比普朗克Planck)低三倍。我们发现,ACT在10,000平方度范围内估计的角功率谱,并在TT、TE和EE中测量到角分钟尺度,能够很好地由CMB和前景的总和拟合,其中CMB谱由$\Lambda$CDM模型描述。将ACT与更大尺度的普朗克数据结合,联合P-ACT数据集为宇宙的成分、膨胀率和初始条件提供了严格的限制。我们发现,无论是普朗克功率谱还是ACT与WMAP数据结合,以及联合P-ACT数据集中的温度或极化,都具有相似的约束能力,并且结果一致。当结合ACT和普朗克的CMB透镜效应以及暗能量光谱仪DESI Y1)的重子声学振荡数据时,我们测量到的重子密度为$\Omega_b h^2=0.0226\pm0.0001$,冷暗物质密度为$\Omega_c h^2=0.118\pm0.001$,哈勃常数为$H_0=68.22\pm0.36$ km/s/Mpc,谱指数为$n_s=0.974\pm0.003$,密度涨落幅度为$\sigma_8=0.813\pm0.005$。我们在功率谱中没有发现过量的透镜效应,也没有发现空间平坦性的偏离。Sunyaev-Zel'dovich效应SZ)各向异性的贡献在高显著性下被检测到;我们发现与基线SZ模板谱相比,小尺度功率受到抑制的倾斜证据,这与带有反馈的流体动力学模拟一致。

摘要

  • 原文标题:BurTorch: Revisiting Training from First Principles by Coupling Autodiff, Math Optimization, and Systems
  • 中文标题:BurTorch:通过耦合自动微分、数学优化和系统重新审视从第一性原理出发的训练
  • 发布日期:2025-03-18 00:52:12+00:00
  • 作者:Konstantin Burlachenko, Peter Richtárik
  • 分类:cs.LG, cs.MS, 65Y10, I.2.6; I.2.8; C.1.3; C.5.3; G.4; C.3
  • 原文链接http://arxiv.org/abs/2503.13795v1

中文摘要:在这项工作中,我们介绍了BurTorch,这是一个紧凑的高性能框架,旨在通过极其高效的基于CPU的反向传播(Rumelhart等,1986;Linnainmaa,1970)实现来优化单节点工作站上的深度学习DL)训练。尽管现代DL框架内部依赖于类似编译器的优化,但BurTorch采取了不同的路径。它采用了极简设计,并证明在这些情况下,经典的编译编程语言可以在DL研究中发挥重要作用。通过消除大型框架的开销并做出高效的实现选择,BurTorchCPU上计算$\nabla f(x)$时实现了性能和内存效率的数量级提升。BurTorch的紧凑代码库旨在同时实现两个关键目标。首先,它提供了类似于基于脚本的编程环境的用户体验。其次,它显著减少了运行时开销。在大型DL框架中,相对较小的计算图$f(x)$的主要内存开销来源是功能繁重的实现。我们将BurTorch与广泛使用的DL框架的执行模式进行了基准测试:JAXBradbury等,2018)、PyTorchPaszke等,2019)、TensorFlowAbadi等,2016);以及几个独立的库:AutogradMaclaurin等,2015)、MicrogradKarpathy,2020)、Apple MLXHannun等,2023)。对于小型计算图,BurTorch在运行时间上比最佳实践解决方案快多达$\times 2000$倍,并将内存消耗减少多达$\times 3500$倍。对于一个小型化的GPT-3模型(Brown等,2020),BurTorch相比PyTorch实现了高达$\times 20$的加速,并将内存减少多达$\times 80$倍。