WikiEdge:ArXiv速递/2025-06-16：修订间差异

2025年6月18日 (三) 05:31的最新版本

摘要

原文标题：Global QCD analysis of spin PDFs in the proton with high-$x$ and lattice constraints
中文标题：质子中自旋部分子分布函数的高x和格点约束全局QCD分析
发布日期：2025-06-16 15:45:01+00:00
作者：C. Cocuzza, N. T. Hunt-Smith, W. Melnitchouk, N. Sato, A. W. Thomas
分类：hep-ph, hep-lat, nucl-th
原文链接：http://arxiv.org/abs/2506.13616v1

中文摘要：我们开展了一项全面的自旋依赖部分子分布函数(PDFs)的全局QCD分析，整合了所有可用的包容性和半包容性深度非弹性散射(DIS)数据，以及极化$pp$对撞中的包容性弱玻色子和喷注产生数据，同时提取自旋平均PDFs和碎裂函数。通过纳入杰斐逊实验室高$x$区域的DIS新数据，并结合领头扭度框架下的次领头幂次修正，我们得以验证$W^2 \geq 4$ GeV$^2$范围内PDFs的稳定性，并更可靠地量化自旋结构函数的不确定性。我们探索了利用格点QCD关于胶子赝Ioffe时间分布的新数据，这些数据与喷注产生和高$x$ DIS数据共同加强了对极化胶子 PDF的约束。数据扩展到高$x$运动学区域使我们能优化自旋结构函数中高扭贡献的边界，并验证Bjorken求和规则的有效性。

摘要

原文标题：EUNIS Habitat Maps: Enhancing Thematic and Spatial Resolution for Europe through Machine Learning
中文标题：EUNIS栖息地地图：通过机器学习提升欧洲专题与空间分辨率
发布日期：2025-06-16 16:10:08+00:00
作者：Sara Si-Moussi, Stephan Hennekens, Sander Mücher, Wanda De Keersmaecker, Milan Chytrý, Emiliano Agrillo, Fabio Attorre, Idoia Biurrun, Gianmaria Bonari, Andraž Čarni, Renata Ćušterevska, Tetiana Dziuba, Klaus Ecker, Behlül Güler, Ute Jandt, Borja Jiménez-Alfaro, Jonathan Lenoir, Jens-Christian Svenning, Grzegorz Swacha, Wilfried Thuiller
分类：stat.AP, cs.LG, physics.geo-ph, q-bio.QM, 62P12, 62M30, 92D40, I.2.6; J.3; I.6.5
原文链接：http://arxiv.org/abs/2506.13649v1

中文摘要：EUNIS栖息地分类体系对欧洲栖息地分类至关重要，其支撑着欧洲自然保护政策及《自然恢复法》的实施。为满足对精细化栖息地信息日益增长的需求，我们针对260种EUNIS三级栖息地类型提供了空间预测结果，同时包含独立验证和不确定性分析。通过集成机器学习模型，结合高分辨率卫星影像及具有生态意义的气候、地形和土壤变量，我们制作了欧洲栖息地地图，以100米分辨率呈现全欧洲最可能的EUNIS栖息地类型。此外，我们还提供了预测不确定性信息，以及每个EUNIS一级分类单元内三级栖息地的最可能分布。该成果对保护和恢复工作具有特殊价值。预测结果通过空间区块交叉验证在欧洲尺度进行验证，并针对法国（仅森林）、荷兰和奥地利的独立数据集进行评估。所获栖息地地图在验证数据集上表现出强劲的预测性能，不同栖息地群系在召回率与精确度方面存在明显权衡关系。

摘要

原文标题：Stability Analysis of Physics-Informed Neural Networks via Variational Coercivity, Perturbation Bounds, and Concentration Estimates
中文标题：基于变分强制性、扰动边界与集中估计的物理信息神经网络稳定性分析
发布日期：2025-06-16 14:41:15+00:00
作者：Ronald Katende
分类：cs.LG, cs.NA, math.FA, math.NA
原文链接：http://arxiv.org/abs/2506.13554v1

中文摘要：我们基于变分分析、算子强制性及显式扰动理论，为物理信息神经网络(PINNs)构建了严格的稳定性框架。PINNs通过最小化采样配置点上的残差损失来逼近偏微分方程(PDE)的解。我们推导了确定性稳定性界，量化网络输出中的有界扰动如何通过残差和监督损失分量传播。借助McDiarmid不等式建立概率稳定性，在最小假设下将采样变异性与经验损失波动相关联，获得非渐近集中界。通过强制性和Sobolev嵌入分析从Sobolev范数训练损失到一致逼近的泛化性，实现逐点误差控制。理论结果适用于标量和向量值 PDE，并涵盖复合损失公式。数值实验验证了扰动敏感性、样本复杂度估计及Sobolev到一致的泛化界。该工作为PINNs提供了数学基础扎实且实际可用的稳定性框架，阐明了算子结构、采样设计和函数正则性在鲁棒训练中的作用。

摘要

原文标题：Global QCD analysis of spin PDFs in the proton with high-$x$ and lattice constraints
中文标题：质子中自旋部分子分布函数的高x和格点约束全局QCD分析
发布日期：2025-06-16 15:45:01+00:00
作者：C. Cocuzza, N. T. Hunt-Smith, W. Melnitchouk, N. Sato, A. W. Thomas
分类：hep-ph, hep-lat, nucl-th
原文链接：http://arxiv.org/abs/2506.13616v1

中文摘要：我们开展了一项全面的自旋依赖部分子分布函数(PDFs)全局QCD分析，整合了所有可用的包容性和半包容性深度非弹性散射(DIS)数据，以及极化$pp$对撞中的包容性弱玻色子和喷注产生数据，同时提取自旋平均PDFs和碎裂函数。通过纳入杰斐逊实验室高$x$区间的DIS新数据，并结合领头扭度框架下的次领头幂次修正，我们得以验证$W^2 \geq 4$ GeV$^2$条件下PDFs的稳定性，并更可靠地量化自旋结构函数的不确定性。我们探索了利用格点QCD关于胶子赝Ioffe时间分布的新数据，这些数据与喷注产生和高$x$ DIS数据共同加强了对极化胶子PDF的约束。实验数据向高$x$区域的运动学扩展，使我们能优化自旋结构函数中高扭贡献的边界限制，并验证Bjorken求和规则的有效性。

摘要

原文标题：Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders
中文标题：驯服大语言模型中的多义性：基于稀疏自编码器的可证明特征恢复
发布日期：2025-06-16 20:58:05+00:00
作者：Siyu Chen, Heejune Sheen, Xuyuan Xiong, Tianhao Wang, Zhuoran Yang
分类：cs.LG, cs.AI, cs.IT, math.IT, stat.ML, I.2.6
原文链接：http://arxiv.org/abs/2506.14002v1

中文摘要：摘要：我们研究利用稀疏自编码器（SAEs）实现理论可靠的特征恢复这一挑战，以解释大语言模型。现有SAE训练算法通常缺乏严格的数学保证，并存在超参数敏感性和不稳定性等实际限制。为解决这些问题，我们首先提出一个新颖的特征恢复统计框架，通过将多义特征建模为底层单义概念的稀疏混合，引入了一种新的特征可识别性概念。基于此框架，我们提出了一种基于"偏置自适应"的新型SAE训练算法，该技术通过自适应调整神经网络偏置参数来确保适当的激活稀疏性。我们理论上证明，当输入数据来自我们提出的统计模型时，该算法能正确恢复所有单义特征。此外，我们开发了改进的经验变体——组偏置自适应（GBA），并证明其在应用于参数高达15亿的大语言模型时，性能优于基准方法。这项工作通过提供首个具有理论恢复保证的SAE算法，为阐明SAE训练机制迈出了基础性一步，从而通过增强的机械可解释性推动更透明、可信赖的AI系统发展。

@@ 第18行： / 第18行： @@
 通过集成[[机器学习模型]]，结合高分辨率[[卫星影像]]及具有生态意义的[[气候]]、[[地形]]和[[土壤]]变量，我们制作了[[欧洲栖息地地图]]，以100米分辨率呈现全欧洲最可能的[[EUNIS栖息地]]类型。此外，我们还提供了预测不确定性信息，以及每个[[EUNIS一级分类]]单元内三级栖息地的最可能分布。该成果对保护和恢复工作具有特殊价值。
 预测结果通过空间区块[[交叉验证]]在[[欧洲]]尺度进行验证，并针对[[法国]]（仅森林）、[[荷兰]]和[[奥地利]]的独立数据集进行评估。所获栖息地地图在验证数据集上表现出强劲的预测性能，不同栖息地群系在[[召回率]]与[[精确度]]方面存在明显权衡关系。
+== 摘要 ==
+* '''原文标题'''：Stability Analysis of Physics-Informed Neural Networks via Variational Coercivity, Perturbation Bounds, and Concentration Estimates
+* '''中文标题'''：基于变分强制性、扰动边界与集中估计的物理信息神经网络稳定性分析
+* '''发布日期'''：2025-06-16 14:41:15+00:00
+* '''作者'''：Ronald Katende
+* '''分类'''：cs.LG, cs.NA, math.FA, math.NA
+*'''原文链接'''：http://arxiv.org/abs/2506.13554v1
+'''中文摘要'''：我们基于[[变分分析]]、[[算子强制性]]及[[显式扰动理论]]，为[[物理信息神经网络]]([[PINNs]])构建了严格的[[稳定性]]框架。[[PINNs]]通过最小化采样配置点上的[[残差损失]]来逼近[[偏微分方程]]([[PDE]])的解。我们推导了[[确定性稳定性界]]，量化[[网络输出]]中的有界扰动如何通过[[残差]]和[[监督损失]]分量传播。借助[[McDiarmid不等式]]建立[[概率稳定性]]，在最小假设下将[[采样变异性]]与[[经验损失]]波动相关联，获得[[非渐近集中界]]。通过[[强制性]]和[[Sobolev嵌入]]分析从[[Sobolev范数]]训练损失到[[一致逼近]]的[[泛化性]]，实现[[逐点误差控制]]。理论结果适用于[[标量]]和[[向量值]][[PDE]]，并涵盖[[复合损失]]公式。数值实验验证了[[扰动敏感性]]、[[样本复杂度]]估计及[[Sobolev]]到[[一致]]的[[泛化界]]。该工作为[[PINNs]]提供了[[数学基础]]扎实且实际可用的[[稳定性框架]]，阐明了[[算子结构]]、[[采样设计]]和[[函数正则性]]在[[鲁棒训练]]中的作用。
+== 摘要 ==
+* '''原文标题'''：Global QCD analysis of spin PDFs in the proton with high-$x$ and lattice constraints
+* '''中文标题'''：质子中自旋部分子分布函数的高x和格点约束全局QCD分析
+* '''发布日期'''：2025-06-16 15:45:01+00:00
+* '''作者'''：C. Cocuzza, N. T. Hunt-Smith, W. Melnitchouk, N. Sato, A. W. Thomas
+* '''分类'''：hep-ph, hep-lat, nucl-th
+*'''原文链接'''：http://arxiv.org/abs/2506.13616v1
+'''中文摘要'''：我们开展了一项全面的[[自旋]]依赖[[部分子分布函数]]([[PDFs]])全局[[QCD]]分析，整合了所有可用的包容性和半包容性[[深度非弹性散射]]([[DIS]])数据，以及[[极化]]$pp$对撞中的包容性[[弱玻色子]]和[[喷注]]产生数据，同时提取[[自旋平均]]PDFs和[[碎裂函数]]。通过纳入[[杰斐逊实验室]]高$x$区间的DIS新数据，并结合[[领头扭度]]框架下的[[次领头幂次修正]]，我们得以验证$W^2 \geq 4$ GeV$^2$条件下PDFs的稳定性，并更可靠地量化[[自旋结构函数]]的不确定性。我们探索了利用[[格点QCD]]关于[[胶子]][[赝Ioffe时间分布]]的新数据，这些数据与喷注产生和高$x$ DIS数据共同加强了对[[极化胶子]]PDF的约束。实验数据向高$x$区域的运动学扩展，使我们能优化自旋结构函数中[[高扭贡献]]的边界限制，并验证[[Bjorken求和规则]]的有效性。
+== 摘要 ==
+* '''原文标题'''：Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders
+* '''中文标题'''：驯服大语言模型中的多义性：基于稀疏自编码器的可证明特征恢复
+* '''发布日期'''：2025-06-16 20:58:05+00:00
+* '''作者'''：Siyu Chen, Heejune Sheen, Xuyuan Xiong, Tianhao Wang, Zhuoran Yang
+* '''分类'''：cs.LG, cs.AI, cs.IT, math.IT, stat.ML, I.2.6
+*'''原文链接'''：http://arxiv.org/abs/2506.14002v1
+'''中文摘要'''：摘要：我们研究利用[[稀疏自编码器]]（[[SAEs]]）实现理论可靠的[[特征恢复]]这一挑战，以解释[[大语言模型]]。现有[[SAE训练算法]]通常缺乏严格的[[数学保证]]，并存在[[超参数敏感性]]和[[不稳定性]]等实际限制。为解决这些问题，我们首先提出一个新颖的[[特征恢复统计框架]]，通过将[[多义特征]]建模为底层[[单义概念]]的[[稀疏混合]]，引入了一种新的[[特征可识别性]]概念。基于此框架，我们提出了一种基于"[[偏置自适应]]"的新型[[SAE训练算法]]，该技术通过自适应调整[[神经网络]]偏置参数来确保适当的[[激活稀疏性]]。我们理论上证明，当输入数据来自我们提出的[[统计模型]]时，该算法能正确恢复所有[[单义特征]]。此外，我们开发了改进的[[经验变体]]——[[组偏置自适应]]（[[GBA]]），并证明其在应用于参数高达15亿的[[大语言模型]]时，性能优于[[基准方法]]。这项工作通过提供首个具有[[理论恢复保证]]的[[SAE算法]]，为阐明[[SAE训练机制]]迈出了基础性一步，从而通过增强的[[机械可解释性]]推动更透明、可信赖的[[AI系统]]发展。

WikiEdge:ArXiv速递/2025-06-16：修订间差异

2025年6月18日 (三) 05:31的最新版本

目录

摘要

摘要

摘要

摘要

摘要

导航菜单

WikiEdge:ArXiv速递/2025-06-16：修订间差异

2025年6月18日 (三) 05:31的最新版本

摘要

摘要

摘要

摘要

摘要

导航菜单

搜索