WikiEdge:ArXiv速递/2025-03-19

摘要

原文标题：An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
中文标题：一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用
发布日期：2025-03-19 17:18:18+00:00
作者：Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
分类：stat.ME, cs.AI
原文链接：http://arxiv.org/abs/2503.15436v1

中文摘要：尽管探索性因果分析在现代科学和医学中的存在加速增长，但用于验证因果模型的可用非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性，类似于统计学中用于估计置信区间的重采样方法。然而，这种方法的许多方面几乎没有受到关注，例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果，证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果，这些结果验证了理论结果，并提供了大量数据，以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。

摘要

原文标题：Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
中文标题：优化检索增强生成系统中金融问答文档的检索策略
发布日期：2025-03-19 13:21:49+00:00
作者：Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
分类：cs.IR
原文链接：http://arxiv.org/abs/2503.15191v1

中文摘要：检索增强生成（RAG）作为一种有前景的框架，能够缓解大型语言模型（LLMs）中的幻觉问题，但其整体性能依赖于底层的检索系统。在金融领域，诸如10-K报告等文档由于领域特定的词汇和多层次的表格数据而带来了独特的挑战。在本研究中，我们引入了一种高效的端到端RAG管道，通过三个阶段（预检索、检索和后检索）来增强金融文档的检索能力。在预检索阶段，采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段，我们利用领域特定知识对最先进的（SOTA）嵌入模型进行了微调，并实施了一种结合密集表示和稀疏表示的混合检索策略。最后，在后检索阶段，通过直接偏好优化（DPO）训练和文档选择方法进一步优化结果。在七个金融问答数据集（FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt）上的评估表明，检索性能显著提升，从而生成了更准确且上下文适当的生成结果。这些发现突显了定制检索技术在提升RAG系统在金融应用中的有效性方面的关键作用。完整的可复现管道可在GitHub上获取：https://github.com/seohyunwoo-0407/GAR。

摘要

原文标题：Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
中文标题：La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响：实验与从头计算相结合的研究
发布日期：2025-03-19 07:34:11+00:00
作者：Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.14952v1

中文摘要：La-Mg-Ni基合金是第三代Ni-MH$_x$电池的有前景的负极材料。在本工作中，我们研究了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金（$x$ = 0.00, 0.25, 0.50和0.75）。X射线衍射测量表明样品具有多相特征，主要为六方Ce$_2$Ni$_7$型和菱面体Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示最大放电容量（$C_{max}$）随Mg浓度的增加而增加，并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]（$x$ = 0.5）时达到最高值304 mAh/g。实验工作之后，我们使用全势局域轨道最小基组方案（FPLO）进行了密度泛函理论（DFT）计算。为了模拟化学无序，我们采用了相干势近似（CPA）。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外，还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱面体结构的总能量几乎相同，这与样品中两相的共存一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外，通过X射线光电子能谱（XPS）研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的相应光谱进行了解释。

摘要

原文标题：Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
中文标题：改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
发布日期：2025-03-19 10:40:27+00:00
作者：Judd Harrison
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.15090v1

中文摘要：我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定，并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克，并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合，一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$，另一个具有$a\approx 0.03\mathrm{fm}$，在该集合上我们能够达到物理底夸克质量。我们的计算使用非微扰重整化的流算子，并覆盖了衰变的整个运动学范围。我们使用最近的重-粲磁化率结果，作为$u=m_c/m_h$的函数，以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$，$A_{\lambda_\tau}=0.5093(42)$，$F_L^{J/\psi}=0.4421(55)$，和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$，分别将不确定性减少了$29\%$，$45\%$，$40\%$和$50\%$。由于我们的格点形状因子覆盖了整个运动学范围，我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案，使用在$q^2_\mathrm{max}$附近运动学范围的前$1/3$的格点结果。我们发现，如果在物理连续外推中省略高阶运动学术语，从高$q^2$区域外推合成数据时，在$q^2=0$附近可能会出现意外大的系统不确定性。这表明，在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时，可能会低估系统不确定性。

摘要

原文标题：State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
中文标题：ttH 产生截面的最新进展：NNLO 预测与 NNLL 重求和及电弱修正的结合
发布日期：2025-03-19 09:32:21+00:00
作者：Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
分类：hep-ph, hep-ex
原文链接：http://arxiv.org/abs/2503.15043v1

中文摘要：我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测，这些预测是根据LHC希格斯工作组建议计算的。通过适当近似双圈虚拟贡献，我们得出了NNLO QCD预测，并补充了高达NNLL精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接QCD，另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的NLO修正相结合，产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。

摘要

原文标题：Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
中文标题：自由中子寿命实验 $τ$SPECT 的超冷中子模拟框架
发布日期：2025-03-19 14:15:34+00:00
作者：Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
分类：physics.ins-det, nucl-ex
原文链接：http://arxiv.org/abs/2503.15239v1

中文摘要：自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而，目前用于测量中子寿命的两种主要技术得出了不相容的结果，这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性，$\tau$SPECT 实验采用了完全磁阱来捕获超冷中子（UCNs）。超冷中子是一种能量极低的中子，其典型速度低于 $8\,\textrm{m/s}$，可以通过磁场、重力和合适的材料导引进行操控，这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为，我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack，并增强了两个配套工具：一个用于灵活且可参数化的 PENTrack 上游配置，以便调整模拟的输入设置以重现实验观测结果；另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢勒研究所使用 $\tau$SPECT 获得的实验数据非常吻合，并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。

摘要

原文标题：pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
中文标题：pyTTN：一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
发布日期：2025-03-19 17:40:49+00:00
作者：Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
分类：quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.15460v1

中文摘要：我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包（pyTTN），该包利用树张量网络（TTN）或等效的多层多构型时间依赖Hartree（ML-MCTDH）波函数表示。该包包含多个功能，允许通过使用子空间扩展技术，使用具有自适应键维度的单集和多集TTN ansätze，轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现，并提供了Python绑定以简化该包的使用。除了这些核心功能外，pyTTN还提供了多种工具，用于设置开放量子系统动力学的高效模拟，包括使用TTN ansatz表示辅助密度算子空间，用于模拟层次运动方程（HEOM）方法和广义伪模式方法；此外，我们证明了这两种方法在作用于伪模式自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用，从广泛使用的24模式吡嗪的光激发动力学基准案例开始，随后考虑了一个更具挑战性的模型，描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后，我们考虑了开放量子系统的应用，包括自旋-玻色子模型、一组扩展耗散自旋模型和安德森杂质模型。通过结合易用性、高效实现以及允许未来扩展的可扩展设计，pyTTN可以集成到广泛的计算建模软件中。

摘要

原文标题：When LLMs Meet API Documentation: Can Retrieval Augmentation Aid Code Generation Just as It Helps Developers?
中文标题：当大语言模型遇到API文档：检索增强能否像帮助开发者一样助力代码生成？
发布日期：2025-03-19 14:08:47+00:00
作者：Jingyi Chen, Songqiang Chen, Jialun Cao, Jiasi Shen, Shing-Chi Cheung
分类：cs.SE
原文链接：http://arxiv.org/abs/2503.15231v1

中文摘要：检索增强生成（RAG）在扩展大型语言模型（LLMs）能力方面日益显示出其强大作用，使其能够超越预训练知识的限制。现有研究表明，RAG可以帮助完成软件开发任务，如代码生成、代码更新和测试生成。然而，使用RAG将LLMs适应于快速变化或较少使用的API库的有效性仍然未知。为了填补这一空白，我们迈出了第一步，研究这一尚未探索但实际存在的场景——当开发者使用较少使用的库进行编码时，他们通常会参考其API文档；同样，当允许LLMs通过RAG查找API文档时，LLMs能在多大程度上得到提升？为了模拟这种场景，我们选择了四个较少使用的开源Python库，共包含1017个符合条件的API。我们研究了影响使用较少使用的API库文档作为检索和生成额外知识有效性的因素。我们的深入研究得出了有趣的发现：（1）RAG帮助将LLMs的性能提升了83%-220%。（2）示例代码对提升LLMs的贡献最大，而不是API文档中的描述性文本和参数列表。（3）LLMs有时可以通过参考其预训练知识或文档上下文容忍轻微的噪声（描述中的拼写错误或错误的参数）。最后，我们建议开发者更多地关注API文档中代码示例的质量和多样性。这项研究为未来的低代码软件开发工作流程提供了启示。

摘要

原文标题：Global Optimization of Gas Transportation and Storage: Convex Hull Characterizations and Relaxations
中文标题：天然气运输和存储的全局优化：凸包表征与松弛
发布日期：2025-03-19 12:09:12+00:00
作者：Bahar Cennet Okumusoglu, Burak Kocuk
分类：math.OC
原文链接：http://arxiv.org/abs/2503.15143v1

中文摘要：天然气运输和储存已成为能源系统中最相关和最重要的优化问题之一。由于气体物理特性，该问题本质上包含高度非线性和非凸的方面，以及由于主动网络元件的控制决策而导致的离散方面。为这一问题获得局部可行解或全局解对系统操作者提出了重大的数学和计算挑战。在本文中，我们通过析取将该问题表述为一个非凸混合整数非线性规划（MINLP）问题。此外，我们研究了由气体物理特性引起的非凸集，并提出了针对非凸MINLP问题的混合整数二阶锥规划松弛。所提出的松弛基于非凸集的凸包表示：我们给出了管道非凸集的凸包表示，并证明它是二阶锥可表示的。我们还完全描述了压缩机非凸集的极值点，并证明这些极值点的凸包是幂锥可表示的。对于实际应用，我们提出了压缩机非凸集的二阶锥外近似。为了获得（接近）全局最优解，我们基于凸包结果开发了一个算法框架。我们通过在各种GasLib网络上的广泛计算实验评估了我们的框架，并与文献中的凸松弛方法和最先进的全局求解器进行了比较。我们的结果突出了我们的凸松弛方法在计算效率和收敛性能方面的优势。此外，我们的方法还始终提供（接近）全局解以及高质量的局部求解器热启动点。

摘要

原文标题：Are "Solved Issues" in SWE-bench Really Solved Correctly? An Empirical Study
中文标题：SWE-bench 中的“已解决问题”真的被正确解决了吗？一项实证研究
发布日期：2025-03-19 14:02:21+00:00
作者：You Wang, Michael Pradel, Zhongxin Liu
分类：cs.SE
原文链接：http://arxiv.org/abs/2503.15223v1

中文摘要：自动问题解决旨在解决软件仓库中的实际问题。最受欢迎的自动问题解决基准是SWE-bench及其人工筛选的子集SWE-bench Verified。这些基准利用测试来验证生成的补丁。然而，由于测试很少是详尽的，补丁可能通过测试但仍未能满足开发者的期望。不幸的是，目前尚不清楚使用SWE-bench进行的评估在多大程度上受到这种看似合理但不正确的补丁的影响。本文对在SWE-bench Verified上评估的三种最先进的问题解决工具生成的看似合理的补丁的正确性进行了深入的实证研究。我们广泛测试和检查生成的补丁，并将其与人工编写的地面真实补丁进行比较。我们方法的核心是一种新颖的差分补丁测试技术PatchDiff，它自动暴露两个补丁之间的行为差异。我们的研究结果揭示了SWE-bench补丁验证机制的关键弱点，导致7.8%的补丁被计为正确，但未能通过开发者编写的测试套件。此外，我们的新颖自动化技术显示，甚至更多（29.6%）的看似合理的补丁引发了与地面真实补丁不同的行为。这些行为差异通常是由于相似但不同的实现（46.8%）以及生成的补丁适应了比地面真实补丁更多的行为（27.3%）。我们的手动检查显示，28.6%的行为差异补丁肯定是错误的。综合来看，这些不同的弱点导致报告的分辨率膨胀了6.2个百分点。我们的研究结果呼吁对问题解决工具进行更稳健和可靠的评估。我们设想我们的自动化差分补丁测试技术将对此目的有用。

摘要

原文标题：TULIP: Towards Unified Language-Image Pretraining
中文标题：TULIP：迈向统一的语言-图像预训练
发布日期：2025-03-19 17:58:57+00:00
作者：Zineng Tang, Long Lian, Seun Eisape, XuDong Wang, Roei Herzig, Adam Yala, Alane Suhr, Trevor Darrell, David M. Chan
分类：cs.CV, cs.AI, cs.CL, cs.LG
原文链接：http://arxiv.org/abs/2503.15485v1

中文摘要：尽管像CLIP和SigLIP这样的图像-文本对比模型最近取得了成功，但这些模型在处理需要高保真图像理解的视觉中心任务时往往表现不佳，例如计数、深度估计和细粒度物体识别。这些模型通过执行语言对齐，往往优先考虑高级语义而非视觉理解，从而削弱了它们的图像理解能力。另一方面，专注于视觉的模型在处理视觉信息方面表现出色，但在理解语言方面存在困难，限制了它们在语言驱动任务中的灵活性。在这项工作中，我们引入了TULIP，这是一个开源的、可直接替代现有CLIP类模型的方案。我们的方法利用生成数据增强、增强的图像-图像和文本-文本对比学习以及图像/文本重建正则化，以学习细粒度的视觉特征，同时保持全局语义对齐。我们的方法扩展到超过10亿个参数，在多个基准测试中优于现有的最先进（SOTA）模型，在ImageNet-1K上建立了新的SOTA零样本性能，在RxRx1上的少样本分类线性探测中比SigLIP提高了2倍，并改进了视觉-语言模型，在MMVP上比SigLIP提高了3倍以上的分数。我们的代码/检查点可在https://tulip-berkeley.github.io获取。

摘要

原文标题：LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
中文标题：LLaVA-MORE：增强视觉指令调优的LLM与视觉骨干对比研究
发布日期：2025-03-19 18:10:12+00:00
作者：Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
分类：cs.CV, cs.AI, cs.CL, cs.MM
原文链接：http://arxiv.org/abs/2503.15621v1

中文摘要：近年来，多模态大语言模型（MLLMs）的进展凸显了视觉骨干网络和底层语言模型的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数，但模型规模、架构和性能之间的权衡仍未得到充分探索。此外，训练数据和评估协议的不一致性阻碍了直接比较，使得难以得出最优的设计选择。在本文中，我们提出了LLaVA-MORE，这是一个新的MLLM系列，将最新的语言模型与多样化的视觉骨干网络相结合。为了确保公平比较，我们采用了一种统一的训练协议，并一致地应用于所有架构。我们的分析系统地探索了中小规模的语言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以评估多模态推理、生成和指令跟随能力，同时研究了模型规模与性能之间的关系。除了评估语言模型对最终结果的影响外，我们还对各种视觉编码器进行了全面研究，范围从基于CLIP的架构到DINOv2、SigLIP和SigLIP2等替代方案。额外的实验研究了增加图像分辨率和预训练数据集变化的影响。总体而言，我们的结果为设计更有效的MLLM提供了见解，提供了一个可重复的评估框架，便于直接比较，并可以指导未来的模型开发。我们的源代码和训练模型公开在：https://github.com/aimagelab/LLaVA-MORE。

摘要

原文标题：Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
中文标题：通过\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之间的核钟跃迁频率差异
发布日期：2025-03-19 09:53:23+00:00
作者：Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
分类：physics.atom-ph
原文链接：http://arxiv.org/abs/2503.15061v1

中文摘要：$^{229}\text{Th}$ 同位素是核钟的有力候选者，其跃迁频率受到电子诱导的核频率偏移的影响。这种效应相对较小，需要高精度的理论计算。在本工作中，我们采用了一种非微扰的多组态 Dirac-Hartree-Fock (MCDHF) 方法，与之前使用的微扰理论不同，以解决场移效应。该方法考虑了核势的细微差异，同时考虑了 $^{229}\text{Th}$ 同位素的基态和同质异能态。因此，$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的核跃迁频率差被确定为 $-639$~MHz，计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 CaF$_2$ 中精确测量的 $^{229}\text{Th}^{4+}$ 跃迁频率 [Nature 633, 63 (2024)]，孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz，括号中的不确定性分别来自我们的原子结构计算、核数据表中的输入核电荷半径以及文献中报告的晶体环境的影响。这为基于离子阱实验的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激发提供了有价值的指导。

摘要

原文标题：Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
中文标题：可持续的基于深度学习的乳腺病变分割：乳腺区域分割对性能的影响
发布日期：2025-03-19 21:42:33+00:00
作者：Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
分类：cs.CV, physics.med-ph
原文链接：http://arxiv.org/abs/2503.15708v1

中文摘要：目的：在动态对比增强磁共振成像（DCE-MRI）中，乳腺病变的分割是准确诊断、制定治疗计划和监测进展的关键步骤。本研究旨在强调乳腺区域分割（BRS）对基于深度学习的乳腺病变分割（BLS）在乳腺DCE-MRI中的影响。方法：使用包含59个DCE-MRI扫描的Stavanger数据集和UNet++作为深度学习模型，进行了四种不同的处理流程，以比较BRS对BLS的影响。这四种方法包括：不使用BRS的整个体积、使用BRS的整个体积、使用BRS的选定病变切片以及使用BRS的最佳体积。通过数据增强和过采样等预处理方法来增强小数据集、统一数据形状并提高模型性能。通过精确的过程研究了最佳体积大小，以确保所有病变都存在于切片中。为了评估模型，使用了包括Dice、Focal和交叉熵的混合损失函数以及5折交叉验证方法，最后使用随机分割的测试数据集来评估模型在未见数据上的性能，针对上述四种方法分别进行了测试。结果：结果表明，使用BRS显著提高了模型的性能和验证效果。与不使用BRS的方法相比，最后一种方法——使用BRS的最佳体积——的性能提升了约50%，证明了BRS在BLS中的有效性。此外，能耗的大幅降低（高达450%）为未来在大数据集上的工作提供了一种更环保的解决方案。

摘要

原文标题：Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets
中文标题：使用GridRad-Severe和HRRR的超单体环境：解决先前龙卷风数据集之间的差异
发布日期：2025-03-19 17:44:36+00:00
作者：Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer
分类：physics.ao-ph
原文链接：http://arxiv.org/abs/2503.15466v1

中文摘要：风暴相对螺旋度（SRH）是超级单体发展以及中尺度气旋强度的重要成分，并且与龙卷风的生成和潜力相关。SRH源自风暴相对风廓线，由垂直风切变和风暴相对流组成。最近的研究在关于较浅或较深的SRH层在龙卷风预报中更具预测能力的问题上得出了相互矛盾的结论。这种差异的可能原因包括使用观测数据与基于模型的邻近探空数据，以及风暴相对风廓线是通过观测还是估计的风暴运动确定的。本研究使用了一个新的数据集，其中包含客观识别的超级单体及其观测到的风暴运动，并结合高分辨率模型分析，以解决先前研究中的差异。与以往基于模型的龙卷风环境数据集不同，本方法揭示了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对流、垂直风切变和SRH方面的实质性差异。使用观测到的风暴运动来计算风暴相对变量进一步放大了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对风中的差异，最终导致较深的SRH层比近地面SRH具有更高的预报能力。因此，结合更高分辨率的模型分析（更好地代表风暴附近环境）和观测到的风暴运动，似乎解释了为什么许多过去使用基于模型的环境分析的龙卷风气候学未能发现风暴相对风廓线的显著差异。这些结果有助于弥合先前使用较粗糙的基于模型的分析与从野外项目中汇总的观测探空数据之间的差距。

摘要

原文标题：An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
中文标题：一项广泛的模拟研究评估重采样技术在多种因果发现背景下的交互作用
发布日期：2025-03-19 17:18:18+00:00
作者：Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
分类：stat.ME, cs.AI
原文链接：http://arxiv.org/abs/2503.15436v1

中文摘要：尽管探索性因果分析在现代科学和医学中的存在加速增长，但用于验证因果模型的非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性，类似于统计学中用于估计置信区间的重采样方法。然而，这种方法的许多方面几乎没有受到关注，例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果，证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果，这些结果验证了理论结果，并提供了大量数据，以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。

摘要

原文标题：Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
中文标题：优化检索增强生成系统中金融问答文档的检索策略
发布日期：2025-03-19 13:21:49+00:00
作者：Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
分类：cs.IR
原文链接：http://arxiv.org/abs/2503.15191v1

中文摘要：检索增强生成（RAG）作为一种有前景的框架，能够缓解大型语言模型（LLMs）中的幻觉问题，但其整体性能依赖于底层的检索系统。在金融领域，诸如10-K报告等文档由于领域特定的词汇和多层次表格数据而带来了独特的挑战。在本研究中，我们引入了一种高效的端到端RAG流程，通过三个阶段（预检索、检索和后检索）来增强金融文档的检索效果。在预检索阶段，采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段，我们利用领域特定知识对最先进的（SOTA）嵌入模型进行了微调，并实施了一种结合密集表示和稀疏表示的混合检索策略。最后，在后检索阶段，通过直接偏好优化（DPO）训练和文档选择方法进一步优化结果。在七个金融问答数据集（FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt）上的评估表明，检索性能显著提升，从而生成了更准确且上下文合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现流程可在GitHub上获取：https://github.com/seohyunwoo-0407/GAR。

摘要

原文标题：Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
中文标题：La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响：实验与从头算研究的结合
发布日期：2025-03-19 07:34:11+00:00
作者：Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.14952v1

中文摘要：La-Mg-Ni基合金是第三代Ni-MH$_x$电池的有前景的负极材料。在本工作中，我们研究了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金（$x$ = 0.00, 0.25, 0.50和0.75）。X射线衍射测量表明样品具有多相特征，主要相为六方Ce$_2$Ni$_7$型和菱面体Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示，最大放电容量（$C_{max}$）随着Mg浓度的增加而增加，并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]（$x$ = 0.5）时达到最高值304 mAh/g。实验工作之后，我们使用全势局域轨道最小基组方案（FPLO）进行了密度泛函理论（DFT）计算。为了模拟化学无序，我们采用了相干势近似（CPA）。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外，还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱面体结构的总能量几乎相同，这与样品中两相的共存一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外，通过X射线光电子能谱（XPS）研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的光谱进行了解释。

摘要

原文标题：Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
中文标题：改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
发布日期：2025-03-19 10:40:27+00:00
作者：Judd Harrison
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.15090v1

中文摘要：我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定，并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克，并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合，一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$，另一个具有$a\approx 0.03\mathrm{fm}$，我们能够在后者上达到物理底夸克质量。我们的计算使用非微扰重整化的流算子，并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果，作为$u=m_c/m_h$的函数，以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$，$A_{\lambda_\tau}=0.5093(42)$，$F_L^{J/\psi}=0.4421(55)$，和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$，分别将不确定性减少了$29\%$，$45\%$，$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围，我们可以使用它们来测试在低反冲区域使用截断范围数据的推断。我们研究了不同的物理连续参数化方案，使用在接近$q^2_\mathrm{max}$的运动学范围的前$1/3$的格点结果。我们发现，如果在物理连续外推中省略高阶运动学术语，从高$q^2$区域外推合成数据时，在$q^2=0$附近可能会出现意外大的系统不确定性。这表明，在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时，可能会低估进入低$q^2$区域的系统不确定性。

摘要

原文标题：State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
中文标题：ttH 产生的最先进截面：NNLO 预测与 NNLL 重求和及电弱修正的结合
发布日期：2025-03-19 09:32:21+00:00
作者：Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
分类：hep-ph, hep-ex
原文链接：http://arxiv.org/abs/2503.15043v1

中文摘要：我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测，这些预测是根据LHC 希格斯工作组建议计算的。通过适当近似双圈虚拟贡献，我们得出了NNLO QCD预测，并补充了高达NNLL精度的软胶子重求和。我们采用了两种不同的重求和框架——一种基于直接QCD，另一种基于软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整的NLO修正相结合，产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。

摘要

原文标题：pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
中文标题：pyTTN：一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
发布日期：2025-03-19 17:40:49+00:00
作者：Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
分类：quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.15460v1

中文摘要：我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包（pyTTN），该包利用树张量网络（TTN）或等效的多层多构型时间依赖Hartree（ML-MCTDH）方法来表示波函数。该包包含多个功能，允许通过使用子空间扩展技术，使用单集和多集TTN ansätze以及自适应键维度，轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现，并提供了Python绑定以简化该包的使用。除了这些核心功能外，pyTTN还提供了多种工具，用于设置开放量子系统动力学的高效模拟，包括使用TTN ansatz来表示辅助密度算子空间，用于模拟层次运动方程（HEOM）方法和广义伪模方法；此外，我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用，从广泛使用的24模吡嗪的光激发动力学基准案例开始，随后考虑了一个更具挑战性的模型，描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后，我们考虑了开放量子系统的应用，包括自旋-玻色子模型、一组扩展的耗散自旋模型以及安德森杂质模型。通过结合易用性、高效实现以及可扩展设计，pyTTN可以集成到广泛的计算建模软件中。

摘要

原文标题：Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
中文标题：自由中子寿命实验$τ$SPECT的超冷中子模拟框架
发布日期：2025-03-19 14:15:34+00:00
作者：Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
分类：physics.ins-det, nucl-ex
原文链接：http://arxiv.org/abs/2503.15239v1

中文摘要：自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而，目前两种主要的中子寿命测量技术得出了不相容的结果，这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性，$\tau$SPECT 实验采用了全磁阱来捕获超冷中子（UCNs）。超冷中子是一种能量极低的中子，其典型速度低于 $8\,\textrm{m/s}$，可以通过磁场、重力和合适的材料导引进行操控，这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为，我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack，并通过两个配套工具进行了增强：一个用于灵活且可参数化的 PENTrack 上游配置，以便调整模拟的输入设置以重现实验观测结果；另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢勒研究所进行的 $\tau$SPECT 实验数据吻合良好，为识别系统不确定性和指导当前实验装置的未来改进提供了强有力的资源。

摘要

原文标题：Simulations of self-magnetization in expanding high-energy-density plasmas
中文标题：高能量密度等离子体膨胀中的自磁化模拟
发布日期：2025-03-19 18:16:50+00:00
作者：K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
分类：physics.plasm-ph
原文链接：http://arxiv.org/abs/2503.15624v1

中文摘要：理解等离子体自磁化是实验室和天体物理等离子体中的一个基本挑战。自磁化可以改变等离子体的输运特性，从而影响等离子体的动力学演化。大多数关于磁重联和非磁化无碰撞冲击的高能量密度（HED）激光实验依赖于Biermann或Weibel机制来自洽地生成感兴趣的磁场。多个HED实验已经观察到了兆高斯强度的离子尺度磁丝的形成，尽管它们的起源仍然存在争议。基于粒子模拟（PIC）的模型已经被提出用于解释磁化，包括等离子体相互渗透驱动的Weibel、温度梯度驱动的Weibel和绝热膨胀驱动的Weibel。在这里，我们进行了带有激光射线追踪模块的二维碰撞PIC模拟，以模拟等离子体的烧蚀、膨胀和随后的磁化。模拟使用平面几何结构，有效地抑制了Biermann磁场，以专注于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$之间变化，这与必须考虑碰撞的HED和ICF实验相关。我们发现，在超过临界强度的情况下，等离子体通过膨胀驱动的Weibel过程迅速自磁化，在前几百皮秒内生成等离子体$\beta$值为100（$\beta = 2k_B n_eT_e/B^2$），霍尔参数$\omega_{\rm ce}\tau_{e}>1$。还讨论了等离子体磁化对热输运的影响。

摘要

原文标题：LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
中文标题：LLaVA-MORE：LLM与视觉骨干网络在增强视觉指令调优中的对比研究
发布日期：2025-03-19 18:10:12+00:00
作者：Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
分类：cs.CV, cs.AI, cs.CL, cs.MM
原文链接：http://arxiv.org/abs/2503.15621v1

中文摘要：近年来，多模态大语言模型（MLLMs）的进展凸显了视觉骨干网络和底层语言模型的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数，但模型规模、架构和性能之间的权衡仍未得到充分探索。此外，训练数据和评估协议的不一致性阻碍了直接比较，使得难以得出最优的设计选择。在本文中，我们提出了LLaVA-MORE，这是一个新的MLLM系列，它将最新的语言模型与多样化的视觉骨干网络相结合。为了确保公平比较，我们采用了一种统一的训练协议，并一致地应用于所有架构。我们的分析系统地探索了中小规模的语言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以评估多模态推理、生成和指令跟随能力，同时研究了模型规模与性能之间的关系。除了评估语言模型对最终结果的影响外，我们还对各种视觉编码器进行了全面研究，范围从基于CLIP的架构到DINOv2、SigLIP和SigLIP2等替代方案。额外的实验研究了增加图像分辨率和预训练数据集变化的影响。总体而言，我们的结果为设计更有效的MLLM提供了见解，提供了一个可重复的评估框架，便于直接比较，并可以指导未来的模型开发。我们的源代码和训练模型公开在：https://github.com/aimagelab/LLaVA-MORE。

摘要

原文标题：Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
中文标题：可持续的基于深度学习的乳腺病变分割：乳腺区域分割对性能的影响
发布日期：2025-03-19 21:42:33+00:00
作者：Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
分类：cs.CV, physics.med-ph
原文链接：http://arxiv.org/abs/2503.15708v1

中文摘要：目的：在动态对比增强磁共振成像（DCE-MRI）中，乳腺病变的分割是准确诊断、治疗计划和进展监测的关键步骤。本研究旨在强调乳腺区域分割（BRS）对基于深度学习的乳腺病变分割（BLS）在乳腺DCE-MRI中的影响。方法：使用包含59个DCE-MRI扫描的Stavanger数据集和UNet++作为深度学习模型，进行了四种不同的处理来比较BRS对BLS的影响。这四种方法包括没有BRS的整个体积、有BRS的整个体积、有BRS的选定病变切片以及最后有BRS的最佳体积。使用了数据增强和过采样等预处理方法来增强小数据集、数据形状的一致性并提高模型性能。通过精确的过程研究了最佳体积大小，以确保所有病变都存在于切片中。为了评估模型，使用了包括Dice、Focal和交叉熵的混合损失函数以及5折交叉验证方法，最后使用随机分割的测试数据集来评估模型在未见数据上的性能，针对上述四种方法中的每一种。结果：结果表明，使用BRS显著提高了模型的性能和验证效果。与没有BRS的方法相比，最后一种方法——有BRS的最佳体积——的性能显著提高了约50%，展示了BRS在BLS中的有效性。此外，能源消耗的大幅减少，高达450%，为未来在大数据集上的工作引入了一种更环保的解决方案。

摘要

原文标题：An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
中文标题：一项广泛的模拟研究评估重采样技术在多因果发现情境中的交互作用
发布日期：2025-03-19 17:18:18+00:00
作者：Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
分类：stat.ME, cs.AI
原文链接：http://arxiv.org/abs/2503.15436v1

中文摘要：尽管探索性因果分析在现代科学和医学中的存在加速增长，但用于验证因果模型的可用非实验方法尚未得到充分表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性，类似于统计学中用于估计置信区间的重采样方法。然而，这种方法的许多方面几乎没有受到关注，例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果，证明某些重采样方法能够很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果，这些结果验证了理论结果，并提供了大量数据，以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。

WikiEdge:ArXiv速递/2025-03-19

目录

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

导航菜单

WikiEdge:ArXiv速递/2025-03-19

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

导航菜单

搜索