WikiEdge:ArXiv速递/2025-03-19
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的存在加速增长,但用于验证因果模型的可用非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大型语言模型(LLMs)中的幻觉问题,但其整体性能依赖于底层的检索系统。在金融领域,诸如10-K报告等文档由于领域特定的词汇和多层次的表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG管道,通过三个阶段(预检索、检索和后检索)来增强金融文档的检索能力。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)嵌入模型进行了微调,并实施了一种结合密集表示和稀疏表示的混合检索策略。最后,在后检索阶段,通过直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成了更准确且上下文适当的生成结果。这些发现突显了定制检索技术在提升RAG系统在金融应用中的有效性方面的关键作用。完整的可复现管道可在GitHub上获取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与从头计算相结合的研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池的有前景的负极材料。在本工作中,我们研究了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射线衍射测量表明样品具有多相特征,主要为六方Ce$_2$Ni$_7$型和菱面体Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示最大放电容量($C_{max}$)随Mg浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用全势局域轨道最小基组方案(FPLO)进行了密度泛函理论(DFT)计算。为了模拟化学无序,我们采用了相干势近似(CPA)。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱面体结构的总能量几乎相同,这与样品中两相的共存一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的相应光谱进行了解释。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克,并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合,一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的整个运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了整个运动学范围,我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案,使用在$q^2_\mathrm{max}$附近运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:ttH 产生截面的最新进展:NNLO 预测与 NNLL 重求和及电弱修正的结合
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测,这些预测是根据LHC希格斯工作组建议计算的。通过适当近似双圈虚拟贡献,我们得出了NNLO QCD预测,并补充了高达NNLL精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的NLO修正相结合,产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。
摘要
- 原文标题:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文标题:自由中子寿命实验 $τ$SPECT 的超冷中子模拟框架
- 发布日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分类:physics.ins-det, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而,目前用于测量中子寿命的两种主要技术得出了不相容的结果,这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了完全磁阱来捕获超冷中子(UCNs)。超冷中子是一种能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack,并增强了两个配套工具:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢勒研究所使用 $\tau$SPECT 获得的实验数据非常吻合,并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包(pyTTN),该包利用树张量网络(TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)波函数表示。该包包含多个功能,允许通过使用子空间扩展技术,使用具有自适应键维度的单集和多集TTN ansätze,轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现,并提供了Python绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz表示辅助密度算子空间,用于模拟层次运动方程(HEOM)方法和广义伪模式方法;此外,我们证明了这两种方法在作用于伪模式自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模式吡嗪的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括自旋-玻色子模型、一组扩展耗散自旋模型和安德森杂质模型。通过结合易用性、高效实现以及允许未来扩展的可扩展设计,pyTTN可以集成到广泛的计算建模软件中。