WikiEdge:ArXiv速递/2025-03-19
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的存在加速增长,但用于验证因果模型的可用非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大型语言模型(LLMs)中的幻觉问题,但其整体性能依赖于底层的检索系统。在金融领域,诸如10-K报告等文档由于领域特定的词汇和多层次的表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG管道,通过三个阶段(预检索、检索和后检索)来增强金融文档的检索能力。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)嵌入模型进行了微调,并实施了一种结合密集表示和稀疏表示的混合检索策略。最后,在后检索阶段,通过直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成了更准确且上下文适当的生成结果。这些发现突显了定制检索技术在提升RAG系统在金融应用中的有效性方面的关键作用。完整的可复现管道可在GitHub上获取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与从头计算相结合的研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池的有前景的负极材料。在本工作中,我们研究了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射线衍射测量表明样品具有多相特征,主要为六方Ce$_2$Ni$_7$型和菱面体Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示最大放电容量($C_{max}$)随Mg浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用全势局域轨道最小基组方案(FPLO)进行了密度泛函理论(DFT)计算。为了模拟化学无序,我们采用了相干势近似(CPA)。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱面体结构的总能量几乎相同,这与样品中两相的共存一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的相应光谱进行了解释。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克,并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合,一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的整个运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了整个运动学范围,我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案,使用在$q^2_\mathrm{max}$附近运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:ttH 产生截面的最新进展:NNLO 预测与 NNLL 重求和及电弱修正的结合
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测,这些预测是根据LHC希格斯工作组建议计算的。通过适当近似双圈虚拟贡献,我们得出了NNLO QCD预测,并补充了高达NNLL精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的NLO修正相结合,产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。
摘要
- 原文标题:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文标题:自由中子寿命实验 $τ$SPECT 的超冷中子模拟框架
- 发布日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分类:physics.ins-det, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而,目前用于测量中子寿命的两种主要技术得出了不相容的结果,这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了完全磁阱来捕获超冷中子(UCNs)。超冷中子是一种能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack,并增强了两个配套工具:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢勒研究所使用 $\tau$SPECT 获得的实验数据非常吻合,并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包(pyTTN),该包利用树张量网络(TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)波函数表示。该包包含多个功能,允许通过使用子空间扩展技术,使用具有自适应键维度的单集和多集TTN ansätze,轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现,并提供了Python绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz表示辅助密度算子空间,用于模拟层次运动方程(HEOM)方法和广义伪模式方法;此外,我们证明了这两种方法在作用于伪模式自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模式吡嗪的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括自旋-玻色子模型、一组扩展耗散自旋模型和安德森杂质模型。通过结合易用性、高效实现以及允许未来扩展的可扩展设计,pyTTN可以集成到广泛的计算建模软件中。
摘要
- 原文标题:When LLMs Meet API Documentation: Can Retrieval Augmentation Aid Code Generation Just as It Helps Developers?
- 中文标题:当大语言模型遇到API文档:检索增强能否像帮助开发者一样助力代码生成?
- 发布日期:2025-03-19 14:08:47+00:00
- 作者:Jingyi Chen, Songqiang Chen, Jialun Cao, Jiasi Shen, Shing-Chi Cheung
- 分类:cs.SE
- 原文链接:http://arxiv.org/abs/2503.15231v1
中文摘要:检索增强生成(RAG)在扩展大型语言模型(LLMs)能力方面日益显示出其强大作用,使其能够超越预训练知识的限制。现有研究表明,RAG可以帮助完成软件开发任务,如代码生成、代码更新和测试生成。然而,使用RAG将LLMs适应于快速变化或较少使用的API库的有效性仍然未知。为了填补这一空白,我们迈出了第一步,研究这一尚未探索但实际存在的场景——当开发者使用较少使用的库进行编码时,他们通常会参考其API文档;同样,当允许LLMs通过RAG查找API文档时,LLMs能在多大程度上得到提升?为了模拟这种场景,我们选择了四个较少使用的开源Python库,共包含1017个符合条件的API。我们研究了影响使用较少使用的API库文档作为检索和生成额外知识有效性的因素。我们的深入研究得出了有趣的发现:(1)RAG帮助将LLMs的性能提升了83%-220%。(2)示例代码对提升LLMs的贡献最大,而不是API文档中的描述性文本和参数列表。(3)LLMs有时可以通过参考其预训练知识或文档上下文容忍轻微的噪声(描述中的拼写错误或错误的参数)。最后,我们建议开发者更多地关注API文档中代码示例的质量和多样性。这项研究为未来的低代码软件开发工作流程提供了启示。
摘要
- 原文标题:Global Optimization of Gas Transportation and Storage: Convex Hull Characterizations and Relaxations
- 中文标题:天然气运输和存储的全局优化:凸包表征与松弛
- 发布日期:2025-03-19 12:09:12+00:00
- 作者:Bahar Cennet Okumusoglu, Burak Kocuk
- 分类:math.OC
- 原文链接:http://arxiv.org/abs/2503.15143v1
中文摘要:天然气运输和储存已成为能源系统中最相关和最重要的优化问题之一。由于气体物理特性,该问题本质上包含高度非线性和非凸的方面,以及由于主动网络元件的控制决策而导致的离散方面。为这一问题获得局部可行解或全局解对系统操作者提出了重大的数学和计算挑战。在本文中,我们通过析取将该问题表述为一个非凸混合整数非线性规划(MINLP)问题。此外,我们研究了由气体物理特性引起的非凸集,并提出了针对非凸MINLP问题的混合整数二阶锥规划松弛。所提出的松弛基于非凸集的凸包表示:我们给出了管道非凸集的凸包表示,并证明它是二阶锥可表示的。我们还完全描述了压缩机非凸集的极值点,并证明这些极值点的凸包是幂锥可表示的。对于实际应用,我们提出了压缩机非凸集的二阶锥外近似。为了获得(接近)全局最优解,我们基于凸包结果开发了一个算法框架。我们通过在各种GasLib网络上的广泛计算实验评估了我们的框架,并与文献中的凸松弛方法和最先进的全局求解器进行了比较。我们的结果突出了我们的凸松弛方法在计算效率和收敛性能方面的优势。此外,我们的方法还始终提供(接近)全局解以及高质量的局部求解器热启动点。
摘要
- 原文标题:Are "Solved Issues" in SWE-bench Really Solved Correctly? An Empirical Study
- 中文标题:SWE-bench 中的“已解决问题”真的被正确解决了吗?一项实证研究
- 发布日期:2025-03-19 14:02:21+00:00
- 作者:You Wang, Michael Pradel, Zhongxin Liu
- 分类:cs.SE
- 原文链接:http://arxiv.org/abs/2503.15223v1
中文摘要:自动问题解决旨在解决软件仓库中的实际问题。最受欢迎的自动问题解决基准是SWE-bench及其人工筛选的子集SWE-bench Verified。这些基准利用测试来验证生成的补丁。然而,由于测试很少是详尽的,补丁可能通过测试但仍未能满足开发者的期望。不幸的是,目前尚不清楚使用SWE-bench进行的评估在多大程度上受到这种看似合理但不正确的补丁的影响。本文对在SWE-bench Verified上评估的三种最先进的问题解决工具生成的看似合理的补丁的正确性进行了深入的实证研究。我们广泛测试和检查生成的补丁,并将其与人工编写的地面真实补丁进行比较。我们方法的核心是一种新颖的差分补丁测试技术PatchDiff,它自动暴露两个补丁之间的行为差异。我们的研究结果揭示了SWE-bench补丁验证机制的关键弱点,导致7.8%的补丁被计为正确,但未能通过开发者编写的测试套件。此外,我们的新颖自动化技术显示,甚至更多(29.6%)的看似合理的补丁引发了与地面真实补丁不同的行为。这些行为差异通常是由于相似但不同的实现(46.8%)以及生成的补丁适应了比地面真实补丁更多的行为(27.3%)。我们的手动检查显示,28.6%的行为差异补丁肯定是错误的。综合来看,这些不同的弱点导致报告的分辨率膨胀了6.2个百分点。我们的研究结果呼吁对问题解决工具进行更稳健和可靠的评估。我们设想我们的自动化差分补丁测试技术将对此目的有用。
摘要
- 原文标题:TULIP: Towards Unified Language-Image Pretraining
- 中文标题:TULIP:迈向统一的语言-图像预训练
- 发布日期:2025-03-19 17:58:57+00:00
- 作者:Zineng Tang, Long Lian, Seun Eisape, XuDong Wang, Roei Herzig, Adam Yala, Alane Suhr, Trevor Darrell, David M. Chan
- 分类:cs.CV, cs.AI, cs.CL, cs.LG
- 原文链接:http://arxiv.org/abs/2503.15485v1
中文摘要:尽管像CLIP和SigLIP这样的图像-文本对比模型最近取得了成功,但这些模型在处理需要高保真图像理解的视觉中心任务时往往表现不佳,例如计数、深度估计和细粒度物体识别。这些模型通过执行语言对齐,往往优先考虑高级语义而非视觉理解,从而削弱了它们的图像理解能力。另一方面,专注于视觉的模型在处理视觉信息方面表现出色,但在理解语言方面存在困难,限制了它们在语言驱动任务中的灵活性。在这项工作中,我们引入了TULIP,这是一个开源的、可直接替代现有CLIP类模型的方案。我们的方法利用生成数据增强、增强的图像-图像和文本-文本对比学习以及图像/文本重建正则化,以学习细粒度的视觉特征,同时保持全局语义对齐。我们的方法扩展到超过10亿个参数,在多个基准测试中优于现有的最先进(SOTA)模型,在ImageNet-1K上建立了新的SOTA零样本性能,在RxRx1上的少样本分类线性探测中比SigLIP提高了2倍,并改进了视觉-语言模型,在MMVP上比SigLIP提高了3倍以上的分数。我们的代码/检查点可在https://tulip-berkeley.github.io获取。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:增强视觉指令调优的LLM与视觉骨干对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:近年来,多模态大语言模型(MLLMs)的进展凸显了视觉骨干网络和底层语言模型的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但模型规模、架构和性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了LLaVA-MORE,这是一个新的MLLM系列,将最新的语言模型与多样化的视觉骨干网络相结合。为了确保公平比较,我们采用了一种统一的训练协议,并一致地应用于所有架构。我们的分析系统地探索了中小规模的语言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以评估多模态推理、生成和指令跟随能力,同时研究了模型规模与性能之间的关系。除了评估语言模型对最终结果的影响外,我们还对各种视觉编码器进行了全面研究,范围从基于CLIP的架构到DINOv2、SigLIP和SigLIP2等替代方案。额外的实验研究了增加图像分辨率和预训练数据集变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的评估框架,便于直接比较,并可以指导未来的模型开发。我们的源代码和训练模型公开在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文标题:通过\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之间的核钟跃迁频率差异
- 发布日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分类:physics.atom-ph
- 原文链接:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核钟的有力候选者,其跃迁频率受到电子诱导的核频率偏移的影响。这种效应相对较小,需要高精度的理论计算。在本工作中,我们采用了一种非微扰的多组态 Dirac-Hartree-Fock (MCDHF) 方法,与之前使用的微扰理论不同,以解决场移效应。该方法考虑了核势的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的基态和同质异能态。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的核跃迁频率差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 CaF$_2$ 中精确测量的 $^{229}\text{Th}^{4+}$ 跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的原子结构计算、核数据表中的输入核电荷半径以及文献中报告的晶体环境的影响。这为基于离子阱实验的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激发提供了有价值的指导。
摘要
- 原文标题:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文标题:可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响
- 发布日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分类:cs.CV, physics.med-ph
- 原文链接:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在动态对比增强磁共振成像(DCE-MRI)中,乳腺病变的分割是准确诊断、制定治疗计划和监测进展的关键步骤。本研究旨在强调乳腺区域分割(BRS)对基于深度学习的乳腺病变分割(BLS)在乳腺DCE-MRI中的影响。 方法:使用包含59个DCE-MRI扫描的Stavanger数据集和UNet++作为深度学习模型,进行了四种不同的处理流程,以比较BRS对BLS的影响。这四种方法包括:不使用BRS的整个体积、使用BRS的整个体积、使用BRS的选定病变切片以及使用BRS的最佳体积。通过数据增强和过采样等预处理方法来增强小数据集、统一数据形状并提高模型性能。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括Dice、Focal和交叉熵的混合损失函数以及5折交叉验证方法,最后使用随机分割的测试数据集来评估模型在未见数据上的性能,针对上述四种方法分别进行了测试。 结果:结果表明,使用BRS显著提高了模型的性能和验证效果。与不使用BRS的方法相比,最后一种方法——使用BRS的最佳体积——的性能提升了约50%,证明了BRS在BLS中的有效性。此外,能耗的大幅降低(高达450%)为未来在大数据集上的工作提供了一种更环保的解决方案。
摘要
- 原文标题:Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets
- 中文标题:使用GridRad-Severe和HRRR的超单体环境:解决先前龙卷风数据集之间的差异
- 发布日期:2025-03-19 17:44:36+00:00
- 作者:Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer
- 分类:physics.ao-ph
- 原文链接:http://arxiv.org/abs/2503.15466v1
中文摘要:风暴相对螺旋度(SRH)是超级单体发展以及中尺度气旋强度的重要成分,并且与龙卷风的生成和潜力相关。SRH源自风暴相对风廓线,由垂直风切变和风暴相对流组成。最近的研究在关于较浅或较深的SRH层在龙卷风预报中更具预测能力的问题上得出了相互矛盾的结论。这种差异的可能原因包括使用观测数据与基于模型的邻近探空数据,以及风暴相对风廓线是通过观测还是估计的风暴运动确定的。本研究使用了一个新的数据集,其中包含客观识别的超级单体及其观测到的风暴运动,并结合高分辨率模型分析,以解决先前研究中的差异。与以往基于模型的龙卷风环境数据集不同,本方法揭示了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对流、垂直风切变和SRH方面的实质性差异。使用观测到的风暴运动来计算风暴相对变量进一步放大了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对风中的差异,最终导致较深的SRH层比近地面SRH具有更高的预报能力。因此,结合更高分辨率的模型分析(更好地代表风暴附近环境)和观测到的风暴运动,似乎解释了为什么许多过去使用基于模型的环境分析的龙卷风气候学未能发现风暴相对风廓线的显著差异。这些结果有助于弥合先前使用较粗糙的基于模型的分析与从野外项目中汇总的观测探空数据之间的差距。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项广泛的模拟研究评估重采样技术在多种因果发现背景下的交互作用
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的存在加速增长,但用于验证因果模型的非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大型语言模型(LLMs)中的幻觉问题,但其整体性能依赖于底层的检索系统。在金融领域,诸如10-K报告等文档由于领域特定的词汇和多层次表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG流程,通过三个阶段(预检索、检索和后检索)来增强金融文档的检索效果。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)嵌入模型进行了微调,并实施了一种结合密集表示和稀疏表示的混合检索策略。最后,在后检索阶段,通过直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成了更准确且上下文合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现流程可在GitHub上获取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与从头算研究的结合
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池的有前景的负极材料。在本工作中,我们研究了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射线衍射测量表明样品具有多相特征,主要相为六方Ce$_2$Ni$_7$型和菱面体Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示,最大放电容量($C_{max}$)随着Mg浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用全势局域轨道最小基组方案(FPLO)进行了密度泛函理论(DFT)计算。为了模拟化学无序,我们采用了相干势近似(CPA)。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱面体结构的总能量几乎相同,这与样品中两相的共存一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的光谱进行了解释。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克,并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合,一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,我们能够在后者上达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲区域使用截断范围数据的推断。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估进入低$q^2$区域的系统不确定性。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:ttH 产生的最先进截面:NNLO 预测与 NNLL 重求和及电弱修正的结合
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测,这些预测是根据LHC希格斯工作组建议计算的。通过适当近似双圈虚拟贡献,我们得出了NNLOQCD预测,并补充了高达NNLL精度的软胶子重求和。我们采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整的NLO修正相结合,产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包(pyTTN),该包利用树张量网络(TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)方法来表示波函数。该包包含多个功能,允许通过使用子空间扩展技术,使用单集和多集TTN ansätze以及自适应键维度,轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现,并提供了Python绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz来表示辅助密度算子空间,用于模拟层次运动方程(HEOM)方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模吡嗪的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括自旋-玻色子模型、一组扩展的耗散自旋模型以及安德森杂质模型。通过结合易用性、高效实现以及可扩展设计,pyTTN可以集成到广泛的计算建模软件中。
摘要
- 原文标题:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文标题:自由中子寿命实验$τ$SPECT的超冷中子模拟框架
- 发布日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分类:physics.ins-det, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而,目前两种主要的中子寿命测量技术得出了不相容的结果,这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了全磁阱来捕获超冷中子(UCNs)。超冷中子是一种能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack,并通过两个配套工具进行了增强:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢勒研究所进行的 $\tau$SPECT 实验数据吻合良好,为识别系统不确定性和指导当前实验装置的未来改进提供了强有力的资源。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体中的一个基本挑战。自磁化可以改变等离子体的输运特性,从而影响等离子体的动力学演化。大多数关于磁重联和非磁化无碰撞冲击的高能量密度(HED)激光实验依赖于Biermann或Weibel机制来自洽地生成感兴趣的磁场。多个HED实验已经观察到了兆高斯强度的离子尺度磁丝的形成,尽管它们的起源仍然存在争议。基于粒子模拟(PIC)的模型已经被提出用于解释磁化,包括等离子体相互渗透驱动的Weibel、温度梯度驱动的Weibel和绝热膨胀驱动的Weibel。在这里,我们进行了带有激光射线追踪模块的二维碰撞PIC模拟,以模拟等离子体的烧蚀、膨胀和随后的磁化。模拟使用平面几何结构,有效地抑制了Biermann磁场,以专注于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$之间变化,这与必须考虑碰撞的HED和ICF实验相关。我们发现,在超过临界强度的情况下,等离子体通过膨胀驱动的Weibel过程迅速自磁化,在前几百皮秒内生成等离子体$\beta$值为100($\beta = 2k_B n_eT_e/B^2$),霍尔参数$\omega_{\rm ce}\tau_{e}>1$。还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:近年来,多模态大语言模型(MLLMs)的进展凸显了视觉骨干网络和底层语言模型的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但模型规模、架构和性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了LLaVA-MORE,这是一个新的MLLM系列,它将最新的语言模型与多样化的视觉骨干网络相结合。为了确保公平比较,我们采用了一种统一的训练协议,并一致地应用于所有架构。我们的分析系统地探索了中小规模的语言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以评估多模态推理、生成和指令跟随能力,同时研究了模型规模与性能之间的关系。除了评估语言模型对最终结果的影响外,我们还对各种视觉编码器进行了全面研究,范围从基于CLIP的架构到DINOv2、SigLIP和SigLIP2等替代方案。额外的实验研究了增加图像分辨率和预训练数据集变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的评估框架,便于直接比较,并可以指导未来的模型开发。我们的源代码和训练模型公开在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文标题:可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响
- 发布日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分类:cs.CV, physics.med-ph
- 原文链接:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在动态对比增强磁共振成像(DCE-MRI)中,乳腺病变的分割是准确诊断、治疗计划和进展监测的关键步骤。本研究旨在强调乳腺区域分割(BRS)对基于深度学习的乳腺病变分割(BLS)在乳腺DCE-MRI中的影响。 方法:使用包含59个DCE-MRI扫描的Stavanger数据集和UNet++作为深度学习模型,进行了四种不同的处理来比较BRS对BLS的影响。这四种方法包括没有BRS的整个体积、有BRS的整个体积、有BRS的选定病变切片以及最后有BRS的最佳体积。使用了数据增强和过采样等预处理方法来增强小数据集、数据形状的一致性并提高模型性能。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括Dice、Focal和交叉熵的混合损失函数以及5折交叉验证方法,最后使用随机分割的测试数据集来评估模型在未见数据上的性能,针对上述四种方法中的每一种。 结果:结果表明,使用BRS显著提高了模型的性能和验证效果。与没有BRS的方法相比,最后一种方法——有BRS的最佳体积——的性能显著提高了约50%,展示了BRS在BLS中的有效性。此外,能源消耗的大幅减少,高达450%,为未来在大数据集上的工作引入了一种更环保的解决方案。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项广泛的模拟研究评估重采样技术在多因果发现情境中的交互作用
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的存在加速增长,但用于验证因果模型的可用非实验方法尚未得到充分表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能够很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大型语言模型(LLMs)中的幻觉问题,但其整体性能依赖于底层的检索系统。在金融领域,诸如10-K报告等文档由于领域特定的词汇和多层次表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG管道,通过三个阶段(预检索、检索和后检索)来增强金融文档的检索效果。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)嵌入模型进行了微调,并实施了一种结合密集表示和稀疏表示的混合检索策略。最后,在后检索阶段,通过直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成了更准确且上下文更合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现管道可在GitHub上获取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La 被 Mg 取代对 La$_{2-x}$Mg$_x$Ni$_7$ 合金电化学和电子性质的影响:实验与从头计算相结合的研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池的潜在负极材料。在本研究中,我们探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射线衍射测量表明样品具有多相特征,主要相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示,最大放电容量($C_{max}$)随Mg浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用全势局域轨道最小基组方案(FPLO)进行了密度泛函理论(DFT)计算。为了模拟化学无序,我们采用了相干势近似(CPA)。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱方结构的总能量几乎相同,这与样品中两相的共存现象一致。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算的光谱进行了解释。
摘要
- 原文标题:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文标题:基于\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$核钟跃迁频率差异
- 发布日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分类:physics.atom-ph
- 原文链接:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核钟的一个有前途的候选者,其跃迁频率受到电子诱导的核频率偏移的影响。这种效应相对较小,需要高精度的理论计算。在本工作中,我们采用了一种非微扰的多组态 Dirac-Hartree-Fock (MCDHF) 方法,与之前使用的微扰理论不同,以解决场移效应。该方法考虑了核势的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的基态和异构态。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的核跃迁频率差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 CaF$_2$ 中精确测量的 $^{229}\text{Th}^{4+}$ 跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的原子结构计算、核数据表中的输入核电荷半径以及文献中报道的晶体环境的影响。这为基于离子阱实验的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激发提供了有价值的指导。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克,并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合,一个具有物理轻的上夸克和下夸克,且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲区域使用截断范围数据的推断。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:ttH 产生的最先进截面:NNLO 预测与 NNLL 重求和及电弱修正的结合
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了关于标准模型希格斯玻色子与顶夸克联合产生的最新预测,这些预测是根据LHC希格斯工作组的建议计算的。通过适当近似双圈虚拟贡献,我们得出了NNLOQCD预测,并补充了高达NNLL精度的软胶子重求和。我们采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并详细比较了它们的特点。这些结果进一步与完整的NLO修正相结合,产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关理论不确定性的来源。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包(pyTTN),该包利用树张量网络(TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)方法来表示波函数。该包包含多个功能,允许通过使用子空间扩展技术,使用单集和多集TTN ansätze自适应键维度,轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现,并提供了Python绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz表示辅助密度算子空间,用于模拟层次运动方程(HEOM)方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模吡嗪光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-[[C$_{60}$]]富勒烯受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括自旋-玻色子模型、一组扩展耗散自旋模型和安德森杂质模型。通过结合易用性、高效实现以及允许未来扩展的可扩展设计,pyTTN可以集成到广泛的计算建模软件中。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLMs 与视觉骨干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:近年来,多模态大语言模型(MLLMs)的进展凸显了视觉骨干网络和底层语言模型的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但模型规模、架构和性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了LLaVA-MORE,这是一个新的MLLM系列,它将最新的语言模型与多样化的视觉骨干网络相结合。为了确保公平比较,我们采用了一种统一的训练协议,并一致地应用于所有架构。我们的分析系统地探索了中小规模的语言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以评估多模态推理、生成和指令跟随能力,同时研究了模型规模与性能之间的关系。除了评估语言模型对最终结果的影响外,我们还对各种视觉编码器进行了全面研究,范围从基于CLIP的架构到DINOv2、SigLIP和SigLIP2等替代方案。额外的实验研究了增加图像分辨率和预训练数据集变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的评估框架,便于直接比较,并可以指导未来的模型开发。我们的源代码和训练模型公开在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文标题:可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响
- 发布日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分类:cs.CV, physics.med-ph
- 原文链接:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在动态对比增强磁共振成像(DCE-MRI)中对乳腺病变进行分割是准确诊断、制定治疗计划和监测进展的关键步骤。本研究旨在强调乳腺区域分割(BRS)对基于深度学习的乳腺病变分割(BLS)在乳腺DCE-MRI中的影响。 方法:使用包含59个DCE-MRI扫描的Stavanger数据集和UNet++作为深度学习模型,进行了四种不同的处理流程,以比较BRS对BLS的影响。这四种方法包括:不使用BRS的整个体积、使用BRS的整个体积、使用BRS的选定病变切片以及使用BRS的最佳体积。通过数据增强和过采样等预处理方法来增强小数据集、统一数据形状并提高模型性能。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括Dice、Focal和交叉熵的混合损失函数以及5折交叉验证方法,最后使用随机分割的测试数据集来评估模型在未见数据上的性能,针对上述四种方法分别进行了评估。 结果:结果表明,使用BRS显著提高了模型的性能和验证效果。与不使用BRS的方法相比,最后一种方法——使用BRS的最佳体积——的性能提升了约50%,展示了BRS在BLS中的有效性。此外,能耗的大幅降低(高达450%)为未来在大数据集上的工作提供了一种更环保的解决方案。
摘要
- 原文标题:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文标题:自由中子寿命实验$τ$SPECT的超冷中子模拟框架
- 发布日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分类:physics.ins-det, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过卡比博-小林-益川矩阵元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成后原始元素的丰度有关。然而,目前用于测量中子寿命的两种主要技术得出了不相容的结果,这种差异被称为中子寿命之谜。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了完全磁阱来捕获超冷中子(UCNs)。UCNs 是能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射它们。为了精确研究和表征 $\tau$SPECT 中 UCNs 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN 蒙特卡罗软件包 PENTrack,并通过两个配套工具进行了增强:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在保罗谢尔研究所使用 $\tau$SPECT 获得的实验数据非常吻合,并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的存在加速增长,但用于验证因果模型的非实验方法尚未得到很好的表征。最流行的方法之一是在对数据进行重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于样本大小、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大型语言模型(LLMs)中的幻觉问题,但其整体性能依赖于底层的检索系统。在金融领域,诸如10-K报告等文档由于领域特定的词汇和多层次表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG流程,通过三个阶段(预检索、检索和后检索)来增强金融文档的检索效果。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)嵌入模型进行了微调,并实施了一种结合密集表示和稀疏表示的混合检索策略。最后,在后检索阶段,通过直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成了更准确且上下文更合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现流程可在GitHub上获取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets
- 中文标题:使用GridRad-Severe和HRRR的超单体环境:解决先前龙卷风数据集之间的差异
- 发布日期:2025-03-19 17:44:36+00:00
- 作者:Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer
- 分类:physics.ao-ph
- 原文链接:http://arxiv.org/abs/2503.15466v1
中文摘要:风暴相对螺旋度(SRH)是超级单体发展以及中尺度气旋强度的重要成分,并且与龙卷风的生成和潜力相关。SRH 源自风暴相对风廓线,由垂直风切变和风暴相对气流组成。最近的研究在关于较浅或较深的 SRH 层在龙卷风预测中更具技能的问题上得出了相互矛盾的结论。这种差异的可能原因包括使用观测数据与基于模型的邻近探空数据,以及风暴相对风廓线是通过观测还是估计的风暴运动确定的。本研究使用了一个新的客观识别的超级单体数据集,结合观测到的风暴运动和高分辨率模型分析,以解决先前研究中的差异。与以往基于模型的龙卷风环境数据集不同,本方法揭示了非龙卷风超级单体与龙卷风超级单体在低至中层风暴相对气流、垂直风切变和 SRH 方面的实质性差异。使用观测到的风暴运动来计算风暴相对变量进一步放大了非龙卷风超级单体与龙卷风超级单体在低至中层风暴相对风中的差异,最终导致较深的 SRH 层比近地面的 SRH 具有更高的预测技能。因此,结合更高分辨率的模型分析(更好地代表风暴附近环境)和观测到的风暴运动,似乎解释了为什么许多过去使用基于模型的环境分析的龙卷风气候学未能发现风暴相对风廓线的显著差异。这些结果有助于弥合先前使用较粗糙的基于模型的分析与那些从野外项目中汇总观测探空数据的研究之间的差距。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La 被 Mg 取代对 La$_{2-x}$Mg$_x$Ni$_7$ 合金电化学和电子性质的影响:实验与从头计算相结合的研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池的潜在负极材料。在本研究中,我们探讨了Mg取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的电化学和电子性质的影响。采用机械合金化技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50 和 0.75)。X射线衍射测量表明样品具有多相特征,主要相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测量显示,最大放电容量($C_{max}$)随Mg浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用全势局域轨道最小基组方案(FPLO)进行了密度泛函理论(DFT)计算。为了模拟化学无序,我们采用了相干势近似(CPA)。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现La$_2$Ni$_7$的六方和菱方结构的总能量几乎相同,这与样品中两相共存的结果一致。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带。实验XPS结果基于DFT计算得到的相应光谱进行了解释。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD的格点QCD对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的交错夸克作用量处理所有价夸克,并结合第二代MILC $n_f=2+1+1$ HISQ胶子场配置。该计算包括两个额外的集合,一个具有物理轻的上夸克和下夸克,且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:ttH产生的最先进截面:NNLO预测与NNLL重求和及电弱修正的结合
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了关于标准模型希格斯玻色子与顶夸克伴随产生的最新预测,这些预测是根据LHC希格斯工作组的建议计算的。通过适当近似双圈虚贡献,我们得到了NNLOQCD预测,并补充了高达NNLL精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的NLO修正相结合,产生了迄今为止对该过程最精确的标准模型预测。我们全面估计并讨论了相关的理论不确定性来源。
摘要
- 原文标题:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文标题:通过\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之间的核钟跃迁频率差异
- 发布日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分类:physics.atom-ph
- 原文链接:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核钟的一个有前途的候选者,其跃迁频率受到电子诱导的核频率偏移的影响。这种效应相对较小,需要高精度的理论计算。在本工作中,我们采用了一种非微扰的多组态 Dirac-Hartree-Fock (MCDHF) 方法,与之前使用的微扰理论不同,以解决场移效应。该方法考虑了核势的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的基态和异构态。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的核跃迁频率差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 CaF$_2$ 中测量的 $^{229}\text{Th}^{4+}$ 的精确跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的原子结构计算、核数据表中的输入核电荷半径以及文献中报道的晶体环境的影响。这为基于离子阱实验的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激发提供了有价值的指导。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体中的一个基本挑战。自磁化可以改变等离子体的输运特性,从而影响等离子体的动力学演化。大多数关于磁重联和非磁化无碰撞冲击的高能量密度(HED)激光实验依赖于Biermann或Weibel机制来自洽地生成感兴趣的磁场。多个HED实验已经观察到了兆高斯强度的离子尺度磁丝的形成,尽管它们的起源仍然存在争议。基于粒子网格(PIC)模拟的模型已经被提出以解释磁化现象,包括等离子体相互渗透驱动的Weibel、温度梯度驱动的Weibel和绝热膨胀驱动的Weibel。在这里,我们进行了带有激光射线追踪模块的二维碰撞PIC模拟,以模拟等离子体的烧蚀、膨胀和随后的磁化。模拟使用平面几何结构,有效地抑制了Biermann磁场,以专注于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$之间变化,这与需要考虑碰撞的HED和ICF实验相关。我们发现,在超过临界强度的情况下,等离子体通过膨胀驱动的Weibel过程迅速自磁化,在最初的几百皮秒内生成等离子体$\beta$值为100($\beta = 2k_B n_eT_e/B^2$),霍尔参数$\omega_{\rm ce}\tau_{e}>1$。还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们介绍了用于评估封闭和开放量子系统动力学特性的Python树张量网络包(pyTTN),该包利用树张量网络(TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)方法来表示波函数。该包包含多个功能,允许通过使用子空间扩展技术,使用单集和多集TTN ansätze以及自适应键维度,轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均在C++中实现,并提供了Python绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz来表示辅助密度算子空间,用于模拟层次运动方程(HEOM)方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一系列应用,从广泛使用的24模吡嗪的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括自旋-玻色子模型、一组扩展的耗散自旋模型以及安德森杂质模型。通过结合易用性、高效实现以及可扩展设计,pyTTN可以集成到广泛的计算建模软件中。
摘要
- 原文标题:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文标题:可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物
- 发布日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分类:eess.IV, cs.AI, cs.CE, cs.CV
- 原文链接:http://arxiv.org/abs/2503.16556v1
中文摘要:摘要:癌症恶病质是一种常见的代谢紊乱疾病,其特征是严重的肌肉萎缩,与不良预后和生活质量相关。通过计算机断层扫描(CT)纵向监测骨骼肌面积(SMA)——这种在癌症护理中常规获取的成像方式,是识别和跟踪该病症的有效方法。然而,现有工具往往缺乏全自动化且准确性不一致,限制了其融入临床工作流程的潜力。为解决这些问题,我们开发了SMAART-AI(基于AI的骨骼肌评估-自动化可靠工具),这是一个由深度学习模型(nnU-Net 2D)驱动的端到端自动化流程,该模型在腰椎中段三分之一的CT图像上通过5折交叉验证训练,确保泛化性和鲁棒性。SMAART-AI整合了基于不确定性的机制,用于标记高误差的SMA预测以供专家审查,从而增强可靠性。我们结合SMA、骨骼肌指数、BMI和临床数据,训练了一个多层感知器(MLP)模型,旨在预测癌症诊断时的恶病质。在胃食管癌数据集上测试时,SMAART-AI的Dice分数达到97.80% ± 0.93%,与使用SliceOmatic手动标注相比,本研究所有四个数据集的SMA估计中位绝对误差为2.48%。不确定性指标——方差、熵和变异系数——与SMA预测误差高度相关(分别为0.83、0.76和0.73)。MLP模型预测恶病质的精确度为79%,为临床医生提供了早期诊断和干预的可靠工具。通过结合自动化、准确性和不确定性意识,SMAART-AI弥合了研究与临床应用之间的差距,为管理癌症恶病质提供了一种变革性方法。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:多模态大语言模型(MLLMs)的最新进展凸显了视觉主干网络与底层语言模型的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿参数规模,但模型尺寸、架构与性能之间的权衡关系仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出LLaVA-MORE——一个整合最新语言模型与多样化视觉主干的新型MLLMs家族。为确保公平比较,我们采用统一训练协议并全程应用于所有架构。通过系统分析中小规模语言模型(包括Phi-4、LLaMA-3.1和Gemma-2),我们评估了多模态推理、生成及指令跟随能力,同时探究模型规模与性能的关系。除评估语言模型对最终结果的影响外,我们还全面研究了从CLIP架构到DINOv2、SigLIP及SigLIP2等多种视觉编码器。额外实验探讨了提高图像分辨率与预训练数据集变化的影响。总体而言,我们的研究结果为设计更高效的MLLMs提供了洞见,建立了一个可复现的评估框架,该框架既能支持直接比较,也可指导未来模型开发。源代码与训练模型已公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档检索能力:预检索阶段采用多种查询与语料库预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征结合的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文标题:改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子
- 发布日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分类:hep-lat, hep-ph
- 原文链接:http://arxiv.org/abs/2503.15090v1
中文摘要:我们更新了HPQCD团队对$B_c\to J/\psi$矢量与轴矢量形状因子的格点QCD计算结果,并首次给出了张量形状因子的新结果。研究中所有价夸克均采用高度改进的交错夸克作用量,配合第二代MILC $n_f=2+1+1$ HISQ胶子场构型。本次计算新增了两个系综:一个包含物理轻度的上下夸克且晶格间距$a\approx 0.06 \mathrm{fm}$,另一个晶格间距$a\approx 0.03\mathrm{fm}$的系综使我们能够达到物理底夸克质量。计算采用非微扰重整化的流算子,覆盖了衰变的完整运动学范围。我们运用最新获得的以$u=m_c/m_h$为变量的重-粲磁化率结果,在物理连续外推中实现了$B_c\to J/\psi$的完全色散参数化。更新后的标准模型预言值为:$R(J/\psi)=0.2597(27)$、$A_{\lambda_\tau}=0.5093(42)$、$F_L^{J/\psi}=0.4421(55)$和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,不确定度分别降低29%、45%、40%和50%。由于格点形状因子覆盖完整运动学范围,我们可用其检验仅基于低反冲区截断数据的传统外推方法。通过比较不同物理连续参数化方案(仅采用$q^2_\mathrm{max}$附近前1/3运动学范围的格点数据),发现当高$q^2$区合成数据的外推过程忽略高阶运动学项时,$q^2=0$附近可能出现意料之外的大系统误差。这表明在相关$B\to D^*\ell\bar{\nu}$衰变过程中,从高$q^2$区向低$q^2$区外推格点QCD合成数据时,可能存在被低估的系统误差。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用全势局域轨道最小基组(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复和电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们针对标准模型希格斯玻色子与顶夸克的联合产生过程,提出了符合LHC希格斯工作组建议的最新理论预测。通过适当近似双圈虚部贡献,我们获得了次次领头阶(NNLO)量子色动力学预测,并进一步补充了达到次次领头对数(NNLL)精度的软胶子重求和。研究采用了两套不同的重求和框架——基于直接QCD的方法和软共线有效理论方法——并对二者的特性进行了详细比较。这些结果还与完整次领头阶修正相结合,产生了迄今为止该过程最精确的标准模型预测。我们对相关理论不确定性来源进行了全面评估与讨论。
摘要
- 原文标题:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文标题:自由中子寿命实验τSPECT的超冷中子模拟框架
- 发布日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分类:physics.ins-det, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子寿命的精确测定在现代精密物理学中具有重要意义。该关键观测量与夸克混合通过卡比博-小林-益川矩阵元$V_{ud}$相关联,并影响大爆炸核合成后原始元素的丰度。然而,当前两种主要的中子寿命测量技术得出了不相容的结果,这一差异被称为中子寿命之谜。为解决中子与物质壁相互作用引起的系统不确定性,$\tau$SPECT实验采用了全磁阱技术来约束超冷中子(UCNs)。超冷中子是指典型速度低于$8\,\textrm{m/s}$的极低能中子,可通过磁场、重力及特殊材料导引管进行操控——这些导引管表面能在任意入射角实现全反射。为精确研究和表征$\tau$SPECT中UCN在产生、导引、存储及探测过程中的行为,我们开发了专用模拟框架。该框架基于外部开发的UCN蒙特卡洛方法软件包PENTrack,并强化了两个配套工具:一是用于PENTrack灵活可参数化的上游配置,使模拟输入设置可调整以复现实验观测;二是用于分析、可视化和动态呈现模拟数据的软件包。模拟结果与保罗谢勒研究所$\tau$SPECT实验数据高度吻合,为识别系统不确定性和指导现有实验装置改进提供了有力工具。
摘要
- 原文标题:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文标题:基于\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$与$^{229}$Th$^{4+}$核钟跃迁频率差
- 发布日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分类:physics.atom-ph
- 原文链接:http://arxiv.org/abs/2503.15061v1
中文摘要:摘要:[[$^{229}\text{Th}$]]同位素是核钟的潜在候选者,其跃迁频率受电子诱导的核频移影响。该效应相对较小,需要高精度的理论计算。本研究采用非微扰的多组态Dirac-Hartree-Fock(MCDHF)方法(区别于先前使用的微扰理论)来解析场移效应。该方法在考虑[[$^{229}\text{Th}$]]同位素基态和同核异能态的同时,计及核势能的细微差异。最终测得[[$^{229}\text{Th}^{3+}$]]与[[$^{229}\text{Th}^{4+}$]]的核跃迁频率差为$-639$~MHz,计算收敛精度达1~MHz。基于近期对CaF$_2$中[[$^{229}\text{Th}^{4+}$]]跃迁频率的精密测量结果[Nature 633, 63 (2024)],预测孤立[[$^{229}\text{Th}^{3+}$]]的跃迁频率为$2,020,406,745 (1)_\text{计算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~MHz,括号内分别表示原子结构计算、核数据表输入的核电荷半径以及文献报道的晶体环境影响的误差来源。该结果为基于离子阱实验直接激光激发孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指导。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:膨胀高能量密度等离子体中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体研究中的基本挑战之一。自磁化能够改变等离子体的输运特性,从而影响其动力学演化过程。目前大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验,都依赖比耶曼机制或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存在争议。已有研究提出基于粒子网格(PIC)模拟的磁化解释模型,包括等离子体相互渗透驱动的魏贝尔机制、温度梯度驱动的魏贝尔机制以及绝热膨胀驱动的魏贝尔机制。本研究采用二维碰撞PIC模拟结合激光光线追踪模块,模拟了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑碰撞效应的HED和ICF实验相关),研究发现:超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内产生霍尔参数$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)的强磁场。研究还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们推出Python树张量网络计算包(pyTTN),用于评估封闭和开放量子系统的动力学特性。该工具包采用树张量网络(TTN)或等效的多层多组态含时Hartree(ML-MCTDH)波函数表示方法,具有以下特点:通过子空间扩展技术实现自适应键维度,支持使用单组和多组TTN拟设轻松设置一般哈密顿量的零温和有限温度计算。所有核心功能均以C++实现并配有Python接口以简化使用。除核心功能外,pyTTN还提供多种工具来高效模拟开放量子系统动力学,包括采用TTN拟设表示辅助密度算子空间以模拟层次运动方程(HEOM)方法和广义赝模方法;我们进一步证明这两种方法在作用于赝模自由度的非幺正正则模变换下是等价的。通过三个应用案例展示该工具包的性能:首先以24模吡嗪的光激发动力学作为基准测试,随后研究描述n-寡聚噻吩供体-C60富勒烯受体系统界面激子动力学的更具挑战性模型,最后应用于开放量子系统(包括自旋-玻色模型、扩展耗散自旋模型集和安德森杂质模型)。pyTTN兼具易用性、高效实现和可扩展设计,能与多种计算建模软件集成。
摘要
- 原文标题:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文标题:可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物
- 发布日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分类:eess.IV, cs.AI, cs.CE, cs.CV
- 原文链接:http://arxiv.org/abs/2503.16556v1
中文摘要:癌症恶病质是一种常见的代谢紊乱疾病,其特征为严重肌肉萎缩,与不良预后及生活质量下降密切相关。通过计算机断层扫描(CT)纵向监测骨骼肌面积(SMA)——这种在癌症诊疗中常规获取的影像模式——是识别和追踪该病症的有效方法。然而现有工具常缺乏全自动化且准确性不稳定,限制了其融入临床工作流程的潜力。为解决这些问题,我们开发了SMAART-AI(基于AI的骨骼肌评估自动化可靠工具),这是一个由深度学习模型(nnU-Net 2D)驱动的端到端自动化流程,模型通过五折交叉验证在第三腰椎中部CT图像上训练,确保泛化性和鲁棒性。SMAART-AI整合了基于不确定性的机制,可标记高误差SMA预测以供专家复核,从而提升可靠性。我们联合SMA、骨骼肌指数、BMI和临床数据训练了多层感知机(MLP)模型,用于预测癌症确诊时的恶病质状态。在胃食管癌数据集测试中,SMAART-AI的Dice分数达97.80%±0.93%,与SliceOmatic手动标注相比,本研究所有数据集的SMA估计中位绝对误差为2.48%。不确定性指标(方差、熵和变异系数)与SMA预测误差呈强相关性(分别为0.83、0.76和0.73)。MLP模型预测恶病质的精确度达79%,为临床医生提供了早期诊断和干预的可靠工具。通过融合自动化、准确性和不确定性感知,SMAART-AI弥合了研究与临床应用间的鸿沟,为癌症恶病质管理提供了变革性方案。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:多模态大语言模型(MLLM)的最新进展凸显了视觉主干网络与底层语言模型的关键作用。尽管先前研究主要聚焦于将模型参数量扩展至数十亿规模,但模型尺寸、架构与性能之间的权衡关系仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出LLaVA-MORE系列模型,通过整合最新语言模型与多样化视觉主干构建新型MLLM。为确保公平比较,我们采用统一的训练协议并应用于所有架构。我们的分析系统考察了中小规模语言模型(包括Phi-4、LLaMA-3.1和Gemma-2)在多模态推理、生成及指令跟随方面的表现,同时探究模型规模与性能的关系。除评估语言模型对最终结果的影响外,我们还对CLIP架构及DINOv2、SigLIP、SigLIP2等替代视觉编码器展开全面研究。额外实验探讨了提升图像分辨率及预训练数据集变化的影响。总体而言,本研究为设计更高效的MLLM提供了见解,建立了一个可复现的评估框架,该框架支持直接比较并能指导未来模型开发。源代码与训练模型已公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少受到关注。我们提出了理论结果,证明某些重采样方法能精确模拟特定算法参数的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果不仅验证了理论发现,更为研究者提供了丰富数据以进一步表征因果发现分析中的重采样特性。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLM)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。预检索阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调最先进的嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射测试表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克伴随产生的最新理论预测,该计算严格遵循LHC希格斯工作组的技术规范。通过双圈虚拟贡献的适当近似,我们获得了次次领头阶(NNLO)量子色动力学预测,并进一步结合了软胶子重求和至次次领头对数(NNLL)精度。研究采用了两套不同的重求和框架——基于直接QCD方法和软共线有效理论——并对二者的特性进行了详细比较。这些结果还与完全次领头阶(NLO)修正相结合,最终给出了该物理过程迄今最精确的标准模型理论预测。我们对相关理论不确定性来源进行了全面评估与讨论。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体中的基本挑战之一。自磁化会改变等离子体的输运特性,从而影响其动力学演化。大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验都依赖比耶曼或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存在争议。已有研究提出基于粒子网格(PIC)模拟的模型来解释磁化现象,包括等离子体相互渗透驱动的魏贝尔不稳定性、温度梯度驱动的魏贝尔不稳定性以及绝热膨胀驱动的魏贝尔不稳定性。本文采用二维碰撞PIC模拟结合激光光线追踪模块,模拟了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何结构以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化,该强度区间需考虑碰撞效应的HED和ICF实验相关。研究发现,超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内产生等离子体β值达100($\beta = 2k_B n_eT_e/B^2$)且霍尔参数$\omega_{\rm ce}\tau_{e}>1$。文中还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们推出Python树张量网络软件包(pyTTN),用于评估封闭和开放量子系统的动力学特性。该工具基于树张量网络(TTN)或等效的多层多组态含时Hartree(ML-MCTDH)波函数表示方法。该软件包具有多项特性:支持通过子空间扩展技术,采用自适应键维度的单/多组TTN拟设,便捷设置任意哈密顿量的零温/有限温度计算。所有核心功能均以C++实现,并提供Python接口以简化使用。除核心功能外,pyTTN还提供多种工具来高效模拟开放量子系统动力学,包括:采用TTN拟设表示辅助密度算子空间以模拟层次运动方程(HEOM)方法和广义赝模方法;我们证明这两种方法通过作用于赝模自由度的非幺正简正模变换可相互转化。通过系列应用案例展示软件性能:从24模吡嗪光激发动力学的基准测试出发,进而研究更复杂的n-寡聚噻吩供体-C60富勒烯受体界面激子动力学模型,最后应用于开放量子系统(包括自旋-玻色模型、扩展耗散自旋模型及安德森杂质模型)。pyTTN兼具易用性、高效实现和可扩展架构,能与多种计算建模软件集成。
摘要
- 原文标题:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文标题:基于自洽场理论的$^{229}$Th$^{3+}$与$^{229}$Th$^{4+}$核钟跃迁频率差预测
- 发布日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分类:physics.atom-ph
- 原文链接:http://arxiv.org/abs/2503.15061v1
中文摘要:摘要:[[$^{229}\text{Th}$]]同位素是核钟的潜在候选者,其跃迁频率受电子诱导的核频移影响。该效应相对较小,需要高精度理论计算。本研究采用非微扰的多组态Dirac-Hartree-Fock(MCDHF)方法(区别于先前使用的微扰理论)来解析场移效应。该方法在考虑[[$^{229}\text{Th}$]]同位素基态和同核异能态的同时,计及核势能的细微差异。最终测得[[$^{229}\text{Th}^{3+}$]]与[[$^{229}\text{Th}^{4+}$]]的核跃迁频率差为$-639$~MHz,计算收敛精度达1~MHz。基于近期对CaF$_2$中[[$^{229}\text{Th}^{4+}$]]跃迁频率的精密测量结果[Nature 633, 63 (2024)],预测孤立[[$^{229}\text{Th}^{3+}$]]的跃迁频率为$2,020,406,745 (1)_\text{计算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~MHz,括号内分别表示原子结构计算、核数据表输入的核电荷半径误差以及文献报道的晶体环境影响。该结果为基于离子阱实验直接激光激发孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指导。
摘要
- 原文标题:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文标题:可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物
- 发布日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分类:eess.IV, cs.AI, cs.CE, cs.CV
- 原文链接:http://arxiv.org/abs/2503.16556v1
中文摘要:癌症恶病质是一种常见的代谢紊乱疾病,其特征为严重的肌肉萎缩,与不良预后和生活质量相关。通过计算机断层扫描(CT)纵向监测骨骼肌面积(SMA)——这种在癌症护理中常规获取的成像模式——是识别和追踪该病症的有效方法。然而,现有工具往往缺乏全自动化且准确性不一致,限制了其融入临床工作流程的潜力。为解决这些问题,我们开发了SMAART-AI(基于AI的骨骼肌评估-自动化可靠工具),这是一个由深度学习模型(nnU-Net 2D)驱动的端到端自动化流程,该模型在腰椎中段三分之一的CT图像上通过5折交叉验证训练,确保泛化性和鲁棒性。SMAART-AI整合了基于不确定性的机制,用于标记高误差的SMA预测以供专家审查,从而增强可靠性。我们结合SMA、骨骼肌指数、BMI和临床数据,训练了一个多层感知器(MLP)模型,旨在预测癌症诊断时的恶病质。在胃食管癌数据集上测试时,SMAART-AI的Dice分数达到97.80% ± 0.93%,与使用SliceOmatic手动标注相比,本研究所有四个数据集的SMA估计中位绝对误差为2.48%。不确定性指标——方差、熵和变异系数——与SMA预测误差高度相关(分别为0.83、0.76和0.73)。MLP模型预测恶病质的精确度为79%,为临床医生提供了早期诊断和干预的可靠工具。通过结合自动化、准确性和不确定性感知,SMAART-AI弥合了研究与临床应用之间的差距,为管理癌症恶病质提供了一种变革性方法。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:增强视觉指令调优的LLM与视觉骨干网络对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:摘要:多模态大语言模型(MLLMs)的最新进展凸显了视觉主干网络与底层语言模型的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿参数规模,但模型大小、架构与性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出LLaVA-MORE——一个融合最新语言模型与多样化视觉主干的新型MLLM家族。为确保公平比较,我们采用统一训练协议并一致应用于所有架构。我们的分析系统探索了中小规模LLM(包括Phi-4、LLaMA-3.1和Gemma-2)在多模态推理、生成及指令跟随方面的表现,同时研究模型规模与性能的关系。除评估LLM对最终结果的影响外,我们还全面研究了从CLIP架构到DINOv2、SigLIP及SigLIP2等替代方案的各类视觉编码器。额外实验探究了提高图像分辨率和预训练数据集变化的影响。总体而言,研究结果为设计更高效的MLLM提供了洞见,并建立了可复现的评估框架以支持直接比较,为未来模型开发提供指导。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:跨多种因果发现场景的重采样技术交互评估的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段运用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:顶夸克对与希格斯玻色子联合产生的最先进截面:NNLO预测结合NNLL恢复及电弱修正
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克伴随产生的最新理论预测,该计算遵循LHC希格斯工作组建议的规范。通过适当近似双圈虚贡献得到的NNLOQCD预测,进一步补充了NNLL精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接QCD方法,另一种基于软共线有效理论——并详细比较了它们的特性。这些结果还与完整NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。文中对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时以其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:膨胀高能量密度等离子体中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体中的基本挑战之一。自磁化会改变等离子体的输运特性,从而影响其动力学演化。大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验依赖于比耶曼或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存在争议。已有研究提出基于粒子网格(PIC)模拟的模型来解释磁化现象,包括等离子体相互渗透驱动的魏贝尔不稳定性、温度梯度驱动的魏贝尔不稳定性以及绝热膨胀驱动的魏贝尔不稳定性。本文通过结合激光光线追踪模块的二维碰撞PIC模拟,研究了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化,该参数范围与需要考虑碰撞效应的HED和ICF实验相关。研究发现,当超过临界强度时,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内产生霍尔参数$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)的强磁化状态。文中还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文标题:pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱
- 发布日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分类:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.15460v1
中文摘要:我们推出Python树张量网络软件包(pyTTN),用于评估封闭和开放量子系统的动力学特性。该工具基于树张量网络(TTN)或等效的多层多组态含时Hartree(ML-MCTDH)波函数表示方法。该软件包具备多项功能:支持通过子空间扩展技术实现自适应键维度的单/多组TTN拟设,可便捷设置一般哈密顿量的零温/有限温度计算。所有核心功能均采用C++实现,并提供Python接口以简化使用。除核心功能外,pyTTN还提供开放量子系统动力学模拟工具,包括采用TTN拟设表示辅助密度算子空间以模拟层次运动方程(HEOM)方法和广义赝模方法,并证明这两种方法通过作用于赝模自由度的非幺正简正模变换可相互转化。我们展示了该软件包的应用案例:从24模吡嗪光激发动力学的基准测试出发,进而研究描述n-寡聚噻吩供体-C60富勒烯受体体系界面激子动力学的更具挑战性模型,最后应用于开放量子系统(包括自旋-玻色模型、扩展耗散自旋模型集和安德森杂质模型)。pyTTN兼具易用性、高效实现和可扩展设计,能与各类计算建模软件集成。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:多模态大语言模型(MLLMs)的最新进展凸显了视觉主干网络与底层语言模型的关键作用。尽管先前研究主要关注将这些组件扩展至数十亿参数规模,但模型大小、架构与性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计选择。本文提出LLaVA-MORE——一个整合最新语言模型与多样化视觉主干的新型MLLM家族。为确保公平比较,我们采用统一训练协议并严格应用于所有架构。通过系统分析中小规模LLM(包括Phi-4、LLaMA-3.1和Gemma-2),我们评估多模态推理、生成与指令跟随能力,同时探究模型规模与性能的关系。除评估LLM对最终结果的影响外,我们还对各类视觉编码器(从CLIP架构到DINOv2、SigLIP及SigLIP2等替代方案)展开全面研究。额外实验探究了提高图像分辨率与预训练数据集变化的影响。总体而言,我们的研究结果为设计更高效的MLLM提供了洞见,建立了一个可复现的评估框架,该框架既能支持直接比较,也可指导未来模型开发。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学与医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少或从未被关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。此外,我们报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLM)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力:在检索前阶段采用多种查询与语料库预处理技术来丰富输入数据;检索中阶段通过领域知识微调最先进的嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克联合产生的最新理论预测,该计算遵循LHC希格斯工作组建议的规范。通过适当近似双圈虚贡献得到的NNLOQCD预测,进一步补充了NNLL精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接QCD方法,另一种基于软共线有效理论——并对二者的特性进行了详细比较。这些结果还与完全NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。文中对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射测试表明样品呈多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究辅以采用全势局域轨道最小基组(FPLO)方案的第一性原理计算,通过相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现六方与菱方La$_2$Ni$_7$结构的总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体研究中的基础性挑战。自磁化会改变等离子体的输运特性,从而影响其动力学演化过程。目前大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验,都依赖比耶曼机制或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存争议。基于粒子网格(PIC)模拟的模型被提出用于解释磁化现象,包括等离子体互穿驱动的魏贝尔机制、温度梯度驱动的魏贝尔机制以及绝热膨胀驱动的魏贝尔机制。本研究采用二维碰撞PIC模拟结合激光光线追踪模块,模拟了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑碰撞效应的HED和ICF实验相关)。研究发现:超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内产生霍尔参数$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)。研究还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉现象的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密与稀疏表征结合的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射分析表明样品具有多相特征,其中主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,为模拟化学无序性使用了相干势近似(CPA)。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱线进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克联合产生的最新理论预测,该计算严格遵循LHC希格斯工作组的技术规范。通过适当近似双圈虚贡献导出的NNLOQCD预测,进一步补充了NNLL精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接QCD方法,另一种基于软共线有效理论——并详细比较了它们的特性。这些结果还与完整的NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。文中对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:多模态大语言模型(MLLMs)的最新进展凸显了视觉主干网络和底层语言模型的关键作用。尽管先前研究主要集中于将这些组件扩展至数十亿参数规模,但模型大小、架构与性能之间的权衡仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出LLaVA-MORE——一个整合最新语言模型与多样化视觉主干的新型MLLM家族。为确保公平比较,我们采用统一训练协议并应用于所有架构。我们的分析系统探索了中小规模LLM(包括Phi-4、LLaMA-3.1和Gemma-2)在多模态推理、生成及指令跟随方面的表现,同时研究模型规模与性能的关系。除评估LLM对最终结果的影响外,我们还全面研究了从CLIP架构到DINOv2、SigLIP和SigLIP2等替代方案的各类视觉编码器。额外实验探究了提高图像分辨率及预训练数据集变化的影响。总体而言,研究结果为设计更高效的MLLM提供了洞见,并建立了可复现的评估框架,该框架既能支持直接比较,也可指导未来模型开发。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:膨胀高能量密度等离子体中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体研究中的基础性挑战。自磁化会改变等离子体的输运特性,从而影响其动力学演化过程。目前大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验,都依赖比耶曼机制或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存争议。已有研究提出基于粒子网格(PIC)模拟的磁化解释模型,包括等离子体互穿驱动的魏贝尔机制、温度梯度驱动的魏贝尔机制以及绝热膨胀驱动的魏贝尔机制。本研究通过结合激光光线追踪模块的二维碰撞PIC模拟,再现了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内调节(该参数范围需考虑碰撞效应的HED和ICF实验相关),研究发现:超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初数百皮秒内即可产生等离子体β值达100($\beta = 2k_B n_eT_e/B^2$)且霍尔参数$\omega_{\rm ce}\tau_{e}>1$的状态。研究还探讨了等离子体磁化对热输运的影响。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多因果发现背景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调最先进(SOTA)嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子特性的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到最高值304 mAh/g。实验工作辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们针对标准模型 希格斯玻色子与顶夸克的伴随产生过程,提出了符合LHC 希格斯工作组建议的最新理论预测。通过适当近似双圈虚贡献获得的NNLO QCD预测,补充了NNLL精度的软胶子重求和。研究采用两种不同的重求和框架——基于直接QCD方法和软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。我们对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文标题:LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究
- 发布日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分类:cs.CV, cs.AI, cs.CL, cs.MM
- 原文链接:http://arxiv.org/abs/2503.15621v1
中文摘要:多模态大语言模型(MLLMs)的最新进展凸显了视觉主干网络与底层语言模型的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿参数规模,但模型大小、架构与性能之间的权衡关系仍未得到充分探索。此外,训练数据和评估协议的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出LLaVA-MORE——一个整合最新语言模型与多样化视觉主干的新型MLLM家族。为确保公平比较,我们在所有架构中采用统一的训练协议。通过系统分析中小规模LLM(包括Phi-4、LLaMA-3.1和Gemma-2),我们评估了多模态推理、生成与指令跟随能力,同时探究模型规模与性能的关系。除评估LLM对最终结果的影响外,我们还对CLIP架构及DINOv2、SigLIP、SigLIP2等替代视觉编码器展开全面研究。额外实验探讨了提高图像分辨率和预训练数据集变化的影响。总体而言,我们的研究结果为设计更高效的MLLM提供了洞见,并建立了可复现的评估框架,该框架既能支持直接比较,也可指导未来模型开发。源代码与训练模型已公开于:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体研究中的基础性挑战。自磁化会改变等离子体的输运特性,从而影响其动力学演化过程。目前大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验,都依赖比耶曼机制或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存争议。基于粒子网格(PIC)模拟的模型被提出用于解释磁化现象,包括等离子体互穿驱动的魏贝尔效应、温度梯度驱动的魏贝尔效应以及绝热膨胀驱动的魏贝尔效应。本研究采用二维碰撞PIC模拟结合激光光线追踪模块,模拟了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑碰撞效应的HED和ICF实验相关)。研究发现:超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内产生霍尔参数$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)。研究还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:跨多种因果发现场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟特定算法参数的赋值过程。此外,我们报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力。检索前阶段采用多种查询与语料库预处理技术来丰富输入数据;检索中阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克伴随产生的最新理论预测,该计算遵循LHC希格斯工作组的建议。通过适当近似双圈虚贡献,我们获得了NNLOQCD预测,并补充了NNLL精度的软胶子重求和。研究采用了两种不同的重求和框架——一种基于直接QCD方法,另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。我们对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文标题:高能量密度等离子体膨胀中的自磁化模拟
- 发布日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分类:physics.plasm-ph
- 原文链接:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等离子体自磁化是实验室和天体物理等离子体研究中的基础性挑战。自磁化会改变等离子体输运特性,从而影响其动力学演化过程。目前大多数关于磁重联和无磁化无碰撞激波的高能量密度(HED)激光实验,都依赖比耶曼机制或魏贝尔机制来自洽地产生目标磁场。多项HED实验已观测到兆高斯强度的离子尺度磁丝形成,但其起源仍存争议。已有研究提出基于粒子网格(PIC)模拟的磁化解释模型,包括等离子体互穿驱动的魏贝尔机制、温度梯度驱动的魏贝尔机制以及绝热膨胀驱动的魏贝尔机制。本研究通过结合激光射线追踪模块的二维碰撞PIC模拟,再现了等离子体烧蚀、膨胀及后续磁化过程。模拟采用平面几何构型以有效抑制比耶曼磁场,从而聚焦于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内调节(该参数范围需考虑碰撞效应的HED和ICF实验相关),研究发现:超过临界强度后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百皮秒内即产生霍尔参数$\omega_{\rm ce}\tau_{e}>1$、等离子体β值达100($\beta = 2k_B n_eT_e/B^2$)的强磁场。研究还讨论了等离子体磁化对热输运的影响。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但目前用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)几乎未受关注。我们提出的理论结果证明,某些重采样方法能高度模拟特定算法参数的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果既验证了理论结论,也为研究人员进一步表征因果发现分析中的重采样特性提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。预检索阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调前沿(SOTA)嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们提出了标准模型希格斯玻色子与顶夸克伴随产生的最新理论预测,该计算遵循LHC希格斯工作组的建议。通过适当近似双圈虚贡献得到的NNLOQCD预测,补充了NNLL精度的软胶子重求和。研究采用了两种不同的重求和框架——一种基于直接QCD,另一种基于软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整NLO修正相结合,产生了迄今为止该过程最精确的标准模型预测。我们对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出了理论结果,证明某些重采样方法能精确模拟特定算法参数的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调最先进(SOTA)嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子特性的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型结构的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到304 mAh/g的最高值。实验研究辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文标题:顶夸克-希格斯玻色子联合产生的前沿截面:NNLO匹配NNLL恢复与电弱修正的预测
- 发布日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分类:hep-ph, hep-ex
- 原文链接:http://arxiv.org/abs/2503.15043v1
中文摘要:我们根据LHC希格斯工作组建议,提出了标准模型希格斯玻色子与顶夸克联合产生的最新理论预测。通过适当近似双圈虚贡献,我们获得了次次领头阶(NNLO)量子色动力学预测,并补充了直至次次领头对数(NNLL)精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接量子色动力学,另一种基于软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整次领头阶修正相结合,产生了迄今为止该过程最精确的标准模型预测。我们对相关理论不确定性来源进行了全面评估和讨论。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法与调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程详见GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探究了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性质的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品具有多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多重因果发现情境下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分研究。其中最流行的方法是通过数据重采样来评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)却鲜少受到关注。我们提出了理论结果,证明某些重采样方法能高度模拟对算法调参赋予特定值的过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一个高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;检索后阶段运用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探究了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性质的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。 实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算。为模拟化学无序态,采用相干势近似(CPA)方法,重点分析了实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。计算发现La$_2$Ni$_7$的六方与菱方结构总能量近乎相同,这与样品中两相共存现象吻合。Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好计算值也与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性质的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算获得的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉现象的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方案显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。预检索阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调最先进的嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能精确模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉现象的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探究了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验工作辅以采用全势局域轨道最小基组(FPLO)的密度泛函理论(DFT)计算,为模拟化学无序性使用了相干势近似(CPA)。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带,实验XPS谱基于DFT计算对应的谱图进行解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:金融问答文档检索增强生成系统中的检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品具有多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但现有的非实验性因果模型验证方法尚未得到充分表征。最流行的方法之一是通过数据重采样来评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟特定算法参数的赋值过程。同时,我们通过大量模拟实验验证了该理论结果,并提供了丰富数据以帮助研究者进一步表征因果发现分析中的重采样特性。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;检索后阶段运用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉现象的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多样化查询与语料预处理技术增强输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学与医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少受到关注。我们提出的理论结果证明,某些重采样方法能精准模拟对算法调参赋予特定值的过程。此外,我们报告了大量模拟实验的结果,这些结果既验证了理论结论,又为研究者进一步表征因果发现分析中的重采样提供了丰富数据。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果既验证了理论结论,又为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:金融问答文档在检索增强生成系统中的检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调最先进(SOTA)嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学与医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作与模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。在预检索阶段,采用多种查询与语料库预处理技术来丰富输入数据;检索阶段则通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样来评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法与调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;检索后阶段运用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能紧密模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密与稀疏表征结合的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能紧密模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLM)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力。在检索前阶段,采用多种查询与语料库预处理技术来丰富输入数据;检索阶段则通过领域知识微调最先进的嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调参参数。我们提出了理论结果,证明某些重采样方法能紧密模拟对算法调参参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略的优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互影响的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力。检索前阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互作用的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但目前用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能很好地模拟对算法调参参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的峰值。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并采用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量近乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的峰值。实验工作辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档检索能力:预检索阶段采用多种查询与语料库预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征结合的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品具有多相特征,其中主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,为模拟化学无序性使用了相干势近似(CPA)。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带,实验XPS结果基于DFT计算的光谱进行了解读。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、使用的算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLM)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。预检索阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射分析表明样品具有多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的峰值。实验研究辅以采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,为模拟化学无序性采用了相干势近似(CPA)。计算重点针对具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分研究。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出了理论结果,证明某些重采样方法能高度模拟特定算法参数的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时对比了其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法能紧密模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLM)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索和检索后)增强金融文档检索能力。在检索前阶段,采用多种查询与语料库预处理技术来丰富输入数据;检索阶段则通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;最后在检索后阶段,利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后,采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并利用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时以其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组(FPLO)方案进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射测试表明样品具有以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型为主的(La,Mg)$_2$Ni$_7$多相特征。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。实验工作辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时参考其他多种结构。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术与因果发现方法交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;检索后阶段运用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子性能的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到304 mAh/g的最高值。实验工作辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察多个结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料库预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子特性的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射分析表明样品呈多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)时达到峰值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,通过相干势近似(CPA)模拟化学无序。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)鲜少或从未被关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射测试表明样品具有以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型为主的(La,Mg)$_2$Ni$_7$多相特征。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。 实验研究辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算。为模拟化学无序,我们采用相干势近似(CPA)。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则结合直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射分析表明样品具有多相特征,其中主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究结合了基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,采用相干势近似(CPA)模拟化学无序。计算重点针对实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现六方与菱方结构的La$_2$Ni$_7$总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术与因果发现方法交互影响的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子性能的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射分析表明样品具有多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型结构的(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)时达到峰值304 mAh/g。实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,采用相干势近似(CPA)模拟化学无序。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量近乎相同,这与样品中两相共存现象吻合。计算获得的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,并基于DFT计算谱图对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射测试表明样品具有多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,为模拟化学无序性使用了相干势近似(CPA)。计算聚焦于具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS结果基于DFT计算的光谱进行了解读。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验研究辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互影响的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施融合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互影响的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。同时,我们报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索和检索后)增强金融文档的检索效果。在检索前阶段,采用多种查询和语料库预处理技术来丰富输入数据;检索阶段则通过领域知识微调最先进的嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用全势局域轨道最小基组方案(FPLO)进行密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时以其他多种结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象高度吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS结果基于DFT计算的光谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互影响的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代镍氢电池极具前景的负极材料。本研究探讨了Mg替代对La$_{2-x}$Mg$_x$Ni$_7$材料电化学与电子性能的影响。采用机械合金化技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用全势局域轨道最小基组(FPLO)方案的第一性原理计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段结合领域知识微调前沿嵌入模型,并实施稠密与稀疏表征混合的检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射分析表明样品呈多相特征,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相为主。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。 实验研究辅以基于全势局域轨道最小基组方案(FPLO)的密度泛函理论(DFT)计算。为模拟化学无序态,采用相干势近似(CPA)方法,重点分析了具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。计算发现La$_2$Ni$_7$的六方与菱方结构总能量近乎相同,这与样品中两相共存现象高度吻合。对于Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中Mg的占位偏好计算,结果与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,并基于DFT计算谱对实验XPS结果进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略的优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料库预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学与电子性能的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验部分后接采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射线衍射分析表明样品呈多相特征,主相为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。实验研究辅以采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算主要针对实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构总能量几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱图进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出了理论结果,证明某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文标题:La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究
- 发布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$电池极具前景的负极材料。本研究探讨了Mg替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料电化学和电子特性的影响。采用机械合金化技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射线衍射表明样品具有多相特征,主要为六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。电化学测试显示最大放电容量($C_{max}$)随Mg浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以采用全势局域轨道最小基组(FPLO)方案进行的密度泛函理论(DFT)计算,并运用相干势近似(CPA)模拟化学无序。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了其他结构作为参照。研究发现六方和菱方结构的La$_2$Ni$_7$总能量几乎相同,这与样品中两相共存现象吻合。计算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过X射线光电子能谱(XPS)研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的价带结构,实验XPS谱图基于DFT计算所得对应谱进行了解析。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分研究。其中最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于样本量、所用算法或算法调参)几乎未受关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论结论,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力。在检索前阶段,采用多种查询与语料库预处理技术来丰富输入数据;检索阶段则通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;最后在检索后阶段,利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。此外,我们报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:预检索阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术与因果发现方法交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟特定算法参数的赋值过程。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:面向检索增强生成系统的金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法(检索前、检索中和检索后)增强金融文档检索能力。检索前阶段采用多种查询与语料库预处理技术来丰富输入数据;检索中阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;检索后阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)作为一种有前景的框架,能够缓解大语言模型(LLMs)中的幻觉问题,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段方法增强金融文档的检索效果。预检索阶段采用多种查询与语料库预处理技术来丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在七个金融问答数据集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参参数。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLMs)幻觉问题的有效框架,但其整体性能取决于底层检索系统。在金融领域,10-K报告等文档因领域特定词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步精炼结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的答案。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景因果发现中重采样技术交互效应的模拟评估研究
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于样本量、所用算法或算法调参。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量模拟实验的结果,这些结果验证了理论发现,并为研究人员进一步表征因果发现分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:检索增强生成系统中金融问答文档检索策略优化
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因专业术语和多层次表格数据带来独特挑战。本研究提出一种高效的端到端RAG流程,通过三阶段方法提升金融文档检索效果:检索前阶段采用多种查询与语料预处理技术丰富输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施稠密表征与稀疏表征结合的混合检索策略;检索后阶段利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的评估表明,该方法显著提升检索性能,生成结果更准确且符合上下文。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文标题:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文标题:多场景下重采样技术交互效应的广泛模拟研究评估
- 发布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分类:stat.ME, cs.AI
- 原文链接:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:尽管探索性因果分析在现代科学和医学中的应用日益加速,但用于验证因果模型的非实验方法尚未得到充分表征。最流行的方法之一是通过数据重采样后评估模型特征的稳定性,类似于统计学中用于估计置信区间的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于样本量、所使用的算法或算法调优参数。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量模拟实验的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征因果发现分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。
摘要
- 原文标题:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文标题:优化检索增强生成系统中金融问答文档的检索策略
- 发布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分类:cs.IR
- 原文链接:http://arxiv.org/abs/2503.15191v1
中文摘要:检索增强生成(RAG)已成为缓解大语言模型(LLM)幻觉问题的有效框架,但其整体性能依赖于底层检索系统。在金融领域,10-K报告等文档因领域专有词汇和多层次表格数据而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过预检索、检索和后检索三阶段优化金融文档检索:预检索阶段采用多种查询与语料库预处理技术增强输入数据;检索阶段通过领域知识微调前沿嵌入模型,并实施结合稠密表示与稀疏表示的混合检索策略;后检索阶段则利用直接偏好优化(DPO)训练和文档选择方法进一步优化结果。在FinDER、FinQABench等七个金融问答数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了定制化检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于GitHub:https://github.com/seohyunwoo-0407/GAR。