查看“WikiEdge:ArXiv速递/2025-03-19”的源代码
←
WikiEdge:ArXiv速递/2025-03-19
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的存在加速增长,但用于验证[[因果模型]]的可用非实验方法尚未得到很好的表征。最流行的方法之一是在对[[数据]]进行[[重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于[[样本大小]]、使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大型语言模型]](LLMs)中的[[幻觉问题]],但其整体性能依赖于底层的[[检索系统]]。在[[金融领域]],诸如[[10-K报告]]等文档由于领域特定的词汇和多层次的[[表格数据]]而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG管道,通过三个阶段([[预检索]]、[[检索]]和[[后检索]])来增强金融文档的检索能力。在预检索阶段,采用了多种[[查询]]和[[语料库预处理]]技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)[[嵌入模型]]进行了微调,并实施了一种结合[[密集表示]]和[[稀疏表示]]的混合检索策略。最后,在后检索阶段,通过[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成了更准确且上下文适当的生成结果。这些发现突显了定制检索技术在提升RAG系统在金融应用中的有效性方面的关键作用。完整的可复现管道可在[[GitHub]]上获取:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与从头计算相结合的研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]的有前景的负极材料。在本工作中,我们研究了[[Mg]]取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的[[电化学]]和[[电子性质]]的影响。采用[[机械合金化]]技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。[[X射线衍射]]测量表明样品具有多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱面体[[Gd$_2$Co$_7$]]型的(La,Mg)$_2$Ni$_7$相。[[电化学测量]]显示最大放电容量($C_{max}$)随[[Mg]]浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用[[全势局域轨道最小基组方案]]([[FPLO]])进行了[[密度泛函理论]]([[DFT]])计算。为了模拟[[化学无序]],我们采用了[[相干势近似]]([[CPA]])。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现[[La$_2$Ni$_7$]]的六方和菱面体结构的总能量几乎相同,这与样品中两相的共存一致。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]]。实验[[XPS]]结果基于[[DFT]]计算的相应光谱进行了解释。 == 摘要 == * '''原文标题''':Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors * '''中文标题''':改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子 * '''发布日期''':2025-03-19 10:40:27+00:00 * '''作者''':Judd Harrison * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.15090v1 '''中文摘要''':我们更新了[[HPQCD]]的[[格点QCD]]对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的[[交错夸克]]作用量处理所有[[价夸克]],并结合第二代[[MILC]] $n_f=2+1+1$ [[HISQ]]胶子场配置。该计算包括两个额外的集合,一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理[[底夸克]]质量。我们的计算使用非微扰重整化的[[流算子]],并覆盖了衰变的整个运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了整个运动学范围,我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案,使用在$q^2_\mathrm{max}$附近运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':ttH 产生截面的最新进展:NNLO 预测与 NNLL 重求和及电弱修正的结合 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了关于[[标准模型]]希格斯玻色子与[[顶夸克]]联合产生的最新预测,这些预测是根据[[LHC]]希格斯工作组建议计算的。通过适当近似双圈虚拟贡献,我们得出了[[NNLO]] [[QCD]]预测,并补充了高达[[NNLL]]精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接[[QCD]],另一种基于软共线有效理论——并对它们的特性进行了详细比较。这些结果进一步与完整的[[NLO]]修正相结合,产生了迄今为止对该过程最精确的[[标准模型]]预测。我们全面估计并讨论了相关理论不确定性的来源。 == 摘要 == * '''原文标题''':Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT * '''中文标题''':自由中子寿命实验 $τ$SPECT 的超冷中子模拟框架 * '''发布日期''':2025-03-19 14:15:34+00:00 * '''作者''':Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost * '''分类''':physics.ins-det, nucl-ex *'''原文链接''':http://arxiv.org/abs/2503.15239v1 '''中文摘要''':[[自由中子]]寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过[[卡比博-小林-益川矩阵元]] $V_{ud}$ 的[[上夸克]]和[[下夸克]]的混合以及[[大爆炸核合成]]后原始元素的丰度有关。然而,目前用于测量中子寿命的两种主要技术得出了不相容的结果,这种差异被称为[[中子寿命之谜]]。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了完全磁阱来捕获[[超冷中子]](UCNs)。超冷中子是一种能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN [[蒙特卡罗方法|蒙特卡罗]]软件包 PENTrack,并增强了两个配套工具:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在[[保罗谢勒研究所]]使用 $\tau$SPECT 获得的实验数据非常吻合,并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们介绍了用于评估封闭和开放[[量子系统]]动力学特性的Python树张量网络包([[pyTTN]]),该包利用[[树张量网络]](TTN)或等效的多层多构型时间依赖Hartree([[ML-MCTDH]])波函数表示。该包包含多个功能,允许通过使用子空间扩展技术,使用具有自适应键维度的单集和多集TTN ansätze,轻松设置一般[[哈密顿量]]的零温和有限温度计算。所有核心功能均在[[C++]]中实现,并提供了[[Python]]绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz表示辅助密度算子空间,用于模拟[[层次运动方程]](HEOM)方法和广义伪模式方法;此外,我们证明了这两种方法在作用于伪模式自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模式[[吡嗪]]的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚[[噻吩]]供体-C$_{60}$[[富勒烯]]受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括[[自旋-玻色子模型]]、一组扩展耗散自旋模型和[[安德森杂质模型]]。通过结合易用性、高效实现以及允许未来扩展的可扩展设计,pyTTN可以集成到广泛的计算建模软件中。 == 摘要 == * '''原文标题''':When LLMs Meet API Documentation: Can Retrieval Augmentation Aid Code Generation Just as It Helps Developers? * '''中文标题''':当大语言模型遇到API文档:检索增强能否像帮助开发者一样助力代码生成? * '''发布日期''':2025-03-19 14:08:47+00:00 * '''作者''':Jingyi Chen, Songqiang Chen, Jialun Cao, Jiasi Shen, Shing-Chi Cheung * '''分类''':cs.SE *'''原文链接''':http://arxiv.org/abs/2503.15231v1 '''中文摘要''':[[检索增强生成]](RAG)在扩展[[大型语言模型]](LLMs)能力方面日益显示出其强大作用,使其能够超越[[预训练]]知识的限制。现有研究表明,RAG可以帮助完成[[软件开发]]任务,如[[代码生成]]、[[代码更新]]和[[测试生成]]。然而,使用RAG将LLMs适应于快速变化或较少使用的[[API库]]的有效性仍然未知。为了填补这一空白,我们迈出了第一步,研究这一尚未探索但实际存在的场景——当开发者使用较少使用的库进行编码时,他们通常会参考其[[API文档]];同样,当允许LLMs通过RAG查找API文档时,LLMs能在多大程度上得到提升?为了模拟这种场景,我们选择了四个较少使用的开源[[Python库]],共包含1017个符合条件的API。我们研究了影响使用较少使用的API库文档作为检索和生成额外知识有效性的因素。我们的深入研究得出了有趣的发现:(1)RAG帮助将LLMs的性能提升了83%-220%。(2)[[示例代码]]对提升LLMs的贡献最大,而不是API文档中的描述性文本和参数列表。(3)LLMs有时可以通过参考其预训练知识或文档上下文容忍轻微的[[噪声]](描述中的拼写错误或错误的参数)。最后,我们建议开发者更多地关注API文档中代码示例的质量和多样性。这项研究为未来的[[低代码]]软件开发工作流程提供了启示。 == 摘要 == * '''原文标题''':Global Optimization of Gas Transportation and Storage: Convex Hull Characterizations and Relaxations * '''中文标题''':天然气运输和存储的全局优化:凸包表征与松弛 * '''发布日期''':2025-03-19 12:09:12+00:00 * '''作者''':Bahar Cennet Okumusoglu, Burak Kocuk * '''分类''':math.OC *'''原文链接''':http://arxiv.org/abs/2503.15143v1 '''中文摘要''':[[天然气]]运输和储存已成为[[能源系统]]中最相关和最重要的优化问题之一。由于气体物理特性,该问题本质上包含高度非线性和非凸的方面,以及由于主动网络元件的控制决策而导致的离散方面。为这一问题获得局部可行解或全局解对系统操作者提出了重大的数学和计算挑战。在本文中,我们通过析取将该问题表述为一个非凸混合整数非线性规划([[MINLP]])问题。此外,我们研究了由气体物理特性引起的非凸集,并提出了针对非凸MINLP问题的混合整数二阶锥规划松弛。所提出的松弛基于非凸集的凸包表示:我们给出了管道非凸集的凸包表示,并证明它是二阶锥可表示的。我们还完全描述了压缩机非凸集的极值点,并证明这些极值点的凸包是幂锥可表示的。对于实际应用,我们提出了压缩机非凸集的二阶锥外近似。为了获得(接近)全局最优解,我们基于凸包结果开发了一个算法框架。我们通过在各种[[GasLib]]网络上的广泛计算实验评估了我们的框架,并与文献中的凸松弛方法和最先进的全局求解器进行了比较。我们的结果突出了我们的凸松弛方法在计算效率和收敛性能方面的优势。此外,我们的方法还始终提供(接近)全局解以及高质量的局部求解器热启动点。 == 摘要 == * '''原文标题''':Are "Solved Issues" in SWE-bench Really Solved Correctly? An Empirical Study * '''中文标题''':SWE-bench 中的“已解决问题”真的被正确解决了吗?一项实证研究 * '''发布日期''':2025-03-19 14:02:21+00:00 * '''作者''':You Wang, Michael Pradel, Zhongxin Liu * '''分类''':cs.SE *'''原文链接''':http://arxiv.org/abs/2503.15223v1 '''中文摘要''':自动问题解决旨在解决[[软件仓库]]中的实际问题。最受欢迎的自动问题解决基准是[[SWE-bench]]及其人工筛选的子集[[SWE-bench Verified]]。这些基准利用[[测试]]来验证生成的补丁。然而,由于测试很少是详尽的,补丁可能通过测试但仍未能满足开发者的期望。不幸的是,目前尚不清楚使用[[SWE-bench]]进行的评估在多大程度上受到这种看似合理但不正确的补丁的影响。本文对在[[SWE-bench Verified]]上评估的三种最先进的问题解决工具生成的看似合理的补丁的正确性进行了深入的实证研究。我们广泛测试和检查生成的补丁,并将其与人工编写的地面真实补丁进行比较。我们方法的核心是一种新颖的差分补丁测试技术[[PatchDiff]],它自动暴露两个补丁之间的行为差异。我们的研究结果揭示了[[SWE-bench]]补丁验证机制的关键弱点,导致7.8%的补丁被计为正确,但未能通过开发者编写的测试套件。此外,我们的新颖自动化技术显示,甚至更多(29.6%)的看似合理的补丁引发了与地面真实补丁不同的行为。这些行为差异通常是由于相似但不同的实现(46.8%)以及生成的补丁适应了比地面真实补丁更多的行为(27.3%)。我们的手动检查显示,28.6%的行为差异补丁肯定是错误的。综合来看,这些不同的弱点导致报告的分辨率膨胀了6.2个百分点。我们的研究结果呼吁对问题解决工具进行更稳健和可靠的评估。我们设想我们的自动化差分补丁测试技术将对此目的有用。 == 摘要 == * '''原文标题''':TULIP: Towards Unified Language-Image Pretraining * '''中文标题''':TULIP:迈向统一的语言-图像预训练 * '''发布日期''':2025-03-19 17:58:57+00:00 * '''作者''':Zineng Tang, Long Lian, Seun Eisape, XuDong Wang, Roei Herzig, Adam Yala, Alane Suhr, Trevor Darrell, David M. Chan * '''分类''':cs.CV, cs.AI, cs.CL, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.15485v1 '''中文摘要''':尽管像[[CLIP]]和[[SigLIP]]这样的图像-文本对比模型最近取得了成功,但这些模型在处理需要高保真图像理解的视觉中心任务时往往表现不佳,例如[[计数]]、[[深度估计]]和[[细粒度物体识别]]。这些模型通过执行语言对齐,往往优先考虑高级语义而非视觉理解,从而削弱了它们的图像理解能力。另一方面,专注于视觉的模型在处理视觉信息方面表现出色,但在理解语言方面存在困难,限制了它们在语言驱动任务中的灵活性。在这项工作中,我们引入了[[TULIP]],这是一个开源的、可直接替代现有[[CLIP]]类模型的方案。我们的方法利用生成数据增强、增强的图像-图像和文本-文本对比学习以及图像/文本重建正则化,以学习细粒度的视觉特征,同时保持全局语义对齐。我们的方法扩展到超过10亿个参数,在多个基准测试中优于现有的最先进([[SOTA]])模型,在[[ImageNet-1K]]上建立了新的[[SOTA]]零样本性能,在[[RxRx1]]上的少样本分类线性探测中比[[SigLIP]]提高了2倍,并改进了视觉-语言模型,在[[MMVP]]上比[[SigLIP]]提高了3倍以上的分数。我们的代码/检查点可在https://tulip-berkeley.github.io获取。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:增强视觉指令调优的LLM与视觉骨干对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':近年来,[[多模态大语言模型]](MLLMs)的进展凸显了[[视觉骨干网络]]和底层[[语言模型]]的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但[[模型规模]]、[[架构]]和[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了[[LLaVA-MORE]],这是一个新的MLLM系列,将最新的[[语言模型]]与多样化的[[视觉骨干网络]]相结合。为了确保公平比较,我们采用了一种统一的[[训练协议]],并一致地应用于所有架构。我们的分析系统地探索了中小规模的[[语言模型]]——包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]——以评估[[多模态推理]]、[[生成]]和[[指令跟随]]能力,同时研究了[[模型规模]]与[[性能]]之间的关系。除了评估[[语言模型]]对最终结果的影响外,我们还对各种[[视觉编码器]]进行了全面研究,范围从基于[[CLIP]]的架构到[[DINOv2]]、[[SigLIP]]和[[SigLIP2]]等替代方案。额外的实验研究了增加[[图像分辨率]]和[[预训练数据集]]变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的[[评估框架]],便于直接比较,并可以指导未来的[[模型开发]]。我们的[[源代码]]和[[训练模型]]公开在:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory * '''中文标题''':通过\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之间的核钟跃迁频率差异 * '''发布日期''':2025-03-19 09:53:23+00:00 * '''作者''':Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma * '''分类''':physics.atom-ph *'''原文链接''':http://arxiv.org/abs/2503.15061v1 '''中文摘要''':$^{229}\text{Th}$ [[同位素]]是[[核钟]]的有力候选者,其[[跃迁频率]]受到[[电子]]诱导的[[核频率偏移]]的影响。这种效应相对较小,需要高精度的[[理论计算]]。在本工作中,我们采用了一种非微扰的[[多组态 Dirac-Hartree-Fock]] (MCDHF) 方法,与之前使用的[[微扰理论]]不同,以解决[[场移效应]]。该方法考虑了[[核势]]的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的[[基态]]和[[同质异能态]]。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的[[核跃迁频率]]差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 [[CaF$_2$]] 中精确测量的 $^{229}\text{Th}^{4+}$ 跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的[[原子结构计算]]、[[核数据表]]中的输入[[核电荷半径]]以及文献中报告的[[晶体环境]]的影响。这为基于[[离子阱实验]]的孤立 $^{229}\text{Th}^{3+}$ 的[[直接激光激发]]提供了有价值的指导。 == 摘要 == * '''原文标题''':Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance * '''中文标题''':可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响 * '''发布日期''':2025-03-19 21:42:33+00:00 * '''作者''':Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik * '''分类''':cs.CV, physics.med-ph *'''原文链接''':http://arxiv.org/abs/2503.15708v1 '''中文摘要''':目的:在[[动态对比增强磁共振成像]]([[DCE-MRI]])中,[[乳腺病变]]的分割是准确诊断、制定治疗计划和监测进展的关键步骤。本研究旨在强调[[乳腺区域分割]]([[BRS]])对基于[[深度学习]]的[[乳腺病变分割]]([[BLS]])在乳腺[[DCE-MRI]]中的影响。 方法:使用包含59个[[DCE-MRI]]扫描的[[Stavanger数据集]]和[[UNet++]]作为[[深度学习模型]],进行了四种不同的处理流程,以比较[[BRS]]对[[BLS]]的影响。这四种方法包括:不使用[[BRS]]的整个体积、使用[[BRS]]的整个体积、使用[[BRS]]的选定病变切片以及使用[[BRS]]的最佳体积。通过[[数据增强]]和[[过采样]]等预处理方法来增强小数据集、统一数据形状并提高模型性能。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括[[Dice]]、[[Focal]]和[[交叉熵]]的混合损失函数以及[[5折交叉验证]]方法,最后使用随机分割的测试数据集来评估模型在未见数据上的性能,针对上述四种方法分别进行了测试。 结果:结果表明,使用[[BRS]]显著提高了模型的性能和验证效果。与不使用[[BRS]]的方法相比,最后一种方法——使用[[BRS]]的最佳体积——的性能提升了约50%,证明了[[BRS]]在[[BLS]]中的有效性。此外,能耗的大幅降低(高达450%)为未来在大数据集上的工作提供了一种更环保的解决方案。 == 摘要 == * '''原文标题''':Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets * '''中文标题''':使用GridRad-Severe和HRRR的超单体环境:解决先前龙卷风数据集之间的差异 * '''发布日期''':2025-03-19 17:44:36+00:00 * '''作者''':Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer * '''分类''':physics.ao-ph *'''原文链接''':http://arxiv.org/abs/2503.15466v1 '''中文摘要''':[[风暴相对螺旋度]](SRH)是[[超级单体]]发展以及[[中尺度气旋]]强度的重要成分,并且与[[龙卷风]]的生成和潜力相关。SRH源自[[风暴相对风廓线]],由[[垂直风切变]]和[[风暴相对流]]组成。最近的研究在关于较浅或较深的SRH层在龙卷风预报中更具预测能力的问题上得出了相互矛盾的结论。这种差异的可能原因包括使用[[观测数据]]与基于模型的邻近探空数据,以及风暴相对风廓线是通过观测还是估计的[[风暴运动]]确定的。本研究使用了一个新的数据集,其中包含客观识别的超级单体及其观测到的风暴运动,并结合高分辨率模型分析,以解决先前研究中的差异。与以往基于模型的龙卷风环境数据集不同,本方法揭示了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对流、垂直风切变和SRH方面的实质性差异。使用观测到的风暴运动来计算风暴相对变量进一步放大了非龙卷风超级单体与龙卷风超级单体在中低层风暴相对风中的差异,最终导致较深的SRH层比近地面SRH具有更高的预报能力。因此,结合更高分辨率的模型分析(更好地代表风暴附近环境)和观测到的风暴运动,似乎解释了为什么许多过去使用基于模型的环境分析的龙卷风气候学未能发现风暴相对风廓线的显著差异。这些结果有助于弥合先前使用较粗糙的基于模型的分析与从野外项目中汇总的观测探空数据之间的差距。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项广泛的模拟研究评估重采样技术在多种因果发现背景下的交互作用 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的存在加速增长,但用于验证[[因果模型]]的非实验方法尚未得到很好的表征。最流行的方法之一是在对[[数据]]进行[[重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于[[样本大小]]、使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大型语言模型]](LLMs)中的[[幻觉问题]],但其整体性能依赖于底层的[[检索系统]]。在[[金融领域]],诸如[[10-K报告]]等文档由于领域特定的词汇和多层次[[表格数据]]而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG流程,通过三个阶段([[预检索]]、[[检索]]和[[后检索]])来增强金融文档的检索效果。在预检索阶段,采用了多种[[查询]]和[[语料库预处理]]技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)[[嵌入模型]]进行了微调,并实施了一种结合[[密集表示]]和[[稀疏表示]]的混合检索策略。最后,在后检索阶段,通过[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成了更准确且上下文合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现流程可在[[GitHub]]上获取:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与从头算研究的结合 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]的有前景的负极材料。在本工作中,我们研究了[[Mg]]取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的[[电化学]]和[[电子性质]]的影响。采用[[机械合金化]]技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。[[X射线衍射]]测量表明样品具有多相特征,主要相为六方[[Ce$_2$Ni$_7$]]型和菱面体[[Gd$_2$Co$_7$]]型的(La,Mg)$_2$Ni$_7$相。[[电化学测量]]显示,最大放电容量($C_{max}$)随着[[Mg]]浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用[[全势局域轨道最小基组方案]]([[FPLO]])进行了[[密度泛函理论]]([[DFT]])计算。为了模拟[[化学无序]],我们采用了[[相干势近似]]([[CPA]])。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现[[La$_2$Ni$_7$]]的六方和菱面体结构的总能量几乎相同,这与样品中两相的共存一致。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]]。实验[[XPS]]结果基于[[DFT]]计算的光谱进行了解释。 == 摘要 == * '''原文标题''':Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors * '''中文标题''':改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子 * '''发布日期''':2025-03-19 10:40:27+00:00 * '''作者''':Judd Harrison * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.15090v1 '''中文摘要''':我们更新了[[HPQCD]]的[[格点QCD]]对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的[[交错夸克]]作用量处理所有[[价夸克]],并结合第二代[[MILC]] $n_f=2+1+1$ [[HISQ]]胶子场配置。该计算包括两个额外的集合,一个具有物理轻上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,我们能够在后者上达到物理底夸克质量。我们的计算使用非微扰重整化的流算子,并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲区域使用截断范围数据的推断。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估进入低$q^2$区域的系统不确定性。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':ttH 产生的最先进截面:NNLO 预测与 NNLL 重求和及电弱修正的结合 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了关于[[标准模型]][[希格斯玻色子]]与[[顶夸克]]联合产生的最新预测,这些预测是根据[[LHC]][[希格斯工作组]]建议计算的。通过适当近似双圈虚拟贡献,我们得出了[[NNLO]][[QCD]]预测,并补充了高达[[NNLL]]精度的软胶子重求和。我们采用了两种不同的重求和框架——一种基于直接[[QCD]],另一种基于软共线有效理论——并详细比较了它们的特性。这些结果进一步与完整的[[NLO]]修正相结合,产生了迄今为止对该过程最精确的[[标准模型]]预测。我们全面估计并讨论了相关理论不确定性的来源。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们介绍了用于评估封闭和开放[[量子系统]]动力学特性的Python树张量网络包([[pyTTN]]),该包利用[[树张量网络]](TTN)或等效的多层多构型时间依赖Hartree([[ML-MCTDH]])方法来表示[[波函数]]。该包包含多个功能,允许通过使用[[子空间扩展技术]],使用单集和多集TTN ansätze以及自适应键维度,轻松设置一般[[哈密顿量]]的零温和有限温度计算。所有核心功能均在[[C++]]中实现,并提供了[[Python]]绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz来表示辅助密度算子空间,用于模拟[[层次运动方程]](HEOM)方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模[[吡嗪]]的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚噻吩供体-C$_{60}$富勒烯受体系统界面处的[[激子动力学]]。最后,我们考虑了开放量子系统的应用,包括[[自旋-玻色子模型]]、一组扩展的耗散自旋模型以及[[安德森杂质模型]]。通过结合易用性、高效实现以及可扩展设计,pyTTN可以集成到广泛的计算建模软件中。 == 摘要 == * '''原文标题''':Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT * '''中文标题''':自由中子寿命实验$τ$SPECT的超冷中子模拟框架 * '''发布日期''':2025-03-19 14:15:34+00:00 * '''作者''':Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost * '''分类''':physics.ins-det, nucl-ex *'''原文链接''':http://arxiv.org/abs/2503.15239v1 '''中文摘要''':[[自由中子]]寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过[[卡比博-小林-益川矩阵元]] $V_{ud}$ 的[[上夸克]]和[[下夸克]]的混合以及[[大爆炸核合成]]后原始元素的丰度有关。然而,目前两种主要的中子寿命测量技术得出了不相容的结果,这种差异被称为[[中子寿命之谜]]。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了全磁阱来捕获[[超冷中子]](UCNs)。超冷中子是一种能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射中子。为了精确研究和表征 $\tau$SPECT 中 UCN 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN [[蒙特卡罗方法|蒙特卡罗]]软件包 [[PENTrack]],并通过两个配套工具进行了增强:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在[[保罗谢勒研究所]]进行的 $\tau$SPECT 实验数据吻合良好,为识别系统不确定性和指导当前实验装置的未来改进提供了强有力的资源。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是实验室和天体物理[[等离子体]]中的一个基本挑战。自磁化可以改变等离子体的输运特性,从而影响等离子体的动力学演化。大多数关于[[磁重联]]和非磁化无碰撞冲击的高能量密度(HED)激光实验依赖于[[Biermann]]或[[Weibel]]机制来自洽地生成感兴趣的磁场。多个HED实验已经观察到了兆高斯强度的离子尺度磁丝的形成,尽管它们的起源仍然存在争议。基于粒子模拟(PIC)的模型已经被提出用于解释磁化,包括等离子体相互渗透驱动的Weibel、温度梯度驱动的Weibel和绝热膨胀驱动的Weibel。在这里,我们进行了带有激光射线追踪模块的二维碰撞PIC模拟,以模拟等离子体的烧蚀、膨胀和随后的磁化。模拟使用平面几何结构,有效地抑制了Biermann磁场,以专注于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$之间变化,这与必须考虑碰撞的HED和ICF实验相关。我们发现,在超过临界强度的情况下,等离子体通过膨胀驱动的Weibel过程迅速自磁化,在前几百皮秒内生成等离子体$\beta$值为100($\beta = 2k_B n_eT_e/B^2$),霍尔参数$\omega_{\rm ce}\tau_{e}>1$。还讨论了等离子体磁化对热输运的影响。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':近年来,[[多模态大语言模型]](MLLMs)的进展凸显了[[视觉骨干网络]]和[[底层语言模型]]的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但[[模型规模]]、[[架构]]和[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了[[LLaVA-MORE]],这是一个新的MLLM系列,它将最新的[[语言模型]]与多样化的[[视觉骨干网络]]相结合。为了确保公平比较,我们采用了一种统一的[[训练协议]],并一致地应用于所有架构。我们的分析系统地探索了中小规模的[[语言模型]]——包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]——以评估[[多模态推理]]、[[生成]]和[[指令跟随能力]],同时研究了[[模型规模]]与[[性能]]之间的关系。除了评估[[语言模型]]对最终结果的影响外,我们还对各种[[视觉编码器]]进行了全面研究,范围从基于[[CLIP]]的架构到[[DINOv2]]、[[SigLIP]]和[[SigLIP2]]等替代方案。额外的实验研究了增加[[图像分辨率]]和[[预训练数据集]]变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的[[评估框架]],便于直接比较,并可以指导未来的[[模型开发]]。我们的[[源代码]]和[[训练模型]]公开在:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance * '''中文标题''':可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响 * '''发布日期''':2025-03-19 21:42:33+00:00 * '''作者''':Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik * '''分类''':cs.CV, physics.med-ph *'''原文链接''':http://arxiv.org/abs/2503.15708v1 '''中文摘要''':目的:在[[动态对比增强磁共振成像]]([[DCE-MRI]])中,[[乳腺病变]]的分割是准确诊断、治疗计划和进展监测的关键步骤。本研究旨在强调[[乳腺区域分割]]([[BRS]])对基于[[深度学习]]的[[乳腺病变分割]]([[BLS]])在乳腺[[DCE-MRI]]中的影响。 方法:使用包含59个[[DCE-MRI]]扫描的[[Stavanger数据集]]和[[UNet++]]作为[[深度学习模型]],进行了四种不同的处理来比较[[BRS]]对[[BLS]]的影响。这四种方法包括没有[[BRS]]的整个体积、有[[BRS]]的整个体积、有[[BRS]]的选定病变切片以及最后有[[BRS]]的最佳体积。使用了[[数据增强]]和[[过采样]]等[[预处理方法]]来增强小数据集、数据形状的一致性并提高[[模型性能]]。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括[[Dice]]、[[Focal]]和[[交叉熵]]的混合[[损失函数]]以及[[5折交叉验证]]方法,最后使用随机分割的[[测试数据集]]来评估模型在未见数据上的性能,针对上述四种方法中的每一种。 结果:结果表明,使用[[BRS]]显著提高了模型的性能和验证效果。与没有[[BRS]]的方法相比,最后一种方法——有[[BRS]]的最佳体积——的性能显著提高了约50%,展示了[[BRS]]在[[BLS]]中的有效性。此外,[[能源消耗]]的大幅减少,高达450%,为未来在[[大数据集]]上的工作引入了一种更环保的解决方案。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项广泛的模拟研究评估重采样技术在多因果发现情境中的交互作用 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的存在加速增长,但用于验证[[因果模型]]的可用非实验方法尚未得到充分表征。最流行的方法之一是在对[[数据]]进行[[重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于[[样本大小]]、使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法能够很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大型语言模型]](LLMs)中的[[幻觉问题]],但其整体性能依赖于底层的[[检索系统]]。在[[金融领域]],诸如[[10-K报告]]等文档由于领域特定的词汇和多层次表格数据而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG管道,通过三个阶段([[预检索]]、[[检索]]和[[后检索]])来增强金融文档的检索效果。在预检索阶段,采用了多种查询和语料库预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)[[嵌入模型]]进行了微调,并实施了一种结合[[密集表示]]和[[稀疏表示]]的混合检索策略。最后,在后检索阶段,通过[[直接偏好优化]](DPO)训练和文档选择方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成了更准确且上下文更合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现管道可在[[GitHub]]上获取:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La 被 Mg 取代对 La$_{2-x}$Mg$_x$Ni$_7$ 合金电化学和电子性质的影响:实验与从头计算相结合的研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]的潜在负极材料。在本研究中,我们探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的[[电化学]]和[[电子性质]]的影响。采用[[机械合金化]]技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。[[X射线衍射]]测量表明样品具有多相特征,主要相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测量]]显示,最大放电容量($C_{max}$)随[[Mg]]浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用[[全势局域轨道最小基组方案]]([[FPLO]])进行了[[密度泛函理论]]([[DFT]])计算。为了模拟[[化学无序]],我们采用了[[相干势近似]]([[CPA]])。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现[[La$_2$Ni$_7$]]的六方和菱方结构的[[总能量]]几乎相同,这与样品中两相的共存现象一致。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]]。实验[[XPS]]结果基于[[DFT]]计算的光谱进行了解释。 == 摘要 == * '''原文标题''':Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory * '''中文标题''':基于\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$核钟跃迁频率差异 * '''发布日期''':2025-03-19 09:53:23+00:00 * '''作者''':Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma * '''分类''':physics.atom-ph *'''原文链接''':http://arxiv.org/abs/2503.15061v1 '''中文摘要''':$^{229}\text{Th}$ [[同位素]]是[[核钟]]的一个有前途的候选者,其[[跃迁频率]]受到[[电子]]诱导的[[核频率偏移]]的影响。这种效应相对较小,需要高精度的[[理论计算]]。在本工作中,我们采用了一种非微扰的[[多组态 Dirac-Hartree-Fock]] (MCDHF) 方法,与之前使用的[[微扰理论]]不同,以解决[[场移效应]]。该方法考虑了[[核势]]的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的[[基态]]和[[异构态]]。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的[[核跃迁频率]]差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 [[CaF$_2$]] 中精确测量的 $^{229}\text{Th}^{4+}$ 跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的[[原子结构计算]]、[[核数据表]]中的输入[[核电荷半径]]以及文献中报道的[[晶体环境]]的影响。这为基于[[离子阱实验]]的孤立 $^{229}\text{Th}^{3+}$ 的[[直接激光激发]]提供了有价值的指导。 == 摘要 == * '''原文标题''':Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors * '''中文标题''':改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子 * '''发布日期''':2025-03-19 10:40:27+00:00 * '''作者''':Judd Harrison * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.15090v1 '''中文摘要''':我们更新了[[HPQCD]]的[[格点QCD]]对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的[[交错夸克]]作用量处理所有[[价夸克]],并结合第二代[[MILC]] $n_f=2+1+1$ [[HISQ]]胶子场配置。该计算包括两个额外的集合,一个具有物理轻的[[上夸克]]和[[下夸克]],且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理[[底夸克]]质量。我们的计算使用非微扰重整化的[[流算子]],并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲区域使用截断范围数据的推断。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围的前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':ttH 产生的最先进截面:NNLO 预测与 NNLL 重求和及电弱修正的结合 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了关于[[标准模型]][[希格斯玻色子]]与[[顶夸克]]联合产生的最新预测,这些预测是根据[[LHC]][[希格斯工作组]]的建议计算的。通过适当近似双圈虚拟贡献,我们得出了[[NNLO]][[QCD]]预测,并补充了高达[[NNLL]]精度的软胶子重求和。我们采用了两种不同的重求和框架——一种基于直接[[QCD]],另一种基于[[软共线有效理论]]——并详细比较了它们的特点。这些结果进一步与完整的[[NLO]]修正相结合,产生了迄今为止对该过程最精确的[[标准模型]]预测。我们全面估计并讨论了相关理论不确定性的来源。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们介绍了用于评估封闭和开放[[量子系统]]动力学特性的[[Python]]树[[张量网络]]包([[pyTTN]]),该包利用树张量网络([[TTN]])或等效的多层多构型时间依赖[[Hartree]]([[ML-MCTDH]])方法来表示[[波函数]]。该包包含多个功能,允许通过使用子空间扩展技术,使用单集和多集TTN ansätze自适应键维度,轻松设置一般[[哈密顿量]]的零温和有限温度计算。所有核心功能均在[[C++]]中实现,并提供了[[Python]]绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz表示辅助密度算子空间,用于模拟层次运动方程([[HEOM]])方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一组应用,从广泛使用的24模[[吡嗪]]光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚[[噻吩]]供体-[[C$_{60}$]]富勒烯受体系统界面处的[[激子]]动力学。最后,我们考虑了开放量子系统的应用,包括[[自旋-玻色子模型]]、一组扩展耗散自旋模型和[[安德森杂质模型]]。通过结合易用性、高效实现以及允许未来扩展的可扩展设计,pyTTN可以集成到广泛的计算建模软件中。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLMs 与视觉骨干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':近年来,[[多模态大语言模型]](MLLMs)的进展凸显了[[视觉骨干网络]]和[[底层语言模型]]的关键作用。尽管先前的研究主要集中在将这些组件扩展到数十亿参数,但[[模型规模]]、[[架构]]和[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,使得难以得出最优的设计选择。在本文中,我们提出了[[LLaVA-MORE]],这是一个新的MLLM系列,它将最新的[[语言模型]]与多样化的[[视觉骨干网络]]相结合。为了确保公平比较,我们采用了一种统一的[[训练协议]],并一致地应用于所有架构。我们的分析系统地探索了中小规模的[[语言模型]]——包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]——以评估[[多模态推理]]、[[生成]]和[[指令跟随能力]],同时研究了[[模型规模]]与[[性能]]之间的关系。除了评估[[语言模型]]对最终结果的影响外,我们还对各种[[视觉编码器]]进行了全面研究,范围从基于[[CLIP]]的架构到[[DINOv2]]、[[SigLIP]]和[[SigLIP2]]等替代方案。额外的实验研究了增加[[图像分辨率]]和[[预训练数据集]]变化的影响。总体而言,我们的结果为设计更有效的MLLM提供了见解,提供了一个可重复的[[评估框架]],便于直接比较,并可以指导未来的[[模型开发]]。我们的[[源代码]]和[[训练模型]]公开在:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance * '''中文标题''':可持续的基于深度学习的乳腺病变分割:乳腺区域分割对性能的影响 * '''发布日期''':2025-03-19 21:42:33+00:00 * '''作者''':Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik * '''分类''':cs.CV, physics.med-ph *'''原文链接''':http://arxiv.org/abs/2503.15708v1 '''中文摘要''':目的:在[[动态对比增强磁共振成像]]([[DCE-MRI]])中对[[乳腺病变]]进行[[分割]]是准确[[诊断]]、制定[[治疗计划]]和监测[[进展]]的关键步骤。本研究旨在强调[[乳腺区域分割]]([[BRS]])对基于[[深度学习]]的[[乳腺病变分割]]([[BLS]])在[[乳腺]][[DCE-MRI]]中的影响。 方法:使用包含59个[[DCE-MRI]]扫描的[[Stavanger数据集]]和[[UNet++]]作为[[深度学习模型]],进行了四种不同的处理流程,以比较[[BRS]]对[[BLS]]的影响。这四种方法包括:不使用[[BRS]]的整个体积、使用[[BRS]]的整个体积、使用[[BRS]]的选定病变切片以及使用[[BRS]]的最佳体积。通过[[数据增强]]和[[过采样]]等[[预处理方法]]来增强小数据集、统一数据形状并提高[[模型性能]]。通过精确的过程研究了最佳体积大小,以确保所有病变都存在于切片中。为了评估模型,使用了包括[[Dice]]、[[Focal]]和[[交叉熵]]的混合[[损失函数]]以及[[5折交叉验证]]方法,最后使用随机分割的[[测试数据集]]来评估模型在未见数据上的性能,针对上述四种方法分别进行了评估。 结果:结果表明,使用[[BRS]]显著提高了模型的性能和验证效果。与不使用[[BRS]]的方法相比,最后一种方法——使用[[BRS]]的最佳体积——的性能提升了约50%,展示了[[BRS]]在[[BLS]]中的有效性。此外,[[能耗]]的大幅降低(高达450%)为未来在[[大数据集]]上的工作提供了一种更环保的解决方案。 == 摘要 == * '''原文标题''':Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT * '''中文标题''':自由中子寿命实验$τ$SPECT的超冷中子模拟框架 * '''发布日期''':2025-03-19 14:15:34+00:00 * '''作者''':Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost * '''分类''':physics.ins-det, nucl-ex *'''原文链接''':http://arxiv.org/abs/2503.15239v1 '''中文摘要''':[[自由中子]]寿命的精确测定在现代精密物理学中具有重要意义。这一关键观测值与通过[[卡比博-小林-益川矩阵元]] $V_{ud}$ 的[[上夸克]]和[[下夸克]]的混合以及[[大爆炸核合成]]后原始元素的丰度有关。然而,目前用于测量中子寿命的两种主要技术得出了不相容的结果,这种差异被称为[[中子寿命之谜]]。为了解决中子与材料壁相互作用引起的系统不确定性,$\tau$SPECT 实验采用了完全磁阱来捕获[[超冷中子]](UCNs)。UCNs 是能量极低的中子,其典型速度低于 $8\,\textrm{m/s}$,可以通过磁场、重力和合适的材料导引进行操控,这些材料的表面可以在任何入射角下反射它们。为了精确研究和表征 $\tau$SPECT 中 UCNs 在生产、导引、存储和检测过程中的行为,我们开发了一个专用的模拟框架。该框架基于外部开发的 UCN [[蒙特卡罗方法|蒙特卡罗]]软件包 [[PENTrack]],并通过两个配套工具进行了增强:一个用于灵活且可参数化的 PENTrack 上游配置,以便调整模拟的输入设置以重现实验观测结果;另一个用于分析、可视化和动画化模拟数据。模拟结果与在[[保罗谢尔研究所]]使用 $\tau$SPECT 获得的实验数据非常吻合,并作为识别系统不确定性和指导当前实验装置未来改进的强大资源。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项广泛的模拟研究评估重采样技术在多种因果发现情境中的交互作用 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的存在加速增长,但用于验证[[因果模型]]的非实验方法尚未得到很好的表征。最流行的方法之一是在对[[数据]]进行[[重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,这种方法的许多方面几乎没有受到关注,例如重采样方法的选择是否应取决于[[样本大小]]、使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法能够很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据,以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同提供了关于在实践中应如何选择重采样方法和调优参数的具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大型语言模型]](LLMs)中的[[幻觉问题]],但其整体性能依赖于底层的[[检索系统]]。在[[金融领域]],诸如[[10-K报告]]等文档由于领域特定的词汇和多层次[[表格数据]]而带来了独特的挑战。在本研究中,我们引入了一种高效的端到端RAG流程,通过三个阶段([[预检索]]、[[检索]]和[[后检索]])来增强金融文档的检索效果。在预检索阶段,采用了多种[[查询]]和[[语料库]]预处理技术来丰富输入数据。在检索阶段,我们利用领域特定知识对最先进的(SOTA)[[嵌入模型]]进行了微调,并实施了一种结合[[密集表示]]和[[稀疏表示]]的混合检索策略。最后,在后检索阶段,通过[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成了更准确且上下文更合适的回答。这些发现突显了定制化检索技术在提升RAG系统金融应用效果中的关键作用。完整的可复现流程可在[[GitHub]]上获取:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets * '''中文标题''':使用GridRad-Severe和HRRR的超单体环境:解决先前龙卷风数据集之间的差异 * '''发布日期''':2025-03-19 17:44:36+00:00 * '''作者''':Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer * '''分类''':physics.ao-ph *'''原文链接''':http://arxiv.org/abs/2503.15466v1 '''中文摘要''':[[风暴相对螺旋度]](SRH)是[[超级单体]]发展以及[[中尺度气旋]]强度的重要成分,并且与[[龙卷风]]的生成和潜力相关。SRH 源自[[风暴相对风廓线]],由[[垂直风切变]]和[[风暴相对气流]]组成。最近的研究在关于较浅或较深的 SRH 层在龙卷风预测中更具技能的问题上得出了相互矛盾的结论。这种差异的可能原因包括使用[[观测数据]]与基于模型的邻近探空数据,以及风暴相对风廓线是通过观测还是估计的[[风暴运动]]确定的。本研究使用了一个新的客观识别的超级单体数据集,结合观测到的风暴运动和高分辨率模型分析,以解决先前研究中的差异。与以往基于模型的龙卷风环境数据集不同,本方法揭示了非龙卷风超级单体与龙卷风超级单体在低至中层风暴相对气流、垂直风切变和 SRH 方面的实质性差异。使用观测到的风暴运动来计算风暴相对变量进一步放大了非龙卷风超级单体与龙卷风超级单体在低至中层风暴相对风中的差异,最终导致较深的 SRH 层比近地面的 SRH 具有更高的预测技能。因此,结合更高分辨率的模型分析(更好地代表风暴附近环境)和观测到的风暴运动,似乎解释了为什么许多过去使用基于模型的环境分析的龙卷风气候学未能发现风暴相对风廓线的显著差异。这些结果有助于弥合先前使用较粗糙的基于模型的分析与那些从野外项目中汇总观测探空数据的研究之间的差距。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La 被 Mg 取代对 La$_{2-x}$Mg$_x$Ni$_7$ 合金电化学和电子性质的影响:实验与从头计算相结合的研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]的潜在负极材料。在本研究中,我们探讨了[[Mg]]取代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的[[电化学]]和[[电子性质]]的影响。采用[[机械合金化]]技术制备了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50 和 0.75)。[[X射线衍射]]测量表明样品具有多相特征,主要相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测量]]显示,最大放电容量($C_{max}$)随[[Mg]]浓度的增加而增加,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)时达到最高值304 mAh/g。实验工作之后,我们使用[[全势局域轨道最小基组方案]]([[FPLO]])进行了[[密度泛函理论]]([[DFT]])计算。为了模拟[[化学无序]],我们采用了[[相干势近似]]([[CPA]])。计算主要集中在具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组成上。此外,还考虑了其他几种结构作为参考点。我们发现[[La$_2$Ni$_7$]]的六方和菱方结构的总能量几乎相同,这与样品中两相共存的结果一致。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好与之前的实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了纳米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]]。实验[[XPS]]结果基于[[DFT]]计算得到的相应光谱进行了解释。 == 摘要 == * '''原文标题''':Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors * '''中文标题''':改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子 * '''发布日期''':2025-03-19 10:40:27+00:00 * '''作者''':Judd Harrison * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.15090v1 '''中文摘要''':我们更新了[[HPQCD]]的[[格点QCD]]对$B_c\to J/\psi$矢量和轴矢量形状因子的确定,并提供了张量形状因子的新结果。我们使用高度改进的[[交错夸克]]作用量处理所有[[价夸克]],并结合第二代[[MILC]] $n_f=2+1+1$ [[HISQ]]胶子场配置。该计算包括两个额外的集合,一个具有物理轻的[[上夸克]]和[[下夸克]],且$a\approx 0.06 \mathrm{fm}$,另一个具有$a\approx 0.03\mathrm{fm}$,在该集合上我们能够达到物理[[底夸克]]质量。我们的计算使用非微扰重整化的[[流算子]],并覆盖了衰变的完整运动学范围。我们使用最近的重-粲磁化率结果,作为$u=m_c/m_h$的函数,以便在我们的物理-连续外推中采用$B_c\to J/\psi$的完整色散参数化。我们给出了更新的标准模型预测$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分别将不确定性减少了$29\%$,$45\%$,$40\%$和$50\%$。由于我们的格点形状因子覆盖了完整的运动学范围,我们可以使用它们来测试在低反冲截断范围内的数据外推。我们研究了不同的物理连续参数化方案,使用在接近$q^2_\mathrm{max}$的运动学范围前$1/3$的格点结果。我们发现,如果在物理连续外推中省略高阶运动学术语,从高$q^2$区域外推合成数据时,在$q^2=0$附近可能会出现意外大的系统不确定性。这表明,在从高$q^2$区域外推相关$B\to D^*\ell\bar{\nu}$衰变的合成格点QCD数据时,可能会低估系统不确定性。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':ttH产生的最先进截面:NNLO预测与NNLL重求和及电弱修正的结合 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了关于[[标准模型]][[希格斯玻色子]]与[[顶夸克]]伴随产生的最新预测,这些预测是根据[[LHC]][[希格斯工作组]]的建议计算的。通过适当近似双圈虚贡献,我们得到了[[NNLO]][[QCD]]预测,并补充了高达[[NNLL]]精度的软胶子重求和。采用了两种不同的重求和框架——一种基于直接[[QCD]],另一种基于[[软共线有效理论]]——并对它们的特性进行了详细比较。这些结果进一步与完整的[[NLO]]修正相结合,产生了迄今为止对该过程最精确的[[标准模型]]预测。我们全面估计并讨论了相关的理论不确定性来源。 == 摘要 == * '''原文标题''':Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory * '''中文标题''':通过\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之间的核钟跃迁频率差异 * '''发布日期''':2025-03-19 09:53:23+00:00 * '''作者''':Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma * '''分类''':physics.atom-ph *'''原文链接''':http://arxiv.org/abs/2503.15061v1 '''中文摘要''':$^{229}\text{Th}$ 同位素是[[核钟]]的一个有前途的候选者,其跃迁频率受到电子诱导的核频率偏移的影响。这种效应相对较小,需要高精度的理论计算。在本工作中,我们采用了一种非微扰的多组态 [[Dirac-Hartree-Fock]] (MCDHF) 方法,与之前使用的微扰理论不同,以解决场移效应。该方法考虑了核势的细微差异,同时考虑了 $^{229}\text{Th}$ 同位素的基态和异构态。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之间的核跃迁频率差被确定为 $-639$~MHz,计算收敛至 1~MHz。鉴于最近在 $^{229}\text{Th}$ 掺杂的 [[CaF$_2$]] 中测量的 $^{229}\text{Th}^{4+}$ 的精确跃迁频率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的跃迁频率被预测为 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括号中的不确定性分别来自我们的原子结构计算、核数据表中的输入核电荷半径以及文献中报道的晶体环境的影响。这为基于[[离子阱]]实验的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激发提供了有价值的指导。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是实验室和天体物理[[等离子体]]中的一个基本挑战。自磁化可以改变[[等离子体]]的输运特性,从而影响[[等离子体]]的动力学演化。大多数关于[[磁重联]]和非磁化无碰撞冲击的高能量密度(HED)激光实验依赖于[[Biermann]]或[[Weibel]]机制来自洽地生成感兴趣的磁场。多个HED实验已经观察到了兆高斯强度的离子尺度磁丝的形成,尽管它们的起源仍然存在争议。基于[[粒子网格]](PIC)模拟的模型已经被提出以解释磁化现象,包括[[等离子体]]相互渗透驱动的[[Weibel]]、温度梯度驱动的[[Weibel]]和绝热膨胀驱动的[[Weibel]]。在这里,我们进行了带有激光射线追踪模块的二维碰撞PIC模拟,以模拟[[等离子体]]的烧蚀、膨胀和随后的磁化。模拟使用平面几何结构,有效地抑制了[[Biermann]]磁场,以专注于各向异性驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$之间变化,这与需要考虑碰撞的HED和ICF实验相关。我们发现,在超过临界强度的情况下,[[等离子体]]通过膨胀驱动的[[Weibel]]过程迅速自磁化,在最初的几百皮秒内生成[[等离子体]]$\beta$值为100($\beta = 2k_B n_eT_e/B^2$),霍尔参数$\omega_{\rm ce}\tau_{e}>1$。还讨论了[[等离子体]]磁化对热输运的影响。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:一个使用树张量网络进行开放和封闭系统量子动力学模拟的开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们介绍了用于评估封闭和开放[[量子系统]]动力学特性的Python树张量网络包(pyTTN),该包利用[[树张量网络]](TTN)或等效的多层多构型时间依赖Hartree(ML-MCTDH)方法来表示[[波函数]]。该包包含多个功能,允许通过使用子空间扩展技术,使用单集和多集TTN ansätze以及自适应键维度,轻松设置一般[[哈密顿量]]的零温和有限温度计算。所有核心功能均在[[C++]]中实现,并提供了[[Python]]绑定以简化该包的使用。除了这些核心功能外,pyTTN还提供了多种工具,用于设置开放量子系统动力学的高效模拟,包括使用TTN ansatz来表示辅助密度算子空间,用于模拟[[层次运动方程]](HEOM)方法和广义伪模方法;此外,我们证明了这两种方法在作用于伪模自由度的非酉正规模式变换下是等价的。我们展示了该包的一系列应用,从广泛使用的24模[[吡嗪]]的光激发动力学基准案例开始,随后考虑了一个更具挑战性的模型,描述了$n$-寡聚[[噻吩]]供体-C$_{60}$[[富勒烯]]受体系统界面处的激子动力学。最后,我们考虑了开放量子系统的应用,包括[[自旋-玻色子模型]]、一组扩展的耗散自旋模型以及[[安德森杂质模型]]。通过结合易用性、高效实现以及可扩展设计,pyTTN可以集成到广泛的计算建模软件中。 == 摘要 == * '''原文标题''':Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis * '''中文标题''':可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物 * '''发布日期''':2025-03-19 19:07:59+00:00 * '''作者''':Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool * '''分类''':eess.IV, cs.AI, cs.CE, cs.CV *'''原文链接''':http://arxiv.org/abs/2503.16556v1 '''中文摘要''':摘要:[[癌症恶病质]]是一种常见的[[代谢紊乱]]疾病,其特征是严重的[[肌肉萎缩]],与[[不良预后]]和[[生活质量]]相关。通过[[计算机断层扫描]]([[CT]])纵向监测[[骨骼肌]]面积([[SMA]])——这种在[[癌症护理]]中常规获取的[[成像]]方式,是识别和跟踪该病症的有效方法。然而,现有工具往往缺乏全自动化且准确性不一致,限制了其融入[[临床工作流程]]的潜力。为解决这些问题,我们开发了[[SMAART-AI]](基于[[AI]]的[[骨骼肌]]评估-自动化可靠工具),这是一个由[[深度学习模型]]([[nnU-Net 2D]])驱动的[[端到端]]自动化流程,该模型在[[腰椎]]中段三分之一的[[CT]]图像上通过[[5折交叉验证]]训练,确保[[泛化性]]和[[鲁棒性]]。[[SMAART-AI]]整合了基于[[不确定性]]的机制,用于标记高误差的[[SMA]]预测以供专家审查,从而增强[[可靠性]]。我们结合[[SMA]]、[[骨骼肌指数]]、[[BMI]]和[[临床数据]],训练了一个[[多层感知器]]([[MLP]])模型,旨在预测[[癌症]]诊断时的[[恶病质]]。在[[胃食管癌]]数据集上测试时,[[SMAART-AI]]的[[Dice分数]]达到97.80% ± 0.93%,与使用[[SliceOmatic]]手动标注相比,本研究所有四个数据集的[[SMA]]估计中位[[绝对误差]]为2.48%。[[不确定性]]指标——[[方差]]、[[熵]]和[[变异系数]]——与[[SMA]]预测误差高度相关(分别为0.83、0.76和0.73)。[[MLP]]模型预测[[恶病质]]的[[精确度]]为79%,为[[临床医生]]提供了早期[[诊断]]和[[干预]]的可靠工具。通过结合[[自动化]]、[[准确性]]和[[不确定性]]意识,[[SMAART-AI]]弥合了[[研究]]与[[临床应用]]之间的差距,为管理[[癌症恶病质]]提供了一种[[变革性]]方法。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':[[多模态大语言模型]]([[MLLMs]])的最新进展凸显了[[视觉主干网络]]与底层[[语言模型]]的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿参数规模,但[[模型尺寸]]、[[架构]]与[[性能]]之间的权衡关系仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出[[LLaVA-MORE]]——一个整合最新[[语言模型]]与多样化[[视觉主干]]的新型[[MLLMs]]家族。为确保公平比较,我们采用统一[[训练协议]]并全程应用于所有架构。通过系统分析中小规模[[语言模型]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]),我们评估了[[多模态推理]]、[[生成]]及[[指令跟随能力]],同时探究[[模型规模]]与[[性能]]的关系。除评估[[语言模型]]对最终结果的影响外,我们还全面研究了从[[CLIP架构]]到[[DINOv2]]、[[SigLIP]]及[[SigLIP2]]等多种[[视觉编码器]]。额外实验探讨了提高[[图像分辨率]]与[[预训练数据集]]变化的影响。总体而言,我们的研究结果为设计更高效的[[MLLMs]]提供了洞见,建立了一个可复现的[[评估框架]],该框架既能支持直接比较,也可指导未来[[模型开发]]。[[源代码]]与[[训练模型]]已公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参参数]]特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]检索能力:预检索阶段采用多种[[查询]]与[[语料库]]预处理技术丰富输入数据;检索阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]结合的[[混合检索策略]];后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors * '''中文标题''':改进的格点QCD $B_c\to J/ψ$ 矢量、轴矢量和张量形状因子 * '''发布日期''':2025-03-19 10:40:27+00:00 * '''作者''':Judd Harrison * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.15090v1 '''中文摘要''':我们更新了[[HPQCD]]团队对$B_c\to [[J/\psi]]$矢量与轴矢量形状因子的[[格点QCD]]计算结果,并首次给出了张量形状因子的新结果。研究中所有[[价夸克]]均采用高度改进的[[交错夸克]]作用量,配合第二代[[MILC]] $n_f=2+1+1$ [[HISQ]]胶子场构型。本次计算新增了两个系综:一个包含物理轻度的[[上下夸克]]且[[晶格间距]]$a\approx 0.06 \mathrm{fm}$,另一个晶格间距$a\approx 0.03\mathrm{fm}$的系综使我们能够达到物理[[底夸克]]质量。计算采用非微扰[[重整化]]的[[流算子]],覆盖了衰变的完整[[运动学]]范围。我们运用最新获得的以$u=m_c/m_h$为变量的重-粲[[磁化率]]结果,在物理连续外推中实现了$B_c\to J/\psi$的完全[[色散]]参数化。更新后的[[标准模型]]预言值为:$R(J/\psi)=0.2597(27)$、$A_{\lambda_\tau}=0.5093(42)$、$F_L^{J/\psi}=0.4421(55)$和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,不确定度分别降低29%、45%、40%和50%。由于[[格点形状因子]]覆盖完整运动学范围,我们可用其检验仅基于低反冲区截断数据的传统外推方法。通过比较不同物理连续参数化方案(仅采用$q^2_\mathrm{max}$附近前1/3运动学范围的格点数据),发现当高$q^2$区合成数据的外推过程忽略高阶运动学项时,$q^2=0$附近可能出现意料之外的大[[系统误差]]。这表明在相关$B\to D^*\ell\bar{\nu}$衰变过程中,从高$q^2$区向低$q^2$区外推格点QCD合成数据时,可能存在被低估的系统误差。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用[[全势局域轨道最小基组]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复和电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们针对[[标准模型]][[希格斯玻色子]]与[[顶夸克]]的联合产生过程,提出了符合[[LHC]][[希格斯工作组]]建议的最新理论预测。通过适当近似双圈虚部贡献,我们获得了[[次次领头阶]]([[NNLO]])[[量子色动力学]]预测,并进一步补充了达到[[次次领头对数]]([[NNLL]])精度的[[软胶子重求和]]。研究采用了两套不同的[[重求和]]框架——基于直接[[QCD]]的方法和[[软共线有效理论]]方法——并对二者的特性进行了详细比较。这些结果还与完整[[次领头阶]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。我们对相关理论[[不确定性]]来源进行了全面评估与讨论。 == 摘要 == * '''原文标题''':Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT * '''中文标题''':自由中子寿命实验τSPECT的超冷中子模拟框架 * '''发布日期''':2025-03-19 14:15:34+00:00 * '''作者''':Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost * '''分类''':physics.ins-det, nucl-ex *'''原文链接''':http://arxiv.org/abs/2503.15239v1 '''中文摘要''':[[自由中子]]寿命的精确测定在现代精密[[物理学]]中具有重要意义。该关键观测量与[[夸克]]混合通过[[卡比博-小林-益川矩阵]]元$V_{ud}$相关联,并影响[[大爆炸核合成]]后原始[[元素]]的丰度。然而,当前两种主要的[[中子寿命]]测量技术得出了不相容的结果,这一差异被称为[[中子寿命之谜]]。为解决中子与物质壁相互作用引起的系统不确定性,$\tau$SPECT实验采用了全[[磁阱]]技术来约束[[超冷中子]](UCNs)。[[超冷中子]]是指典型速度低于$8\,\textrm{m/s}$的极低能中子,可通过[[磁场]]、[[重力]]及特殊材料[[导引管]]进行操控——这些导引管表面能在任意入射角实现全反射。为精确研究和表征$\tau$SPECT中UCN在产生、导引、存储及探测过程中的行为,我们开发了专用[[模拟框架]]。该框架基于外部开发的UCN[[蒙特卡洛方法]]软件包[[PENTrack]],并强化了两个配套工具:一是用于PENTrack灵活可参数化的上游配置,使模拟输入设置可调整以复现实验观测;二是用于分析、可视化和动态呈现模拟数据的软件包。模拟结果与[[保罗谢勒研究所]]$\tau$SPECT实验数据高度吻合,为识别系统不确定性和指导现有实验装置改进提供了有力工具。 == 摘要 == * '''原文标题''':Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory * '''中文标题''':基于\textit{ab-initio}自洽场理论预测$^{229}$Th$^{3+}$与$^{229}$Th$^{4+}$核钟跃迁频率差 * '''发布日期''':2025-03-19 09:53:23+00:00 * '''作者''':Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma * '''分类''':physics.atom-ph *'''原文链接''':http://arxiv.org/abs/2503.15061v1 '''中文摘要''':摘要:[[$^{229}\text{Th}$]][[同位素]]是[[核钟]]的潜在候选者,其[[跃迁频率]]受[[电子]]诱导的[[核频移]]影响。该效应相对较小,需要高精度的[[理论计算]]。本研究采用非微扰的[[多组态Dirac-Hartree-Fock]]([[MCDHF]])方法(区别于先前使用的[[微扰理论]])来解析[[场移效应]]。该方法在考虑[[$^{229}\text{Th}$]][[同位素]][[基态]]和[[同核异能态]]的同时,计及[[核势能]]的细微差异。最终测得[[$^{229}\text{Th}^{3+}$]]与[[$^{229}\text{Th}^{4+}$]]的[[核跃迁]]频率差为$-639$~[[MHz]],计算收敛精度达1~[[MHz]]。基于近期对[[CaF$_2$]]中[[$^{229}\text{Th}^{4+}$]][[跃迁频率]]的精密测量结果[Nature 633, 63 (2024)],预测孤立[[$^{229}\text{Th}^{3+}$]]的[[跃迁频率]]为$2,020,406,745 (1)_\text{计算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~[[MHz]],括号内分别表示[[原子结构]]计算、[[核数据表]]输入的[[核电荷半径]]以及文献报道的[[晶体环境]]影响的误差来源。该结果为基于[[离子阱]]实验直接[[激光激发]]孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指导。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':膨胀高能量密度等离子体中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体研究中的基本挑战之一。自磁化能够改变等离子体的[[输运特性]],从而影响其[[动力学演化]]过程。目前大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]],都依赖[[比耶曼机制]]或[[魏贝尔机制]]来自洽地产生目标磁场。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存在争议。已有研究提出基于[[粒子网格]](PIC)模拟的磁化解释模型,包括等离子体相互渗透驱动的魏贝尔机制、[[温度梯度]]驱动的魏贝尔机制以及[[绝热膨胀]]驱动的魏贝尔机制。本研究采用二维[[碰撞]]PIC模拟结合[[激光光线追踪]]模块,模拟了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何构型]]以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的[[不稳定性]]。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑碰撞效应的HED和[[ICF实验]]相关),研究发现:超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内产生[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)的[[强磁场]]。研究还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们推出[[Python]]树[[张量网络]]计算包([[pyTTN]]),用于评估封闭和开放[[量子系统]]的[[动力学]]特性。该工具包采用树[[张量网络]]([[TTN]])或等效的多层多组态含时[[Hartree]]([[ML-MCTDH]])波函数表示方法,具有以下特点:通过子空间扩展技术实现自适应键维度,支持使用单组和多组[[TTN]]拟设轻松设置一般[[哈密顿量]]的零温和有限温度计算。所有核心功能均以[[C++]]实现并配有[[Python]]接口以简化使用。除核心功能外,[[pyTTN]]还提供多种工具来高效模拟开放[[量子系统]]动力学,包括采用[[TTN]]拟设表示辅助密度算子空间以模拟[[层次运动方程]]([[HEOM]])方法和广义[[赝模]]方法;我们进一步证明这两种方法在作用于[[赝模]]自由度的非幺正正则模变换下是等价的。通过三个应用案例展示该工具包的性能:首先以24模[[吡嗪]]的光激发动力学作为基准测试,随后研究描述n-寡聚[[噻吩]]供体-[[C60]][[富勒烯]]受体系统界面[[激子]]动力学的更具挑战性模型,最后应用于开放[[量子系统]](包括[[自旋-玻色模型]]、扩展耗散[[自旋模型]]集和[[安德森杂质模型]])。[[pyTTN]]兼具易用性、高效实现和可扩展设计,能与多种计算建模软件集成。 == 摘要 == * '''原文标题''':Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis * '''中文标题''':可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物 * '''发布日期''':2025-03-19 19:07:59+00:00 * '''作者''':Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool * '''分类''':eess.IV, cs.AI, cs.CE, cs.CV *'''原文链接''':http://arxiv.org/abs/2503.16556v1 '''中文摘要''':[[癌症恶病质]]是一种常见的[[代谢紊乱]]疾病,其特征为严重[[肌肉萎缩]],与[[不良预后]]及[[生活质量]]下降密切相关。通过[[计算机断层扫描]]([[CT]])纵向监测[[骨骼肌]]面积([[SMA]])——这种在[[癌症诊疗]]中常规获取的[[影像模式]]——是识别和追踪该病症的有效方法。然而现有工具常缺乏全自动化且准确性不稳定,限制了其融入[[临床工作流程]]的潜力。为解决这些问题,我们开发了[[SMAART-AI]](基于[[AI]]的[[骨骼肌]]评估自动化可靠工具),这是一个由[[深度学习模型]]([[nnU-Net]] 2D)驱动的[[端到端]]自动化流程,模型通过[[五折交叉验证]]在第三[[腰椎]]中部[[CT图像]]上训练,确保[[泛化性]]和[[鲁棒性]]。[[SMAART-AI]]整合了基于[[不确定性]]的机制,可标记高误差[[SMA]]预测以供专家复核,从而提升可靠性。我们联合[[SMA]]、[[骨骼肌指数]]、[[BMI]]和[[临床数据]]训练了[[多层感知机]]([[MLP]])模型,用于预测[[癌症]]确诊时的[[恶病质]]状态。在[[胃食管癌]]数据集测试中,[[SMAART-AI]]的[[Dice分数]]达97.80%±0.93%,与[[SliceOmatic]]手动标注相比,本研究所有数据集的[[SMA]]估计中位[[绝对误差]]为2.48%。[[不确定性]]指标([[方差]]、[[熵]]和[[变异系数]])与[[SMA]]预测误差呈强相关性(分别为0.83、0.76和0.73)。[[MLP]]模型预测[[恶病质]]的精确度达79%,为[[临床医生]]提供了[[早期诊断]]和[[干预]]的可靠工具。通过融合[[自动化]]、[[准确性]]和[[不确定性感知]],[[SMAART-AI]]弥合了[[研究]]与[[临床应用]]间的鸿沟,为[[癌症恶病质]]管理提供了[[变革性]]方案。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':[[多模态大语言模型]]([[MLLM]])的最新进展凸显了[[视觉主干网络]]与底层[[语言模型]]的关键作用。尽管先前研究主要聚焦于将模型参数量扩展至数十亿规模,但模型尺寸、架构与性能之间的权衡关系仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出[[LLaVA-MORE]]系列模型,通过整合最新[[语言模型]]与多样化[[视觉主干]]构建新型[[MLLM]]。为确保公平比较,我们采用统一的[[训练协议]]并应用于所有架构。我们的分析系统考察了中小规模[[语言模型]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]])在[[多模态推理]]、[[生成]]及[[指令跟随]]方面的表现,同时探究模型规模与性能的关系。除评估[[语言模型]]对最终结果的影响外,我们还对[[CLIP]]架构及[[DINOv2]]、[[SigLIP]]、[[SigLIP2]]等替代[[视觉编码器]]展开全面研究。额外实验探讨了提升[[图像分辨率]]及[[预训练数据集]]变化的影响。总体而言,本研究为设计更高效的[[MLLM]]提供了见解,建立了一个可复现的[[评估框架]],该框架支持直接比较并能指导未来模型开发。源代码与训练模型已公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少受到关注。我们提出了理论结果,证明某些重采样方法能精确模拟特定[[算法参数]]的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果不仅验证了理论发现,更为研究者提供了丰富数据以进一步表征[[因果发现]]分析中的重采样特性。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLM)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术来丰富输入数据;[[检索阶段]]通过[[领域知识]]微调最先进的[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]测试表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组]]方案([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]伴随产生的最新理论预测,该计算严格遵循[[LHC]][[希格斯工作组]]的技术规范。通过双圈虚拟贡献的适当近似,我们获得了[[次次领头阶]]([[NNLO]])[[量子色动力学]]预测,并进一步结合了[[软胶子重求和]]至[[次次领头对数]]([[NNLL]])精度。研究采用了两套不同的[[重求和]]框架——基于[[直接QCD方法]]和[[软共线有效理论]]——并对二者的特性进行了详细比较。这些结果还与完全[[次领头阶]]([[NLO]])修正相结合,最终给出了该[[物理过程]]迄今最精确的[[标准模型]]理论预测。我们对相关[[理论不确定性]]来源进行了全面评估与讨论。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体中的基本挑战之一。自磁化会改变等离子体的[[输运特性]],从而影响其[[动力学演化]]。大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]]都依赖[[比耶曼]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存在争议。已有研究提出基于[[粒子网格]](PIC)模拟的模型来解释磁化现象,包括[[等离子体相互渗透]]驱动的[[魏贝尔不稳定性]]、[[温度梯度]]驱动的魏贝尔不稳定性以及[[绝热膨胀]]驱动的魏贝尔不稳定性。本文采用二维[[碰撞]]PIC模拟结合[[激光光线追踪]]模块,模拟了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何结构]]以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的不稳定性。[[激光强度]]在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化,该强度区间需考虑[[碰撞效应]]的HED和[[ICF实验]]相关。研究发现,超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内产生等离子体[[β值]]达100($\beta = 2k_B n_eT_e/B^2$)且[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$。文中还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们推出[[Python]][[树张量网络]]软件包([[pyTTN]]),用于评估封闭和开放[[量子系统]]的[[动力学]]特性。该工具基于[[树张量网络]]([[TTN]])或等效的[[多层多组态含时Hartree]]([[ML-MCTDH]])[[波函数]]表示方法。该软件包具有多项特性:支持通过[[子空间]]扩展技术,采用自适应[[键维度]]的单/多组[[TTN]]拟设,便捷设置任意[[哈密顿量]]的零温/有限温度计算。所有核心功能均以[[C++]]实现,并提供[[Python]]接口以简化使用。除核心功能外,[[pyTTN]]还提供多种工具来高效模拟开放[[量子系统]][[动力学]],包括:采用[[TTN]]拟设表示辅助[[密度算子]]空间以模拟[[层次运动方程]]([[HEOM]])方法和[[广义赝模方法]];我们证明这两种方法通过作用于[[赝模]]自由度的非幺正[[简正模变换]]可相互转化。通过系列应用案例展示软件性能:从24模[[吡嗪]][[光激发]][[动力学]]的基准测试出发,进而研究更复杂的[[n-寡聚噻吩]]供体-[[C60]][[富勒烯]]受体界面[[激子]][[动力学]]模型,最后应用于开放[[量子系统]](包括[[自旋-玻色模型]]、扩展[[耗散]][[自旋模型]]及[[安德森杂质模型]])。[[pyTTN]]兼具易用性、高效实现和可扩展架构,能与多种[[计算建模]]软件集成。 == 摘要 == * '''原文标题''':Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory * '''中文标题''':基于自洽场理论的$^{229}$Th$^{3+}$与$^{229}$Th$^{4+}$核钟跃迁频率差预测 * '''发布日期''':2025-03-19 09:53:23+00:00 * '''作者''':Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma * '''分类''':physics.atom-ph *'''原文链接''':http://arxiv.org/abs/2503.15061v1 '''中文摘要''':摘要:[[$^{229}\text{Th}$]][[同位素]]是[[核钟]]的潜在候选者,其[[跃迁频率]]受[[电子]]诱导的[[核频移]]影响。该效应相对较小,需要高精度[[理论计算]]。本研究采用非微扰的[[多组态Dirac-Hartree-Fock]]([[MCDHF]])方法(区别于先前使用的[[微扰理论]])来解析[[场移效应]]。该方法在考虑[[$^{229}\text{Th}$]][[同位素]][[基态]]和[[同核异能态]]的同时,计及[[核势能]]的细微差异。最终测得[[$^{229}\text{Th}^{3+}$]]与[[$^{229}\text{Th}^{4+}$]]的[[核跃迁频率]]差为$-639$~[[MHz]],计算收敛精度达1~[[MHz]]。基于近期对[[CaF$_2$]]中[[$^{229}\text{Th}^{4+}$]][[跃迁频率]]的精密测量结果[Nature 633, 63 (2024)],预测孤立[[$^{229}\text{Th}^{3+}$]]的[[跃迁频率]]为$2,020,406,745 (1)_\text{计算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~[[MHz]],括号内分别表示[[原子结构计算]]、[[核数据表]]输入的[[核电荷半径]]误差以及文献报道的[[晶体环境]]影响。该结果为基于[[离子阱]]实验直接[[激光激发]]孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指导。 == 摘要 == * '''原文标题''':Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis * '''中文标题''':可靠的放射学骨骼肌面积评估——癌症恶病质诊断的生物标志物 * '''发布日期''':2025-03-19 19:07:59+00:00 * '''作者''':Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool * '''分类''':eess.IV, cs.AI, cs.CE, cs.CV *'''原文链接''':http://arxiv.org/abs/2503.16556v1 '''中文摘要''':[[癌症恶病质]]是一种常见的[[代谢紊乱]]疾病,其特征为严重的[[肌肉萎缩]],与不良[[预后]]和[[生活质量]]相关。通过[[计算机断层扫描]]([[CT]])纵向监测[[骨骼肌]]面积([[SMA]])——这种在[[癌症护理]]中常规获取的[[成像模式]]——是识别和追踪该病症的有效方法。然而,现有工具往往缺乏全[[自动化]]且[[准确性]]不一致,限制了其融入[[临床工作流程]]的潜力。为解决这些问题,我们开发了[[SMAART-AI]](基于[[AI]]的[[骨骼肌]]评估-自动化可靠工具),这是一个由[[深度学习模型]]([[nnU-Net]] [[2D]])驱动的[[端到端]]自动化流程,该模型在[[腰椎]]中段三分之一的[[CT图像]]上通过[[5折交叉验证]]训练,确保[[泛化性]]和[[鲁棒性]]。[[SMAART-AI]]整合了基于[[不确定性]]的机制,用于标记高误差的[[SMA]]预测以供[[专家审查]],从而增强[[可靠性]]。我们结合[[SMA]]、[[骨骼肌指数]]、[[BMI]]和[[临床数据]],训练了一个[[多层感知器]]([[MLP]])模型,旨在预测[[癌症]]诊断时的[[恶病质]]。在[[胃食管癌]]数据集上测试时,[[SMAART-AI]]的[[Dice分数]]达到97.80% ± 0.93%,与使用[[SliceOmatic]]手动标注相比,本研究所有四个数据集的[[SMA]]估计[[中位绝对误差]]为2.48%。[[不确定性指标]]——[[方差]]、[[熵]]和[[变异系数]]——与[[SMA]]预测误差高度相关(分别为0.83、0.76和0.73)。[[MLP]]模型预测[[恶病质]]的[[精确度]]为79%,为[[临床医生]]提供了早期[[诊断]]和[[干预]]的可靠工具。通过结合[[自动化]]、[[准确性]]和[[不确定性感知]],[[SMAART-AI]]弥合了[[研究]]与[[临床应用]]之间的差距,为管理[[癌症恶病质]]提供了一种[[变革性]]方法。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:增强视觉指令调优的LLM与视觉骨干网络对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':摘要:[[多模态]][[大语言模型]]([[MLLMs]])的最新进展凸显了[[视觉主干网络]]与底层[[语言模型]]的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿[[参数]]规模,但[[模型大小]]、[[架构]]与[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出[[LLaVA-MORE]]——一个融合最新[[语言模型]]与多样化[[视觉主干]]的新型[[MLLM]]家族。为确保公平比较,我们采用统一[[训练协议]]并一致应用于所有架构。我们的分析系统探索了中小规模[[LLM]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]])在[[多模态推理]]、[[生成]]及[[指令跟随]]方面的表现,同时研究[[模型规模]]与[[性能]]的关系。除评估[[LLM]]对最终结果的影响外,我们还全面研究了从[[CLIP]]架构到[[DINOv2]]、[[SigLIP]]及[[SigLIP2]]等替代方案的各类[[视觉编码器]]。额外实验探究了提高[[图像分辨率]]和[[预训练数据集]]变化的影响。总体而言,研究结果为设计更高效的[[MLLM]]提供了洞见,并建立了可复现的[[评估框架]]以支持直接比较,为未来[[模型开发]]提供指导。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':跨多种因果发现场景的重采样技术交互评估的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参]]赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后阶段]]运用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':顶夸克对与希格斯玻色子联合产生的最先进截面:NNLO预测结合NNLL恢复及电弱修正 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]伴随产生的最新理论预测,该计算遵循[[LHC]][[希格斯工作组]]建议的规范。通过适当近似双圈虚贡献得到的[[NNLO]][[QCD]]预测,进一步补充了[[NNLL]]精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接[[QCD]]方法,另一种基于[[软共线有效理论]]——并详细比较了它们的特性。这些结果还与完整[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。文中对相关理论不确定性来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时以其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':膨胀高能量密度等离子体中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体中的基本挑战之一。自磁化会改变等离子体的[[输运特性]],从而影响其[[动力学演化]]。大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]]依赖于[[比耶曼]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存在争议。已有研究提出基于[[粒子网格]](PIC)模拟的模型来解释磁化现象,包括等离子体相互渗透驱动的[[魏贝尔不稳定性]]、[[温度梯度]]驱动的魏贝尔不稳定性以及[[绝热膨胀]]驱动的魏贝尔不稳定性。本文通过结合[[激光光线追踪]]模块的二维[[碰撞PIC模拟]],研究了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何构型]]以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化,该参数范围与需要考虑[[碰撞效应]]的HED和[[ICF实验]]相关。研究发现,当超过[[临界强度]]时,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内产生[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)的[[强磁化状态]]。文中还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks * '''中文标题''':pyTTN:基于树张量网络的开放与封闭系统量子动力学模拟开源工具箱 * '''发布日期''':2025-03-19 17:40:49+00:00 * '''作者''':Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger * '''分类''':quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.15460v1 '''中文摘要''':我们推出[[Python]]树张量网络软件包([[pyTTN]]),用于评估封闭和开放[[量子系统]]的[[动力学]]特性。该工具基于[[树张量网络]](TTN)或等效的多层多组态含时Hartree([[ML-MCTDH]])波函数表示方法。该软件包具备多项功能:支持通过[[子空间扩展]]技术实现自适应键维度的单/多组TTN拟设,可便捷设置一般[[哈密顿量]]的零温/有限温度计算。所有核心功能均采用[[C++]]实现,并提供[[Python]]接口以简化使用。除核心功能外,[[pyTTN]]还提供开放量子系统动力学模拟工具,包括采用TTN拟设表示辅助密度算子空间以模拟[[层次运动方程]](HEOM)方法和广义赝模方法,并证明这两种方法通过作用于赝模自由度的非幺正简正模变换可相互转化。我们展示了该软件包的应用案例:从24模[[吡嗪]]光激发动力学的基准测试出发,进而研究描述n-寡聚[[噻吩]]供体-[[C60]]富勒烯受体体系界面激子动力学的更具挑战性模型,最后应用于开放量子系统(包括[[自旋-玻色模型]]、扩展耗散自旋模型集和[[安德森杂质模型]])。[[pyTTN]]兼具易用性、高效实现和可扩展设计,能与各类计算建模软件集成。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':[[多模态大语言模型]]([[MLLMs]])的最新进展凸显了[[视觉主干网络]]与底层[[语言模型]]的关键作用。尽管先前研究主要关注将这些组件扩展至数十亿参数规模,但[[模型大小]]、[[架构]]与[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优[[设计选择]]。本文提出[[LLaVA-MORE]]——一个整合最新[[语言模型]]与多样化[[视觉主干]]的新型[[MLLM]]家族。为确保公平比较,我们采用统一[[训练协议]]并严格应用于所有[[架构]]。通过系统分析中小规模[[LLM]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]),我们评估[[多模态推理]]、[[生成]]与[[指令跟随]]能力,同时探究[[模型规模]]与[[性能]]的关系。除评估[[LLM]]对最终结果的影响外,我们还对各类[[视觉编码器]](从[[CLIP]]架构到[[DINOv2]]、[[SigLIP]]及[[SigLIP2]]等替代方案)展开全面研究。额外实验探究了提高[[图像分辨率]]与[[预训练数据集]]变化的影响。总体而言,我们的研究结果为设计更高效的[[MLLM]]提供了洞见,建立了一个可复现的[[评估框架]],该框架既能支持直接比较,也可指导未来[[模型开发]]。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]与[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面(如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少或从未被关注。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参]]赋予特定值的过程。此外,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的[[重采样]]提供了丰富数据。理论工作与[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])作为一种有前景的框架,能够缓解[[大语言模型]]([[LLM]])中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力:在[[检索前]]阶段采用多种[[查询]]与[[语料库预处理]]技术来丰富输入数据;[[检索中]]阶段通过[[领域知识]]微调最先进的[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]联合产生的最新理论预测,该计算遵循[[LHC]][[希格斯工作组]]建议的规范。通过适当近似双圈虚贡献得到的[[NNLO]][[QCD]]预测,进一步补充了[[NNLL]]精度的软胶子重求和。研究采用两种不同的重求和框架——一种基于直接[[QCD]]方法,另一种基于[[软共线有效理论]]——并对二者的特性进行了详细比较。这些结果还与完全[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。文中对相关理论不确定性来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]测试表明样品呈多相特征,其中以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型[[(La,Mg)$_2$Ni$_7$]]相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案的[[第一性原理计算]],通过[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现六方与菱方[[La$_2$Ni$_7$]]结构的[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体研究中的基础性挑战。自磁化会改变等离子体的[[输运特性]],从而影响其[[动力学演化]]过程。目前大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]],都依赖[[比耶曼机制]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存争议。基于[[粒子网格]](PIC)模拟的模型被提出用于解释磁化现象,包括[[等离子体互穿]]驱动的魏贝尔机制、[[温度梯度]]驱动的魏贝尔机制以及[[绝热膨胀]]驱动的魏贝尔机制。本研究采用二维[[碰撞]]PIC模拟结合[[激光光线追踪]]模块,模拟了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何构型]]以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的[[不稳定性]]。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑碰撞效应的HED和[[ICF实验]]相关)。研究发现:超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内产生[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)。研究还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉]]现象的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索]]阶段采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];[[检索]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]结合的[[混合检索]]策略;[[后检索]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品具有多相特征,其中主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,为模拟[[化学无序性]]使用了[[相干势近似]]([[CPA]])。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象高度吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱线进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]联合产生的最新理论预测,该计算严格遵循[[LHC]][[希格斯工作组]]的技术规范。通过适当近似双圈虚贡献导出的[[NNLO]][[QCD]]预测,进一步补充了[[NNLL]]精度的[[软胶子重求和]]。研究采用两种不同的[[重求和]]框架——一种基于直接[[QCD]]方法,另一种基于[[软共线有效理论]]——并详细比较了它们的特性。这些结果还与完整的[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。文中对相关[[理论不确定性]]来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉骨干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':[[多模态大语言模型]]([[MLLMs]])的最新进展凸显了[[视觉主干网络]]和底层[[语言模型]]的关键作用。尽管先前研究主要集中于将这些组件扩展至数十亿参数规模,但[[模型大小]]、[[架构]]与[[性能]]之间的权衡仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出[[LLaVA-MORE]]——一个整合最新[[语言模型]]与多样化[[视觉主干]]的新型[[MLLM]]家族。为确保公平比较,我们采用统一[[训练协议]]并应用于所有架构。我们的分析系统探索了中小规模[[LLM]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]])在[[多模态推理]]、[[生成]]及[[指令跟随]]方面的表现,同时研究[[模型规模]]与[[性能]]的关系。除评估[[LLM]]对最终结果的影响外,我们还全面研究了从[[CLIP架构]]到[[DINOv2]]、[[SigLIP]]和[[SigLIP2]]等替代方案的各类[[视觉编码器]]。额外实验探究了提高[[图像分辨率]]及[[预训练数据集]]变化的影响。总体而言,研究结果为设计更高效的[[MLLM]]提供了洞见,并建立了可复现的[[评估框架]],该框架既能支持直接比较,也可指导未来[[模型开发]]。源代码与训练模型公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':膨胀高能量密度等离子体中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体研究中的基础性挑战。自磁化会改变等离子体的[[输运特性]],从而影响其[[动力学演化]]过程。目前大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]],都依赖[[比耶曼机制]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存争议。已有研究提出基于[[粒子网格]](PIC)模拟的磁化解释模型,包括[[等离子体互穿]]驱动的魏贝尔机制、[[温度梯度]]驱动的魏贝尔机制以及[[绝热膨胀]]驱动的魏贝尔机制。本研究通过结合[[激光光线追踪]]模块的二维[[碰撞]]PIC模拟,再现了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何构型]]以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的[[不稳定性]]。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内调节(该参数范围需考虑碰撞效应的HED和[[ICF实验]]相关),研究发现:超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初数百[[皮秒]]内即可产生等离子体[[β值]]达100($\beta = 2k_B n_eT_e/B^2$)且[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$的状态。研究还探讨了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多因果发现背景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:预检索阶段采用多种[[查询]]与[[语料库]]预处理技术增强输入数据;检索阶段通过[[领域知识]]微调[[最先进]](SOTA)[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]]的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到最高值304 mAh/g。实验工作辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$型]]和[[Gd$_2$Co$_7$型]]La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们针对[[标准模型]] [[希格斯玻色子]]与[[顶夸克]]的伴随产生过程,提出了符合[[LHC]] [[希格斯工作组]]建议的最新理论预测。通过适当近似双圈虚贡献获得的[[NNLO]] [[QCD]]预测,补充了[[NNLL]]精度的软胶子重求和。研究采用两种不同的重求和框架——基于直接[[QCD]]方法和[[软共线有效理论]]——并详细比较了它们的特性。这些结果进一步与完整[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。我们对相关理论不确定性来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning * '''中文标题''':LLaVA-MORE:LLM与视觉主干网络在增强视觉指令调优中的对比研究 * '''发布日期''':2025-03-19 18:10:12+00:00 * '''作者''':Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara * '''分类''':cs.CV, cs.AI, cs.CL, cs.MM *'''原文链接''':http://arxiv.org/abs/2503.15621v1 '''中文摘要''':[[多模态大语言模型]]([[MLLMs]])的最新进展凸显了[[视觉主干网络]]与底层[[语言模型]]的关键作用。尽管先前研究主要聚焦于将这些组件扩展至数十亿参数规模,但[[模型大小]]、[[架构]]与[[性能]]之间的权衡关系仍未得到充分探索。此外,[[训练数据]]和[[评估协议]]的不一致性阻碍了直接比较,导致难以确定最优设计方案。本文提出[[LLaVA-MORE]]——一个整合最新[[语言模型]]与多样化[[视觉主干]]的新型[[MLLM]]家族。为确保公平比较,我们在所有架构中采用统一的[[训练协议]]。通过系统分析中小规模[[LLM]](包括[[Phi-4]]、[[LLaMA-3.1]]和[[Gemma-2]]),我们评估了[[多模态推理]]、[[生成]]与[[指令跟随能力]],同时探究[[模型规模]]与[[性能]]的关系。除评估[[LLM]]对最终结果的影响外,我们还对[[CLIP架构]]及[[DINOv2]]、[[SigLIP]]、[[SigLIP2]]等替代[[视觉编码器]]展开全面研究。额外实验探讨了提高[[图像分辨率]]和[[预训练数据集]]变化的影响。总体而言,我们的研究结果为设计更高效的[[MLLM]]提供了洞见,并建立了可复现的[[评估框架]],该框架既能支持直接比较,也可指导未来[[模型开发]]。源代码与训练模型已公开于:https://github.com/aimagelab/LLaVA-MORE。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体研究中的基础性挑战。自磁化会改变等离子体的[[输运特性]],从而影响其[[动力学演化]]过程。目前大多数关于[[磁重联]]和[[无磁化无碰撞激波]]的[[高能量密度]](HED)[[激光实验]],都依赖[[比耶曼机制]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存争议。基于[[粒子网格]](PIC)模拟的模型被提出用于解释[[磁化]]现象,包括等离子体互穿驱动的[[魏贝尔效应]]、[[温度梯度]]驱动的魏贝尔效应以及[[绝热膨胀]]驱动的魏贝尔效应。本研究采用二维[[碰撞]]PIC模拟结合[[激光光线追踪]]模块,模拟了等离子体[[烧蚀]]、[[膨胀]]及后续磁化过程。模拟采用[[平面几何构型]]以有效抑制[[比耶曼磁场]],从而聚焦于[[各向异性]]驱动的[[不稳定性]]。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内变化(该参数范围需考虑[[碰撞效应]]的HED和[[ICF实验]]相关)。研究发现:超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内产生[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$且等离子体$\beta$值达100($\beta = 2k_B n_eT_e/B^2$)。研究还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':跨多种因果发现场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些重采样方法能高度模拟特定[[算法参数]]的赋值过程。此外,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力。[[检索前]]阶段采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;[[检索中]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索]]策略;[[检索后]]阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]伴随产生的最新理论预测,该计算遵循[[LHC]][[希格斯工作组]]的建议。通过适当近似双圈虚贡献,我们获得了[[NNLO]][[QCD]]预测,并补充了[[NNLL]]精度的软胶子重求和。研究采用了两种不同的重求和框架——一种基于直接[[QCD]]方法,另一种基于[[软共线有效理论]]——并对它们的特性进行了详细比较。这些结果进一步与完整的[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。我们对相关理论不确定性来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':Simulations of self-magnetization in expanding high-energy-density plasmas * '''中文标题''':高能量密度等离子体膨胀中的自磁化模拟 * '''发布日期''':2025-03-19 18:16:50+00:00 * '''作者''':K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox * '''分类''':physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2503.15624v1 '''中文摘要''':理解[[等离子体]]自磁化是[[实验室]]和[[天体物理]]等离子体研究中的基础性挑战。自磁化会改变等离子体[[输运]]特性,从而影响其[[动力学演化]]过程。目前大多数关于[[磁重联]]和无磁化无碰撞[[激波]]的[[高能量密度]](HED)[[激光]]实验,都依赖[[比耶曼机制]]或[[魏贝尔机制]]来自洽地产生目标[[磁场]]。多项HED实验已观测到[[兆高斯]]强度的[[离子尺度]]磁丝形成,但其起源仍存争议。已有研究提出基于[[粒子网格]](PIC)模拟的磁化解释模型,包括等离子体互穿驱动的魏贝尔机制、[[温度梯度]]驱动的魏贝尔机制以及[[绝热膨胀]]驱动的魏贝尔机制。本研究通过结合激光[[射线追踪]]模块的二维碰撞PIC模拟,再现了等离子体[[烧蚀]]、膨胀及后续磁化过程。模拟采用[[平面几何]]构型以有效抑制比耶曼磁场,从而聚焦于[[各向异性]]驱动的不稳定性。激光强度在$10^{13}$-$10^{14}$ W/cm$^2$范围内调节(该参数范围需考虑[[碰撞效应]]的HED和[[ICF]]实验相关),研究发现:超过[[临界强度]]后,等离子体通过膨胀驱动的魏贝尔过程快速自磁化,在最初几百[[皮秒]]内即产生[[霍尔参数]]$\omega_{\rm ce}\tau_{e}>1$、等离子体[[β值]]达100($\beta = 2k_B n_eT_e/B^2$)的强磁场。研究还讨论了等离子体磁化对[[热输运]]的影响。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但目前用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面(如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])几乎未受关注。我们提出的[[理论结果]]证明,某些[[重采样方法]]能高度模拟特定[[算法参数]]的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果既验证了[[理论结论]],也为研究人员进一步表征[[因果发现]]分析中的[[重采样]]特性提供了丰富数据。[[理论工作]]和[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。预检索阶段采用多种[[查询]]与[[语料库]]预处理技术来丰富[[输入数据]];检索阶段通过[[领域知识]]微调前沿([[SOTA]])[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':最先进的ttH产生截面:NNLO预测与NNLL恢复及电弱修正的匹配 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]伴随产生的最新理论预测,该计算遵循[[LHC]][[希格斯工作组]]的建议。通过适当近似双圈虚贡献得到的[[NNLO]][[QCD]]预测,补充了[[NNLL]]精度的[[软胶子重求和]]。研究采用了两种不同的重求和框架——一种基于直接[[QCD]],另一种基于[[软共线有效理论]]——并详细比较了它们的特性。这些结果进一步与完整[[NLO]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。我们对相关理论不确定性来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或从未受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出了理论结果,证明某些[[重采样方法]]能精确模拟特定[[算法参数]]的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。理论工作和[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库]]预处理技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调[[最先进]](SOTA)[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]]结构的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到304 mAh/g的最高值。实验研究辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$型]]和[[Gd$_2$Co$_7$型]]La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的占位偏好与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections * '''中文标题''':顶夸克-希格斯玻色子联合产生的前沿截面:NNLO匹配NNLL恢复与电弱修正的预测 * '''发布日期''':2025-03-19 09:32:21+00:00 * '''作者''':Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro * '''分类''':hep-ph, hep-ex *'''原文链接''':http://arxiv.org/abs/2503.15043v1 '''中文摘要''':我们根据[[LHC]][[希格斯]]工作组建议,提出了[[标准模型]][[希格斯玻色子]]与[[顶夸克]]联合产生的最新理论预测。通过适当近似[[双圈虚贡献]],我们获得了[[次次领头阶]]([[NNLO]])[[量子色动力学]]预测,并补充了直至[[次次领头对数]]([[NNLL]])精度的[[软胶子重求和]]。研究采用两种不同的[[重求和]]框架——一种基于直接[[量子色动力学]],另一种基于[[软共线有效理论]]——并详细比较了它们的特性。这些结果进一步与完整[[次领头阶]]修正相结合,产生了迄今为止该过程最精确的[[标准模型]]预测。我们对相关理论[[不确定性]]来源进行了全面评估和讨论。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法与调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富[[输入数据]];[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则结合[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化]]检索技术对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程详见[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探究了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性质]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品具有多相特征,主要包含六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多重因果发现情境下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分研究。其中最流行的方法是通过[[数据重采样]]来评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])却鲜少受到关注。我们提出了理论结果,证明某些重采样方法能高度模拟对算法调参赋予特定值的过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一个高效的端到端RAG流程,通过三阶段方法提升[[金融文档]]检索效果:检索前阶段采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;检索阶段结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;检索后阶段运用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探究了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性质]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。 实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算。为模拟[[化学无序态]],采用[[相干势近似]]([[CPA]])方法,重点分析了实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。计算发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]近乎相同,这与样品中两相共存现象吻合。[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]计算值也与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了[[理论结果]],证明某些[[重采样方法]]可以很好地模拟为[[算法调优参数]]分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论发现]],并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:预检索阶段采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];检索阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的检索策略;后检索阶段则结合[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性质]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算获得的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉现象]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强[[输入数据]];[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则结合[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方案显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。[[预检索]]阶段采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;[[检索]]阶段通过[[领域知识]]微调最先进的[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索]]阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组]]方案([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的[[稳定性]],类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的[[理论结果]]证明,某些[[重采样方法]]能精确模拟对[[算法调参参数]]赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论结论]],并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了大量[[数据]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉现象]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探究了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验工作辅以采用[[全势局域轨道最小基组]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,为模拟[[化学无序性]]使用了[[相干势近似]]([[CPA]])。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]][[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]],实验[[XPS]]谱基于[[DFT]]计算对应的谱图进行解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现]]分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':金融问答文档检索增强生成系统中的检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]][[RAG]]流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[后检索阶段]]则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品具有多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但现有的非实验性[[因果模型]]验证方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]来评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟特定[[算法参数]]的赋值过程。同时,我们通过大量[[模拟实验]]验证了该理论结果,并提供了丰富数据以帮助研究者进一步表征[[因果发现]]分析中的重采样特性。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过三阶段方法提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[检索后阶段]]运用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟为算法调优参数分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉现象]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的端到端RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化金融文档检索:预检索阶段采用[[多样化查询]]与[[语料预处理]]技术增强输入数据;检索阶段结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升检索性能,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]与[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面(如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少受到关注。我们提出的[[理论结果]]证明,某些[[重采样方法]]能精准模拟对[[算法调参]]赋予特定值的过程。此外,我们报告了大量[[模拟实验]]的结果,这些结果既验证了[[理论结论]],又为研究者进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。[[理论工作]]与[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果既验证了理论结论,又为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作与模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLMs]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的端到端[[RAG]]流程,通过三阶段方法提升[[金融文档]]检索效果:[[预检索]]阶段采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索]]阶段结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]混合的检索策略;[[后检索]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':金融问答文档在检索增强生成系统中的检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的检索策略;[[后检索阶段]]则结合[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了[[理论结果]],证明某些[[重采样方法]]可以很好地模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论结果]],并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];[[检索阶段]]通过[[领域知识]]微调[[最先进]](SOTA)[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则结合[[直接偏好优化]](DPO)[[训练]]和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的[[答案]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统[[效能]]的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':一项评估多重因果发现情境下重采样技术交互作用的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]与[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面(如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少受到关注。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的[[重采样]]提供了丰富数据。理论工作与[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。在预检索阶段,采用多种[[查询]]与[[语料库预处理]]技术来丰富输入数据;检索阶段则通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];后检索阶段利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]来评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索]]阶段采用多种[[查询]]与[[语料库预处理]]技术增强[[输入数据]];[[检索]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])却鲜少受到关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法与调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[检索后阶段]]运用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些[[重采样方法]]能紧密模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了大量数据。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索]]阶段采用多种[[查询]]与[[语料库]]预处理技术增强输入数据;[[检索]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]结合的[[混合检索策略]];[[后检索]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的答案。这些发现凸显了[[定制化]][[检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档检索]]:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了[[理论结果]],证明某些[[重采样方法]]能紧密模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论发现]],并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLM)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端RAG流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力。在检索前阶段,采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;检索阶段则通过[[领域知识]]微调最先进的[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索]]策略;检索后阶段利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调参参数]]。我们提出了理论结果,证明某些[[重采样方法]]能紧密模拟对[[算法调参参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略的优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLMs]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的端到端[[RAG]]流程,通过三阶段方法提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后阶段]]利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互影响的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面鲜少或从未受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的[[理论结果]]证明,某些[[重采样方法]]能高度模拟对[[算法调参参数]]特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论发现]],并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了大量[[数据]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力。检索前阶段采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;检索阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索]]策略;检索后阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互作用的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但目前用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能很好地模拟对算法调参参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:预检索阶段采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];检索阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈[[多相]]特征,主相为[[六方]][[Ce$_2$Ni$_7$]]型和[[菱方]][[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的峰值。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了其他结构作为参照。发现[[La$_2$Ni$_7$]]的[[六方]]与[[菱方]]结构[[总能量]]近乎相同,这与样品中[[两相共存]]现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]][[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的峰值。实验工作辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现]]分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]检索能力:预检索阶段采用多种[[查询]]与[[语料库]]预处理技术丰富输入数据;检索阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]结合的[[混合检索策略]];后检索阶段则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升了检索性能,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品具有多相特征,其中主要为[[六方]][[Ce$_2$Ni$_7$]]型和[[菱方]][[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,为模拟[[化学无序性]]使用了[[相干势近似]]([[CPA]])。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,并引入其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的[[六方]]与[[菱方]]结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]][[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带]],实验[[XPS]]结果基于[[DFT]]计算的[[光谱]]进行了解读。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、使用的[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])作为一种有前景的框架,能够缓解[[大语言模型]]([[LLM]])中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的端到端[[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。[[预检索]]阶段采用多种[[查询]]与[[语料库预处理]]技术来丰富输入数据;[[检索]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索]]阶段则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品具有[[多相]]特征,其中以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型[[(La,Mg)$_2$Ni$_7$]]相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的峰值。实验研究辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,为模拟[[化学无序性]]采用了[[相干势近似]]([[CPA]])。计算重点针对具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中[[两相共存]]现象高度吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分研究。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出了理论结果,证明某些重采样方法能高度模拟特定[[算法参数]]的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时对比了其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法能紧密模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLM)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过三阶段方法([[检索前]]、[[检索]]和[[检索后]])增强[[金融文档]]检索能力。在检索前阶段,采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;检索阶段则通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索]]策略;最后在检索后阶段,利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学和电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后,采用[[全势局域轨道最小基组方案]]([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并利用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时以其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强[[输入数据]];[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含[[六方]][[Ce$_2$Ni$_7$]]型和[[菱方]][[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组]]([[FPLO]])方案进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的[[六方]]与[[菱方]]结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]][[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些[[重采样方法]]可以很好地模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库]]预处理技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]测试表明样品具有以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型为主的[[(La,Mg)$_2$Ni$_7$]]多相特征。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。实验工作辅以采用[[全势局域轨道最小基组]]方案([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时参考其他多种结构。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象高度吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术与因果发现方法交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现]]分析中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过三阶段方法提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[检索后阶段]]运用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]]的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg浓度]]增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到304 mAh/g的最高值。实验工作辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察多个结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的[[占位偏好]]与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料库预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择方法]]进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品呈多相特征,其中以六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]](La,Mg)$_2$Ni$_7$相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)时达到峰值304 mAh/g。实验研究后采用[[全势局域轨道最小基组]]方案([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,通过[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象高度吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$型]]和[[Gd$_2$Co$_7$型]]La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])鲜少或从未被关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了丰富数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则结合[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]测试表明样品具有以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型为主的[[(La,Mg)$_2$Ni$_7$]]多相特征。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。 实验研究辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算。为模拟[[化学无序]],我们采用[[相干势近似]]([[CPA]])。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象高度吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些[[重采样方法]]可以很好地模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出一种高效的端到端[[RAG]]流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索]]阶段采用多种[[查询]]与[[语料预处理]]技术增强输入数据;[[检索]]阶段通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密]]与[[稀疏表征]]混合的检索策略;[[后检索]]阶段则结合[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的实验表明,该方法显著提升[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品具有多相特征,其中主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。实验研究结合了基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算重点针对实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,并引入其他结构作为参照。研究发现六方与菱方结构的[[La$_2$Ni$_7$]]总能量几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术与因果发现方法交互影响的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强[[输入数据]];[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的[[答案]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$[[合金]]系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品具有[[多相]]特征,其中以六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]]结构的(La,Mg)$_2$Ni$_7$相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg浓度]]增加而提升,并在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)时达到峰值304 mAh/g。实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,采用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算重点针对实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,并引入其他结构作为参照。研究发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]近乎相同,这与样品中[[两相共存]]现象吻合。计算获得的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的[[占位偏好]]与前期[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],并基于[[DFT]]计算[[谱图]]对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]测试表明样品具有[[多相]]特征,其中以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型[[(La,Mg)$_2$Ni$_7$]]相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到304 mAh/g的最高值。实验工作辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,为模拟[[化学无序性]]使用了[[相干势近似]]([[CPA]])。计算聚焦于具有最高$C_{max}$测量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中[[两相共存]]现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]结果基于[[DFT]]计算的[[光谱]]进行了解读。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了[[理论结果]],证明某些[[重采样方法]]可以很好地模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论结果]],并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。[[理论]]和[[模拟]]结果共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验研究辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互影响的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面很少或根本没有受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些重采样方法可以很好地模拟对算法调优参数特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的重采样。理论工作和模拟结果共同为实践中如何选择重采样方法和调优参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施融合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互影响的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参参数]]赋予特定值的过程。同时,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了大量数据。理论工作和模拟结果共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])作为一种有前景的框架,能够缓解[[大语言模型]]([[LLMs]])中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG]]流程,通过三阶段方法([[检索前]]、[[检索]]和[[检索后]])增强[[金融文档]]的检索效果。在[[检索前]]阶段,采用多种[[查询]]和[[语料库预处理]]技术来丰富[[输入数据]];[[检索]]阶段则通过[[领域知识]]微调最先进的[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后]]阶段利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,[[检索性能]]显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要包含六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验研究后采用[[全势局域轨道最小基组]]方案([[FPLO]])进行[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于具有最高$C_{max}$实测值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时以其他多种结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象高度吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]结果基于[[DFT]]计算的[[光谱]]进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互影响的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的检索策略;[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[镍氢电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对La$_{2-x}$Mg$_x$Ni$_7$材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主要为六方[[Ce$_2$Ni$_7$型]]和菱方[[Gd$_2$Co$_7$型]]的(La,Mg)$_2$Ni$_7$相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)达到最高值304 mAh/g。实验研究辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案的[[第一性原理计算]],并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$组分,同时考察了若干其他结构作为参照。发现La$_2$Ni$_7$的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$型]]和[[Gd$_2$Co$_7$型]]La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]]La$_{1.5}$Mg$_{0.5}$Ni$_7$样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面鲜少或从未被关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG流程]],通过[[三阶段方法]]提升[[金融文档检索]]效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]结合[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密与稀疏表征]]混合的[[检索策略]];[[后检索阶段]]则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择方法]]进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品呈[[多相]]特征,其中以六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型[[(La,Mg)$_2$Ni$_7$]]相为主。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,并在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)时达到峰值304 mAh/g。 实验研究辅以基于[[全势局域轨道最小基组方案]]([[FPLO]])的[[密度泛函理论]]([[DFT]])计算。为模拟[[化学无序态]],采用[[相干势近似]]([[CPA]])方法,重点分析了具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。计算发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]近乎相同,这与样品中[[两相共存]]现象高度吻合。对于[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中[[Mg]]的[[占位偏好]]计算,结果与前期[[实验数据]]一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],并基于[[DFT]]计算谱对实验[[XPS]]结果进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、使用的[[算法]]或[[算法调优参数]]。我们提出了[[理论结果]],证明某些[[重采样方法]]可以很好地模拟为[[算法调优参数]]分配特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论结果]],并提供了大量[[数据]]以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略的优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择方法]]进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的答案。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg取代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子特性的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]与[[电子性能]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到峰值304 mAh/g。实验部分后接采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]组分,同时考察了若干其他结构作为参照。发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的[[占位偏好]]与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了丰富数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。[[X射线衍射]]分析表明样品呈多相特征,主相为六方[[Ce$_2$Ni$_7$]]型和菱方[[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到304 mAh/g的最高值。实验研究辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算主要针对实测$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了若干其他结构作为参照。研究发现[[La$_2$Ni$_7$]]的六方与菱方结构[[总能量]]几乎相同,这与样品中两相共存现象吻合。计算得到的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与前期实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]] [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱图进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少或从未受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出了理论结果,证明某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的答案。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies * '''中文标题''':La被Mg替代对La$_{2-x}$Mg$_x$Ni$_7$合金电化学与电子性质的影响:实验与第一性原理综合研究 * '''发布日期''':2025-03-19 07:34:11+00:00 * '''作者''':Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.14952v1 '''中文摘要''':摘要:[[La-Mg-Ni基合金]]是第三代[[Ni-MH$_x$电池]]极具前景的[[负极材料]]。本研究探讨了[[Mg]]替代对[[La$_{2-x}$Mg$_x$Ni$_7$]]材料[[电化学]]和[[电子特性]]的影响。采用[[机械合金化]]技术制备了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。[[X射线衍射]]表明样品具有多相特征,主要为[[六方]][[Ce$_2$Ni$_7$]]型和[[菱方]][[Gd$_2$Co$_7$]]型的[[(La,Mg)$_2$Ni$_7$]]相。[[电化学测试]]显示最大[[放电容量]]($C_{max}$)随[[Mg]]浓度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)达到最高值304 mAh/g。实验工作辅以采用[[全势局域轨道最小基组]]([[FPLO]])方案进行的[[密度泛函理论]]([[DFT]])计算,并运用[[相干势近似]]([[CPA]])模拟[[化学无序]]。计算聚焦于具有最高实测$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同时考察了其他结构作为参照。研究发现[[六方]]和[[菱方]]结构的[[La$_2$Ni$_7$]]总能量几乎相同,这与样品中两相共存现象吻合。计算的[[Mg]]在[[Ce$_2$Ni$_7$]]型和[[Gd$_2$Co$_7$]]型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的占位偏好与先前实验数据一致。此外,通过[[X射线光电子能谱]]([[XPS]])研究了[[纳米晶]][[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]样品的[[价带结构]],实验[[XPS]]谱图基于[[DFT]]计算所得对应谱进行了解析。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分研究。其中最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的诸多方面(如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]])几乎未受关注。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结论,并为研究人员进一步表征[[因果发现]]分析中的重采样提供了大量数据。理论工作和模拟结果共同为实践中如何选择重采样方法和调参提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力。在检索前阶段,采用多种[[查询]]与[[语料库]]预处理技术来丰富[[输入数据]];检索阶段则通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索]]策略;最后在检索后阶段,利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化]]检索技术对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的重采样方法。然而,该方法的许多方面鲜少受到关注,例如重采样方法的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的理论结果证明,某些重采样方法能高度模拟对算法调参参数赋予特定值的过程。此外,我们报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的重采样提供了大量数据。理论工作和模拟实验共同为实践中如何选择重采样方法和调参参数提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]][[RAG]]流程,通过[[三阶段方法]]提升[[金融文档]]检索效果:[[预检索阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的评估表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的[[关键作用]]。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术与因果发现方法交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面鲜少或从未受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的[[理论结果]]证明,某些[[重采样方法]]能高度模拟特定[[算法参数]]的赋值过程。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论发现]],并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。[[理论工作]]和[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':面向检索增强生成系统的金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过三阶段方法([[检索前]]、[[检索中]]和[[检索后]])增强[[金融文档]]检索能力。[[检索前阶段]]采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;[[检索中阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[检索后阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答]]数据集([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面鲜少或从未被关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参]]特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了大量数据。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)作为一种有前景的框架,能够缓解[[大语言模型]](LLMs)中的[[幻觉问题]],但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段方法增强[[金融文档]]的检索效果。[[预检索阶段]]采用多种[[查询]]与[[语料库]]预处理技术来丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在七个[[金融问答数据集]]([[FinDER]]、[[FinQABench]]、[[FinanceBench]]、[[TATQA]]、[[FinQA]]、[[ConvFinQA]]和[[MultiHiertt]])上的评估表明,检索性能显著提升,从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在[[现代科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参参数]]。我们提出的[[理论结果]]证明,某些[[重采样方法]]能高度模拟对[[算法调参参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了[[理论发现]],并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。[[理论工作]]和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调参参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLMs)[[幻觉问题]]的有效框架,但其整体性能取决于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域特定词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]]RAG流程,通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档]]检索:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步精炼结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的答案。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]]RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景因果发现中重采样技术交互效应的模拟评估研究 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估[[模型特征]]的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的诸多方面鲜少受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所用[[算法]]或[[算法调参]]。我们提出的理论结果证明,某些[[重采样方法]]能高度模拟对[[算法调参]]特定值的赋值。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论发现,并为研究人员进一步表征[[因果发现分析]]中的[[重采样]]提供了丰富数据。理论工作和[[模拟实验]]共同为实践中如何选择[[重采样方法]]和[[调参]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':检索增强生成系统中金融问答文档检索策略优化 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]](RAG)已成为缓解[[大语言模型]](LLM)[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[专业术语]]和[[多层次表格数据]]带来独特挑战。本研究提出一种高效的[[端到端]]RAG流程,通过三阶段方法提升[[金融文档]]检索效果:[[检索前阶段]]采用多种[[查询]]与[[语料预处理]]技术丰富输入数据;[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施[[稠密表征]]与[[稀疏表征]]结合的[[混合检索策略]];[[检索后阶段]]利用[[直接偏好优化]](DPO)训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答]]数据集上的评估表明,该方法显著提升[[检索性能]],生成结果更准确且符合[[上下文]]。这些发现凸显了[[定制化检索技术]]对提升金融领域RAG系统效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。 == 摘要 == * '''原文标题''':An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts * '''中文标题''':多场景下重采样技术交互效应的广泛模拟研究评估 * '''发布日期''':2025-03-19 17:18:18+00:00 * '''作者''':Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld * '''分类''':stat.ME, cs.AI *'''原文链接''':http://arxiv.org/abs/2503.15436v1 '''中文摘要''':摘要:尽管[[探索性因果分析]]在现代[[科学]]和[[医学]]中的应用日益加速,但用于验证[[因果模型]]的非实验方法尚未得到充分表征。最流行的方法之一是通过[[数据重采样]]后评估模型特征的稳定性,类似于[[统计学]]中用于估计[[置信区间]]的[[重采样方法]]。然而,该方法的许多方面很少或根本没有受到关注,例如[[重采样方法]]的选择是否应取决于[[样本量]]、所使用的[[算法]]或[[算法调优参数]]。我们提出了理论结果,证明某些[[重采样方法]]可以很好地模拟对[[算法调优参数]]特定值的分配。我们还报告了大量[[模拟实验]]的结果,这些结果验证了理论结果,并提供了大量数据以帮助研究人员进一步表征[[因果发现分析]]中的[[重采样]]。理论工作和[[模拟结果]]共同为实践中如何选择[[重采样方法]]和[[调优参数]]提供了具体指导。 == 摘要 == * '''原文标题''':Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems * '''中文标题''':优化检索增强生成系统中金融问答文档的检索策略 * '''发布日期''':2025-03-19 13:21:49+00:00 * '''作者''':Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim * '''分类''':cs.IR *'''原文链接''':http://arxiv.org/abs/2503.15191v1 '''中文摘要''':[[检索增强生成]]([[RAG]])已成为缓解[[大语言模型]]([[LLM]])[[幻觉问题]]的有效框架,但其整体性能依赖于底层[[检索系统]]。在[[金融领域]],[[10-K报告]]等文档因[[领域专有词汇]]和[[多层次表格数据]]而带来独特挑战。本研究提出了一种高效的[[端到端]][[RAG流程]],通过[[预检索]]、[[检索]]和[[后检索]]三阶段优化[[金融文档检索]]:[[预检索阶段]]采用多种[[查询]]与[[语料库预处理]]技术增强[[输入数据]];[[检索阶段]]通过[[领域知识]]微调前沿[[嵌入模型]],并实施结合[[稠密表示]]与[[稀疏表示]]的[[混合检索策略]];[[后检索阶段]]则利用[[直接偏好优化]]([[DPO]])训练和[[文档选择]]方法进一步优化结果。在[[FinDER]]、[[FinQABench]]等七个[[金融问答数据集]]上的实验表明,该方法显著提升了[[检索性能]],从而生成更准确且符合语境的回答。这些发现凸显了[[定制化检索技术]]对提升[[金融领域]][[RAG系统]]效能的关键作用。完整可复现流程已发布于[[GitHub]]:https://github.com/seohyunwoo-0407/GAR。
返回
WikiEdge:ArXiv速递/2025-03-19
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息