WikiEdge:ArXiv速遞/2025-03-19
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多種因果發現情境中的交互作用
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的可用非實驗方法尚未得到很好的表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次的表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG管道,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索能力。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文適當的生成結果。這些發現突顯了定製檢索技術在提升RAG系統在金融應用中的有效性方面的關鍵作用。完整的可復現管道可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學和電子性質的影響:實驗與從頭計算相結合的研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的有前景的負極材料。在本工作中,我們研究了Mg取代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射線衍射測量表明樣品具有多相特徵,主要為六方Ce$_2$Ni$_7$型和菱面體Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示最大放電容量($C_{max}$)隨Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱面體結構的總能量幾乎相同,這與樣品中兩相的共存一致。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算的相應光譜進行了解釋。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD的格點QCD對$B_c\to J/\psi$矢量和軸矢量形狀因子的確定,並提供了張量形狀因子的新結果。我們使用高度改進的交錯夸克作用量處理所有價夸克,並結合第二代MILC $n_f=2+1+1$ HISQ膠子場配置。該計算包括兩個額外的集合,一個具有物理輕上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一個具有$a\approx 0.03\mathrm{fm}$,在該集合上我們能夠達到物理底夸克質量。我們的計算使用非微擾重整化的流算子,並覆蓋了衰變的整個運動學範圍。我們使用最近的重-粲磁化率結果,作為$u=m_c/m_h$的函數,以便在我們的物理-連續外推中採用$B_c\to J/\psi$的完整色散參數化。我們給出了更新的標準模型預測$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分別將不確定性減少了$29\%$,$45\%$,$40\%$和$50\%$。由於我們的格點形狀因子覆蓋了整個運動學範圍,我們可以使用它們來測試在低反衝截斷範圍內的數據外推。我們研究了不同的物理連續參數化方案,使用在$q^2_\mathrm{max}$附近運動學範圍的前$1/3$的格點結果。我們發現,如果在物理連續外推中省略高階運動學術語,從高$q^2$區域外推合成數據時,在$q^2=0$附近可能會出現意外大的系統不確定性。這表明,在從高$q^2$區域外推相關$B\to D^*\ell\bar{\nu}$衰變的合成格點QCD數據時,可能會低估系統不確定性。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:ttH 產生截面的最新進展:NNLO 預測與 NNLL 重求和及電弱修正的結合
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了關於標準模型希格斯玻色子與頂夸克聯合產生的最新預測,這些預測是根據LHC希格斯工作組建議計算的。通過適當近似雙圈虛擬貢獻,我們得出了NNLO QCD預測,並補充了高達NNLL精度的軟膠子重求和。採用了兩種不同的重求和框架——一種基於直接QCD,另一種基於軟共線有效理論——並對它們的特性進行了詳細比較。這些結果進一步與完整的NLO修正相結合,產生了迄今為止對該過程最精確的標準模型預測。我們全面估計並討論了相關理論不確定性的來源。
摘要
- 原文標題:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文標題:自由中子壽命實驗 $τ$SPECT 的超冷中子模擬框架
- 發佈日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分類:physics.ins-det, nucl-ex
- 原文連結:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子壽命的精確測定在現代精密物理學中具有重要意義。這一關鍵觀測值與通過卡比博-小林-益川矩陣元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成後原始元素的豐度有關。然而,目前用於測量中子壽命的兩種主要技術得出了不相容的結果,這種差異被稱為中子壽命之謎。為了解決中子與材料壁相互作用引起的系統不確定性,$\tau$SPECT 實驗採用了完全磁阱來捕獲超冷中子(UCNs)。超冷中子是一種能量極低的中子,其典型速度低於 $8\,\textrm{m/s}$,可以通過磁場、重力和合適的材料導引進行操控,這些材料的表面可以在任何入射角下反射中子。為了精確研究和表徵 $\tau$SPECT 中 UCN 在生產、導引、存儲和檢測過程中的行為,我們開發了一個專用的模擬框架。該框架基於外部開發的 UCN 蒙特卡羅軟件包 PENTrack,並增強了兩個配套工具:一個用於靈活且可參數化的 PENTrack 上游配置,以便調整模擬的輸入設置以重現實驗觀測結果;另一個用於分析、可視化和動畫化模擬數據。模擬結果與在保羅謝勒研究所使用 $\tau$SPECT 獲得的實驗數據非常吻合,並作為識別系統不確定性和指導當前實驗裝置未來改進的強大資源。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:一個使用樹張量網絡進行開放和封閉系統量子動力學模擬的開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們介紹了用於評估封閉和開放量子系統動力學特性的Python樹張量網絡包(pyTTN),該包利用樹張量網絡(TTN)或等效的多層多構型時間依賴Hartree(ML-MCTDH)波函數表示。該包包含多個功能,允許通過使用子空間擴展技術,使用具有自適應鍵維度的單集和多集TTN ansätze,輕鬆設置一般哈密頓量的零溫和有限溫度計算。所有核心功能均在C++中實現,並提供了Python綁定以簡化該包的使用。除了這些核心功能外,pyTTN還提供了多種工具,用於設置開放量子系統動力學的高效模擬,包括使用TTN ansatz表示輔助密度算子空間,用於模擬層次運動方程(HEOM)方法和廣義偽模式方法;此外,我們證明了這兩種方法在作用於偽模式自由度的非酉正規模式變換下是等價的。我們展示了該包的一組應用,從廣泛使用的24模式吡嗪的光激發動力學基準案例開始,隨後考慮了一個更具挑戰性的模型,描述了$n$-寡聚噻吩供體-C$_{60}$富勒烯受體系統界面處的激子動力學。最後,我們考慮了開放量子系統的應用,包括自旋-玻色子模型、一組擴展耗散自旋模型和安德森雜質模型。通過結合易用性、高效實現以及允許未來擴展的可擴展設計,pyTTN可以集成到廣泛的計算建模軟件中。
摘要
- 原文標題:When LLMs Meet API Documentation: Can Retrieval Augmentation Aid Code Generation Just as It Helps Developers?
- 中文標題:當大語言模型遇到API文檔:檢索增強能否像幫助開發者一樣助力代碼生成?
- 發佈日期:2025-03-19 14:08:47+00:00
- 作者:Jingyi Chen, Songqiang Chen, Jialun Cao, Jiasi Shen, Shing-Chi Cheung
- 分類:cs.SE
- 原文連結:http://arxiv.org/abs/2503.15231v1
中文摘要:檢索增強生成(RAG)在擴展大型語言模型(LLMs)能力方面日益顯示出其強大作用,使其能夠超越預訓練知識的限制。現有研究表明,RAG可以幫助完成軟件開發任務,如代碼生成、代碼更新和測試生成。然而,使用RAG將LLMs適應於快速變化或較少使用的API庫的有效性仍然未知。為了填補這一空白,我們邁出了第一步,研究這一尚未探索但實際存在的場景——當開發者使用較少使用的庫進行編碼時,他們通常會參考其API文檔;同樣,當允許LLMs通過RAG查找API文檔時,LLMs能在多大程度上得到提升?為了模擬這種場景,我們選擇了四個較少使用的開源Python庫,共包含1017個符合條件的API。我們研究了影響使用較少使用的API庫文檔作為檢索和生成額外知識有效性的因素。我們的深入研究得出了有趣的發現:(1)RAG幫助將LLMs的性能提升了83%-220%。(2)示例代碼對提升LLMs的貢獻最大,而不是API文檔中的描述性文本和參數列表。(3)LLMs有時可以通過參考其預訓練知識或文檔上下文容忍輕微的噪聲(描述中的拼寫錯誤或錯誤的參數)。最後,我們建議開發者更多地關注API文檔中代碼示例的質量和多樣性。這項研究為未來的低代碼軟件開發工作流程提供了啟示。
摘要
- 原文標題:Global Optimization of Gas Transportation and Storage: Convex Hull Characterizations and Relaxations
- 中文標題:天然氣運輸和存儲的全局優化:凸包表徵與鬆弛
- 發佈日期:2025-03-19 12:09:12+00:00
- 作者:Bahar Cennet Okumusoglu, Burak Kocuk
- 分類:math.OC
- 原文連結:http://arxiv.org/abs/2503.15143v1
中文摘要:天然氣運輸和儲存已成為能源系統中最相關和最重要的優化問題之一。由於氣體物理特性,該問題本質上包含高度非線性和非凸的方面,以及由於主動網絡元件的控制決策而導致的離散方面。為這一問題獲得局部可行解或全局解對系統操作者提出了重大的數學和計算挑戰。在本文中,我們通過析取將該問題表述為一個非凸混合整數非線性規劃(MINLP)問題。此外,我們研究了由氣體物理特性引起的非凸集,並提出了針對非凸MINLP問題的混合整數二階錐規劃鬆弛。所提出的鬆弛基於非凸集的凸包表示:我們給出了管道非凸集的凸包表示,並證明它是二階錐可表示的。我們還完全描述了壓縮機非凸集的極值點,並證明這些極值點的凸包是冪錐可表示的。對於實際應用,我們提出了壓縮機非凸集的二階錐外近似。為了獲得(接近)全局最優解,我們基於凸包結果開發了一個算法框架。我們通過在各種GasLib網絡上的廣泛計算實驗評估了我們的框架,並與文獻中的凸鬆弛方法和最先進的全局求解器進行了比較。我們的結果突出了我們的凸鬆弛方法在計算效率和收斂性能方面的優勢。此外,我們的方法還始終提供(接近)全局解以及高質量的局部求解器熱啟動點。
摘要
- 原文標題:Are "Solved Issues" in SWE-bench Really Solved Correctly? An Empirical Study
- 中文標題:SWE-bench 中的「已解決問題」真的被正確解決了嗎?一項實證研究
- 發佈日期:2025-03-19 14:02:21+00:00
- 作者:You Wang, Michael Pradel, Zhongxin Liu
- 分類:cs.SE
- 原文連結:http://arxiv.org/abs/2503.15223v1
中文摘要:自動問題解決旨在解決軟件倉庫中的實際問題。最受歡迎的自動問題解決基準是SWE-bench及其人工篩選的子集SWE-bench Verified。這些基準利用測試來驗證生成的補丁。然而,由於測試很少是詳盡的,補丁可能通過測試但仍未能滿足開發者的期望。不幸的是,目前尚不清楚使用SWE-bench進行的評估在多大程度上受到這種看似合理但不正確的補丁的影響。本文對在SWE-bench Verified上評估的三種最先進的問題解決工具生成的看似合理的補丁的正確性進行了深入的實證研究。我們廣泛測試和檢查生成的補丁,並將其與人工編寫的地面真實補丁進行比較。我們方法的核心是一種新穎的差分補丁測試技術PatchDiff,它自動暴露兩個補丁之間的行為差異。我們的研究結果揭示了SWE-bench補丁驗證機制的關鍵弱點,導致7.8%的補丁被計為正確,但未能通過開發者編寫的測試套件。此外,我們的新穎自動化技術顯示,甚至更多(29.6%)的看似合理的補丁引發了與地面真實補丁不同的行為。這些行為差異通常是由於相似但不同的實現(46.8%)以及生成的補丁適應了比地面真實補丁更多的行為(27.3%)。我們的手動檢查顯示,28.6%的行為差異補丁肯定是錯誤的。綜合來看,這些不同的弱點導致報告的解像度膨脹了6.2個百分點。我們的研究結果呼籲對問題解決工具進行更穩健和可靠的評估。我們設想我們的自動化差分補丁測試技術將對此目的有用。
摘要
- 原文標題:TULIP: Towards Unified Language-Image Pretraining
- 中文標題:TULIP:邁向統一的語言-圖像預訓練
- 發佈日期:2025-03-19 17:58:57+00:00
- 作者:Zineng Tang, Long Lian, Seun Eisape, XuDong Wang, Roei Herzig, Adam Yala, Alane Suhr, Trevor Darrell, David M. Chan
- 分類:cs.CV, cs.AI, cs.CL, cs.LG
- 原文連結:http://arxiv.org/abs/2503.15485v1
中文摘要:儘管像CLIP和SigLIP這樣的圖像-文本對比模型最近取得了成功,但這些模型在處理需要高保真圖像理解的視覺中心任務時往往表現不佳,例如計數、深度估計和細粒度物體識別。這些模型通過執行語言對齊,往往優先考慮高級語義而非視覺理解,從而削弱了它們的圖像理解能力。另一方面,專注於視覺的模型在處理視覺信息方面表現出色,但在理解語言方面存在困難,限制了它們在語言驅動任務中的靈活性。在這項工作中,我們引入了TULIP,這是一個開源的、可直接替代現有CLIP類模型的方案。我們的方法利用生成數據增強、增強的圖像-圖像和文本-文本對比學習以及圖像/文本重建正則化,以學習細粒度的視覺特徵,同時保持全局語義對齊。我們的方法擴展到超過10億個參數,在多個基準測試中優於現有的最先進(SOTA)模型,在ImageNet-1K上建立了新的SOTA零樣本性能,在RxRx1上的少樣本分類線性探測中比SigLIP提高了2倍,並改進了視覺-語言模型,在MMVP上比SigLIP提高了3倍以上的分數。我們的代碼/檢查點可在https://tulip-berkeley.github.io獲取。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:增強視覺指令調優的LLM與視覺骨幹對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:近年來,多模態大語言模型(MLLMs)的進展凸顯了視覺骨幹網絡和底層語言模型的關鍵作用。儘管先前的研究主要集中在將這些組件擴展到數十億參數,但模型規模、架構和性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,使得難以得出最優的設計選擇。在本文中,我們提出了LLaVA-MORE,這是一個新的MLLM系列,將最新的語言模型與多樣化的視覺骨幹網絡相結合。為了確保公平比較,我們採用了一種統一的訓練協議,並一致地應用於所有架構。我們的分析系統地探索了中小規模的語言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以評估多模態推理、生成和指令跟隨能力,同時研究了模型規模與性能之間的關係。除了評估語言模型對最終結果的影響外,我們還對各種視覺編碼器進行了全面研究,範圍從基於CLIP的架構到DINOv2、SigLIP和SigLIP2等替代方案。額外的實驗研究了增加圖像解像度和預訓練數據集變化的影響。總體而言,我們的結果為設計更有效的MLLM提供了見解,提供了一個可重複的評估框架,便於直接比較,並可以指導未來的模型開發。我們的原始碼和訓練模型公開在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文標題:通過\textit{ab-initio}自洽場理論預測$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之間的核鍾躍遷頻率差異
- 發佈日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分類:physics.atom-ph
- 原文連結:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核鍾的有力候選者,其躍遷頻率受到電子誘導的核頻率偏移的影響。這種效應相對較小,需要高精度的理論計算。在本工作中,我們採用了一種非微擾的多組態 Dirac-Hartree-Fock (MCDHF) 方法,與之前使用的微擾理論不同,以解決場移效應。該方法考慮了核勢的細微差異,同時考慮了 $^{229}\text{Th}$ 同位素的基態和同質異能態。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之間的核躍遷頻率差被確定為 $-639$~MHz,計算收斂至 1~MHz。鑑於最近在 $^{229}\text{Th}$ 摻雜的 CaF$_2$ 中精確測量的 $^{229}\text{Th}^{4+}$ 躍遷頻率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的躍遷頻率被預測為 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括號中的不確定性分別來自我們的原子結構計算、核數據表中的輸入核電荷半徑以及文獻中報告的晶體環境的影響。這為基於離子阱實驗的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激發提供了有價值的指導。
摘要
- 原文標題:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文標題:可持續的基於深度學習的乳腺病變分割:乳腺區域分割對性能的影響
- 發佈日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分類:cs.CV, physics.med-ph
- 原文連結:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在動態對比增強磁共振成像(DCE-MRI)中,乳腺病變的分割是準確診斷、制定治療計劃和監測進展的關鍵步驟。本研究旨在強調乳腺區域分割(BRS)對基於深度學習的乳腺病變分割(BLS)在乳腺DCE-MRI中的影響。 方法:使用包含59個DCE-MRI掃描的Stavanger數據集和UNet++作為深度學習模型,進行了四種不同的處理流程,以比較BRS對BLS的影響。這四種方法包括:不使用BRS的整個體積、使用BRS的整個體積、使用BRS的選定病變切片以及使用BRS的最佳體積。通過數據增強和過採樣等預處理方法來增強小數據集、統一數據形狀並提高模型性能。通過精確的過程研究了最佳體積大小,以確保所有病變都存在於切片中。為了評估模型,使用了包括Dice、Focal和交叉熵的混合損失函數以及5折交叉驗證方法,最後使用隨機分割的測試數據集來評估模型在未見數據上的性能,針對上述四種方法分別進行了測試。 結果:結果表明,使用BRS顯著提高了模型的性能和驗證效果。與不使用BRS的方法相比,最後一種方法——使用BRS的最佳體積——的性能提升了約50%,證明了BRS在BLS中的有效性。此外,能耗的大幅降低(高達450%)為未來在大數據集上的工作提供了一種更環保的解決方案。
摘要
- 原文標題:Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets
- 中文標題:使用GridRad-Severe和HRRR的超單體環境:解決先前龍捲風數據集之間的差異
- 發佈日期:2025-03-19 17:44:36+00:00
- 作者:Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer
- 分類:physics.ao-ph
- 原文連結:http://arxiv.org/abs/2503.15466v1
中文摘要:風暴相對螺旋度(SRH)是超級單體發展以及中尺度氣旋強度的重要成分,並且與龍捲風的生成和潛力相關。SRH源自風暴相對風廓線,由垂直風切變和風暴相對流組成。最近的研究在關於較淺或較深的SRH層在龍捲風預報中更具預測能力的問題上得出了相互矛盾的結論。這種差異的可能原因包括使用觀測數據與基於模型的鄰近探空數據,以及風暴相對風廓線是通過觀測還是估計的風暴運動確定的。本研究使用了一個新的數據集,其中包含客觀識別的超級單體及其觀測到的風暴運動,並結合高解像度模型分析,以解決先前研究中的差異。與以往基於模型的龍捲風環境數據集不同,本方法揭示了非龍捲風超級單體與龍捲風超級單體在中低層風暴相對流、垂直風切變和SRH方面的實質性差異。使用觀測到的風暴運動來計算風暴相對變量進一步放大了非龍捲風超級單體與龍捲風超級單體在中低層風暴相對風中的差異,最終導致較深的SRH層比近地面SRH具有更高的預報能力。因此,結合更高解像度的模型分析(更好地代表風暴附近環境)和觀測到的風暴運動,似乎解釋了為什麼許多過去使用基於模型的環境分析的龍捲風氣候學未能發現風暴相對風廓線的顯著差異。這些結果有助於彌合先前使用較粗糙的基於模型的分析與從野外項目中匯總的觀測探空數據之間的差距。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多種因果發現背景下的交互作用
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的非實驗方法尚未得到很好的表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG流程,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索效果。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文合適的回答。這些發現突顯了定製化檢索技術在提升RAG系統金融應用效果中的關鍵作用。完整的可復現流程可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學和電子性質的影響:實驗與從頭算研究的結合
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的有前景的負極材料。在本工作中,我們研究了Mg取代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射線衍射測量表明樣品具有多相特徵,主要相為六方Ce$_2$Ni$_7$型和菱面體Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示,最大放電容量($C_{max}$)隨着Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱面體結構的總能量幾乎相同,這與樣品中兩相的共存一致。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算的光譜進行了解釋。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD的格點QCD對$B_c\to J/\psi$矢量和軸矢量形狀因子的確定,並提供了張量形狀因子的新結果。我們使用高度改進的交錯夸克作用量處理所有價夸克,並結合第二代MILC $n_f=2+1+1$ HISQ膠子場配置。該計算包括兩個額外的集合,一個具有物理輕上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一個具有$a\approx 0.03\mathrm{fm}$,我們能夠在後者上達到物理底夸克質量。我們的計算使用非微擾重整化的流算子,並覆蓋了衰變的完整運動學範圍。我們使用最近的重-粲磁化率結果,作為$u=m_c/m_h$的函數,以便在我們的物理-連續外推中採用$B_c\to J/\psi$的完整色散參數化。我們給出了更新的標準模型預測$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分別將不確定性減少了$29\%$,$45\%$,$40\%$和$50\%$。由於我們的格點形狀因子覆蓋了完整的運動學範圍,我們可以使用它們來測試在低反衝區域使用截斷範圍數據的推斷。我們研究了不同的物理連續參數化方案,使用在接近$q^2_\mathrm{max}$的運動學範圍的前$1/3$的格點結果。我們發現,如果在物理連續外推中省略高階運動學術語,從高$q^2$區域外推合成數據時,在$q^2=0$附近可能會出現意外大的系統不確定性。這表明,在從高$q^2$區域外推相關$B\to D^*\ell\bar{\nu}$衰變的合成格點QCD數據時,可能會低估進入低$q^2$區域的系統不確定性。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:ttH 產生的最先進截面:NNLO 預測與 NNLL 重求和及電弱修正的結合
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了關於標準模型希格斯玻色子與頂夸克聯合產生的最新預測,這些預測是根據LHC希格斯工作組建議計算的。通過適當近似雙圈虛擬貢獻,我們得出了NNLOQCD預測,並補充了高達NNLL精度的軟膠子重求和。我們採用了兩種不同的重求和框架——一種基於直接QCD,另一種基於軟共線有效理論——並詳細比較了它們的特性。這些結果進一步與完整的NLO修正相結合,產生了迄今為止對該過程最精確的標準模型預測。我們全面估計並討論了相關理論不確定性的來源。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:一個使用樹張量網絡進行開放和封閉系統量子動力學模擬的開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們介紹了用於評估封閉和開放量子系統動力學特性的Python樹張量網絡包(pyTTN),該包利用樹張量網絡(TTN)或等效的多層多構型時間依賴Hartree(ML-MCTDH)方法來表示波函數。該包包含多個功能,允許通過使用子空間擴展技術,使用單集和多集TTN ansätze以及自適應鍵維度,輕鬆設置一般哈密頓量的零溫和有限溫度計算。所有核心功能均在C++中實現,並提供了Python綁定以簡化該包的使用。除了這些核心功能外,pyTTN還提供了多種工具,用於設置開放量子系統動力學的高效模擬,包括使用TTN ansatz來表示輔助密度算子空間,用於模擬層次運動方程(HEOM)方法和廣義偽模方法;此外,我們證明了這兩種方法在作用於偽模自由度的非酉正規模式變換下是等價的。我們展示了該包的一組應用,從廣泛使用的24模吡嗪的光激發動力學基準案例開始,隨後考慮了一個更具挑戰性的模型,描述了$n$-寡聚噻吩供體-C$_{60}$富勒烯受體系統界面處的激子動力學。最後,我們考慮了開放量子系統的應用,包括自旋-玻色子模型、一組擴展的耗散自旋模型以及安德森雜質模型。通過結合易用性、高效實現以及可擴展設計,pyTTN可以集成到廣泛的計算建模軟件中。
摘要
- 原文標題:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文標題:自由中子壽命實驗$τ$SPECT的超冷中子模擬框架
- 發佈日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分類:physics.ins-det, nucl-ex
- 原文連結:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子壽命的精確測定在現代精密物理學中具有重要意義。這一關鍵觀測值與通過卡比博-小林-益川矩陣元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成後原始元素的豐度有關。然而,目前兩種主要的中子壽命測量技術得出了不相容的結果,這種差異被稱為中子壽命之謎。為了解決中子與材料壁相互作用引起的系統不確定性,$\tau$SPECT 實驗採用了全磁阱來捕獲超冷中子(UCNs)。超冷中子是一種能量極低的中子,其典型速度低於 $8\,\textrm{m/s}$,可以通過磁場、重力和合適的材料導引進行操控,這些材料的表面可以在任何入射角下反射中子。為了精確研究和表徵 $\tau$SPECT 中 UCN 在生產、導引、存儲和檢測過程中的行為,我們開發了一個專用的模擬框架。該框架基於外部開發的 UCN 蒙特卡羅軟件包 PENTrack,並通過兩個配套工具進行了增強:一個用於靈活且可參數化的 PENTrack 上游配置,以便調整模擬的輸入設置以重現實驗觀測結果;另一個用於分析、可視化和動畫化模擬數據。模擬結果與在保羅謝勒研究所進行的 $\tau$SPECT 實驗數據吻合良好,為識別系統不確定性和指導當前實驗裝置的未來改進提供了強有力的資源。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體中的一個基本挑戰。自磁化可以改變等離子體的輸運特性,從而影響等離子體的動力學演化。大多數關於磁重聯和非磁化無碰撞衝擊的高能量密度(HED)激光實驗依賴於Biermann或Weibel機制來自洽地生成感興趣的磁場。多個HED實驗已經觀察到了兆高斯強度的離子尺度磁絲的形成,儘管它們的起源仍然存在爭議。基於粒子模擬(PIC)的模型已經被提出用於解釋磁化,包括等離子體相互滲透驅動的Weibel、溫度梯度驅動的Weibel和絕熱膨脹驅動的Weibel。在這裏,我們進行了帶有激光射線追蹤模塊的二維碰撞PIC模擬,以模擬等離子體的燒蝕、膨脹和隨後的磁化。模擬使用平面幾何結構,有效地抑制了Biermann磁場,以專注於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$之間變化,這與必須考慮碰撞的HED和ICF實驗相關。我們發現,在超過臨界強度的情況下,等離子體通過膨脹驅動的Weibel過程迅速自磁化,在前幾百皮秒內生成等離子體$\beta$值為100($\beta = 2k_B n_eT_e/B^2$),霍爾參數$\omega_{\rm ce}\tau_{e}>1$。還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺骨幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:近年來,多模態大語言模型(MLLMs)的進展凸顯了視覺骨幹網絡和底層語言模型的關鍵作用。儘管先前的研究主要集中在將這些組件擴展到數十億參數,但模型規模、架構和性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,使得難以得出最優的設計選擇。在本文中,我們提出了LLaVA-MORE,這是一個新的MLLM系列,它將最新的語言模型與多樣化的視覺骨幹網絡相結合。為了確保公平比較,我們採用了一種統一的訓練協議,並一致地應用於所有架構。我們的分析系統地探索了中小規模的語言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以評估多模態推理、生成和指令跟隨能力,同時研究了模型規模與性能之間的關係。除了評估語言模型對最終結果的影響外,我們還對各種視覺編碼器進行了全面研究,範圍從基於CLIP的架構到DINOv2、SigLIP和SigLIP2等替代方案。額外的實驗研究了增加圖像解像度和預訓練數據集變化的影響。總體而言,我們的結果為設計更有效的MLLM提供了見解,提供了一個可重複的評估框架,便於直接比較,並可以指導未來的模型開發。我們的原始碼和訓練模型公開在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文標題:可持續的基於深度學習的乳腺病變分割:乳腺區域分割對性能的影響
- 發佈日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分類:cs.CV, physics.med-ph
- 原文連結:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在動態對比增強磁共振成像(DCE-MRI)中,乳腺病變的分割是準確診斷、治療計劃和進展監測的關鍵步驟。本研究旨在強調乳腺區域分割(BRS)對基於深度學習的乳腺病變分割(BLS)在乳腺DCE-MRI中的影響。 方法:使用包含59個DCE-MRI掃描的Stavanger數據集和UNet++作為深度學習模型,進行了四種不同的處理來比較BRS對BLS的影響。這四種方法包括沒有BRS的整個體積、有BRS的整個體積、有BRS的選定病變切片以及最後有BRS的最佳體積。使用了數據增強和過採樣等預處理方法來增強小數據集、數據形狀的一致性並提高模型性能。通過精確的過程研究了最佳體積大小,以確保所有病變都存在於切片中。為了評估模型,使用了包括Dice、Focal和交叉熵的混合損失函數以及5折交叉驗證方法,最後使用隨機分割的測試數據集來評估模型在未見數據上的性能,針對上述四種方法中的每一種。 結果:結果表明,使用BRS顯著提高了模型的性能和驗證效果。與沒有BRS的方法相比,最後一種方法——有BRS的最佳體積——的性能顯著提高了約50%,展示了BRS在BLS中的有效性。此外,能源消耗的大幅減少,高達450%,為未來在大數據集上的工作引入了一種更環保的解決方案。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多因果發現情境中的交互作用
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的可用非實驗方法尚未得到充分表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG管道,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索效果。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文更合適的回答。這些發現突顯了定製化檢索技術在提升RAG系統金融應用效果中的關鍵作用。完整的可復現管道可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La 被 Mg 取代對 La$_{2-x}$Mg$_x$Ni$_7$ 合金電化學和電子性質的影響:實驗與從頭計算相結合的研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的潛在負極材料。在本研究中,我們探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射線衍射測量表明樣品具有多相特徵,主要相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示,最大放電容量($C_{max}$)隨Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱方結構的總能量幾乎相同,這與樣品中兩相的共存現象一致。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算的光譜進行了解釋。
摘要
- 原文標題:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文標題:基於\textit{ab-initio}自洽場理論預測$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$核鍾躍遷頻率差異
- 發佈日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分類:physics.atom-ph
- 原文連結:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核鍾的一個有前途的候選者,其躍遷頻率受到電子誘導的核頻率偏移的影響。這種效應相對較小,需要高精度的理論計算。在本工作中,我們採用了一種非微擾的多組態 Dirac-Hartree-Fock (MCDHF) 方法,與之前使用的微擾理論不同,以解決場移效應。該方法考慮了核勢的細微差異,同時考慮了 $^{229}\text{Th}$ 同位素的基態和異構態。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之間的核躍遷頻率差被確定為 $-639$~MHz,計算收斂至 1~MHz。鑑於最近在 $^{229}\text{Th}$ 摻雜的 CaF$_2$ 中精確測量的 $^{229}\text{Th}^{4+}$ 躍遷頻率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的躍遷頻率被預測為 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括號中的不確定性分別來自我們的原子結構計算、核數據表中的輸入核電荷半徑以及文獻中報道的晶體環境的影響。這為基於離子阱實驗的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激發提供了有價值的指導。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD的格點QCD對$B_c\to J/\psi$矢量和軸矢量形狀因子的確定,並提供了張量形狀因子的新結果。我們使用高度改進的交錯夸克作用量處理所有價夸克,並結合第二代MILC $n_f=2+1+1$ HISQ膠子場配置。該計算包括兩個額外的集合,一個具有物理輕的上夸克和下夸克,且$a\approx 0.06 \mathrm{fm}$,另一個具有$a\approx 0.03\mathrm{fm}$,在該集合上我們能夠達到物理底夸克質量。我們的計算使用非微擾重整化的流算子,並覆蓋了衰變的完整運動學範圍。我們使用最近的重-粲磁化率結果,作為$u=m_c/m_h$的函數,以便在我們的物理-連續外推中採用$B_c\to J/\psi$的完整色散參數化。我們給出了更新的標準模型預測$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分別將不確定性減少了$29\%$,$45\%$,$40\%$和$50\%$。由於我們的格點形狀因子覆蓋了完整的運動學範圍,我們可以使用它們來測試在低反衝區域使用截斷範圍數據的推斷。我們研究了不同的物理連續參數化方案,使用在接近$q^2_\mathrm{max}$的運動學範圍的前$1/3$的格點結果。我們發現,如果在物理連續外推中省略高階運動學術語,從高$q^2$區域外推合成數據時,在$q^2=0$附近可能會出現意外大的系統不確定性。這表明,在從高$q^2$區域外推相關$B\to D^*\ell\bar{\nu}$衰變的合成格點QCD數據時,可能會低估系統不確定性。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:ttH 產生的最先進截面:NNLO 預測與 NNLL 重求和及電弱修正的結合
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了關於標準模型希格斯玻色子與頂夸克聯合產生的最新預測,這些預測是根據LHC希格斯工作組的建議計算的。通過適當近似雙圈虛擬貢獻,我們得出了NNLOQCD預測,並補充了高達NNLL精度的軟膠子重求和。我們採用了兩種不同的重求和框架——一種基於直接QCD,另一種基於軟共線有效理論——並詳細比較了它們的特點。這些結果進一步與完整的NLO修正相結合,產生了迄今為止對該過程最精確的標準模型預測。我們全面估計並討論了相關理論不確定性的來源。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:一個使用樹張量網絡進行開放和封閉系統量子動力學模擬的開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們介紹了用於評估封閉和開放量子系統動力學特性的Python樹張量網絡包(pyTTN),該包利用樹張量網絡(TTN)或等效的多層多構型時間依賴Hartree(ML-MCTDH)方法來表示波函數。該包包含多個功能,允許通過使用子空間擴展技術,使用單集和多集TTN ansätze自適應鍵維度,輕鬆設置一般哈密頓量的零溫和有限溫度計算。所有核心功能均在C++中實現,並提供了Python綁定以簡化該包的使用。除了這些核心功能外,pyTTN還提供了多種工具,用於設置開放量子系統動力學的高效模擬,包括使用TTN ansatz表示輔助密度算子空間,用於模擬層次運動方程(HEOM)方法和廣義偽模方法;此外,我們證明了這兩種方法在作用於偽模自由度的非酉正規模式變換下是等價的。我們展示了該包的一組應用,從廣泛使用的24模吡嗪光激發動力學基準案例開始,隨後考慮了一個更具挑戰性的模型,描述了$n$-寡聚噻吩供體-[[C$_{60}$]]富勒烯受體系統界面處的激子動力學。最後,我們考慮了開放量子系統的應用,包括自旋-玻色子模型、一組擴展耗散自旋模型和安德森雜質模型。通過結合易用性、高效實現以及允許未來擴展的可擴展設計,pyTTN可以集成到廣泛的計算建模軟件中。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLMs 與視覺骨幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:近年來,多模態大語言模型(MLLMs)的進展凸顯了視覺骨幹網絡和底層語言模型的關鍵作用。儘管先前的研究主要集中在將這些組件擴展到數十億參數,但模型規模、架構和性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,使得難以得出最優的設計選擇。在本文中,我們提出了LLaVA-MORE,這是一個新的MLLM系列,它將最新的語言模型與多樣化的視覺骨幹網絡相結合。為了確保公平比較,我們採用了一種統一的訓練協議,並一致地應用於所有架構。我們的分析系統地探索了中小規模的語言模型——包括Phi-4、LLaMA-3.1和Gemma-2——以評估多模態推理、生成和指令跟隨能力,同時研究了模型規模與性能之間的關係。除了評估語言模型對最終結果的影響外,我們還對各種視覺編碼器進行了全面研究,範圍從基於CLIP的架構到DINOv2、SigLIP和SigLIP2等替代方案。額外的實驗研究了增加圖像解像度和預訓練數據集變化的影響。總體而言,我們的結果為設計更有效的MLLM提供了見解,提供了一個可重複的評估框架,便於直接比較,並可以指導未來的模型開發。我們的原始碼和訓練模型公開在:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance
- 中文標題:可持續的基於深度學習的乳腺病變分割:乳腺區域分割對性能的影響
- 發佈日期:2025-03-19 21:42:33+00:00
- 作者:Sam Narimani, Solveig Roth Hoff, Kathinka Dahli Kurz, Kjell-Inge Gjesdal, Jurgen Geisler, Endre Grovik
- 分類:cs.CV, physics.med-ph
- 原文連結:http://arxiv.org/abs/2503.15708v1
中文摘要:目的:在動態對比增強磁共振成像(DCE-MRI)中對乳腺病變進行分割是準確診斷、制定治療計劃和監測進展的關鍵步驟。本研究旨在強調乳腺區域分割(BRS)對基於深度學習的乳腺病變分割(BLS)在乳腺DCE-MRI中的影響。 方法:使用包含59個DCE-MRI掃描的Stavanger數據集和UNet++作為深度學習模型,進行了四種不同的處理流程,以比較BRS對BLS的影響。這四種方法包括:不使用BRS的整個體積、使用BRS的整個體積、使用BRS的選定病變切片以及使用BRS的最佳體積。通過數據增強和過採樣等預處理方法來增強小數據集、統一數據形狀並提高模型性能。通過精確的過程研究了最佳體積大小,以確保所有病變都存在於切片中。為了評估模型,使用了包括Dice、Focal和交叉熵的混合損失函數以及5折交叉驗證方法,最後使用隨機分割的測試數據集來評估模型在未見數據上的性能,針對上述四種方法分別進行了評估。 結果:結果表明,使用BRS顯著提高了模型的性能和驗證效果。與不使用BRS的方法相比,最後一種方法——使用BRS的最佳體積——的性能提升了約50%,展示了BRS在BLS中的有效性。此外,能耗的大幅降低(高達450%)為未來在大數據集上的工作提供了一種更環保的解決方案。
摘要
- 原文標題:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文標題:自由中子壽命實驗$τ$SPECT的超冷中子模擬框架
- 發佈日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分類:physics.ins-det, nucl-ex
- 原文連結:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子壽命的精確測定在現代精密物理學中具有重要意義。這一關鍵觀測值與通過卡比博-小林-益川矩陣元 $V_{ud}$ 的上夸克和下夸克的混合以及大爆炸核合成後原始元素的豐度有關。然而,目前用於測量中子壽命的兩種主要技術得出了不相容的結果,這種差異被稱為中子壽命之謎。為了解決中子與材料壁相互作用引起的系統不確定性,$\tau$SPECT 實驗採用了完全磁阱來捕獲超冷中子(UCNs)。UCNs 是能量極低的中子,其典型速度低於 $8\,\textrm{m/s}$,可以通過磁場、重力和合適的材料導引進行操控,這些材料的表面可以在任何入射角下反射它們。為了精確研究和表徵 $\tau$SPECT 中 UCNs 在生產、導引、存儲和檢測過程中的行為,我們開發了一個專用的模擬框架。該框架基於外部開發的 UCN 蒙特卡羅軟件包 PENTrack,並通過兩個配套工具進行了增強:一個用於靈活且可參數化的 PENTrack 上游配置,以便調整模擬的輸入設置以重現實驗觀測結果;另一個用於分析、可視化和動畫化模擬數據。模擬結果與在保羅謝爾研究所使用 $\tau$SPECT 獲得的實驗數據非常吻合,並作為識別系統不確定性和指導當前實驗裝置未來改進的強大資源。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多種因果發現情境中的交互作用
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的非實驗方法尚未得到很好的表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG流程,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索效果。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文更合適的回答。這些發現突顯了定製化檢索技術在提升RAG系統金融應用效果中的關鍵作用。完整的可復現流程可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Supercell environments using GridRad-Severe and the HRRR: Addressing discrepancies between prior tornado datasets
- 中文標題:使用GridRad-Severe和HRRR的超單體環境:解決先前龍捲風數據集之間的差異
- 發佈日期:2025-03-19 17:44:36+00:00
- 作者:Brice Coffer, Matthew Parker, Michael Coniglio, Cameron Homeyer
- 分類:physics.ao-ph
- 原文連結:http://arxiv.org/abs/2503.15466v1
中文摘要:風暴相對螺旋度(SRH)是超級單體發展以及中尺度氣旋強度的重要成分,並且與龍捲風的生成和潛力相關。SRH 源自風暴相對風廓線,由垂直風切變和風暴相對氣流組成。最近的研究在關於較淺或較深的 SRH 層在龍捲風預測中更具技能的問題上得出了相互矛盾的結論。這種差異的可能原因包括使用觀測數據與基於模型的鄰近探空數據,以及風暴相對風廓線是通過觀測還是估計的風暴運動確定的。本研究使用了一個新的客觀識別的超級單體數據集,結合觀測到的風暴運動和高解像度模型分析,以解決先前研究中的差異。與以往基於模型的龍捲風環境數據集不同,本方法揭示了非龍捲風超級單體與龍捲風超級單體在低至中層風暴相對氣流、垂直風切變和 SRH 方面的實質性差異。使用觀測到的風暴運動來計算風暴相對變量進一步放大了非龍捲風超級單體與龍捲風超級單體在低至中層風暴相對風中的差異,最終導致較深的 SRH 層比近地面的 SRH 具有更高的預測技能。因此,結合更高解像度的模型分析(更好地代表風暴附近環境)和觀測到的風暴運動,似乎解釋了為什麼許多過去使用基於模型的環境分析的龍捲風氣候學未能發現風暴相對風廓線的顯著差異。這些結果有助於彌合先前使用較粗糙的基於模型的分析與那些從野外項目中匯總觀測探空數據的研究之間的差距。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La 被 Mg 取代對 La$_{2-x}$Mg$_x$Ni$_7$ 合金電化學和電子性質的影響:實驗與從頭計算相結合的研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的潛在負極材料。在本研究中,我們探討了Mg取代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50 和 0.75)。X射線衍射測量表明樣品具有多相特徵,主要相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示,最大放電容量($C_{max}$)隨Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱方結構的總能量幾乎相同,這與樣品中兩相共存的結果一致。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算得到的相應光譜進行了解釋。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD的格點QCD對$B_c\to J/\psi$矢量和軸矢量形狀因子的確定,並提供了張量形狀因子的新結果。我們使用高度改進的交錯夸克作用量處理所有價夸克,並結合第二代MILC $n_f=2+1+1$ HISQ膠子場配置。該計算包括兩個額外的集合,一個具有物理輕的上夸克和下夸克,且$a\approx 0.06 \mathrm{fm}$,另一個具有$a\approx 0.03\mathrm{fm}$,在該集合上我們能夠達到物理底夸克質量。我們的計算使用非微擾重整化的流算子,並覆蓋了衰變的完整運動學範圍。我們使用最近的重-粲磁化率結果,作為$u=m_c/m_h$的函數,以便在我們的物理-連續外推中採用$B_c\to J/\psi$的完整色散參數化。我們給出了更新的標準模型預測$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分別將不確定性減少了$29\%$,$45\%$,$40\%$和$50\%$。由於我們的格點形狀因子覆蓋了完整的運動學範圍,我們可以使用它們來測試在低反衝截斷範圍內的數據外推。我們研究了不同的物理連續參數化方案,使用在接近$q^2_\mathrm{max}$的運動學範圍前$1/3$的格點結果。我們發現,如果在物理連續外推中省略高階運動學術語,從高$q^2$區域外推合成數據時,在$q^2=0$附近可能會出現意外大的系統不確定性。這表明,在從高$q^2$區域外推相關$B\to D^*\ell\bar{\nu}$衰變的合成格點QCD數據時,可能會低估系統不確定性。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:ttH產生的最先進截面:NNLO預測與NNLL重求和及電弱修正的結合
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了關於標準模型希格斯玻色子與頂夸克伴隨產生的最新預測,這些預測是根據LHC希格斯工作組的建議計算的。通過適當近似雙圈虛貢獻,我們得到了NNLOQCD預測,並補充了高達NNLL精度的軟膠子重求和。採用了兩種不同的重求和框架——一種基於直接QCD,另一種基於軟共線有效理論——並對它們的特性進行了詳細比較。這些結果進一步與完整的NLO修正相結合,產生了迄今為止對該過程最精確的標準模型預測。我們全面估計並討論了相關的理論不確定性來源。
摘要
- 原文標題:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文標題:通過\textit{ab-initio}自洽場理論預測$^{229}$Th$^{3+}$和$^{229}$Th$^{4+}$之間的核鍾躍遷頻率差異
- 發佈日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分類:physics.atom-ph
- 原文連結:http://arxiv.org/abs/2503.15061v1
中文摘要:$^{229}\text{Th}$ 同位素是核鍾的一個有前途的候選者,其躍遷頻率受到電子誘導的核頻率偏移的影響。這種效應相對較小,需要高精度的理論計算。在本工作中,我們採用了一種非微擾的多組態 Dirac-Hartree-Fock (MCDHF) 方法,與之前使用的微擾理論不同,以解決場移效應。該方法考慮了核勢的細微差異,同時考慮了 $^{229}\text{Th}$ 同位素的基態和異構態。因此,$^{229}\text{Th}^{3+}$ 和 $^{229}\text{Th}^{4+}$ 之間的核躍遷頻率差被確定為 $-639$~MHz,計算收斂至 1~MHz。鑑於最近在 $^{229}\text{Th}$ 摻雜的 CaF$_2$ 中測量的 $^{229}\text{Th}^{4+}$ 的精確躍遷頻率 [Nature 633, 63 (2024)],孤立的 $^{229}\text{Th}^{3+}$ 的躍遷頻率被預測為 $2,020,406,745 (1)_\text{comp.}(77)_{\delta \langle r^2 \rangle} (100)_\text{ext.}$~MHz,括號中的不確定性分別來自我們的原子結構計算、核數據表中的輸入核電荷半徑以及文獻中報道的晶體環境的影響。這為基於離子阱實驗的孤立 $^{229}\text{Th}^{3+}$ 的直接激光激發提供了有價值的指導。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體中的一個基本挑戰。自磁化可以改變等離子體的輸運特性,從而影響等離子體的動力學演化。大多數關於磁重聯和非磁化無碰撞衝擊的高能量密度(HED)激光實驗依賴於Biermann或Weibel機制來自洽地生成感興趣的磁場。多個HED實驗已經觀察到了兆高斯強度的離子尺度磁絲的形成,儘管它們的起源仍然存在爭議。基於粒子網格(PIC)模擬的模型已經被提出以解釋磁化現象,包括等離子體相互滲透驅動的Weibel、溫度梯度驅動的Weibel和絕熱膨脹驅動的Weibel。在這裏,我們進行了帶有激光射線追蹤模塊的二維碰撞PIC模擬,以模擬等離子體的燒蝕、膨脹和隨後的磁化。模擬使用平面幾何結構,有效地抑制了Biermann磁場,以專注於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$之間變化,這與需要考慮碰撞的HED和ICF實驗相關。我們發現,在超過臨界強度的情況下,等離子體通過膨脹驅動的Weibel過程迅速自磁化,在最初的幾百皮秒內生成等離子體$\beta$值為100($\beta = 2k_B n_eT_e/B^2$),霍爾參數$\omega_{\rm ce}\tau_{e}>1$。還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:一個使用樹張量網絡進行開放和封閉系統量子動力學模擬的開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們介紹了用於評估封閉和開放量子系統動力學特性的Python樹張量網絡包(pyTTN),該包利用樹張量網絡(TTN)或等效的多層多構型時間依賴Hartree(ML-MCTDH)方法來表示波函數。該包包含多個功能,允許通過使用子空間擴展技術,使用單集和多集TTN ansätze以及自適應鍵維度,輕鬆設置一般哈密頓量的零溫和有限溫度計算。所有核心功能均在C++中實現,並提供了Python綁定以簡化該包的使用。除了這些核心功能外,pyTTN還提供了多種工具,用於設置開放量子系統動力學的高效模擬,包括使用TTN ansatz來表示輔助密度算子空間,用於模擬層次運動方程(HEOM)方法和廣義偽模方法;此外,我們證明了這兩種方法在作用於偽模自由度的非酉正規模式變換下是等價的。我們展示了該包的一系列應用,從廣泛使用的24模吡嗪的光激發動力學基準案例開始,隨後考慮了一個更具挑戰性的模型,描述了$n$-寡聚噻吩供體-C$_{60}$富勒烯受體系統界面處的激子動力學。最後,我們考慮了開放量子系統的應用,包括自旋-玻色子模型、一組擴展的耗散自旋模型以及安德森雜質模型。通過結合易用性、高效實現以及可擴展設計,pyTTN可以集成到廣泛的計算建模軟件中。
摘要
- 原文標題:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文標題:可靠的放射學骨骼肌面積評估——癌症惡病質診斷的生物標誌物
- 發佈日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分類:eess.IV, cs.AI, cs.CE, cs.CV
- 原文連結:http://arxiv.org/abs/2503.16556v1
中文摘要:摘要:癌症惡病質是一種常見的代謝紊亂疾病,其特徵是嚴重的肌肉萎縮,與不良預後和生活質量相關。通過計算機斷層掃描(CT)縱向監測骨骼肌面積(SMA)——這種在癌症護理中常規獲取的成像方式,是識別和跟蹤該病症的有效方法。然而,現有工具往往缺乏全自動化且準確性不一致,限制了其融入臨床工作流程的潛力。為解決這些問題,我們開發了SMAART-AI(基於AI的骨骼肌評估-自動化可靠工具),這是一個由深度學習模型(nnU-Net 2D)驅動的端到端自動化流程,該模型在腰椎中段三分之一的CT圖像上通過5折交叉驗證訓練,確保泛化性和魯棒性。SMAART-AI整合了基於不確定性的機制,用於標記高誤差的SMA預測以供專家審查,從而增強可靠性。我們結合SMA、骨骼肌指數、BMI和臨床數據,訓練了一個多層感知器(MLP)模型,旨在預測癌症診斷時的惡病質。在胃食管癌數據集上測試時,SMAART-AI的Dice分數達到97.80% ± 0.93%,與使用SliceOmatic手動標註相比,本研究所有四個數據集的SMA估計中位絕對誤差為2.48%。不確定性指標——方差、熵和變異係數——與SMA預測誤差高度相關(分別為0.83、0.76和0.73)。MLP模型預測惡病質的精確度為79%,為臨床醫生提供了早期診斷和干預的可靠工具。通過結合自動化、準確性和不確定性意識,SMAART-AI彌合了研究與臨床應用之間的差距,為管理癌症惡病質提供了一種變革性方法。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺骨幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:多模態大語言模型(MLLMs)的最新進展凸顯了視覺主幹網絡與底層語言模型的關鍵作用。儘管先前研究主要聚焦於將這些組件擴展至數十億參數規模,但模型尺寸、架構與性能之間的權衡關係仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計方案。本文提出LLaVA-MORE——一個整合最新語言模型與多樣化視覺主幹的新型MLLMs家族。為確保公平比較,我們採用統一訓練協議並全程應用於所有架構。通過系統分析中小規模語言模型(包括Phi-4、LLaMA-3.1和Gemma-2),我們評估了多模態推理、生成及指令跟隨能力,同時探究模型規模與性能的關係。除評估語言模型對最終結果的影響外,我們還全面研究了從CLIP架構到DINOv2、SigLIP及SigLIP2等多種視覺編碼器。額外實驗探討了提高圖像解像度與預訓練數據集變化的影響。總體而言,我們的研究結果為設計更高效的MLLMs提供了洞見,建立了一個可復現的評估框架,該框架既能支持直接比較,也可指導未來模型開發。原始碼與訓練模型已公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔檢索能力:預檢索階段採用多種查詢與語料庫預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵結合的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD團隊對$B_c\to J/\psi$矢量與軸矢量形狀因子的格點QCD計算結果,並首次給出了張量形狀因子的新結果。研究中所有價夸克均採用高度改進的交錯夸克作用量,配合第二代MILC $n_f=2+1+1$ HISQ膠子場構型。本次計算新增了兩個系綜:一個包含物理輕度的上下夸克且晶格間距$a\approx 0.06 \mathrm{fm}$,另一個晶格間距$a\approx 0.03\mathrm{fm}$的系綜使我們能夠達到物理底夸克質量。計算採用非微擾重整化的流算子,覆蓋了衰變的完整運動學範圍。我們運用最新獲得的以$u=m_c/m_h$為變量的重-粲磁化率結果,在物理連續外推中實現了$B_c\to J/\psi$的完全色散參數化。更新後的標準模型預言值為:$R(J/\psi)=0.2597(27)$、$A_{\lambda_\tau}=0.5093(42)$、$F_L^{J/\psi}=0.4421(55)$和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,不確定度分別降低29%、45%、40%和50%。由於格點形狀因子覆蓋完整運動學範圍,我們可用其檢驗僅基於低反衝區截斷數據的傳統外推方法。通過比較不同物理連續參數化方案(僅採用$q^2_\mathrm{max}$附近前1/3運動學範圍的格點數據),發現當高$q^2$區合成數據的外推過程忽略高階運動學項時,$q^2=0$附近可能出現意料之外的大系統誤差。這表明在相關$B\to D^*\ell\bar{\nu}$衰變過程中,從高$q^2$區向低$q^2$區外推格點QCD合成數據時,可能存在被低估的系統誤差。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以採用全勢局域軌道最小基組(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了若干其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復和電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們針對標準模型希格斯玻色子與頂夸克的聯合產生過程,提出了符合LHC希格斯工作組建議的最新理論預測。通過適當近似雙圈虛部貢獻,我們獲得了次次領頭階(NNLO)量子色動力學預測,並進一步補充了達到次次領頭對數(NNLL)精度的軟膠子重求和。研究採用了兩套不同的重求和框架——基於直接QCD的方法和軟共線有效理論方法——並對二者的特性進行了詳細比較。這些結果還與完整次領頭階修正相結合,產生了迄今為止該過程最精確的標準模型預測。我們對相關理論不確定性來源進行了全面評估與討論。
摘要
- 原文標題:Ultra-cold neutron simulation framework for the free neutron lifetime experiment $τ$SPECT
- 中文標題:自由中子壽命實驗τSPECT的超冷中子模擬框架
- 發佈日期:2025-03-19 14:15:34+00:00
- 作者:Julian Auler, Utkarsh Bajpai, Martin Engler, Viktoria Ermuth, Martin Fertl, Konrad Franz, Werner Heil, Simon Kaufmann, Bernhard Lauss, Niklas Pfeifer, Dieter Ries, Sylvain Vanneste, Noah Yazdandoost
- 分類:physics.ins-det, nucl-ex
- 原文連結:http://arxiv.org/abs/2503.15239v1
中文摘要:自由中子壽命的精確測定在現代精密物理學中具有重要意義。該關鍵觀測量與夸克混合通過卡比博-小林-益川矩陣元$V_{ud}$相關聯,並影響大爆炸核合成後原始元素的豐度。然而,當前兩種主要的中子壽命測量技術得出了不相容的結果,這一差異被稱為中子壽命之謎。為解決中子與物質壁相互作用引起的系統不確定性,$\tau$SPECT實驗採用了全磁阱技術來約束超冷中子(UCNs)。超冷中子是指典型速度低於$8\,\textrm{m/s}$的極低能中子,可通過磁場、重力及特殊材料導引管進行操控——這些導引管表面能在任意入射角實現全反射。為精確研究和表徵$\tau$SPECT中UCN在產生、導引、存儲及探測過程中的行為,我們開發了專用模擬框架。該框架基於外部開發的UCN蒙特卡洛方法軟件包PENTrack,並強化了兩個配套工具:一是用於PENTrack靈活可參數化的上游配置,使模擬輸入設置可調整以復現實驗觀測;二是用於分析、可視化和動態呈現模擬數據的軟件包。模擬結果與保羅謝勒研究所$\tau$SPECT實驗數據高度吻合,為識別系統不確定性和指導現有實驗裝置改進提供了有力工具。
摘要
- 原文標題:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文標題:基於\textit{ab-initio}自洽場理論預測$^{229}$Th$^{3+}$與$^{229}$Th$^{4+}$核鍾躍遷頻率差
- 發佈日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分類:physics.atom-ph
- 原文連結:http://arxiv.org/abs/2503.15061v1
中文摘要:摘要:[[$^{229}\text{Th}$]]同位素是核鍾的潛在候選者,其躍遷頻率受電子誘導的核頻移影響。該效應相對較小,需要高精度的理論計算。本研究採用非微擾的多組態Dirac-Hartree-Fock(MCDHF)方法(區別於先前使用的微擾理論)來解析場移效應。該方法在考慮[[$^{229}\text{Th}$]]同位素基態和同核異能態的同時,計及核勢能的細微差異。最終測得[[$^{229}\text{Th}^{3+}$]]與[[$^{229}\text{Th}^{4+}$]]的核躍遷頻率差為$-639$~MHz,計算收斂精度達1~MHz。基於近期對CaF$_2$中[[$^{229}\text{Th}^{4+}$]]躍遷頻率的精密測量結果[Nature 633, 63 (2024)],預測孤立[[$^{229}\text{Th}^{3+}$]]的躍遷頻率為$2,020,406,745 (1)_\text{計算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~MHz,括號內分別表示原子結構計算、核數據表輸入的核電荷半徑以及文獻報道的晶體環境影響的誤差來源。該結果為基於離子阱實驗直接激光激發孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指導。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:膨脹高能量密度等離子體中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體研究中的基本挑戰之一。自磁化能夠改變等離子體的輸運特性,從而影響其動力學演化過程。目前大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗,都依賴比耶曼機制或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存在爭議。已有研究提出基於粒子網格(PIC)模擬的磁化解釋模型,包括等離子體相互滲透驅動的魏貝爾機制、溫度梯度驅動的魏貝爾機制以及絕熱膨脹驅動的魏貝爾機制。本研究採用二維碰撞PIC模擬結合激光光線追蹤模塊,模擬了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內變化(該參數範圍需考慮碰撞效應的HED和ICF實驗相關),研究發現:超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內產生霍爾參數$\omega_{\rm ce}\tau_{e}>1$且等離子體$\beta$值達100($\beta = 2k_B n_eT_e/B^2$)的強磁場。研究還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:基於樹張量網絡的開放與封閉系統量子動力學模擬開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們推出Python樹張量網絡計算包(pyTTN),用於評估封閉和開放量子系統的動力學特性。該工具包採用樹張量網絡(TTN)或等效的多層多組態含時Hartree(ML-MCTDH)波函數表示方法,具有以下特點:通過子空間擴展技術實現自適應鍵維度,支持使用單組和多組TTN擬設輕鬆設置一般哈密頓量的零溫和有限溫度計算。所有核心功能均以C++實現並配有Python接口以簡化使用。除核心功能外,pyTTN還提供多種工具來高效模擬開放量子系統動力學,包括採用TTN擬設表示輔助密度算子空間以模擬層次運動方程(HEOM)方法和廣義贗模方法;我們進一步證明這兩種方法在作用於贗模自由度的非么正正則模變換下是等價的。通過三個應用案例展示該工具包的性能:首先以24模吡嗪的光激發動力學作為基準測試,隨後研究描述n-寡聚噻吩供體-C60富勒烯受體系統界面激子動力學的更具挑戰性模型,最後應用於開放量子系統(包括自旋-玻色模型、擴展耗散自旋模型集和安德森雜質模型)。pyTTN兼具易用性、高效實現和可擴展設計,能與多種計算建模軟件集成。
摘要
- 原文標題:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文標題:可靠的放射學骨骼肌面積評估——癌症惡病質診斷的生物標誌物
- 發佈日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分類:eess.IV, cs.AI, cs.CE, cs.CV
- 原文連結:http://arxiv.org/abs/2503.16556v1
中文摘要:癌症惡病質是一種常見的代謝紊亂疾病,其特徵為嚴重肌肉萎縮,與不良預後及生活質量下降密切相關。通過計算機斷層掃描(CT)縱向監測骨骼肌面積(SMA)——這種在癌症診療中常規獲取的影像模式——是識別和追蹤該病症的有效方法。然而現有工具常缺乏全自動化且準確性不穩定,限制了其融入臨床工作流程的潛力。為解決這些問題,我們開發了SMAART-AI(基於AI的骨骼肌評估自動化可靠工具),這是一個由深度學習模型(nnU-Net 2D)驅動的端到端自動化流程,模型通過五折交叉驗證在第三腰椎中部CT圖像上訓練,確保泛化性和魯棒性。SMAART-AI整合了基於不確定性的機制,可標記高誤差SMA預測以供專家覆核,從而提升可靠性。我們聯合SMA、骨骼肌指數、BMI和臨床數據訓練了多層感知機(MLP)模型,用於預測癌症確診時的惡病質狀態。在胃食管癌數據集測試中,SMAART-AI的Dice分數達97.80%±0.93%,與SliceOmatic手動標註相比,本研究所有數據集的SMA估計中位絕對誤差為2.48%。不確定性指標(方差、熵和變異係數)與SMA預測誤差呈強相關性(分別為0.83、0.76和0.73)。MLP模型預測惡病質的精確度達79%,為臨床醫生提供了早期診斷和干預的可靠工具。通過融合自動化、準確性和不確定性感知,SMAART-AI彌合了研究與臨床應用間的鴻溝,為癌症惡病質管理提供了變革性方案。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺主幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:多模態大語言模型(MLLM)的最新進展凸顯了視覺主幹網絡與底層語言模型的關鍵作用。儘管先前研究主要聚焦於將模型參數量擴展至數十億規模,但模型尺寸、架構與性能之間的權衡關係仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計方案。本文提出LLaVA-MORE系列模型,通過整合最新語言模型與多樣化視覺主幹構建新型MLLM。為確保公平比較,我們採用統一的訓練協議並應用於所有架構。我們的分析系統考察了中小規模語言模型(包括Phi-4、LLaMA-3.1和Gemma-2)在多模態推理、生成及指令跟隨方面的表現,同時探究模型規模與性能的關係。除評估語言模型對最終結果的影響外,我們還對CLIP架構及DINOv2、SigLIP、SigLIP2等替代視覺編碼器展開全面研究。額外實驗探討了提升圖像解像度及預訓練數據集變化的影響。總體而言,本研究為設計更高效的MLLM提供了見解,建立了一個可復現的評估框架,該框架支持直接比較並能指導未來模型開發。原始碼與訓練模型已公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少受到關注。我們提出了理論結果,證明某些重採樣方法能精確模擬特定算法參數的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果不僅驗證了理論發現,更為研究者提供了豐富數據以進一步表徵因果發現分析中的重採樣特性。理論工作與模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLM)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。預檢索階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調最先進的嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射測試表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於具有最高$C_{max}$實測值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克伴隨產生的最新理論預測,該計算嚴格遵循LHC希格斯工作組的技術規範。通過雙圈虛擬貢獻的適當近似,我們獲得了次次領頭階(NNLO)量子色動力學預測,並進一步結合了軟膠子重求和至次次領頭對數(NNLL)精度。研究採用了兩套不同的重求和框架——基於直接QCD方法和軟共線有效理論——並對二者的特性進行了詳細比較。這些結果還與完全次領頭階(NLO)修正相結合,最終給出了該物理過程迄今最精確的標準模型理論預測。我們對相關理論不確定性來源進行了全面評估與討論。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體中的基本挑戰之一。自磁化會改變等離子體的輸運特性,從而影響其動力學演化。大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗都依賴比耶曼或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存在爭議。已有研究提出基於粒子網格(PIC)模擬的模型來解釋磁化現象,包括等離子體相互滲透驅動的魏貝爾不穩定性、溫度梯度驅動的魏貝爾不穩定性以及絕熱膨脹驅動的魏貝爾不穩定性。本文採用二維碰撞PIC模擬結合激光光線追蹤模塊,模擬了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何結構以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內變化,該強度區間需考慮碰撞效應的HED和ICF實驗相關。研究發現,超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內產生等離子體β值達100($\beta = 2k_B n_eT_e/B^2$)且霍爾參數$\omega_{\rm ce}\tau_{e}>1$。文中還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:基於樹張量網絡的開放與封閉系統量子動力學模擬開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們推出Python樹張量網絡軟件包(pyTTN),用於評估封閉和開放量子系統的動力學特性。該工具基於樹張量網絡(TTN)或等效的多層多組態含時Hartree(ML-MCTDH)波函數表示方法。該軟件包具有多項特性:支持通過子空間擴展技術,採用自適應鍵維度的單/多組TTN擬設,便捷設置任意哈密頓量的零溫/有限溫度計算。所有核心功能均以C++實現,並提供Python接口以簡化使用。除核心功能外,pyTTN還提供多種工具來高效模擬開放量子系統動力學,包括:採用TTN擬設表示輔助密度算子空間以模擬層次運動方程(HEOM)方法和廣義贗模方法;我們證明這兩種方法通過作用於贗模自由度的非么正簡正模變換可相互轉化。通過系列應用案例展示軟件性能:從24模吡嗪光激發動力學的基準測試出發,進而研究更複雜的n-寡聚噻吩供體-C60富勒烯受體界面激子動力學模型,最後應用於開放量子系統(包括自旋-玻色模型、擴展耗散自旋模型及安德森雜質模型)。pyTTN兼具易用性、高效實現和可擴展架構,能與多種計算建模軟件集成。
摘要
- 原文標題:Prediction of Nuclear Clock Transitions Frequency Difference between $^{229}$Th$^{3+}$ and $^{229}$Th$^{4+}$ via \textit{ab-initio} Self-Consistent Field Theory
- 中文標題:基於自洽場理論的$^{229}$Th$^{3+}$與$^{229}$Th$^{4+}$核鍾躍遷頻率差預測
- 發佈日期:2025-03-19 09:53:23+00:00
- 作者:Ran Si, Chaofan Shi, Nan Xue, Xiangjin Kong, Chongyang Chen, Bingsheng Tu, Yu-Gang Ma
- 分類:physics.atom-ph
- 原文連結:http://arxiv.org/abs/2503.15061v1
中文摘要:摘要:[[$^{229}\text{Th}$]]同位素是核鍾的潛在候選者,其躍遷頻率受電子誘導的核頻移影響。該效應相對較小,需要高精度理論計算。本研究採用非微擾的多組態Dirac-Hartree-Fock(MCDHF)方法(區別於先前使用的微擾理論)來解析場移效應。該方法在考慮[[$^{229}\text{Th}$]]同位素基態和同核異能態的同時,計及核勢能的細微差異。最終測得[[$^{229}\text{Th}^{3+}$]]與[[$^{229}\text{Th}^{4+}$]]的核躍遷頻率差為$-639$~MHz,計算收斂精度達1~MHz。基於近期對CaF$_2$中[[$^{229}\text{Th}^{4+}$]]躍遷頻率的精密測量結果[Nature 633, 63 (2024)],預測孤立[[$^{229}\text{Th}^{3+}$]]的躍遷頻率為$2,020,406,745 (1)_\text{計算}(77)_{\delta \langle r^2 \rangle} (100)_\text{外延}$~MHz,括號內分別表示原子結構計算、核數據表輸入的核電荷半徑誤差以及文獻報道的晶體環境影響。該結果為基於離子阱實驗直接激光激發孤立[[$^{229}\text{Th}^{3+}$]]提供了重要指導。
摘要
- 原文標題:Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis
- 中文標題:可靠的放射學骨骼肌面積評估——癌症惡病質診斷的生物標誌物
- 發佈日期:2025-03-19 19:07:59+00:00
- 作者:Sabeen Ahmed, Nathan Parker, Margaret Park, Daniel Jeong, Lauren Peres, Evan W. Davis, Jennifer B. Permuth, Erin Siegel, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
- 分類:eess.IV, cs.AI, cs.CE, cs.CV
- 原文連結:http://arxiv.org/abs/2503.16556v1
中文摘要:癌症惡病質是一種常見的代謝紊亂疾病,其特徵為嚴重的肌肉萎縮,與不良預後和生活質量相關。通過計算機斷層掃描(CT)縱向監測骨骼肌面積(SMA)——這種在癌症護理中常規獲取的成像模式——是識別和追蹤該病症的有效方法。然而,現有工具往往缺乏全自動化且準確性不一致,限制了其融入臨床工作流程的潛力。為解決這些問題,我們開發了SMAART-AI(基於AI的骨骼肌評估-自動化可靠工具),這是一個由深度學習模型(nnU-Net 2D)驅動的端到端自動化流程,該模型在腰椎中段三分之一的CT圖像上通過5折交叉驗證訓練,確保泛化性和魯棒性。SMAART-AI整合了基於不確定性的機制,用於標記高誤差的SMA預測以供專家審查,從而增強可靠性。我們結合SMA、骨骼肌指數、BMI和臨床數據,訓練了一個多層感知器(MLP)模型,旨在預測癌症診斷時的惡病質。在胃食管癌數據集上測試時,SMAART-AI的Dice分數達到97.80% ± 0.93%,與使用SliceOmatic手動標註相比,本研究所有四個數據集的SMA估計中位絕對誤差為2.48%。不確定性指標——方差、熵和變異係數——與SMA預測誤差高度相關(分別為0.83、0.76和0.73)。MLP模型預測惡病質的精確度為79%,為臨床醫生提供了早期診斷和干預的可靠工具。通過結合自動化、準確性和不確定性感知,SMAART-AI彌合了研究與臨床應用之間的差距,為管理癌症惡病質提供了一種變革性方法。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:增強視覺指令調優的LLM與視覺骨幹網絡對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:摘要:多模態大語言模型(MLLMs)的最新進展凸顯了視覺主幹網絡與底層語言模型的關鍵作用。儘管先前研究主要聚焦於將這些組件擴展至數十億參數規模,但模型大小、架構與性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計方案。本文提出LLaVA-MORE——一個融合最新語言模型與多樣化視覺主幹的新型MLLM家族。為確保公平比較,我們採用統一訓練協議並一致應用於所有架構。我們的分析系統探索了中小規模LLM(包括Phi-4、LLaMA-3.1和Gemma-2)在多模態推理、生成及指令跟隨方面的表現,同時研究模型規模與性能的關係。除評估LLM對最終結果的影響外,我們還全面研究了從CLIP架構到DINOv2、SigLIP及SigLIP2等替代方案的各類視覺編碼器。額外實驗探究了提高圖像解像度和預訓練數據集變化的影響。總體而言,研究結果為設計更高效的MLLM提供了洞見,並建立了可復現的評估框架以支持直接比較,為未來模型開發提供指導。原始碼與訓練模型公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:跨多種因果發現場景的重採樣技術交互評估的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段運用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:頂夸克對與希格斯玻色子聯合產生的最先進截面:NNLO預測結合NNLL恢復及電弱修正
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克伴隨產生的最新理論預測,該計算遵循LHC希格斯工作組建議的規範。通過適當近似雙圈虛貢獻得到的NNLOQCD預測,進一步補充了NNLL精度的軟膠子重求和。研究採用兩種不同的重求和框架——一種基於直接QCD方法,另一種基於軟共線有效理論——並詳細比較了它們的特性。這些結果還與完整NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。文中對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於具有最高$C_{max}$實測值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時以其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:膨脹高能量密度等離子體中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體中的基本挑戰之一。自磁化會改變等離子體的輸運特性,從而影響其動力學演化。大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗依賴於比耶曼或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存在爭議。已有研究提出基於粒子網格(PIC)模擬的模型來解釋磁化現象,包括等離子體相互滲透驅動的魏貝爾不穩定性、溫度梯度驅動的魏貝爾不穩定性以及絕熱膨脹驅動的魏貝爾不穩定性。本文通過結合激光光線追蹤模塊的二維碰撞PIC模擬,研究了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內變化,該參數範圍與需要考慮碰撞效應的HED和ICF實驗相關。研究發現,當超過臨界強度時,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內產生霍爾參數$\omega_{\rm ce}\tau_{e}>1$且等離子體$\beta$值達100($\beta = 2k_B n_eT_e/B^2$)的強磁化狀態。文中還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks
- 中文標題:pyTTN:基於樹張量網絡的開放與封閉系統量子動力學模擬開源工具箱
- 發佈日期:2025-03-19 17:40:49+00:00
- 作者:Lachlan P Lindoy, Daniel Rodrigo-Albert, Yannic Rath, Ivan Rungger
- 分類:quant-ph, cond-mat.str-el, physics.chem-ph, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.15460v1
中文摘要:我們推出Python樹張量網絡軟件包(pyTTN),用於評估封閉和開放量子系統的動力學特性。該工具基於樹張量網絡(TTN)或等效的多層多組態含時Hartree(ML-MCTDH)波函數表示方法。該軟件包具備多項功能:支持通過子空間擴展技術實現自適應鍵維度的單/多組TTN擬設,可便捷設置一般哈密頓量的零溫/有限溫度計算。所有核心功能均採用C++實現,並提供Python接口以簡化使用。除核心功能外,pyTTN還提供開放量子系統動力學模擬工具,包括採用TTN擬設表示輔助密度算子空間以模擬層次運動方程(HEOM)方法和廣義贗模方法,並證明這兩種方法通過作用於贗模自由度的非么正簡正模變換可相互轉化。我們展示了該軟件包的應用案例:從24模吡嗪光激發動力學的基準測試出發,進而研究描述n-寡聚噻吩供體-C60富勒烯受體體系界面激子動力學的更具挑戰性模型,最後應用於開放量子系統(包括自旋-玻色模型、擴展耗散自旋模型集和安德森雜質模型)。pyTTN兼具易用性、高效實現和可擴展設計,能與各類計算建模軟件集成。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺主幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:多模態大語言模型(MLLMs)的最新進展凸顯了視覺主幹網絡與底層語言模型的關鍵作用。儘管先前研究主要關注將這些組件擴展至數十億參數規模,但模型大小、架構與性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計選擇。本文提出LLaVA-MORE——一個整合最新語言模型與多樣化視覺主幹的新型MLLM家族。為確保公平比較,我們採用統一訓練協議並嚴格應用於所有架構。通過系統分析中小規模LLM(包括Phi-4、LLaMA-3.1和Gemma-2),我們評估多模態推理、生成與指令跟隨能力,同時探究模型規模與性能的關係。除評估LLM對最終結果的影響外,我們還對各類視覺編碼器(從CLIP架構到DINOv2、SigLIP及SigLIP2等替代方案)展開全面研究。額外實驗探究了提高圖像解像度與預訓練數據集變化的影響。總體而言,我們的研究結果為設計更高效的MLLM提供了洞見,建立了一個可復現的評估框架,該框架既能支持直接比較,也可指導未來模型開發。原始碼與訓練模型公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學與醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少或從未被關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參賦予特定值的過程。此外,我們報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作與模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLM)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力:在檢索前階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索中階段通過領域知識微調最先進的嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克聯合產生的最新理論預測,該計算遵循LHC希格斯工作組建議的規範。通過適當近似雙圈虛貢獻得到的NNLOQCD預測,進一步補充了NNLL精度的軟膠子重求和。研究採用兩種不同的重求和框架——一種基於直接QCD方法,另一種基於軟共線有效理論——並對二者的特性進行了詳細比較。這些結果還與完全NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。文中對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射測試表明樣品呈多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到峰值304 mAh/g。實驗研究輔以採用全勢局域軌道最小基組(FPLO)方案的第一性原理計算,通過相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。研究發現六方與菱方La$_2$Ni$_7$結構的總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體研究中的基礎性挑戰。自磁化會改變等離子體的輸運特性,從而影響其動力學演化過程。目前大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗,都依賴比耶曼機制或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存爭議。基於粒子網格(PIC)模擬的模型被提出用於解釋磁化現象,包括等離子體互穿驅動的魏貝爾機制、溫度梯度驅動的魏貝爾機制以及絕熱膨脹驅動的魏貝爾機制。本研究採用二維碰撞PIC模擬結合激光光線追蹤模塊,模擬了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內變化(該參數範圍需考慮碰撞效應的HED和ICF實驗相關)。研究發現:超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內產生霍爾參數$\omega_{\rm ce}\tau_{e}>1$且等離子體$\beta$值達100($\beta = 2k_B n_eT_e/B^2$)。研究還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺現象的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵結合的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品具有多相特徵,其中主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到304 mAh/g的最高值。實驗工作輔以採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,為模擬化學無序性使用了相干勢近似(CPA)。計算聚焦於具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜線進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克聯合產生的最新理論預測,該計算嚴格遵循LHC希格斯工作組的技術規範。通過適當近似雙圈虛貢獻導出的NNLOQCD預測,進一步補充了NNLL精度的軟膠子重求和。研究採用兩種不同的重求和框架——一種基於直接QCD方法,另一種基於軟共線有效理論——並詳細比較了它們的特性。這些結果還與完整的NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。文中對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺骨幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:多模態大語言模型(MLLMs)的最新進展凸顯了視覺主幹網絡和底層語言模型的關鍵作用。儘管先前研究主要集中於將這些組件擴展至數十億參數規模,但模型大小、架構與性能之間的權衡仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計方案。本文提出LLaVA-MORE——一個整合最新語言模型與多樣化視覺主幹的新型MLLM家族。為確保公平比較,我們採用統一訓練協議並應用於所有架構。我們的分析系統探索了中小規模LLM(包括Phi-4、LLaMA-3.1和Gemma-2)在多模態推理、生成及指令跟隨方面的表現,同時研究模型規模與性能的關係。除評估LLM對最終結果的影響外,我們還全面研究了從CLIP架構到DINOv2、SigLIP和SigLIP2等替代方案的各類視覺編碼器。額外實驗探究了提高圖像解像度及預訓練數據集變化的影響。總體而言,研究結果為設計更高效的MLLM提供了洞見,並建立了可復現的評估框架,該框架既能支持直接比較,也可指導未來模型開發。原始碼與訓練模型公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:膨脹高能量密度等離子體中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體研究中的基礎性挑戰。自磁化會改變等離子體的輸運特性,從而影響其動力學演化過程。目前大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗,都依賴比耶曼機制或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存爭議。已有研究提出基於粒子網格(PIC)模擬的磁化解釋模型,包括等離子體互穿驅動的魏貝爾機制、溫度梯度驅動的魏貝爾機制以及絕熱膨脹驅動的魏貝爾機制。本研究通過結合激光光線追蹤模塊的二維碰撞PIC模擬,再現了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內調節(該參數範圍需考慮碰撞效應的HED和ICF實驗相關),研究發現:超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初數百皮秒內即可產生等離子體β值達100($\beta = 2k_B n_eT_e/B^2$)且霍爾參數$\omega_{\rm ce}\tau_{e}>1$的狀態。研究還探討了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多因果發現背景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少或從未被關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調最先進(SOTA)嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子特性的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)達到最高值304 mAh/g。實驗工作輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們針對標準模型 希格斯玻色子與頂夸克的伴隨產生過程,提出了符合LHC 希格斯工作組建議的最新理論預測。通過適當近似雙圈虛貢獻獲得的NNLO QCD預測,補充了NNLL精度的軟膠子重求和。研究採用兩種不同的重求和框架——基於直接QCD方法和軟共線有效理論——並詳細比較了它們的特性。這些結果進一步與完整NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。我們對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning
- 中文標題:LLaVA-MORE:LLM與視覺主幹網絡在增強視覺指令調優中的對比研究
- 發佈日期:2025-03-19 18:10:12+00:00
- 作者:Federico Cocchi, Nicholas Moratelli, Davide Caffagni, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, Rita Cucchiara
- 分類:cs.CV, cs.AI, cs.CL, cs.MM
- 原文連結:http://arxiv.org/abs/2503.15621v1
中文摘要:多模態大語言模型(MLLMs)的最新進展凸顯了視覺主幹網絡與底層語言模型的關鍵作用。儘管先前研究主要聚焦於將這些組件擴展至數十億參數規模,但模型大小、架構與性能之間的權衡關係仍未得到充分探索。此外,訓練數據和評估協議的不一致性阻礙了直接比較,導致難以確定最優設計方案。本文提出LLaVA-MORE——一個整合最新語言模型與多樣化視覺主幹的新型MLLM家族。為確保公平比較,我們在所有架構中採用統一的訓練協議。通過系統分析中小規模LLM(包括Phi-4、LLaMA-3.1和Gemma-2),我們評估了多模態推理、生成與指令跟隨能力,同時探究模型規模與性能的關係。除評估LLM對最終結果的影響外,我們還對CLIP架構及DINOv2、SigLIP、SigLIP2等替代視覺編碼器展開全面研究。額外實驗探討了提高圖像解像度和預訓練數據集變化的影響。總體而言,我們的研究結果為設計更高效的MLLM提供了洞見,並建立了可復現的評估框架,該框架既能支持直接比較,也可指導未來模型開發。原始碼與訓練模型已公開於:https://github.com/aimagelab/LLaVA-MORE。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體研究中的基礎性挑戰。自磁化會改變等離子體的輸運特性,從而影響其動力學演化過程。目前大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗,都依賴比耶曼機制或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存爭議。基於粒子網格(PIC)模擬的模型被提出用於解釋磁化現象,包括等離子體互穿驅動的魏貝爾效應、溫度梯度驅動的魏貝爾效應以及絕熱膨脹驅動的魏貝爾效應。本研究採用二維碰撞PIC模擬結合激光光線追蹤模塊,模擬了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內變化(該參數範圍需考慮碰撞效應的HED和ICF實驗相關)。研究發現:超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內產生霍爾參數$\omega_{\rm ce}\tau_{e}>1$且等離子體$\beta$值達100($\beta = 2k_B n_eT_e/B^2$)。研究還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:跨多種因果發現場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬特定算法參數的賦值過程。此外,我們報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力。檢索前階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索中階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克伴隨產生的最新理論預測,該計算遵循LHC希格斯工作組的建議。通過適當近似雙圈虛貢獻,我們獲得了NNLOQCD預測,並補充了NNLL精度的軟膠子重求和。研究採用了兩種不同的重求和框架——一種基於直接QCD方法,另一種基於軟共線有效理論——並對它們的特性進行了詳細比較。這些結果進一步與完整的NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。我們對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:Simulations of self-magnetization in expanding high-energy-density plasmas
- 中文標題:高能量密度等離子體膨脹中的自磁化模擬
- 發佈日期:2025-03-19 18:16:50+00:00
- 作者:K. V. Lezhnin, S. R. Totorica, J. Griff-McMahon, M. Medvedev, H. Landsberger, A. Diallo, W. Fox
- 分類:physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2503.15624v1
中文摘要:理解等離子體自磁化是實驗室和天體物理等離子體研究中的基礎性挑戰。自磁化會改變等離子體輸運特性,從而影響其動力學演化過程。目前大多數關於磁重聯和無磁化無碰撞激波的高能量密度(HED)激光實驗,都依賴比耶曼機制或魏貝爾機制來自洽地產生目標磁場。多項HED實驗已觀測到兆高斯強度的離子尺度磁絲形成,但其起源仍存爭議。已有研究提出基於粒子網格(PIC)模擬的磁化解釋模型,包括等離子體互穿驅動的魏貝爾機制、溫度梯度驅動的魏貝爾機制以及絕熱膨脹驅動的魏貝爾機制。本研究通過結合激光射線追蹤模塊的二維碰撞PIC模擬,再現了等離子體燒蝕、膨脹及後續磁化過程。模擬採用平面幾何構型以有效抑制比耶曼磁場,從而聚焦於各向異性驅動的不穩定性。激光強度在$10^{13}$-$10^{14}$ W/cm$^2$範圍內調節(該參數範圍需考慮碰撞效應的HED和ICF實驗相關),研究發現:超過臨界強度後,等離子體通過膨脹驅動的魏貝爾過程快速自磁化,在最初幾百皮秒內即產生霍爾參數$\omega_{\rm ce}\tau_{e}>1$、等離子體β值達100($\beta = 2k_B n_eT_e/B^2$)的強磁場。研究還討論了等離子體磁化對熱輸運的影響。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但目前用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)幾乎未受關注。我們提出的理論結果證明,某些重採樣方法能高度模擬特定算法參數的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果既驗證了理論結論,也為研究人員進一步表徵因果發現分析中的重採樣特性提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。預檢索階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調前沿(SOTA)嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:最先進的ttH產生截面:NNLO預測與NNLL恢復及電弱修正的匹配
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們提出了標準模型希格斯玻色子與頂夸克伴隨產生的最新理論預測,該計算遵循LHC希格斯工作組的建議。通過適當近似雙圈虛貢獻得到的NNLOQCD預測,補充了NNLL精度的軟膠子重求和。研究採用了兩種不同的重求和框架——一種基於直接QCD,另一種基於軟共線有效理論——並詳細比較了它們的特性。這些結果進一步與完整NLO修正相結合,產生了迄今為止該過程最精確的標準模型預測。我們對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出了理論結果,證明某些重採樣方法能精確模擬特定算法參數的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調最先進(SOTA)嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子特性的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型結構的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)達到304 mAh/g的最高值。實驗研究輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算重點針對實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,同時考察了若干其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:State-of-the-art cross sections for ttH: NNLO predictions matched with NNLL resummation and EW corrections
- 中文標題:頂夸克-希格斯玻色子聯合產生的前沿截面:NNLO匹配NNLL恢復與電弱修正的預測
- 發佈日期:2025-03-19 09:32:21+00:00
- 作者:Roger Balsach, Alessandro Broggio, Simone Devoto, Andrea Ferroglia, Rikkert Frederix, Massimiliano Grazzini, Stefan Kallweit, Anna Kulesza, Javier Mazzitelli, Leszek Motyka, Davide Pagani, Benjamin D. Pecjak, Chiara Savoini, Tomasz Stebel, Malgorzata Worek, Marco Zaro
- 分類:hep-ph, hep-ex
- 原文連結:http://arxiv.org/abs/2503.15043v1
中文摘要:我們根據LHC希格斯工作組建議,提出了標準模型希格斯玻色子與頂夸克聯合產生的最新理論預測。通過適當近似雙圈虛貢獻,我們獲得了次次領頭階(NNLO)量子色動力學預測,並補充了直至次次領頭對數(NNLL)精度的軟膠子重求和。研究採用兩種不同的重求和框架——一種基於直接量子色動力學,另一種基於軟共線有效理論——並詳細比較了它們的特性。這些結果進一步與完整次領頭階修正相結合,產生了迄今為止該過程最精確的標準模型預測。我們對相關理論不確定性來源進行了全面評估和討論。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)卻鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法與調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程詳見GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探究了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性質的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品具有多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多重因果發現情境下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分研究。其中最流行的方法是通過數據重採樣來評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)卻鮮少受到關注。我們提出了理論結果,證明某些重採樣方法能高度模擬對算法調參賦予特定值的過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一個高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;檢索後階段運用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探究了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性質的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到峰值304 mAh/g。 實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算。為模擬化學無序態,採用相干勢近似(CPA)方法,重點分析了實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。計算發現La$_2$Ni$_7$的六方與菱方結構總能量近乎相同,這與樣品中兩相共存現象吻合。Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好計算值也與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性質的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗工作輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算獲得的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺現象的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方案顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗工作輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少或從未被關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。預檢索階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調最先進的嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能精確模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺現象的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探究了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到峰值304 mAh/g。實驗工作輔以採用全勢局域軌道最小基組(FPLO)的密度泛函理論(DFT)計算,為模擬化學無序性使用了相干勢近似(CPA)。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶,實驗XPS譜基於DFT計算對應的譜圖進行解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:金融問答文檔檢索增強生成系統中的檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品具有多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但現有的非實驗性因果模型驗證方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣來評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)卻鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能高度模擬特定算法參數的賦值過程。同時,我們通過大量模擬實驗驗證了該理論結果,並提供了豐富數據以幫助研究者進一步表徵因果發現分析中的重採樣特性。理論工作與模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;檢索後階段運用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺現象的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多樣化查詢與語料預處理技術增強輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到峰值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學與醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能精準模擬對算法調參賦予特定值的過程。此外,我們報告了大量模擬實驗的結果,這些結果既驗證了理論結論,又為研究者進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作與模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果既驗證了理論結論,又為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作與模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:金融問答文檔在檢索增強生成系統中的檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調最先進(SOTA)嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項評估多重因果發現情境下重採樣技術交互作用的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學與醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作與模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。在預檢索階段,採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段則通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣來評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)卻鮮少受到關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法與調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;檢索後階段運用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能緊密模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵結合的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能緊密模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLM)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力。在檢索前階段,採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段則通過領域知識微調最先進的嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調參參數。我們提出了理論結果,證明某些重採樣方法能緊密模擬對算法調參參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略的優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互影響的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力。檢索前階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了若干其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互作用的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但目前用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能很好地模擬對算法調參參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到304 mAh/g的峰值。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並採用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量近乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到304 mAh/g的峰值。實驗工作輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔檢索能力:預檢索階段採用多種查詢與語料庫預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵結合的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品具有多相特徵,其中主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到304 mAh/g的最高值。實驗工作輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,為模擬化學無序性使用了相干勢近似(CPA)。計算聚焦於具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,並引入其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶,實驗XPS結果基於DFT計算的光譜進行了解讀。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、使用的算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLM)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。預檢索階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品具有多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到304 mAh/g的峰值。實驗研究輔以採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,為模擬化學無序性採用了相干勢近似(CPA)。計算重點針對具有最高$C_{max}$實測值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分研究。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未被關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出了理論結果,證明某些重採樣方法能高度模擬特定算法參數的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時對比了其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能緊密模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLM)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索和檢索後)增強金融文檔檢索能力。在檢索前階段,採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段則通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;最後在檢索後階段,利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學和電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後,採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並利用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時以其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組(FPLO)方案進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射測試表明樣品具有以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型為主的(La,Mg)$_2$Ni$_7$多相特徵。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到304 mAh/g的最高值。實驗工作輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時參考其他多種結構。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術與因果發現方法交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;檢索後階段運用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子性能的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)達到304 mAh/g的最高值。實驗工作輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,同時考察多個結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料庫預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子特性的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品呈多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)時達到峰值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,通過相干勢近似(CPA)模擬化學無序。計算重點針對實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,並引入其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)鮮少或從未被關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射測試表明樣品具有以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型為主的(La,Mg)$_2$Ni$_7$多相特徵。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到304 mAh/g的最高值。 實驗研究輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算。為模擬化學無序,我們採用相干勢近似(CPA)。計算聚焦於具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則結合直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品具有多相特徵,其中主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到峰值304 mAh/g。實驗研究結合了基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,採用相干勢近似(CPA)模擬化學無序。計算重點針對實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,並引入其他結構作為參照。研究發現六方與菱方結構的La$_2$Ni$_7$總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術與因果發現方法交互影響的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子性能的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品具有多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型結構的(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)時達到峰值304 mAh/g。實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,採用相干勢近似(CPA)模擬化學無序。計算重點針對實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,並引入其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量近乎相同,這與樣品中兩相共存現象吻合。計算獲得的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,並基於DFT計算譜圖對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射測試表明樣品具有多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到304 mAh/g的最高值。實驗工作輔以採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,為模擬化學無序性使用了相干勢近似(CPA)。計算聚焦於具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS結果基於DFT計算的光譜進行了解讀。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到峰值304 mAh/g。實驗研究輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互影響的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施融合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究輔以採用全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互影響的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。同時,我們報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索和檢索後)增強金融文檔的檢索效果。在檢索前階段,採用多種查詢和語料庫預處理技術來豐富輸入數據;檢索階段則通過領域知識微調最先進的嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要包含六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗研究後採用全勢局域軌道最小基組方案(FPLO)進行密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於具有最高$C_{max}$實測值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時以其他多種結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象高度吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS結果基於DFT計算的光譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互影響的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代鎳氫電池極具前景的負極材料。本研究探討了Mg替代對La$_{2-x}$Mg$_x$Ni$_7$材料電化學與電子性能的影響。採用機械合金化技術製備了La$_{2-x}$Mg$_x$Ni$_7$合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中La$_{1.5}$Mg$_{0.5}$Ni$_7$($x$=0.5)達到最高值304 mAh/g。實驗研究輔以採用全勢局域軌道最小基組(FPLO)方案的第一性原理計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的La$_{1.5}$Mg$_{0.5}$Ni$_7$組分,同時考察了若干其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型La$_{1.5}$Mg$_{0.5}$Ni$_7$相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶La$_{1.5}$Mg$_{0.5}$Ni$_7$樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少或從未被關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段結合領域知識微調前沿嵌入模型,並實施稠密與稀疏表徵混合的檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品呈多相特徵,其中以六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型(La,Mg)$_2$Ni$_7$相為主。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)時達到峰值304 mAh/g。 實驗研究輔以基於全勢局域軌道最小基組方案(FPLO)的密度泛函理論(DFT)計算。為模擬化學無序態,採用相干勢近似(CPA)方法,重點分析了具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了若干其他結構作為參照。計算發現La$_2$Ni$_7$的六方與菱方結構總能量近乎相同,這與樣品中兩相共存現象高度吻合。對於Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中Mg的佔位偏好計算,結果與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,並基於DFT計算譜對實驗XPS結果進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略的優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料庫預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子特性的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學與電子性能的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到峰值304 mAh/g。實驗部分後接採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組分,同時考察了若干其他結構作為參照。發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$=0.00、0.25、0.50和0.75)。X射線衍射分析表明樣品呈多相特徵,主相為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到304 mAh/g的最高值。實驗研究輔以採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算主要針對實測$C_{max}$最高的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時考察了若干其他結構作為參照。研究發現La$_2$Ni$_7$的六方與菱方結構總能量幾乎相同,這與樣品中兩相共存現象吻合。計算得到的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與前期實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶 [[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜圖進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出了理論結果,證明某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg替代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學與電子性質的影響:實驗與第一性原理綜合研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池極具前景的負極材料。本研究探討了Mg替代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料電化學和電子特性的影響。採用機械合金化技術製備了[[La$_{2-x}$Mg$_x$Ni$_7$]]合金系列($x$ = 0.00、0.25、0.50和0.75)。X射線衍射表明樣品具有多相特徵,主要為六方Ce$_2$Ni$_7$型和菱方Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測試顯示最大放電容量($C_{max}$)隨Mg濃度增加而提升,其中[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$=0.5)達到最高值304 mAh/g。實驗工作輔以採用全勢局域軌道最小基組(FPLO)方案進行的密度泛函理論(DFT)計算,並運用相干勢近似(CPA)模擬化學無序。計算聚焦於具有最高實測$C_{max}$值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]成分,同時考察了其他結構作為參照。研究發現六方和菱方結構的La$_2$Ni$_7$總能量幾乎相同,這與樣品中兩相共存現象吻合。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的佔位偏好與先前實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶結構,實驗XPS譜圖基於DFT計算所得對應譜進行了解析。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分研究。其中最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面(如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參)幾乎未受關注。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結論,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力。在檢索前階段,採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段則通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;最後在檢索後階段,利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數賦予特定值的過程。此外,我們報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:預檢索階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術與因果發現方法交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬特定算法參數的賦值過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:面向檢索增強生成系統的金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過三階段方法(檢索前、檢索中和檢索後)增強金融文檔檢索能力。檢索前階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索中階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;檢索後階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面鮮少或從未被關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了大量數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大語言模型(LLMs)中的幻覺問題,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段方法增強金融文檔的檢索效果。預檢索階段採用多種查詢與語料庫預處理技術來豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參參數。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調參參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLMs)幻覺問題的有效框架,但其整體性能取決於底層檢索系統。在金融領域,10-K報告等文檔因領域特定詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步精煉結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的答案。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景因果發現中重採樣技術交互效應的模擬評估研究
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的諸多方面鮮少受到關注,例如重採樣方法的選擇是否應取決於樣本量、所用算法或算法調參。我們提出的理論結果證明,某些重採樣方法能高度模擬對算法調參特定值的賦值。我們還報告了大量模擬實驗的結果,這些結果驗證了理論發現,並為研究人員進一步表徵因果發現分析中的重採樣提供了豐富數據。理論工作和模擬實驗共同為實踐中如何選擇重採樣方法和調參提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:檢索增強生成系統中金融問答文檔檢索策略優化
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因專業術語和多層次表格數據帶來獨特挑戰。本研究提出一種高效的端到端RAG流程,通過三階段方法提升金融文檔檢索效果:檢索前階段採用多種查詢與語料預處理技術豐富輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施稠密表徵與稀疏表徵結合的混合檢索策略;檢索後階段利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的評估表明,該方法顯著提升檢索性能,生成結果更準確且符合上下文。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:多場景下重採樣技術交互效應的廣泛模擬研究評估
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:摘要:儘管探索性因果分析在現代科學和醫學中的應用日益加速,但用於驗證因果模型的非實驗方法尚未得到充分表徵。最流行的方法之一是通過數據重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,該方法的許多方面很少或根本沒有受到關注,例如重採樣方法的選擇是否應取決於樣本量、所使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法可以很好地模擬對算法調優參數特定值的分配。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同為實踐中如何選擇重採樣方法和調優參數提供了具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)已成為緩解大語言模型(LLM)幻覺問題的有效框架,但其整體性能依賴於底層檢索系統。在金融領域,10-K報告等文檔因領域專有詞彙和多層次表格數據而帶來獨特挑戰。本研究提出了一種高效的端到端RAG流程,通過預檢索、檢索和後檢索三階段優化金融文檔檢索:預檢索階段採用多種查詢與語料庫預處理技術增強輸入數據;檢索階段通過領域知識微調前沿嵌入模型,並實施結合稠密表示與稀疏表示的混合檢索策略;後檢索階段則利用直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在FinDER、FinQABench等七個金融問答數據集上的實驗表明,該方法顯著提升了檢索性能,從而生成更準確且符合語境的回答。這些發現凸顯了定製化檢索技術對提升金融領域RAG系統效能的關鍵作用。完整可復現流程已發佈於GitHub:https://github.com/seohyunwoo-0407/GAR。