WikiEdge:ArXiv速遞/2025-03-19
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多種因果發現情境中的交互作用
- 發布日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文鏈接:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的可用非實驗方法尚未得到很好的表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發布日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文鏈接:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次的表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG管道,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索能力。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文適當的生成結果。這些發現突顯了定製檢索技術在提升RAG系統在金融應用中的有效性方面的關鍵作用。完整的可復現管道可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學和電子性質的影響:實驗與從頭計算相結合的研究
- 發布日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文鏈接:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的有前景的負極材料。在本工作中,我們研究了Mg取代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射線衍射測量表明樣品具有多相特徵,主要為六方Ce$_2$Ni$_7$型和菱面體Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示最大放電容量($C_{max}$)隨Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱面體結構的總能量幾乎相同,這與樣品中兩相的共存一致。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算的相應光譜進行了解釋。