WikiEdge:ArXiv速遞/2025-03-19
摘要
- 原文標題:An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts
- 中文標題:一項廣泛的模擬研究評估重採樣技術在多種因果發現情境中的交互作用
- 發佈日期:2025-03-19 17:18:18+00:00
- 作者:Ritwick Banerjee, Bryan Andrews, Erich Kummerfeld
- 分類:stat.ME, cs.AI
- 原文連結:http://arxiv.org/abs/2503.15436v1
中文摘要:儘管探索性因果分析在現代科學和醫學中的存在加速增長,但用於驗證因果模型的可用非實驗方法尚未得到很好的表徵。最流行的方法之一是在對數據進行重採樣後評估模型特徵的穩定性,類似於統計學中用於估計置信區間的重採樣方法。然而,這種方法的許多方面幾乎沒有受到關注,例如重採樣方法的選擇是否應取決於樣本大小、使用的算法或算法調優參數。我們提出了理論結果,證明某些重採樣方法能夠很好地模擬為算法調優參數分配特定值的過程。我們還報告了大量模擬實驗的結果,這些結果驗證了理論結果,並提供了大量數據,以幫助研究人員進一步表徵因果發現分析中的重採樣。理論工作和模擬結果共同提供了關於在實踐中應如何選擇重採樣方法和調優參數的具體指導。
摘要
- 原文標題:Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems
- 中文標題:優化檢索增強生成系統中金融問答文檔的檢索策略
- 發佈日期:2025-03-19 13:21:49+00:00
- 作者:Sejong Kim, Hyunseo Song, Hyunwoo Seo, Hyunjun Kim
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2503.15191v1
中文摘要:檢索增強生成(RAG)作為一種有前景的框架,能夠緩解大型語言模型(LLMs)中的幻覺問題,但其整體性能依賴於底層的檢索系統。在金融領域,諸如10-K報告等文檔由於領域特定的詞彙和多層次的表格數據而帶來了獨特的挑戰。在本研究中,我們引入了一種高效的端到端RAG管道,通過三個階段(預檢索、檢索和後檢索)來增強金融文檔的檢索能力。在預檢索階段,採用了多種查詢和語料庫預處理技術來豐富輸入數據。在檢索階段,我們利用領域特定知識對最先進的(SOTA)嵌入模型進行了微調,並實施了一種結合密集表示和稀疏表示的混合檢索策略。最後,在後檢索階段,通過直接偏好優化(DPO)訓練和文檔選擇方法進一步優化結果。在七個金融問答數據集(FinDER、FinQABench、FinanceBench、TATQA、FinQA、ConvFinQA和MultiHiertt)上的評估表明,檢索性能顯著提升,從而生成了更準確且上下文適當的生成結果。這些發現突顯了定製檢索技術在提升RAG系統在金融應用中的有效性方面的關鍵作用。完整的可復現管道可在GitHub上獲取:https://github.com/seohyunwoo-0407/GAR。
摘要
- 原文標題:Effect of substitution La by Mg on electrochemical and electronic properties in La$_{2-x}$Mg$_x$Ni$_7$ alloys: a combined experimental and ab initio studies
- 中文標題:La被Mg取代對La$_{2-x}$Mg$_x$Ni$_7$合金電化學和電子性質的影響:實驗與從頭計算相結合的研究
- 發佈日期:2025-03-19 07:34:11+00:00
- 作者:Mirosław Werwiński, Andrzej Szajek, Agnieszka Marczyńska, Lesław Smardz, Marek Nowak, Mieczysław Jurczyk
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文連結:http://arxiv.org/abs/2503.14952v1
中文摘要:La-Mg-Ni基合金是第三代Ni-MH$_x$電池的有前景的負極材料。在本工作中,我們研究了Mg取代對[[La$_{2-x}$Mg$_x$Ni$_7$]]材料的電化學和電子性質的影響。採用機械合金化技術製備了一系列[[La$_{2-x}$Mg$_x$Ni$_7$]]合金($x$ = 0.00, 0.25, 0.50和0.75)。X射線衍射測量表明樣品具有多相特徵,主要為六方Ce$_2$Ni$_7$型和菱面體Gd$_2$Co$_7$型的(La,Mg)$_2$Ni$_7$相。電化學測量顯示最大放電容量($C_{max}$)隨Mg濃度的增加而增加,並在[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]($x$ = 0.5)時達到最高值304 mAh/g。實驗工作之後,我們使用全勢局域軌道最小基組方案(FPLO)進行了密度泛函理論(DFT)計算。為了模擬化學無序,我們採用了相干勢近似(CPA)。計算主要集中在具有最高$C_{max}$測量值的[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]組成上。此外,還考慮了其他幾種結構作為參考點。我們發現La$_2$Ni$_7$的六方和菱面體結構的總能量幾乎相同,這與樣品中兩相的共存一致。計算的Mg在Ce$_2$Ni$_7$型和Gd$_2$Co$_7$型[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]相中的位置偏好與之前的實驗數據一致。此外,通過X射線光電子能譜(XPS)研究了納米晶[[La$_{1.5}$Mg$_{0.5}$Ni$_7$]]樣品的價帶。實驗XPS結果基於DFT計算的相應光譜進行了解釋。
摘要
- 原文標題:Improved Lattice QCD $B_c\to J/ψ$ Vector, Axial-Vector, and Tensor Form Factors
- 中文標題:改進的格點QCD $B_c\to J/ψ$ 矢量、軸矢量和張量形狀因子
- 發佈日期:2025-03-19 10:40:27+00:00
- 作者:Judd Harrison
- 分類:hep-lat, hep-ph
- 原文連結:http://arxiv.org/abs/2503.15090v1
中文摘要:我們更新了HPQCD的格點QCD對$B_c\to J/\psi$矢量和軸矢量形狀因子的確定,並提供了張量形狀因子的新結果。我們使用高度改進的交錯夸克作用量處理所有價夸克,並結合第二代MILC $n_f=2+1+1$ HISQ膠子場配置。該計算包括兩個額外的集合,一個具有物理輕上夸克和下夸克且$a\approx 0.06 \mathrm{fm}$,另一個具有$a\approx 0.03\mathrm{fm}$,在該集合上我們能夠達到物理底夸克質量。我們的計算使用非微擾重整化的流算子,並覆蓋了衰變的整個運動學範圍。我們使用最近的重-粲磁化率結果,作為$u=m_c/m_h$的函數,以便在我們的物理-連續外推中採用$B_c\to J/\psi$的完整色散參數化。我們給出了更新的標準模型預測$R(J/\psi)=0.2597(27)$,$A_{\lambda_\tau}=0.5093(42)$,$F_L^{J/\psi}=0.4421(55)$,和$\mathcal{A}_\mathrm{FB}=-0.0567(61)$,分別將不確定性減少了$29\%$,$45\%$,$40\%$和$50\%$。由於我們的格點形狀因子覆蓋了整個運動學範圍,我們可以使用它們來測試在低反衝截斷範圍內的數據外推。我們研究了不同的物理連續參數化方案,使用在$q^2_\mathrm{max}$附近運動學範圍的前$1/3$的格點結果。我們發現,如果在物理連續外推中省略高階運動學術語,從高$q^2$區域外推合成數據時,在$q^2=0$附近可能會出現意外大的系統不確定性。這表明,在從高$q^2$區域外推相關$B\to D^*\ell\bar{\nu}$衰變的合成格點QCD數據時,可能會低估系統不確定性。