WikiEdge:ArXiv速遞/2025-04-02
摘要
- 原文標題:GeoRAG: A Question-Answering Approach from a Geographical Perspective
- 中文標題:GeoRAG:地理視角下的問答方法
- 發佈日期:2025-04-02 08:11:05+00:00
- 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2504.01458v1
中文摘要:地理問答(GeoQA)通過處理地理領域的自然語言查詢來滿足複雜用戶需求並提升信息檢索效率。然而傳統問答系統存在理解局限、檢索精度低、交互性弱及複雜任務處理不足等問題,阻礙了精準信息獲取。本研究提出GeoRAG框架,該知識增強型問答系統融合領域微調、提示工程與檢索增強生成(RAG)技術,以提升地理知識檢索精度和用戶交互體驗。方法論包含四個組件:(1)基於3267份語料(研究論文、專著與技術報告)構建結構化地理知識庫,通過多智能體方法歸類為語義理解、空間位置、幾何形態、屬性特徵、要素關聯、演化過程與運作機制七個維度,最終生成145234條分類條目與875432組多維問答對;(2)基於BERT-Base-Chinese的多標籤文本分類器,用於通過地理維度分類解析查詢類型;(3)利用問答對數據的檢索評估器,優化查詢-文檔相關性判定以提升檢索精度;(4)GeoPrompt模板動態整合用戶查詢與檢索信息,通過維度特異性提示提升響應質量。對比實驗表明GeoRAG在多個基礎模型上均優於傳統RAG,驗證了其泛化能力。本研究通過提出領域專用大語言模型部署新範式,推動地理人工智能發展,對提升現實場景中GeoQA系統的可擴展性與準確性具有實踐意義。
摘要
- 原文標題:A Unified Approach to Analysis and Design of Denoising Markov Models
- 中文標題:去噪馬爾可夫模型分析與設計的統一方法
- 發佈日期:2025-04-02 17:46:43+00:00
- 作者:Yinuo Ren, Grant M. Rotskoff, Lexing Ying
- 分類:cs.LG, cs.NA, math.NA, stat.ML
- 原文連結:http://arxiv.org/abs/2504.01938v1
中文摘要:基於測度傳輸的概率生成模型(如擴散模型和基於流的模型)通常採用馬爾可夫隨機動力學語言進行表述,其中底層過程的選擇同時影響算法設計決策和理論分析。本文旨在為去噪馬爾可夫模型建立嚴格的數學基礎——這類生成模型假設存在從前向過程(從目標分佈過渡到簡單易採樣分佈)與特別構建的後向過程(實現逆向高效採樣)。通過與非平衡統計力學及廣義Doob's h-變換的深層聯繫,我們提出一組最小假設條件以確保:(1) 後向生成算子的顯式構造,(2) 直接最小化測度傳輸差異的統一變分目標,(3) 經典分數匹配方法在不同動力學中的適應性實現。本框架統一了連續/離散擴散模型的現有表述,在正向生成算子滿足特定正則性假設下識別出去噪馬爾可夫模型的最一般形式,並為任意Lévy型過程驅動的去噪模型設計提供了系統化方案。我們通過採用幾何布朗運動和跳躍過程作為前向動力學的新型去噪模型,展示了該框架在複雜分佈建模中的潛在靈活性與效能。
摘要
- 原文標題:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
- 中文標題:通過第一性原理計算展示銫(Cs I)中多個低激發態電偶極極化率的關聯趨勢
- 發佈日期:2025-04-02 07:10:28+00:00
- 作者:A. Chakraborty, B. K. Sahoo
- 分類:physics.atom-ph, quant-ph
- 原文連結:http://arxiv.org/abs/2504.01418v1
中文摘要:在銫原子(Cs)多個偶宇稱和奇宇稱態標量與張量靜態電偶極極化率($\alpha_d$)的計算中,我們採用狄拉克-哈特里-福克方法(DHF)、二階微擾理論(MBPT(2))、三階微擾理論(MBPT(3))、隨機相位近似(RPA)以及單雙激發近似相對論耦合簇方法(RCCSD),探究了電子關聯效應和高階相對論效應。為處理奇宇稱E1算符對原子軌道的微擾影響,計算採用線性響應方法進行。最終獲得的$\alpha_d$值及其不確定度估計與先前理論計算及現有實驗結果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA結果間的差異表明:在銫原子$\alpha_d$值的確定過程中,電子對關聯(PC)效應比核心極化(CP)效應起着更主要的作用。通過比較MBPT(3)與RCC結果,我們發現PC與CP效應的關聯效應以及雙CP效應在這些計算中同樣具有顯著影響。此外,在高激發態中,Breit相互作用的貢獻表現得尤為突出。
摘要
- 原文標題:A thorough benchmark of automatic text classification: From traditional approaches to large language models
- 中文標題:自動文本分類的全面基準測試:從傳統方法到大語言模型
- 發佈日期:2025-04-02 17:40:08+00:00
- 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
- 分類:cs.CL, cs.AI
- 原文連結:http://arxiv.org/abs/2504.01930v1
中文摘要:自動文本分類(ATC)在過去十年中取得了顯著進展,以基於Transformer架構的小型及大型語言模型(SLMs和LLMs)為典型代表。儘管近期在效果上有所提升,但文獻中仍缺乏全面的成本效益分析,以評估這些新方法相較於支持向量機(SVM)和邏輯回歸等傳統文本分類方法的效果提升是否足以抵消其高昂成本。對此,本研究的兩項主要貢獻是:(i)對12種傳統與新興ATC方案(包括5個開源LLM)進行科學嚴謹的成本效益對比分析;(ii)構建包含22個數據集的大規模基準測試集(涵蓋情感分析和主題分類任務),其訓練-驗證-測試劃分基於摺疊交叉驗證流程,並配套文檔和代碼。通過公開代碼、數據及文檔,本研究支持學界以更科學的方式復現實驗並推動領域發展。實驗結果表明:LLMs在效果上優於傳統方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微調過程導致計算成本顯著更高——分別比傳統方法和SLMs平均慢590倍和8.5倍。由此提出建議:(1)對效果要求極致且能承擔成本的場景選用LLMs;(2)資源受限或無法承擔LLMs調優成本的場景選用邏輯回歸/SVM等傳統方法;(3)追求接近最優效果-效率平衡時選用Roberta等SLMs。
摘要
- 原文標題:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
- 中文標題:基於原子力顯微鏡相位趨近曲線的材料識別與虛擬s-SNOM數據集及方法學
- 發佈日期:2025-04-02 11:42:03+00:00
- 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
- 分類:physics.optics
- 原文連結:http://arxiv.org/abs/2504.01636v1
中文摘要:原子力顯微鏡(AFM)相位趨近曲線在納米尺度材料表徵方面具有重要潛力,但現有魯棒數據集和自動化分析工具仍較為匱乏。本文提出了一種基於高維數據集的新型材料識別方法,該數據集包含從矽、二氧化矽、鉑、銀和金五種材料採集的AFM相位趨近曲線。每次測量獲取逐漸增加針尖-樣品距離時的50個相位值,最終形成50×50×50體素圖像以表徵不同深度的相位變化。利用該數據集,我們比較了k近鄰(KNN)、隨機森林(RF)和前饋神經網絡(FNN)在材料分割中的表現。結果表明,FNN具有最高的準確率和F1分數,優於傳統方法。最後,我們通過生成虛擬散射型掃描近場光學顯微鏡(s-SNOM)圖像驗證了分割圖的實際價值,揭示了如何利用AFM相位趨近曲線構建用於納米尺度光學分析的精細化預測工具。
摘要
- 原文標題:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
- 中文標題:Al2O3/超寬禁帶AlGaN異質結構中的能帶與擊穿特性
- 發佈日期:2025-04-02 01:49:58+00:00
- 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
- 分類:cond-mat.mtrl-sci, physics.app-ph
- 原文連結:http://arxiv.org/abs/2504.01291v1
中文摘要:我們報道了超寬禁帶(UWBG) AlGaN異質結構上Al2O3介質的能帶與擊穿特性。金屬-介質-半導體結構對於維持未來高性能UWBG電晶體所需的高電場至關重要。通過系統實驗,我們測定了半導體平帶條件下氧化物中的固定電荷密度(> 1013 cm-2)、介質/界面特性及電場分佈。在金屬-氧化物-半導體結構中獲得了低至5×10-7 A/cm2的柵漏電流。橫向金屬-半導體-絕緣體測試結構在溝道面電荷密度為1.27×1013 cm-2時,擊穿電壓超過1 kV。有效峰值電場與平均擊穿場強分別估計為>4.27 MV/cm和1.99 MV/cm。這些發現證明了Al2O3集成對提升UWBGAlGaNHEMTs擊穿性能的潛力。
摘要
- 原文標題:Study of scaling laws in language families
- 中文標題:語言家族中的標度律研究
- 發佈日期:2025-04-02 12:28:59+00:00
- 作者:Maelyson R. F. Santos, Marcelo A. F. Gomes
- 分類:physics.soc-ph, cs.CL
- 原文連結:http://arxiv.org/abs/2504.01681v1
中文摘要:本文利用來自六千多種語言的數據,通過分析齊普夫式分類圖中湧現的模式,研究語言家族中的標度律現象。研究從宏觀(基於各語系包含的語言數量)和微觀(基於語系中各語言的使用者數量)兩個維度考察了這些分類特徵。尤其值得注意的是,在排除亞非語系和尼羅-撒哈拉語系後,研究發現當代十四大語系存在明顯分化現象——這些語系分佈在三個語系四重奏組中,每組在齊普夫圖中均表現出顯著不同的指數特徵。該發現揭示了主要語系的底層結構與組織方式,為理解語言多樣性和分佈的本質提供了新的見解。
摘要
- 原文標題:GeoRAG: A Question-Answering Approach from a Geographical Perspective
- 中文標題:GeoRAG:基於地理視角的問答方法
- 發佈日期:2025-04-02 08:11:05+00:00
- 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2504.01458v1
中文摘要:地理問答系統(GeoQA)通過處理地理領域的自然語言查詢來滿足複雜用戶需求並提升信息檢索效率。然而傳統問答系統存在理解局限、檢索精度低、交互性弱及複雜任務處理不足等缺陷,阻礙了精準信息獲取。本研究提出GeoRAG——一個整合領域微調、提示工程與檢索增強生成(RAG)技術的知識增強型問答框架,旨在提升地理知識檢索精度與用戶交互體驗。該框架包含四個核心組件:(1)基於3267份語料(研究論文、專著與技術報告)構建的結構化知識庫,通過多智能體方法歸類為語義理解、空間定位、幾何形態、屬性特徵、要素關聯、演化過程及作用機制七個維度,最終形成145234條分類條目與875432組多維問答對;(2)基於BERT-Base-Chinese的多標籤文本分類器,用於通過地理維度分類解析查詢類型;(3)利用問答對數據評估查詢-文檔相關性的檢索評估模塊,優化檢索精度;(4)GeoPrompt模板引擎,動態整合用戶查詢與檢索信息,通過維度特異性提示提升響應質量。對比實驗表明GeoRAG在多個基礎模型上均優於傳統RAG,驗證了其泛化能力。本研究通過提出領域特定場景下部署大語言模型的新範式,推動地理人工智能發展,對提升現實應用中GeoQA系統的可擴展性與準確性具有重要價值。
摘要
- 原文標題:A thorough benchmark of automatic text classification: From traditional approaches to large language models
- 中文標題:自動文本分類的全面基準測試:從傳統方法到大語言模型
- 發佈日期:2025-04-02 17:40:08+00:00
- 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
- 分類:cs.CL, cs.AI
- 原文連結:http://arxiv.org/abs/2504.01930v1
中文摘要:自動文本分類(ATC)在過去十年中取得了顯著進展,以基於Transformer架構的小型及大型語言模型(SLMs和LLMs)為典型代表。儘管近期效果有所提升,但文獻中仍缺乏全面的成本效益分析,以驗證這些新方法相較於支持向量機(SVM)和邏輯回歸等傳統文本分類方法的效果提升是否足以抵消其高昂成本。為此,本研究的兩項主要貢獻是:(i) 對12種傳統與新興ATC方案(含5個開源LLM)進行科學嚴謹的成本效益對比分析;(ii) 發佈包含22個數據集的大規模基準測試(涵蓋情感分析和主題分類任務),提供基於摺疊交叉驗證的數據劃分方案、完整文檔及代碼。代碼、數據和文檔的公開將助力學界復現實驗並以更科學的方式推動領域發展。實驗結果表明:LLMs在效果上優於傳統方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微調過程產生顯著更高的計算成本,平均速度分別比傳統方法和SLMs慢590倍和8.5倍。由此提出建議:(1) 對效果要求極致且能承擔成本的場景選用LLMs;(2) 資源受限或無法承擔LLM調優成本的場景選用邏輯回歸/SVM等傳統方法;(3) 追求效果-效率平衡時選擇Roberta等SLMs。
摘要
- 原文標題:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
- 中文標題:基於第一性原理計算展示銫(Cs I)多個低激發態電偶極極化率的關聯趨勢
- 發佈日期:2025-04-02 07:10:28+00:00
- 作者:A. Chakraborty, B. K. Sahoo
- 分類:physics.atom-ph, quant-ph
- 原文連結:http://arxiv.org/abs/2504.01418v1
中文摘要:摘要:在銫原子(Cs)多個偶宇稱和奇宇稱態的標量與張量靜態電偶極極化率($\alpha_d$)計算中,我們採用狄拉克-哈特里-福克方法(DHF)、二階微擾理論(MBPT(2))、三階微擾理論(MBPT(3))、隨機相位近似(RPA)以及單雙激發近似相對論耦合簇方法(RCCSD),探究了電子關聯效應和高階相對論效應的影響。為處理奇宇稱E1算子對原子軌道的微擾,計算採用線性響應方法進行。最終獲得的$\alpha_d$值及其不確定度估計與先前理論計算和現有實驗結果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA結果間的差異表明:在銫原子$\alpha_d$值的確定過程中,電子對關聯(PC)效應比核心極化(CP)效應起着更主導作用。通過比較MBPT(3)與RCC結果的差異,我們發現PC與CP效應之間的關聯效應以及雙CP效應在這些計算中也具有顯著影響。此外,在高激發態中,Breit相互作用的貢獻表現得尤為突出。
摘要
- 原文標題:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
- 中文標題:基於原子力顯微鏡相位趨近曲線的材料識別與虛擬s-SNOM數據集及方法學
- 發佈日期:2025-04-02 11:42:03+00:00
- 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
- 分類:physics.optics
- 原文連結:http://arxiv.org/abs/2504.01636v1
中文摘要:原子力顯微鏡(AFM)相位趨近曲線在納米尺度材料表徵方面具有重要潛力,但現有魯棒數據集和自動化分析工具較為匱乏。本文提出了一種利用高維數據集進行材料識別的新方法,該數據集包含從矽、二氧化矽、鉑、銀和金五種材料採集的AFM相位趨近曲線。每次測量獲取50個在探針-樣品間距遞增時的相位值,最終形成50×50×50體素圖像以表徵不同深度的相位變化。基於此數據集,我們比較了K近鄰(KNN)、隨機森林(RF)和前饋神經網絡(FNN)在材料分割中的表現。結果表明FNN具有最高的準確率和F1分數,優於傳統方法。最後,我們通過生成虛擬散射型掃描近場光學顯微鏡(s-SNOM)圖像驗證了分割圖的實際價值,揭示了如何利用AFM相位趨近曲線構建納米級光學分析的精細化預測工具。
摘要
- 原文標題:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
- 中文標題:Al2O3/超寬禁帶AlGaN異質結構中的能帶與擊穿特性
- 發佈日期:2025-04-02 01:49:58+00:00
- 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
- 分類:cond-mat.mtrl-sci, physics.app-ph
- 原文連結:http://arxiv.org/abs/2504.01291v1
中文摘要:我們報道了超寬禁帶(UWBG) AlGaN異質結構上Al2O3介質的能帶和擊穿特性。金屬-介質-半導體結構對於維持未來高性能UWBG電晶體所需的高電場至關重要。通過系統實驗,我們測定了半導體平帶條件下氧化物中的固定電荷密度(> 1013 cm-2)、介質/界面特性及電場分佈。在金屬-氧化物-半導體結構中獲得了低至5×10-7 A/cm2的柵漏電流。橫向金屬-半導體-絕緣體測試結構中,在1.27×1013 cm-2的溝道面電荷密度下實現了超過1 kV的擊穿電壓。有效峰值電場和平均擊穿場強分別估計為>4.27 MV/cm和1.99 MV/cm。這些發現證明了Al2O3集成對提升UWBGAlGaNHEMTs擊穿性能的潛力。
摘要
- 原文標題:GeoRAG: A Question-Answering Approach from a Geographical Perspective
- 中文標題:GeoRAG:地理視角下的問答方法
- 發佈日期:2025-04-02 08:11:05+00:00
- 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2504.01458v1
中文摘要:地理問答系統(GeoQA)通過處理地理領域的自然語言查詢來滿足複雜用戶需求並提升信息檢索效率。然而傳統問答系統存在理解局限、檢索精度低、交互性弱及複雜任務處理不足等缺陷,阻礙了精準信息獲取。本研究提出GeoRAG框架,該知識增強型問答系統融合領域微調、提示工程與檢索增強生成(RAG)技術,以提升地理知識檢索精度和用戶交互體驗。方法論包含四個組件:(1)基於3267份語料(研究論文、專著和技術報告)構建結構化地理知識庫,通過多智能體方法歸類為語義理解、空間定位、幾何形態、屬性特徵、要素關聯、演化過程和運行機制七個維度,最終形成145234條分類條目和875432組多維問答對;(2)基於BERT-Base-Chinese的多標籤文本分類器,用於通過地理維度分類解析查詢類型;(3)利用問答對數據的檢索評估器,優化查詢-文檔相關性判定;(4)GeoPrompt模板動態整合用戶查詢與檢索信息,通過維度特異性提示提升響應質量。對比實驗表明GeoRAG在多個基礎模型上均優於傳統RAG,驗證了其泛化能力。本研究通過提出領域特定場景下大語言模型部署新範式,推動地理人工智能發展,對提升現實應用中GeoQA系統的可擴展性和準確性具有重要價值。
摘要
- 原文標題:A thorough benchmark of automatic text classification: From traditional approaches to large language models
- 中文標題:自動文本分類的全面基準測試:從傳統方法到大語言模型
- 發佈日期:2025-04-02 17:40:08+00:00
- 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
- 分類:cs.CL, cs.AI
- 原文連結:http://arxiv.org/abs/2504.01930v1
中文摘要:自動文本分類(ATC)在過去十年中取得了顯著進展,其中以基於Transformer架構的小型及大型語言模型(SLMs和LLMs)最為典型。儘管近期方法在效果上有所提升,但文獻中仍缺乏全面的成本效益分析,以驗證這些新方法相較於支持向量機(SVM)和邏輯回歸等傳統文本分類方法的效果提升是否足以抵消其高昂成本。對此,本研究的主要貢獻包括:(i)對12種傳統與新興ATC方案(含5個開源LLM)進行科學嚴謹的成本效益對比分析;(ii)構建包含22個數據集的大規模基準測試集(涵蓋情感分析和主題分類任務),其訓練-驗證-測試劃分基於摺疊交叉驗證流程,並配套文檔與代碼。代碼、數據和文檔的發佈使研究社區能復現實驗並以更科學的方式推動領域發展。實驗結果表明:LLMs在效果上優於傳統方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微調過程產生顯著更高的計算成本,平均速度分別比傳統方法和SLMs慢590倍和8.5倍。由此提出建議:(1)對效果要求極致且能承擔成本的場景選用LLMs;(2)資源受限或無法承擔LLM調優成本的場景選用邏輯回歸/SVM等傳統方法;(3)追求接近最優效果-效率平衡時選用Roberta等SLMs。
摘要
- 原文標題:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
- 中文標題:通過第一性原理計算展示銫(Cs I)中多個低激發態電偶極極化率的關聯趨勢
- 發佈日期:2025-04-02 07:10:28+00:00
- 作者:A. Chakraborty, B. K. Sahoo
- 分類:physics.atom-ph, quant-ph
- 原文連結:http://arxiv.org/abs/2504.01418v1
中文摘要:摘要:本研究採用狄拉克-哈特里-福克方法(DHF)、二階微擾理論(MBPT(2))、三階微擾理論(MBPT(3))、隨機相位近似(RPA)以及單雙激發近似相對論耦合簇方法(RCCSD),通過第一性原理計算探究了銫原子(Cs)中多個偶宇稱和奇宇稱態標量與張量靜態電偶極極化率($\alpha_d$)的電子關聯效應和高階相對論效應。為處理奇宇稱E1算子對原子軌道的微擾影響,計算採用線性響應方法進行。最終獲得的$\alpha_d$值及其不確定度估計與先前理論計算和現有實驗結果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA結果間的差異表明:在銫原子$\alpha_d$值的確定過程中,電子對關聯(PC)效應比核心極化(CP)效應起着更主導作用。通過對比MBPT(3)與RCC結果,我們發現PC與CP效應間的關聯效應以及雙CP效應在這些計算中同樣具有顯著影響。此外,在高激發態中,Breit相互作用的貢獻表現得尤為突出。
摘要
- 原文標題:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
- 中文標題:基於原子力顯微鏡相位趨近曲線的材料識別與虛擬s-SNOM數據集及方法學
- 發佈日期:2025-04-02 11:42:03+00:00
- 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
- 分類:physics.optics
- 原文連結:http://arxiv.org/abs/2504.01636v1
中文摘要:原子力顯微鏡(AFM)相位趨近曲線在納米級材料表徵方面具有重要潛力,但現有魯棒數據集和自動化分析工具較為匱乏。本文提出一種基於高維數據集的新材料識別方法,該數據集包含從矽、二氧化矽、鉑、銀和金五種材料採集的AFM相位趨近曲線。每次測量獲取50個隨探針-樣品距離遞增的相位值,最終形成50×50×50體素圖像以表徵不同深度的相位變化。利用該數據集,我們比較了k近鄰(KNN)、隨機森林(RF)和前饋神經網絡(FNN)在材料分割中的表現。結果表明FNN具有最高的準確率和F1分數,優於傳統方法。最後通過生成虛擬散射型掃描近場光學顯微鏡(s-SNOM)圖像,我們驗證了這些分割圖的實際價值,揭示了如何利用AFM相位趨近曲線構建用於納米級光學分析的精細化預測工具。
摘要
- 原文標題:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
- 中文標題:Al2O3/超寬禁帶AlGaN異質結構中的能帶與擊穿特性
- 發佈日期:2025-04-02 01:49:58+00:00
- 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
- 分類:cond-mat.mtrl-sci, physics.app-ph
- 原文連結:http://arxiv.org/abs/2504.01291v1
中文摘要:我們報道了超寬帶隙(UWBG) AlGaN異質結構上Al2O3介質的能帶與擊穿特性。金屬-介質-半導體結構對於維持未來高性能UWBG電晶體所需的高電場至關重要。通過系統實驗,我們測定了半導體平帶條件下氧化物中的固定電荷密度(> 1013 cm-2)、介質/界面特性及內部電場。金屬-氧化物-半導體結構中獲得了低至5×10-7 A/cm2的柵漏電流。在橫向金屬-半導體-絕緣體測試結構中,當溝道面電荷密度為1.27×1013 cm-2時,擊穿電壓超過1 kV。有效峰值電場與平均擊穿場強分別估算為>4.27 MV/cm和1.99 MV/cm。這些發現證明了Al2O3集成對提升UWBGAlGaNHEMTs擊穿性能的潛力。
摘要
- 原文標題:GeoRAG: A Question-Answering Approach from a Geographical Perspective
- 中文標題:GeoRAG:地理視角下的問答方法
- 發佈日期:2025-04-02 08:11:05+00:00
- 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
- 分類:cs.IR
- 原文連結:http://arxiv.org/abs/2504.01458v1
中文摘要:地理問答(GeoQA)通過處理地理領域的自然語言查詢來滿足複雜用戶需求並提升信息檢索效率。然而傳統問答系統存在理解局限、檢索精度低、交互性弱及複雜任務處理不足等問題,阻礙了精準信息獲取。本研究提出GeoRAG框架,該知識增強型問答系統融合領域微調、提示工程與檢索增強生成(RAG)技術,以提升地理知識檢索精度和用戶交互體驗。方法論包含四個組件:(1)基於3267份語料(研究論文、專著與技術報告)構建結構化地理知識庫,通過多智能體方法歸類為語義理解、空間定位、幾何形態、屬性特徵、要素關聯、演化過程與運作機制七個維度,最終生成145234條分類條目及875432組多維問答對;(2)基於BERT-Base-Chinese訓練的多標籤文本分類器,通過地理維度分類解析查詢類型;(3)利用問答對數據評估查詢-文檔相關性的檢索評估器,優化檢索精度;(4)GeoPrompt模板動態整合用戶查詢與檢索信息,通過維度特異性提示提升響應質量。對比實驗表明GeoRAG在多個基礎模型上均優於傳統RAG,驗證了其泛化能力。本研究通過提出領域專用大語言模型部署新範式,推動地理人工智能發展,對提升現實應用中GeoQA系統的可擴展性與準確性具有重要價值。
摘要
- 原文標題:A thorough benchmark of automatic text classification: From traditional approaches to large language models
- 中文標題:自動文本分類的全面基準測試:從傳統方法到大語言模型
- 發佈日期:2025-04-02 17:40:08+00:00
- 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
- 分類:cs.CL, cs.AI
- 原文連結:http://arxiv.org/abs/2504.01930v1
中文摘要:自動文本分類(ATC)在過去十年中取得了顯著進展,以基於Transformer架構的小型及大型語言模型(SLMs和LLMs)為典型代表。儘管近期在效果上有所提升,但文獻中仍缺乏全面的成本效益分析,以驗證這些新方法相較於支持向量機(SVM)和邏輯回歸等傳統文本分類方法的效果提升是否足以抵消其高昂成本。為此,本研究的兩項主要貢獻在於:(i)對12種傳統與新興ATC方案(含5個開源LLMs)進行科學嚴謹的成本效益對比分析;(ii)發佈包含22個數據集(涵蓋情感分析和主題分類任務)的大型基準測試集,其訓練-驗證-測試劃分基於摺疊交叉驗證流程,並配套文檔與代碼。代碼、數據和文檔的公開使研究社區能復現實驗並以更科學的方式推動領域發展。實驗結果表明:LLMs在效果上優於傳統方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微調過程產生顯著更高的計算成本,速度分別比傳統方法和SLMs慢590倍和8.5倍。由此提出建議:(1)對效果要求極致且能承擔成本的應用選用LLMs;(2)資源受限或無法承擔LLMs調優成本的應用選用邏輯回歸/SVM等傳統方法;(3)追求接近最優效果-效率平衡時選擇Roberta等SLMs。