WikiEdge:ArXiv速递/2025-04-02

来自WikiEdge
Carole留言 | 贡献2025年4月7日 (一) 17:22的版本 (Updated page by Carole)
跳转到导航 跳转到搜索

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:地理视角下的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答(GeoQA)通过处理地理领域自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准信息获取。本研究提出GeoRAG框架,该知识增强型问答系统融合领域微调提示工程检索增强生成(RAG)技术,以提升地理知识检索精度和用户交互体验。方法论包含四个组件:(1)基于3267份语料(研究论文专著技术报告)构建结构化地理知识库,通过多智能体方法归类为语义理解空间位置几何形态属性特征要素关联演化过程运作机制七个维度,最终生成145234条分类条目与875432组多维问答对;(2)基于BERT-Base-Chinese多标签文本分类器,用于通过地理维度分类解析查询类型;(3)利用问答对数据的检索评估器,优化查询-文档相关性判定以提升检索精度;(4)GeoPrompt模板动态整合用户查询检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域专用大语言模型部署新范式,推动地理人工智能发展,对提升现实场景中GeoQA系统的可扩展性准确性具有实践意义

摘要

  • 原文标题:A Unified Approach to Analysis and Design of Denoising Markov Models
  • 中文标题:去噪马尔可夫模型分析与设计的统一方法
  • 发布日期:2025-04-02 17:46:43+00:00
  • 作者:Yinuo Ren, Grant M. Rotskoff, Lexing Ying
  • 分类:cs.LG, cs.NA, math.NA, stat.ML
  • 原文链接http://arxiv.org/abs/2504.01938v1

中文摘要:基于测度传输概率生成模型(如扩散模型和基于的模型)通常采用马尔可夫随机动力学语言进行表述,其中底层过程的选择同时影响算法设计决策和理论分析。本文旨在为去噪马尔可夫模型建立严格的数学基础——这类生成模型假设存在从前向过程(从目标分布过渡到简单易采样分布)与特别构建的后向过程(实现逆向高效采样)。通过与非平衡统计力学及广义Doob's h-变换的深层联系,我们提出一组最小假设条件以确保:(1) 后向生成算子的显式构造,(2) 直接最小化测度传输差异的统一变分目标,(3) 经典分数匹配方法在不同动力学中的适应性实现。本框架统一了连续/离散扩散模型的现有表述,在正向生成算子满足特定正则性假设下识别出去噪马尔可夫模型的最一般形式,并为任意Lévy型过程驱动的去噪模型设计提供了系统化方案。我们通过采用几何布朗运动跳跃过程作为前向动力学的新型去噪模型,展示了该框架在复杂分布建模中的潜在灵活性与效能。

摘要

  • 原文标题:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
  • 中文标题:通过第一性原理计算展示铯(Cs I)中多个低激发态电偶极极化率的关联趋势
  • 发布日期:2025-04-02 07:10:28+00:00
  • 作者:A. Chakraborty, B. K. Sahoo
  • 分类:physics.atom-ph, quant-ph
  • 原文链接http://arxiv.org/abs/2504.01418v1

中文摘要:在铯原子(Cs)多个偶宇称和奇宇称态标量与张量静态电偶极极化率($\alpha_d$)的计算中,我们采用狄拉克-哈特里-福克方法(DHF)、二阶微扰理论(MBPT(2))、三阶微扰理论(MBPT(3))、随机相位近似(RPA)以及单双激发近似相对论耦合簇方法(RCCSD),探究了电子关联效应高阶相对论效应。为处理奇宇称E1算符原子轨道的微扰影响,计算采用线性响应方法进行。最终获得的$\alpha_d$值及其不确定度估计与先前理论计算及现有实验结果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA结果间的差异表明:在铯原子$\alpha_d$值的确定过程中,电子对关联(PC)效应比核心极化(CP)效应起着更主要的作用。通过比较MBPT(3)与RCC结果,我们发现PC与CP效应的关联效应以及双CP效应在这些计算中同样具有显著影响。此外,在高激发态中,Breit相互作用的贡献表现得尤为突出。

摘要

  • 原文标题:A thorough benchmark of automatic text classification: From traditional approaches to large language models
  • 中文标题:自动文本分类的全面基准测试:从传统方法到大语言模型
  • 发布日期:2025-04-02 17:40:08+00:00
  • 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
  • 分类:cs.CL, cs.AI
  • 原文链接http://arxiv.org/abs/2504.01930v1

中文摘要自动文本分类ATC)在过去十年中取得了显著进展,以基于Transformer架构的小型及大型语言模型SLMsLLMs)为典型代表。尽管近期在效果上有所提升,但文献中仍缺乏全面的成本效益分析,以评估这些新方法相较于支持向量机SVM)和逻辑回归等传统文本分类方法的效果提升是否足以抵消其高昂成本。对此,本研究的两项主要贡献是:(i)对12种传统与新兴ATC方案(包括5个开源LLM)进行科学严谨的成本效益对比分析;(ii)构建包含22个数据集的大规模基准测试集(涵盖情感分析主题分类任务),其训练-验证-测试划分基于折叠交叉验证流程,并配套文档代码。通过公开代码数据文档,本研究支持学界以更科学的方式复现实验并推动领域发展。实验结果表明:LLMs在效果上优于传统方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微调过程导致计算成本显著更高——分别比传统方法和SLMs平均慢590倍和8.5倍。由此提出建议:(1)对效果要求极致且能承担成本的场景选用LLMs;(2)资源受限或无法承担LLMs调优成本的场景选用逻辑回归/SVM等传统方法;(3)追求接近最优效果-效率平衡时选用RobertaSLMs

摘要

  • 原文标题:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
  • 中文标题:基于原子力显微镜相位趋近曲线的材料识别与虚拟s-SNOM数据集及方法学
  • 发布日期:2025-04-02 11:42:03+00:00
  • 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
  • 分类:physics.optics
  • 原文链接http://arxiv.org/abs/2504.01636v1

中文摘要原子力显微镜AFM)相位趋近曲线在纳米尺度材料表征方面具有重要潜力,但现有鲁棒数据集自动化分析工具仍较为匮乏。本文提出了一种基于高维数据集的新型材料识别方法,该数据集包含从二氧化硅五种材料采集的AFM相位趋近曲线。每次测量获取逐渐增加针尖-样品距离时的50个相位值,最终形成50×50×50体素图像以表征不同深度的相位变化。利用该数据集,我们比较了k近邻KNN)、随机森林RF)和前馈神经网络FNN)在材料分割中的表现。结果表明,FNN具有最高的准确率F1分数,优于传统方法。最后,我们通过生成虚拟散射型扫描近场光学显微镜s-SNOM)图像验证了分割图的实际价值,揭示了如何利用AFM相位趋近曲线构建用于纳米尺度光学分析的精细化预测工具。

摘要

  • 原文标题:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
  • 中文标题:Al2O3/超宽禁带AlGaN异质结构中的能带与击穿特性
  • 发布日期:2025-04-02 01:49:58+00:00
  • 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
  • 分类:cond-mat.mtrl-sci, physics.app-ph
  • 原文链接http://arxiv.org/abs/2504.01291v1

中文摘要:我们报道了超宽禁带(UWBG) AlGaN异质结构Al2O3介质能带击穿特性。金属-介质-半导体结构对于维持未来高性能UWBG晶体管所需的高电场至关重要。通过系统实验,我们测定了半导体平带条件下氧化物中的固定电荷密度(> 1013 cm-2)、介质/界面特性及电场分布。在金属-氧化物-半导体结构中获得了低至5×10-7 A/cm2的栅漏电流。横向金属-半导体-绝缘体测试结构在沟道面电荷密度为1.27×1013 cm-2时,击穿电压超过1 kV。有效峰值电场与平均击穿场强分别估计为>4.27 MV/cm和1.99 MV/cm。这些发现证明了Al2O3集成对提升UWBGAlGaNHEMTs击穿性能的潜力。

摘要

  • 原文标题:Study of scaling laws in language families
  • 中文标题:语言家族中的标度律研究
  • 发布日期:2025-04-02 12:28:59+00:00
  • 作者:Maelyson R. F. Santos, Marcelo A. F. Gomes
  • 分类:physics.soc-ph, cs.CL
  • 原文链接http://arxiv.org/abs/2504.01681v1

中文摘要:本文利用来自六千多种语言的数据,通过分析齐普夫式分类图中涌现的模式,研究语言家族中的标度律现象。研究从宏观(基于各语系包含的语言数量)和微观(基于语系中各语言的使用者数量)两个维度考察了这些分类特征。尤其值得注意的是,在排除亚非语系尼罗-撒哈拉语系后,研究发现当代十四大语系存在明显分化现象——这些语系分布在三个语系四重奏组中,每组在齐普夫图中均表现出显著不同的指数特征。该发现揭示了主要语系的底层结构与组织方式,为理解语言多样性和分布的本质提供了新的见解。

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:基于地理视角的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答系统(GeoQA)通过处理地理领域自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等缺陷,阻碍了精准信息获取。本研究提出GeoRAG——一个整合领域微调提示工程检索增强生成(RAG)技术的知识增强型问答框架,旨在提升地理知识检索精度与用户交互体验。该框架包含四个核心组件:(1)基于3267份语料(研究论文专著技术报告)构建的结构化知识库,通过多智能体方法归类为语义理解空间定位几何形态属性特征要素关联演化过程作用机制七个维度,最终形成145234条分类条目与875432组多维问答对;(2)基于BERT-Base-Chinese多标签文本分类器,用于通过地理维度分类解析查询类型;(3)利用问答对数据评估查询-文档相关性检索评估模块,优化检索精度;(4)GeoPrompt模板引擎,动态整合用户查询检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域特定场景下部署大语言模型的新范式,推动地理人工智能发展,对提升现实应用中GeoQA系统的可扩展性准确性具有重要价值。

摘要

  • 原文标题:A thorough benchmark of automatic text classification: From traditional approaches to large language models
  • 中文标题:自动文本分类的全面基准测试:从传统方法到大语言模型
  • 发布日期:2025-04-02 17:40:08+00:00
  • 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
  • 分类:cs.CL, cs.AI
  • 原文链接http://arxiv.org/abs/2504.01930v1

中文摘要自动文本分类ATC)在过去十年中取得了显著进展,以基于Transformer架构小型及大型语言模型SLMsLLMs)为典型代表。尽管近期效果有所提升,但文献中仍缺乏全面的成本效益分析,以验证这些新方法相较于支持向量机SVM)和逻辑回归等传统文本分类方法的效果提升是否足以抵消其高昂成本。为此,本研究的两项主要贡献是:(i) 对12种传统与新兴ATC方案(含5个开源LLM)进行科学严谨的成本效益对比分析;(ii) 发布包含22个数据集的大规模基准测试(涵盖情感分析主题分类任务),提供基于折叠交叉验证数据划分方案、完整文档代码代码数据文档的公开将助力学界复现实验并以更科学的方式推动领域发展。实验结果表明:LLMs在效果上优于传统方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微调过程产生显著更高的计算成本,平均速度分别比传统方法和SLMs慢590倍和8.5倍。由此提出建议:(1) 对效果要求极致且能承担成本的场景选用LLMs;(2) 资源受限或无法承担LLM调优成本的场景选用逻辑回归/SVM等传统方法;(3) 追求效果-效率平衡时选择RobertaSLMs

摘要

  • 原文标题:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
  • 中文标题:基于第一性原理计算展示铯(Cs I)多个低激发态电偶极极化率的关联趋势
  • 发布日期:2025-04-02 07:10:28+00:00
  • 作者:A. Chakraborty, B. K. Sahoo
  • 分类:physics.atom-ph, quant-ph
  • 原文链接http://arxiv.org/abs/2504.01418v1

中文摘要:摘要:在铯原子(Cs)多个偶宇称和奇宇称态的标量与张量静态电偶极极化率($\alpha_d$)计算中,我们采用狄拉克-哈特里-福克方法(DHF)、二阶微扰理论(MBPT(2))、三阶微扰理论(MBPT(3))、随机相位近似(RPA)以及单双激发近似相对论耦合簇方法(RCCSD),探究了电子关联效应高阶相对论效应的影响。为处理奇宇称E1算子原子轨道的微扰,计算采用线性响应方法进行。最终获得的$\alpha_d$值及其不确定度估计与先前理论计算和现有实验结果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA结果间的差异表明:在铯原子$\alpha_d$值的确定过程中,电子对关联(PC)效应比核心极化(CP)效应起着更主导作用。通过比较MBPT(3)与RCC结果的差异,我们发现PC与CP效应之间的关联效应以及双CP效应在这些计算中也具有显著影响。此外,在高激发态中,Breit相互作用的贡献表现得尤为突出。

摘要

  • 原文标题:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
  • 中文标题:基于原子力显微镜相位趋近曲线的材料识别与虚拟s-SNOM数据集及方法学
  • 发布日期:2025-04-02 11:42:03+00:00
  • 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
  • 分类:physics.optics
  • 原文链接http://arxiv.org/abs/2504.01636v1

中文摘要原子力显微镜AFM)相位趋近曲线在纳米尺度材料表征方面具有重要潜力,但现有鲁棒数据集和自动化分析工具较为匮乏。本文提出了一种利用高维数据集进行材料识别的新方法,该数据集包含从二氧化硅五种材料采集的AFM相位趋近曲线。每次测量获取50个在探针-样品间距递增时的相位值,最终形成50×50×50体素图像以表征不同深度的相位变化。基于此数据集,我们比较了K近邻KNN)、随机森林RF)和前馈神经网络FNN)在材料分割中的表现。结果表明FNN具有最高的准确率F1分数,优于传统方法。最后,我们通过生成虚拟散射型扫描近场光学显微镜s-SNOM)图像验证了分割图的实际价值,揭示了如何利用AFM相位趋近曲线构建纳米级光学分析的精细化预测工具

摘要

  • 原文标题:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
  • 中文标题:Al2O3/超宽禁带AlGaN异质结构中的能带与击穿特性
  • 发布日期:2025-04-02 01:49:58+00:00
  • 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
  • 分类:cond-mat.mtrl-sci, physics.app-ph
  • 原文链接http://arxiv.org/abs/2504.01291v1

中文摘要:我们报道了超宽禁带(UWBG) AlGaN异质结构Al2O3介质能带击穿特性金属-介质-半导体结构对于维持未来高性能UWBG晶体管所需的高电场至关重要。通过系统实验,我们测定了半导体平带条件氧化物中的固定电荷密度(> 1013 cm-2)、介质/界面特性电场分布。在金属-氧化物-半导体结构中获得了低至5×10-7 A/cm2的栅漏电流横向金属-半导体-绝缘体测试结构中,在1.27×1013 cm-2的沟道面电荷密度下实现了超过1 kV的击穿电压。有效峰值电场和平均击穿场强分别估计为>4.27 MV/cm和1.99 MV/cm。这些发现证明了Al2O3集成对提升UWBGAlGaNHEMTs击穿性能的潜力。

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:地理视角下的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答系统(GeoQA)通过处理地理领域自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等缺陷,阻碍了精准信息获取。本研究提出GeoRAG框架,该知识增强问答系统融合领域微调提示工程检索增强生成(RAG)技术,以提升地理知识检索精度和用户交互体验。方法论包含四个组件:(1)基于3267份语料(研究论文专著技术报告)构建结构化地理知识库,通过多智能体方法归类为语义理解空间定位几何形态属性特征要素关联演化过程运行机制七个维度,最终形成145234条分类条目和875432组多维问答对;(2)基于BERT-Base-Chinese多标签文本分类器,用于通过地理维度分类解析查询类型;(3)利用问答对数据的检索评估器,优化查询-文档相关性判定;(4)GeoPrompt模板动态整合用户查询检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域特定场景下大语言模型部署新范式,推动地理人工智能发展,对提升现实应用中GeoQA系统的可扩展性准确性具有重要价值。

摘要

  • 原文标题:A thorough benchmark of automatic text classification: From traditional approaches to large language models
  • 中文标题:自动文本分类的全面基准测试:从传统方法到大语言模型
  • 发布日期:2025-04-02 17:40:08+00:00
  • 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
  • 分类:cs.CL, cs.AI
  • 原文链接http://arxiv.org/abs/2504.01930v1

中文摘要自动文本分类ATC)在过去十年中取得了显著进展,其中以基于Transformer架构小型及大型语言模型SLMsLLMs)最为典型。尽管近期方法在效果上有所提升,但文献中仍缺乏全面的成本效益分析,以验证这些新方法相较于支持向量机SVM)和逻辑回归等传统文本分类方法的效果提升是否足以抵消其高昂成本。对此,本研究的主要贡献包括:(i)对12种传统与新兴ATC方案(含5个开源LLM)进行科学严谨的成本效益对比分析;(ii)构建包含22个数据集的大规模基准测试集(涵盖情感分析主题分类任务),其训练-验证-测试划分基于折叠交叉验证流程,并配套文档代码代码数据文档的发布使研究社区能复现实验并以更科学的方式推动领域发展。实验结果表明:LLMs在效果上优于传统方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微调过程产生显著更高的计算成本,平均速度分别比传统方法和SLMs慢590倍和8.5倍。由此提出建议:(1)对效果要求极致且能承担成本的场景选用LLMs;(2)资源受限或无法承担LLM调优成本的场景选用逻辑回归/SVM等传统方法;(3)追求接近最优效果-效率平衡时选用RobertaSLMs

摘要

  • 原文标题:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
  • 中文标题:通过第一性原理计算展示铯(Cs I)中多个低激发态电偶极极化率的关联趋势
  • 发布日期:2025-04-02 07:10:28+00:00
  • 作者:A. Chakraborty, B. K. Sahoo
  • 分类:physics.atom-ph, quant-ph
  • 原文链接http://arxiv.org/abs/2504.01418v1

中文摘要:摘要:本研究采用狄拉克-哈特里-福克方法(DHF)、二阶微扰理论(MBPT(2))、三阶微扰理论(MBPT(3))、随机相位近似(RPA)以及单双激发近似相对论耦合簇方法(RCCSD),通过第一性原理计算探究了铯原子(Cs)中多个偶宇称奇宇称标量张量静态电偶极极化率($\alpha_d$)的电子关联效应高阶相对论效应。为处理奇宇称E1算子原子轨道的微扰影响,计算采用线性响应方法进行。最终获得的$\alpha_d$值及其不确定度估计与先前理论计算和现有实验结果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA结果间的差异表明:在铯原子$\alpha_d$值的确定过程中,电子对关联(PC)效应比核心极化(CP)效应起着更主导作用。通过对比MBPT(3)与RCC结果,我们发现PC与CP效应间的关联效应以及双CP效应在这些计算中同样具有显著影响。此外,在高激发态中,Breit相互作用的贡献表现得尤为突出。

摘要

  • 原文标题:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
  • 中文标题:基于原子力显微镜相位趋近曲线的材料识别与虚拟s-SNOM数据集及方法学
  • 发布日期:2025-04-02 11:42:03+00:00
  • 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
  • 分类:physics.optics
  • 原文链接http://arxiv.org/abs/2504.01636v1

中文摘要原子力显微镜AFM)相位趋近曲线在纳米级材料表征方面具有重要潜力,但现有鲁棒数据集自动化分析工具较为匮乏。本文提出一种基于高维数据集的新材料识别方法,该数据集包含从二氧化硅五种材料采集的AFM相位趋近曲线。每次测量获取50个随探针-样品距离递增的相位值,最终形成50×50×50体素图像以表征不同深度的相位变化。利用该数据集,我们比较了k近邻KNN)、随机森林RF)和前馈神经网络FNN)在材料分割中的表现。结果表明FNN具有最高的准确率F1分数,优于传统方法。最后通过生成虚拟散射型扫描近场光学显微镜s-SNOM)图像,我们验证了这些分割图的实际价值,揭示了如何利用AFM相位趋近曲线构建用于纳米级光学分析的精细化预测工具

摘要

  • 原文标题:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
  • 中文标题:Al2O3/超宽禁带AlGaN异质结构中的能带与击穿特性
  • 发布日期:2025-04-02 01:49:58+00:00
  • 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
  • 分类:cond-mat.mtrl-sci, physics.app-ph
  • 原文链接http://arxiv.org/abs/2504.01291v1

中文摘要:我们报道了超宽带隙(UWBG) AlGaN异质结构Al2O3介质能带击穿特性。金属-介质-半导体结构对于维持未来高性能UWBG晶体管所需的高电场至关重要。通过系统实验,我们测定了半导体平带条件下氧化物中的固定电荷密度(> 1013 cm-2)、介质/界面特性及内部电场金属-氧化物-半导体结构中获得了低至5×10-7 A/cm2的栅漏电流。在横向金属-半导体-绝缘体测试结构中,当沟道电荷密度为1.27×1013 cm-2时,击穿电压超过1 kV。有效峰值电场与平均击穿场强分别估算为>4.27 MV/cm和1.99 MV/cm。这些发现证明了Al2O3集成对提升UWBGAlGaNHEMTs击穿性能的潜力。

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:地理视角下的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答(GeoQA)通过处理地理领域的自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准信息获取。本研究提出GeoRAG框架,该知识增强型问答系统融合领域微调提示工程检索增强生成(RAG)技术,以提升地理知识检索精度和用户交互体验。方法论包含四个组件:(1)基于3267份语料(研究论文专著技术报告)构建结构化地理知识库,通过多智能体方法归类为语义理解空间定位几何形态属性特征要素关联演化过程运作机制七个维度,最终生成145234条分类条目及875432组多维问答对;(2)基于BERT-Base-Chinese训练的多标签文本分类器,通过地理维度分类解析查询类型;(3)利用问答对数据评估查询-文档相关性的检索评估器,优化检索精度;(4)GeoPrompt模板动态整合用户查询与检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域专用大语言模型部署新范式,推动地理人工智能发展,对提升现实应用中GeoQA系统的可扩展性准确性具有重要价值。

摘要

  • 原文标题:A thorough benchmark of automatic text classification: From traditional approaches to large language models
  • 中文标题:自动文本分类的全面基准测试:从传统方法到大语言模型
  • 发布日期:2025-04-02 17:40:08+00:00
  • 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
  • 分类:cs.CL, cs.AI
  • 原文链接http://arxiv.org/abs/2504.01930v1

中文摘要自动文本分类(ATC)在过去十年中取得了显著进展,以基于Transformer架构的小型及大型语言模型SLMsLLMs)为典型代表。尽管近期在效果上有所提升,但文献中仍缺乏全面的成本效益分析,以验证这些新方法相较于支持向量机SVM)和逻辑回归等传统文本分类方法的效果提升是否足以抵消其高昂成本。为此,本研究的两项主要贡献在于:(i)对12种传统与新兴ATC方案(含5个开源LLMs)进行科学严谨的成本效益对比分析;(ii)发布包含22个数据集(涵盖情感分析主题分类任务)的大型基准测试集,其训练-验证-测试划分基于折叠交叉验证流程,并配套文档代码代码数据文档的公开使研究社区能复现实验并以更科学的方式推动领域发展。实验结果表明:LLMs在效果上优于传统方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微调过程产生显著更高的计算成本,速度分别比传统方法和SLMs慢590倍和8.5倍。由此提出建议:(1)对效果要求极致且能承担成本的应用选用LLMs;(2)资源受限或无法承担LLMs调优成本的应用选用逻辑回归/SVM等传统方法;(3)追求接近最优效果-效率平衡时选择RobertaSLMs

摘要

  • 原文标题:An Explainable Reconfiguration-Based Optimization Algorithm for Industrial and Reliability-Redundancy Allocation Problems
  • 中文标题:面向工业与可靠性冗余分配问题的可解释重构优化算法
  • 发布日期:2025-04-02 03:33:48+00:00
  • 作者:Dikshit Chauhan, Nitin Gupta, Anupam Yadav
  • 分类:cs.AI, cs.NE
  • 原文链接http://arxiv.org/abs/2504.01331v1

中文摘要工业可靠性优化问题通常涉及复杂约束条件,并需要高效、可解释的解决方案。本文提出AI-AEFA算法——一种基于参数重构高级元启发式算法,专为解决大规模工业优化可靠性-冗余分配问题而设计。该算法通过创新的对数S型参数自适应机制混沌映射策略,显著提升了搜索空间探索能力与收敛效率。研究在28个IEEE CEC 2017约束基准问题、15个大规模工业优化问题及7个可靠性-冗余分配问题上验证了算法性能,结果表明其在可行性计算效率收敛速度方面均优于现有最先进优化技术。本工作的另一关键贡献是集成SHAPShapley加性解释)方法以增强AI-AEFA可解释性,通过分析库仑常数电荷量加速度静电力等关键参数的影响机制,为优化过程中的决策行为提供透明化解读。实验证实AI-AEFA是一种兼具鲁棒性可扩展性可解释性优化工具,具有重要的实际应用价值

摘要

  • 原文标题:Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations
  • 中文标题:通过第一性原理计算展示铯(Cs I)中多个低激发态电偶极极化率的关联趋势
  • 发布日期:2025-04-02 07:10:28+00:00
  • 作者:A. Chakraborty, B. K. Sahoo
  • 分类:physics.atom-ph, quant-ph
  • 原文链接http://arxiv.org/abs/2504.01418v1

中文摘要:摘要:本研究采用狄拉克-哈特里-福克方法(DHF)、二阶微扰理论(MBPT(2))、三阶微扰理论(MBPT(3))、随机相位近似(RPA)以及单双激发近似相对论耦合簇方法(RCCSD),通过第一性原理计算探究了铯原子(Cs)中多个偶宇称和奇宇称态的标量与张量静态电偶极极化率($\alpha_d$)的电子关联效应高阶相对论效应。为处理奇宇称E1算子对原子轨道的微扰,计算采用线性响应方法进行。最终获得的$\alpha_d$值(含估计不确定度)与先前理论计算及现有实验结果吻合良好。DHF、MBPT(2)、MBPT(3)和RPA结果间的差异表明:在铯原子极化率测定中,对关联(PC)效应比核心极化(CP)效应起更主导作用。通过对比MBPT(3)与RCC结果,我们发现PC与CP效应的关联效应以及双CP效应在这些计算中同样具有显著影响。此外,在高激发态中,Breit相互作用的贡献尤为突出。

摘要

  • 原文标题:Dataset and Methodology for Material Identification and virtual s-SNOM Using AFM Phase Approach Curves
  • 中文标题:基于原子力显微镜相位趋近曲线的材料识别与虚拟s-SNOM数据集及方法学
  • 发布日期:2025-04-02 11:42:03+00:00
  • 作者:Stefan R. Anton, Denis E. Tranca, Stefan G. Stanciu, Adrian M. Ionescu, George A. Stanciu
  • 分类:physics.optics
  • 原文链接http://arxiv.org/abs/2504.01636v1

中文摘要原子力显微镜AFM)相位趋近曲线在纳米尺度材料表征方面具有重要潜力,但现有鲁棒数据集自动化分析工具仍较为有限。本文提出了一种基于高维数据集的新型材料识别方法,该数据集包含从二氧化硅五种材料采集的AFM相位趋近曲线。每次测量获取50个随探针-样品距离递增的相位值,最终形成50x50x50体素图像以表征不同深度的相位变化。利用该数据集,我们比较了k近邻KNN)、随机森林RF)和前馈神经网络FNN)在材料分割中的表现。结果表明FNN具有最高的准确率F1分数,优于传统方法。最后,我们通过生成虚拟散射型扫描近场光学显微镜s-SNOM)图像验证了分割图的实际价值,揭示了如何利用AFM相位趋近曲线构建纳米级光学分析的精细化预测工具

摘要

  • 原文标题:Energy Bands and Breakdown Characteristics in Al2O3/UWBG AlGaN Heterostructures
  • 中文标题:Al2O3/超宽禁带AlGaN异质结构中的能带与击穿特性
  • 发布日期:2025-04-02 01:49:58+00:00
  • 作者:Seungheon Shin, Kyle Liddy, Yinxuan Zhu, Chandan Joishi, Brianna A. Klein, Andrew Armstrong, Andrew A. Allerman, Siddharth Rajan
  • 分类:cond-mat.mtrl-sci, physics.app-ph
  • 原文链接http://arxiv.org/abs/2504.01291v1

中文摘要:我们报道了超宽禁带(UWBG) AlGaN异质结构Al2O3介质能带击穿特性。金属-介电-半导体结构对于维持未来高性能UWBG晶体管所需的高电场至关重要。通过系统实验,我们测定了半导体平带条件氧化物中的固定电荷密度(> 1013 cm-2)、介电/界面特性电场分布。在金属-氧化物-半导体结构中获得了低至5×10-7 A/cm2的栅漏电流。横向金属-半导体-绝缘体测试结构沟道面电荷密度为1.27×1013 cm-2时,击穿电压超过1 kV。有效峰值电场与平均击穿场强分别估算为>4.27 MV/cm和1.99 MV/cm。这些发现证明了Al2O3集成对提升UWBGAlGaNHEMTs击穿性能的潜力。

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:基于地理视角的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答(GeoQA)通过处理地理领域自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准信息获取。本研究提出GeoRAG框架,该知识增强型问答系统结合领域微调提示工程检索增强生成(RAG)技术,以提升地理知识检索精度和用户交互体验。方法论包含四个组件:(1)基于3267份语料(研究论文专著技术报告)构建结构化地理知识库,通过多智能体方法归类为七个维度:语义理解空间位置几何形态属性特征要素关联演化过程作用机制,最终生成145234条分类条目及875432组多维问答对;(2)基于BERT-Base-Chinese多标签文本分类器,用于通过地理维度分类解析查询类型;(3)利用问答对数据的检索评估器,优化查询-文档相关性判定以提升检索精度;(4)GeoPrompt模板动态整合用户查询检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域专用大语言模型部署新范式,推动地理人工智能发展,对提升现实场景中GeoQA系统的可扩展性准确性具有实践意义

摘要

  • 原文标题:A thorough benchmark of automatic text classification: From traditional approaches to large language models
  • 中文标题:自动文本分类的全面基准测试:从传统方法到大语言模型
  • 发布日期:2025-04-02 17:40:08+00:00
  • 作者:Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
  • 分类:cs.CL, cs.AI
  • 原文链接http://arxiv.org/abs/2504.01930v1

中文摘要自动文本分类(ATC)在过去十年中取得了显著进展,以基于Transformer架构的小型及大型语言模型SLMsLLMs)为典型代表。尽管近期在效果上有所提升,但文献中仍缺乏全面的成本效益分析,以验证这些新方法相较于支持向量机SVM)和逻辑回归等传统文本分类方法的效果提升是否足以抵消其高昂成本。对此,本研究的主要贡献包括:(i)对12种传统与新兴ATC方案(含5个开源LLMs)进行科学严谨的成本效益对比分析;(ii)发布包含22个数据集的大规模基准测试(涵盖情感分析主题分类任务),其训练-验证-测试划分基于折叠交叉验证流程,并配套文档代码代码数据文档的公开将使学界能复现实验并以更科学的方式推动领域发展。实验结果表明:LLMs在效果上优于传统方法(平均提升26%-7.1%)和SLMs(平均提升4.9%-1.9%),但因其微调过程产生显著更高的计算成本,速度分别比传统方法和SLMs慢590倍和8.5倍。由此提出建议:(1)对效果要求极致且能承担成本的应用选用LLMs;(2)资源受限或无法承担LLMs调优成本的应用选用逻辑回归/SVM等传统方法;(3)追求接近最优效果-效率平衡时选用RobertaSLMs