WikiEdge:ArXiv速递/2025-04-02:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
Carole留言 | 贡献
Created page by Carole
 
Carole留言 | 贡献
Updated page by Carole
第7行: 第7行:
*'''原文链接''':http://arxiv.org/abs/2504.01458v1
*'''原文链接''':http://arxiv.org/abs/2504.01458v1
'''中文摘要''':[[地理问答]](GeoQA)通过处理[[地理领域]]的[[自然语言查询]]来满足复杂[[用户需求]]并提升[[信息检索]]效率。然而传统[[问答系统]]存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准[[信息获取]]。本研究提出[[GeoRAG]]框架,该知识增强型问答系统融合[[领域微调]]、[[提示工程]]与[[检索增强生成]](RAG)技术,以提升[[地理知识]]检索精度和[[用户交互]]体验。[[方法论]]包含四个组件:(1)基于3267份语料([[研究论文]]、[[专著]]与[[技术报告]])构建结构化[[地理知识库]],通过[[多智能体]]方法归类为[[语义理解]]、[[空间位置]]、[[几何形态]]、[[属性特征]]、[[要素关联]]、[[演化过程]]与[[运作机制]]七个维度,最终生成145234条分类条目与875432组多维[[问答对]];(2)基于[[BERT-Base-Chinese]]的[[多标签文本分类器]],用于通过[[地理维度]]分类解析[[查询类型]];(3)利用[[问答对]]数据的[[检索评估器]],优化[[查询-文档相关性]]判定以提升[[检索精度]];(4)[[GeoPrompt]]模板动态整合[[用户查询]]与[[检索信息]],通过[[维度特异性]]提示提升[[响应质量]]。对比实验表明[[GeoRAG]]在多个[[基础模型]]上均优于传统[[RAG]],验证了其[[泛化能力]]。本研究通过提出[[领域专用]]大语言模型部署新范式,推动[[地理人工智能]]发展,对提升现实场景中[[GeoQA]]系统的[[可扩展性]]与[[准确性]]具有[[实践意义]]。
'''中文摘要''':[[地理问答]](GeoQA)通过处理[[地理领域]]的[[自然语言查询]]来满足复杂[[用户需求]]并提升[[信息检索]]效率。然而传统[[问答系统]]存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准[[信息获取]]。本研究提出[[GeoRAG]]框架,该知识增强型问答系统融合[[领域微调]]、[[提示工程]]与[[检索增强生成]](RAG)技术,以提升[[地理知识]]检索精度和[[用户交互]]体验。[[方法论]]包含四个组件:(1)基于3267份语料([[研究论文]]、[[专著]]与[[技术报告]])构建结构化[[地理知识库]],通过[[多智能体]]方法归类为[[语义理解]]、[[空间位置]]、[[几何形态]]、[[属性特征]]、[[要素关联]]、[[演化过程]]与[[运作机制]]七个维度,最终生成145234条分类条目与875432组多维[[问答对]];(2)基于[[BERT-Base-Chinese]]的[[多标签文本分类器]],用于通过[[地理维度]]分类解析[[查询类型]];(3)利用[[问答对]]数据的[[检索评估器]],优化[[查询-文档相关性]]判定以提升[[检索精度]];(4)[[GeoPrompt]]模板动态整合[[用户查询]]与[[检索信息]],通过[[维度特异性]]提示提升[[响应质量]]。对比实验表明[[GeoRAG]]在多个[[基础模型]]上均优于传统[[RAG]],验证了其[[泛化能力]]。本研究通过提出[[领域专用]]大语言模型部署新范式,推动[[地理人工智能]]发展,对提升现实场景中[[GeoQA]]系统的[[可扩展性]]与[[准确性]]具有[[实践意义]]。
== 摘要 ==
* '''原文标题''':A Unified Approach to Analysis and Design of Denoising Markov Models
* '''中文标题''':去噪马尔可夫模型分析与设计的统一方法
* '''发布日期''':2025-04-02 17:46:43+00:00
* '''作者''':Yinuo Ren, Grant M. Rotskoff, Lexing Ying
* '''分类''':cs.LG, cs.NA, math.NA, stat.ML
*'''原文链接''':http://arxiv.org/abs/2504.01938v1
'''中文摘要''':基于[[测度传输]]的[[概率生成模型]](如[[扩散模型]]和基于[[流]]的模型)通常采用[[马尔可夫随机过程|马尔可夫随机动力学]]语言进行表述,其中底层过程的选择同时影响[[算法设计]]决策和[[理论分析]]。本文旨在为[[去噪马尔可夫模型]]建立严格的[[数学基础]]——这类生成模型假设存在从前向过程(从[[目标分布]]过渡到简单易采样分布)与特别构建的后向过程(实现逆向高效采样)。通过与[[非平衡统计力学]]及广义[[Doob's h-变换]]的深层联系,我们提出一组最小假设条件以确保:(1) 后向生成算子的显式构造,(2) 直接最小化测度传输差异的[[统一变分目标]],(3) 经典[[分数匹配]]方法在不同动力学中的适应性实现。本框架统一了连续/离散[[扩散模型]]的现有表述,在正向生成算子满足特定[[正则性假设]]下识别出[[去噪马尔可夫模型]]的最一般形式,并为任意[[Lévy过程|Lévy型过程]]驱动的去噪模型设计提供了系统化方案。我们通过采用[[几何布朗运动]]和[[跳跃过程]]作为前向动力学的新型去噪模型,展示了该框架在复杂分布建模中的潜在灵活性与效能。

2025年4月3日 (四) 04:23的版本

摘要

  • 原文标题:GeoRAG: A Question-Answering Approach from a Geographical Perspective
  • 中文标题:GeoRAG:地理视角下的问答方法
  • 发布日期:2025-04-02 08:11:05+00:00
  • 作者:Jian Wang, Zhuo Zhao, Zheng Jie Wang, Bo Da Cheng, Lei Nie, Wen Luo, Zhao Yuan Yu, Ling Wang Yuan
  • 分类:cs.IR
  • 原文链接http://arxiv.org/abs/2504.01458v1

中文摘要地理问答(GeoQA)通过处理地理领域自然语言查询来满足复杂用户需求并提升信息检索效率。然而传统问答系统存在理解局限、检索精度低、交互性弱及复杂任务处理不足等问题,阻碍了精准信息获取。本研究提出GeoRAG框架,该知识增强型问答系统融合领域微调提示工程检索增强生成(RAG)技术,以提升地理知识检索精度和用户交互体验。方法论包含四个组件:(1)基于3267份语料(研究论文专著技术报告)构建结构化地理知识库,通过多智能体方法归类为语义理解空间位置几何形态属性特征要素关联演化过程运作机制七个维度,最终生成145234条分类条目与875432组多维问答对;(2)基于BERT-Base-Chinese多标签文本分类器,用于通过地理维度分类解析查询类型;(3)利用问答对数据的检索评估器,优化查询-文档相关性判定以提升检索精度;(4)GeoPrompt模板动态整合用户查询检索信息,通过维度特异性提示提升响应质量。对比实验表明GeoRAG在多个基础模型上均优于传统RAG,验证了其泛化能力。本研究通过提出领域专用大语言模型部署新范式,推动地理人工智能发展,对提升现实场景中GeoQA系统的可扩展性准确性具有实践意义

摘要

  • 原文标题:A Unified Approach to Analysis and Design of Denoising Markov Models
  • 中文标题:去噪马尔可夫模型分析与设计的统一方法
  • 发布日期:2025-04-02 17:46:43+00:00
  • 作者:Yinuo Ren, Grant M. Rotskoff, Lexing Ying
  • 分类:cs.LG, cs.NA, math.NA, stat.ML
  • 原文链接http://arxiv.org/abs/2504.01938v1

中文摘要:基于测度传输概率生成模型(如扩散模型和基于的模型)通常采用马尔可夫随机动力学语言进行表述,其中底层过程的选择同时影响算法设计决策和理论分析。本文旨在为去噪马尔可夫模型建立严格的数学基础——这类生成模型假设存在从前向过程(从目标分布过渡到简单易采样分布)与特别构建的后向过程(实现逆向高效采样)。通过与非平衡统计力学及广义Doob's h-变换的深层联系,我们提出一组最小假设条件以确保:(1) 后向生成算子的显式构造,(2) 直接最小化测度传输差异的统一变分目标,(3) 经典分数匹配方法在不同动力学中的适应性实现。本框架统一了连续/离散扩散模型的现有表述,在正向生成算子满足特定正则性假设下识别出去噪马尔可夫模型的最一般形式,并为任意Lévy型过程驱动的去噪模型设计提供了系统化方案。我们通过采用几何布朗运动跳跃过程作为前向动力学的新型去噪模型,展示了该框架在复杂分布建模中的潜在灵活性与效能。