WikiEdge:ArXiv-2407.01219/abs
跳转到导航
跳转到搜索
- 标题:Searching for Best Practices in 检索增强生成
- 中文标题:检索增强生成中的最佳实践探索
- 发布日期:2024-07-01 12:06:34+00:00
- 作者:Xiaohua Wang, Zhenghua Wang, Xuan Gao, Feiran Zhang, Yixin Wu, Zhibo Xu, Tianyuan Shi, Zhengyuan Wang, Shizheng Li, Qi Qian, Ruicheng Yin, Changze Lv, Xiaoqing Zheng, Xuanjing Huang
- 分类:cs.CL
- 原文链接:http://arxiv.org/abs/2407.01219
摘要:检索增强生成(RAG)技术已被证明在整合最新信息、减轻幻觉和提高响应质量方面有效,特别是在专业领域。虽然许多RAG方法已被提出以通过依赖查询的检索来增强大型语言模型,但这些方法仍然面临复杂的实现和延长的响应时间。通常,RAG工作流程涉及多个处理步骤,每个步骤可以以多种方式执行。在这里,我们调查现有的RAG方法及其潜在组合,以识别最佳的RAG实践。通过广泛的实验,我们建议几种在性能和效率之间取得平衡的RAG部署策略。此外,我们展示了多模态检索技术可以显著增强关于视觉输入的问题回答能力,并使用“检索作为生成”策略加速多模态内容的生成。