WikiEdge:ArXiv-2407.01219/methods
跳转到导航
跳转到搜索
这篇文献的工作部分详细介绍了检索增强生成(RAG)技术在提升大型语言模型性能方面的应用。以下是这部分的主要内容:
- 检索增强生成(Retrieval-Augmented Generation, RAG):
- 定义了RAG的概念,即通过检索与查询相关的文档来增强语言模型的生成能力,以提供准确、实时、特定领域的上下文信息。
- RAG工作流程(RAG Workflow):
- 查询分类(Query Classification):
- 介绍了查询分类模块,用于确定是否需要对特定输入查询进行检索增强,以提高信息准确性和减少生成内容的虚构。
- 检索方法(Retrieval Methods):
- 重排序策略(Reranking Strategies):
- 讨论了重排序策略,使用深度语言模型对检索到的文档进行重新排序,以提高与查询的相关性。
- 重新打包(Repacking):
- 探索了不同的文档重新打包方法,如正向、反向和侧向,以优化文档的排列顺序,从而提高后续处理模块的性能。
- 摘要技术(Summarization Techniques):
- 分析了提取式和抽象式摘要方法,以及它们在减少冗余信息和提高语言模型生成准确性方面的作用。
- 生成器微调(Generator Fine-tuning):
- 研究了微调生成器对提高RAG系统性能的影响,特别是相关和不相关上下文对生成器性能的影响。
- 多模态扩展(Multimodal Extension):