这篇文献的背景主要集中在以下几个方面:
- 检索增强生成(Retrieval-Augmented Generation, RAG)技术的发展:
- RAG技术通过结合预训练模型和基于检索的模型,有效整合最新信息,减少生成内容中的虚假陈述,尤其在专业领域中提升响应质量。
- 尽管提出了多种RAG方法来增强大型语言模型(LLMs),但这些方法在实现复杂性和响应延迟方面仍存在挑战。
- RAG工作流程的优化需求:
- RAG工作流程包含多个处理步骤,如查询分类、检索、重排序、重打包和摘要等,每个步骤都有多种可能的执行方式。
- 实现RAG时,各步骤的实施方法及其组合显著影响RAG系统的效能和效率,但目前尚缺乏系统性的研究来追求RAG的最优实现。
- 多模态检索技术的潜力:
- 研究表明,多模态检索技术可以显著提升对视觉输入的问题回答能力,并可通过“检索即生成”策略加速多模态内容的生成。
综上所述,这篇文献的背景强调了在大型语言模型中应用RAG方法的重要性,以及通过系统性实验来识别和推荐最优RAG实践的必要性。