這篇文獻的背景主要集中在以下幾個方面:
- 檢索增強生成(Retrieval-Augmented Generation, RAG)技術的發展:
- RAG技術通過結合預訓練模型和基於檢索的模型,有效整合最新信息,減少生成內容中的虛假陳述,尤其在專業領域中提升響應質量。
- 儘管提出了多種RAG方法來增強大型語言模型(LLMs),但這些方法在實現複雜性和響應延遲方面仍存在挑戰。
- RAG工作流程的優化需求:
- RAG工作流程包含多個處理步驟,如查詢分類、檢索、重排序、重打包和摘要等,每個步驟都有多種可能的執行方式。
- 實現RAG時,各步驟的實施方法及其組合顯著影響RAG系統的效能和效率,但目前尚缺乏系統性的研究來追求RAG的最優實現。
- 多模態檢索技術的潛力:
- 研究表明,多模態檢索技術可以顯著提升對視覺輸入的問題回答能力,並可通過「檢索即生成」策略加速多模態內容的生成。
綜上所述,這篇文獻的背景強調了在大型語言模型中應用RAG方法的重要性,以及通過系統性實驗來識別和推薦最優RAG實踐的必要性。