WikiEdge:ArXiv-2407.01219/abs

出自WikiEdge
跳至導覽 跳至搜尋
編輯
  • 標題:Searching for Best Practices in 檢索增強生成
  • 中文標題:檢索增強生成中的最佳實踐探索
  • 發布日期:2024-07-01 12:06:34+00:00
  • 作者:Xiaohua Wang, Zhenghua Wang, Xuan Gao, Feiran Zhang, Yixin Wu, Zhibo Xu, Tianyuan Shi, Zhengyuan Wang, Shizheng Li, Qi Qian, Ruicheng Yin, Changze Lv, Xiaoqing Zheng, Xuanjing Huang
  • 分類:cs.CL
  • 原文連結http://arxiv.org/abs/2407.01219

摘要檢索增強生成(RAG)技術已被證明在整合最新信息、減輕幻覺和提高響應質量方面有效,特別是在專業領域。雖然許多RAG方法已被提出以通過依賴查詢的檢索來增強大型語言模型,但這些方法仍然面臨複雜的實現和延長的響應時間。通常,RAG工作流程涉及多個處理步驟,每個步驟可以以多種方式執行。在這裡,我們調查現有的RAG方法及其潛在組合,以識別最佳的RAG實踐。通過廣泛的實驗,我們建議幾種在性能和效率之間取得平衡的RAG部署策略。此外,我們展示了多模態檢索技術可以顯著增強關於視覺輸入的問題回答能力,並使用「檢索作為生成」策略加速多模態內容的生成。