作者面對的是大型語言模型(LLMs)在提供可靠和準確回答方面的挑戰。具體問題包括:
- 確保生成性代理提供準確和可靠的答案:隨著大型語言模型(LLMs)性能和普及度的提升,如何確保這些模型在多個領域中提供的答案既準確又可靠成為一個持續的挑戰。
- 提升LLMs的推理能力:現有的問答系統主要依賴於生成性的大型語言模型,為了提高這些模型的真理性和可靠性,通常需要針對特定用例進行微調。
- 多代理辯論(MAD)策略的有效性:在多代理辯論系統中,如何通過不同的辯論和提示策略來提高LLMs的真理性,以及如何確定這些策略之間的權衡。
- 辯論策略與非辯論策略的比較:在多代理辯論策略與其他提示策略(如自我一致性和使用多個推理路徑的集成)之間的性能比較,以及如何確定最佳利用多個代理進行有效交互推理的方法。