作者面对的是大型语言模型(LLMs)在提供可靠和准确回答方面的挑战。具体问题包括:
- 确保生成性代理提供准确和可靠的答案:随着大型语言模型(LLMs)性能和普及度的提升,如何确保这些模型在多个领域中提供的答案既准确又可靠成为一个持续的挑战。
- 提升LLMs的推理能力:现有的问答系统主要依赖于生成性的大型语言模型,为了提高这些模型的真理性和可靠性,通常需要针对特定用例进行微调。
- 多代理辩论(MAD)策略的有效性:在多代理辩论系统中,如何通过不同的辩论和提示策略来提高LLMs的真理性,以及如何确定这些策略之间的权衡。
- 辩论策略与非辩论策略的比较:在多代理辩论策略与其他提示策略(如自我一致性和使用多个推理路径的集成)之间的性能比较,以及如何确定最佳利用多个代理进行有效交互推理的方法。