查看“WikiEdge:ArXiv-2401.14423”的源代码

* '''标题'''：Prompt Design and Engineering: Introduction and Advanced Methods
* '''中文标题'''：提示设计与工程：介绍和高级方法
* '''发布日期'''：2024-01-24 06:20:18+00:00
* '''作者'''：Xavier Amatriain
* '''分类'''：cs.SE, cs.LG
*'''原文链接'''：http://arxiv.org/abs/2401.14423v4
'''摘要'''：提示设计和工程已迅速成为最大化大型语言模型潜力的关键。在本文中，我们介绍了核心概念，如链式思考和反思等高级技术，以及构建基于LLM的代理的原则。最后，我们提供了提示工程师的工具调查。

== 问题与动机 ==
作者面对的研究问题包括：
* 如何设计有效的[[提示（prompt）]]来最大化[[大型语言模型（LLMs）]]的潜力？
* 如何通过高级提示技术如“[[思维链（Chain-of-Thought）]]”和“[[反思（Reflection）]]”提升LLMs的性能？
* 如何构建基于LLMs的[[智能代理]]，并理解其背后的原理？
* 如何通过工具来支持[[提示工程师]]的工作？
* LLMs在处理复杂问题时存在哪些限制，如何通过高级提示设计技巧来克服这些限制？
* 如何通过自动化的[[提示工程（APE）]]提高提示设计的效率和准确性？
* 如何利用[[检索增强生成（RAG）]]技术来扩展LLMs，以访问实时或特定领域的信息？
* 如何通过工具和框架来增强LLMs的功能和应用范围？

== 背景介绍 ==
这篇文献的研究背景主要集中在以下几个方面：
== '''[[提示设计与工程]]''' ==
* [[提示]]（Prompt）在[[生成式AI模型]]中是用户输入的文本，用于指导模型的输出，可以是简单的问题或详细的描述。
* [[提示工程]]（Prompt Engineering）是指导AI模型输出的新兴学科，涉及构建最佳提示以实现特定目标。
* 随着[[大型语言模型]]（LLMs）的发展，提示设计和工程变得至关重要，以最大化这些模型的潜力。
== '''[[大型语言模型（LLMs）及其局限性]]''' ==
* LLMs在[[自然语言处理]]方面取得了显著进展，但它们受到固有限制的约束，如瞬态状态、概率性质、过时信息、内容编造和资源密集性。
* 这些限制强调了高级提示工程和专门技术的必要性，以提高LLM的效用并减轻固有限制。
== '''[[高级提示设计技巧和策略]]''' ==
* 包括链式思考（Chain of Thought）提示、使用工具、自我一致性、反思等，这些技术旨在优化LLM在特定限制内的性能。
* 这些技术通过将隐含的推理步骤转化为明确的、引导的序列，从而增强了模型在复杂问题解决环境中基于逻辑推理产生输出的能力。
== '''[[工具、连接器和技能的集成]]''' ==
* 工具、连接器和技能的集成显著扩展了LLMs的功能和应用范围，使它们能够与外部数据源交互并执行特定任务。
* 例如，[[Toolformer]]训练LLM决定何时使用工具，甚至确定API需要什么参数，包括两种不同的搜索引擎或计算器。
== '''[[自我一致性和反思]]''' ==
* [[自我一致性]]（Self-Consistency）方法通过产生多个答案并评估它们的一致性来提高LLM输出的准确性和可靠性。
* [[反思]]（Reflection）概念使LLM能够进行自我改进，通过自我评估其输出来提高输出的准确性、逻辑一致性和相关性。
综上所述，这篇文献的背景强调了随着LLMs和[[生成式AI]]的发展，提示设计和工程的重要性日益增加，以及如何通过高级技术来克服LLMs的固有限制。