查看“WikiEdge:ArXiv-2407.08995/background”的源代码

<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2407.08995/background|action=edit}} 编辑]</div>
这篇文献的背景主要集中在以下几个方面：
# '''大型语言模型（[[LLMs]]）的角色扮演能力'''：
#* 近期在[[LLMs]]领域的进展展示了它们在基于不同指令和上下文模拟各种角色的对话风格和认知过程方面的卓越能力。
#* 研究表明，通过[[角色扮演提示]]（role-play prompting）策略，即将[[LLMs]]赋予专家角色，可以增强其在相应领域的表现。
#  '''角色扮演提示的局限性'''：
#* [[角色扮演提示]]虽然是有效的，但它面临两个主要限制：一是任务特定性，即角色选择和提示设计必须针对个别任务量身定制，且通常无法迁移到不同任务；二是提示设计劳动密集，需要大量的领域专业知识和迭代改进，可能耗时且效率低下。
#  '''自我提示调整（[[Self-Prompt Tuning]]）的提出'''：
#* 为了解决这些限制，研究者提出了[[自我提示调整]]方法，通过微调使[[LLMs]]自身生成[[角色扮演提示]]，减少对人类干预的依赖。
#* 利用[[LIMA]]数据集作为基础语料库，并通过[[GPT-4]]为每个数据点注释[[角色扮演提示]]，创建了[[LIMA-Role]]数据集，然后对[[LLMs]]如[[Llama-2-7B]]和[[Mistral-7B]]进行微调。
#  '''自我提示调整的评估与结果'''：
#* 通过在广泛使用的[[NLP]]基准测试和开放式问题测试上对[[自我提示调整]]后的[[LLMs]]进行评估，实证结果表明，与标准指令调整基线相比，[[自我提示调整]]后的[[LLMs]]在大多数数据集上表现更佳。
综上所述，这篇文献的背景强调了通过微调实现[[LLMs]]自我提示的潜力，以及自动化复杂提示策略的可能性。作者提出的[[自我提示调整]]方法为自动化多样化的提示策略开辟了新的途径。