WikiEdge:ArXiv-2407.08995/methods
跳转到导航
跳转到搜索
这篇文献的工作部分详细介绍了如何开发和评估自我提示调整(self-prompt tuning)方法,以提高大型语言模型(LLMs)在各种任务中的表现。以下是这部分的主要内容:
- 自我提示调整(Self-Prompt Tuning):
- 提出了自我提示调整的概念,即通过微调(fine-tuning)让LLMs能够自动生成适合特定问题的专家角色提示(role-play prompts),从而提高其在相关领域的性能。
- LIMA-Role 数据集构建(Construction of LIMA-Role Dataset):
- 利用GPT-4为LIMA数据集中的每个数据点生成角色扮演提示,创建了LIMA-Role数据集,该数据集用于后续的LLMs微调。
- LLMs 微调(Fine-tuning of LLMs):
- 在LIMA-Role数据集上微调了如Llama-2-7B和Mistral-7B等LLMs,使得微调后的模型能够自动为任何给定问题生成专家角色提示。
- 评估(Evaluation):