查看“WikiEdge:ArXiv-2409.12262/summary”的源代码

<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2409.12262/summary|action=edit}} 编辑]</div>
这篇论文介绍了一种新的方法，该方法从大型语言模型（[[LLM]]）中提取知识以生成对象级计划，这些计划描述了对象状态的高级变化，并使用它们以分层的方式引导[[任务]]和[[运动规划]]（[[TAMP]]）。现有工作使用LLM直接输出任务计划或生成如[[PDDL]]这样的表示中的目标，但这些方法存在不足，因为它们要么依赖LLM进行实际规划，要么输出难以满足的目标。相反，我们的方法从LLM中提取知识，形成称为功能面向对象网络（[[FOON]]）的对象级表示，从中我们自动生成PDDL子目标。我们的实验表明，我们方法的性能在模拟中的多个任务上显著超过了其他规划策略。
== I. 引言 ==
大型语言模型（LLM）的出现促进了大量利用其能力进行规划的工作，包括使用LLM进行[[机器人]]和具体化代理的规划。语言模型编码了关于世界的领域知识，这对决策制定很有用。这些方法将LLM用作：1）任务规划器，2）任务目标生成器。然而，现有工作在处理复杂、目标导向的任务方面存在几个关键缺陷。我们提出一种方法，LLM用于在对象级别生成部分目标模式，然后用于生成PDDL子目标。这样的方法继承了LLM的常识规划知识，同时仍然支持健全和完整的任务级规划。
== II. 背景 ==
大型语言模型（LLM）是通过自监督学习和自注意力训练的复杂神经网络模型。LLM在[[自然语言处理]]（[[NLP]]）和生成任务中表现出色。我们使用[[OpenAI]]的[[Chat-GPT]]。任务和运动规划（[[TAMP]]）的目标是将高级符号任务规划与低级运动规划集成，以使机器人能够解决复杂的长期任务。
== III. 使用语言模型进行对象级规划 ==
我们提出了一种对象级规划方法，它仅针对对象交互进行推理。我们使用功能面向对象网络（[[FOON]]）：一种描述对象-动作关系的知识点图表示。我们的方法通过两阶段过程构建FOON，从自然语言任务提示中生成对象级计划草图。
== IV. 连接到任务和运动规划 ==
我们生成一个计划模式GT，用它可以解决自然语言中给出的任务T。然而，这个模式太抽象，无法以其当前形式执行，它必须基于机器人的体现和环境进行接地。我们使用GT通过提供PDDL子目标来引导TAMP。
== V. 评估 ==
我们评估了我们分层规划方法的灵活性，该方法利用LLM提取OLP，并将它们转换为任务和运动级问题。我们特别强调LLM无法可靠地生成PDDL定义，并且无法可靠地进行任务规划；然而，我们可以提示LLM以对象级细节，这对于构建PDDL子目标很有用。
== VI. 相关工作 ==
许多研究人员已经探索了语言模型在[[机器人]]应用中的使用，受到它们在语言相关任务中的出色表现的启发。先前的工作已经研究了LLM的规划能力。其他工作则用语言模型补充任务规划。
== VII. 结论 ==
我们介绍了一种分层规划方法，该方法利用大型语言模型（[[LLM]]）的强大功能来引导任务和运动规划（[[TAMP]]）。通过在TAMP之上增加一个额外的规划层，称为对象级规划，我们使机器人能够灵活地从通过LLM提示提取的计划草图中找到规划解决方案。