查看“WikiEdge:ArXiv-2409.12262/summary”的源代码
←
WikiEdge:ArXiv-2409.12262/summary
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2409.12262/summary|action=edit}} 编辑]</div> 这篇论文介绍了一种新的方法,该方法从大型语言模型([[LLM]])中提取知识以生成对象级计划,这些计划描述了对象状态的高级变化,并使用它们以分层的方式引导[[任务]]和[[运动规划]]([[TAMP]])。现有工作使用LLM直接输出任务计划或生成如[[PDDL]]这样的表示中的目标,但这些方法存在不足,因为它们要么依赖LLM进行实际规划,要么输出难以满足的目标。相反,我们的方法从LLM中提取知识,形成称为功能面向对象网络([[FOON]])的对象级表示,从中我们自动生成PDDL子目标。我们的实验表明,我们方法的性能在模拟中的多个任务上显著超过了其他规划策略。 == I. 引言 == 大型语言模型(LLM)的出现促进了大量利用其能力进行规划的工作,包括使用LLM进行[[机器人]]和具体化代理的规划。语言模型编码了关于世界的领域知识,这对决策制定很有用。这些方法将LLM用作:1)任务规划器,2)任务目标生成器。然而,现有工作在处理复杂、目标导向的任务方面存在几个关键缺陷。我们提出一种方法,LLM用于在对象级别生成部分目标模式,然后用于生成PDDL子目标。这样的方法继承了LLM的常识规划知识,同时仍然支持健全和完整的任务级规划。 == II. 背景 == 大型语言模型(LLM)是通过自监督学习和自注意力训练的复杂神经网络模型。LLM在[[自然语言处理]]([[NLP]])和生成任务中表现出色。我们使用[[OpenAI]]的[[Chat-GPT]]。任务和运动规划([[TAMP]])的目标是将高级符号任务规划与低级运动规划集成,以使机器人能够解决复杂的长期任务。 == III. 使用语言模型进行对象级规划 == 我们提出了一种对象级规划方法,它仅针对对象交互进行推理。我们使用功能面向对象网络([[FOON]]):一种描述对象-动作关系的知识点图表示。我们的方法通过两阶段过程构建FOON,从自然语言任务提示中生成对象级计划草图。 == IV. 连接到任务和运动规划 == 我们生成一个计划模式GT,用它可以解决自然语言中给出的任务T。然而,这个模式太抽象,无法以其当前形式执行,它必须基于机器人的体现和环境进行接地。我们使用GT通过提供PDDL子目标来引导TAMP。 == V. 评估 == 我们评估了我们分层规划方法的灵活性,该方法利用LLM提取OLP,并将它们转换为任务和运动级问题。我们特别强调LLM无法可靠地生成PDDL定义,并且无法可靠地进行任务规划;然而,我们可以提示LLM以对象级细节,这对于构建PDDL子目标很有用。 == VI. 相关工作 == 许多研究人员已经探索了语言模型在[[机器人]]应用中的使用,受到它们在语言相关任务中的出色表现的启发。先前的工作已经研究了LLM的规划能力。其他工作则用语言模型补充任务规划。 == VII. 结论 == 我们介绍了一种分层规划方法,该方法利用大型语言模型([[LLM]])的强大功能来引导任务和运动规划([[TAMP]])。通过在TAMP之上增加一个额外的规划层,称为对象级规划,我们使机器人能够灵活地从通过LLM提示提取的计划草图中找到规划解决方案。
返回
WikiEdge:ArXiv-2409.12262/summary
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息