WikiEdge:ArXiv-2409.12262/summary

編輯

這篇論文介紹了一種新的方法，該方法從大型語言模型（LLM）中提取知識以生成對象級計劃，這些計劃描述了對象狀態的高級變化，並使用它們以分層的方式引導任務和運動規劃（TAMP）。現有工作使用LLM直接輸出任務計劃或生成如PDDL這樣的表示中的目標，但這些方法存在不足，因為它們要麼依賴LLM進行實際規劃，要麼輸出難以滿足的目標。相反，我們的方法從LLM中提取知識，形成稱為功能面向對象網絡（FOON）的對象級表示，從中我們自動生成PDDL子目標。我們的實驗表明，我們方法的性能在模擬中的多個任務上顯著超過了其他規劃策略。

引言: 大型語言模型（LLM）的出現促進了大量利用其能力進行規劃的工作，包括使用LLM進行機器人和具體化代理的規劃。語言模型編碼了關於世界的領域知識，這對決策制定很有用。這些方法將LLM用作：1）任務規劃器，2）任務目標生成器。然而，現有工作在處理複雜、目標導向的任務方面存在幾個關鍵缺陷。我們提出一種方法，LLM用於在對象級別生成部分目標模式，然後用於生成PDDL子目標。這樣的方法繼承了LLM的常識規劃知識，同時仍然支持健全和完整的任務級規劃。
背景: 大型語言模型（LLM）是通過自監督學習和自注意力訓練的複雜神經網絡模型。LLM在自然語言處理（NLP）和生成任務中表現出色。我們使用OpenAI的Chat-GPT。任務和運動規劃（TAMP）的目標是將高級符號任務規劃與低級運動規劃集成，以使機器人能夠解決複雜的長期任務。
使用語言模型進行對象級規劃: 我們提出了一種對象級規劃方法，它僅針對對象交互進行推理。我們使用功能面向對象網絡（FOON）：一種描述對象-動作關係的知識點圖表示。我們的方法通過兩階段過程構建FOON，從自然語言任務提示中生成對象級計劃草圖。
連接到任務和運動規劃: 我們生成一個計劃模式GT，用它可以解決自然語言中給出的任務T。然而，這個模式太抽象，無法以其當前形式執行，它必須基於機器人的體現和環境進行接地。我們使用GT通過提供PDDL子目標來引導TAMP。
評估: 我們評估了我們分層規劃方法的靈活性，該方法利用LLM提取OLP，並將它們轉換為任務和運動級問題。我們特別強調LLM無法可靠地生成PDDL定義，並且無法可靠地進行任務規劃；然而，我們可以提示LLM以對象級細節，這對於構建PDDL子目標很有用。
相關工作: 許多研究人員已經探索了語言模型在機器人應用中的使用，受到它們在語言相關任務中的出色表現的啟發。先前的工作已經研究了LLM的規劃能力。其他工作則用語言模型補充任務規劃。
結論: 我們介紹了一種分層規劃方法，該方法利用大型語言模型（LLM）的強大功能來引導任務和運動規劃（TAMP）。通過在TAMP之上增加一個額外的規劃層，稱為對象級規劃，我們使機器人能夠靈活地從通過LLM提示提取的計劃草圖中找到規劃解決方案。

WikiEdge:ArXiv-2409.12262/summary

導覽選單

搜尋