WikiEdge:ArXiv-1711.08028

出自WikiEdge
於 2024年9月29日 (日) 05:44 由 David對話 | 貢獻 所做的修訂 (Updated page by David)
跳至導覽 跳至搜尋
  • 標題:Recurrent Relational Networks
  • 中文標題:循環關係網絡
  • 發佈日期:2017-11-21 20:34:48+00:00
  • 作者:Rasmus Berg Palm, Ulrich Paquet, Ole Winther
  • 分類:cs.AI
  • 原文連結http://arxiv.org/abs/1711.08028v4

摘要:本文主要研究如何學習解決需要一系列相互依賴的關係推理步驟的任務,例如回答有關對象之間關係的複雜問題,或解決其中解決方案的較小元素相互約束的謎題。我們引入了循環關係網絡,這是一個通用模塊,可以在對象的圖形表示上進行操作。作為Santoro等人[2017]的關係網絡的泛化,它可以增強任何神經網絡模型的多步關係推理能力。我們在bAbI文本問題回答數據集上使用循環關係網絡,取得了最新的結果,穩定解決了20/20的任務。由於bAbI在關係推理方面並不特別具有挑戰性,我們引入了Pretty-CLEVR,這是一個新的關係推理診斷數據集。在Pretty-CLEVR的設置中,我們可以改變問題以控制獲取答案所需的關係推理步驟的數量。使用Pretty-CLEVR,我們探索了多層感知器、關係和循環關係網絡的限制。最後,我們展示了如何使用監督訓練數據讓循環關係網絡學習解決數獨難題,這是一個需要超過64步關係推理的挑戰性任務。我們在相似方法中取得了最新的結果,解決了96.6%的最難數獨難題。

問題與動機

作者的研究問題包括:

  • 如何構建一個能夠進行多步關係推理神經網絡模型
  • 如何在不同的數據集上驗證提出的模型是否能夠實現多步關係推理?
  • 如何在複雜的任務(如數獨解謎)中應用提出的模型,並與現有方法比較其性能?