WikiEdge:ArXiv-1711.08028
- 标题:Recurrent Relational Networks
- 中文标题:循环关系网络
- 发布日期:2017-11-21 20:34:48+00:00
- 作者:Rasmus Berg Palm, Ulrich Paquet, Ole Winther
- 分类:cs.AI
- 原文链接:http://arxiv.org/abs/1711.08028v4
摘要:本文主要研究如何学习解决需要一系列相互依赖的关系推理步骤的任务,例如回答有关对象之间关系的复杂问题,或解决其中解决方案的较小元素相互约束的谜题。我们引入了循环关系网络,这是一个通用模块,可以在对象的图形表示上进行操作。作为Santoro等人[2017]的关系网络的泛化,它可以增强任何神经网络模型的多步关系推理能力。我们在bAbI文本问题回答数据集上使用循环关系网络,取得了最新的结果,稳定解决了20/20的任务。由于bAbI在关系推理方面并不特别具有挑战性,我们引入了Pretty-CLEVR,这是一个新的关系推理诊断数据集。在Pretty-CLEVR的设置中,我们可以改变问题以控制获取答案所需的关系推理步骤的数量。使用Pretty-CLEVR,我们探索了多层感知器、关系和循环关系网络的限制。最后,我们展示了如何使用监督训练数据让循环关系网络学习解决数独难题,这是一个需要超过64步关系推理的挑战性任务。我们在相似方法中取得了最新的结果,解决了96.6%的最难数独难题。
问题与动机
作者的研究问题包括:
背景介绍
这篇文献的背景主要集中在以下几个方面:
- 复杂问题解决的挑战:
- 关系推理的引入:
- 递归关系网络的提出:
- 实验验证:
综上所述,这篇文献的背景强调了在解决需要复杂关系推理的任务中,递归关系网络作为一种新型的深度学习模型,其在多个数据集上展现出的潜力和有效性。
章节摘要
这篇论文是关于学习解决需要一系列相互依赖的关系推理步骤的任务的研究,主要内容包括:
- 引言:
- 实验:
- 在bAbI文本问答数据集上实现了最先进的结果,解决了所有20个任务。
- 引入了Pretty-CLEVR数据集,用于诊断关系推理。
- 使用Pretty-CLEVR评估了多层感知器、关系网络和递归关系网络的局限性。
- 展示了RRN如何通过监督训练数据学习解决数独谜题,并在最难的数独问题上达到了96.6%的解决率。
- 讨论:
- 提出了一种通用的关系推理模型,能够解决比当前技术更复杂的关系推理任务。
- 讨论了在每一步都有损失函数可能带来的问题,以及模型如何避免陷入局部最小值。
- 强调了模型的非贪婪多步算法的能力。