查看“WikiEdge:ArXiv-2408.01072v1/abs”的源代码

<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.01072v1/abs|action=edit}} 编辑]</div>
* '''标题'''：A Survey on Self-play Methods in [[Reinforcement Learning]]
* '''中文标题'''：自我对弈方法在[[强化学习]]中的综述
* '''发布日期'''：2024-08-02 07:47:51+00:00
* '''作者'''：['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
* '''分类'''：['cs.AI']
* '''原文链接'''：http://arxiv.org/abs/2408.01072v1
'''摘要'''：自我对弈是指代理与自身的副本或过去版本进行互动，近年来在[[强化学习]]中获得了显著关注。本文首先阐明了自我对弈的基础知识，包括[[多智能体强化学习]]框架和基本[[博弈论]]概念。然后，提供了一个统一的框架，并在该框架内对现有的自我对弈算法进行了分类。此外，本文通过展示自我对弈在不同场景中的作用，弥合了算法与其实际应用之间的差距。最后，调查强调了自我对弈中的开放挑战和未来研究方向。本文是理解[[强化学习]]中自我对弈多方面景观的重要指南。