WikiEdge:ArXiv-2408.01072v1/abs

标题：A Survey on Self-play Methods in Reinforcement Learning
中文标题：自我对弈方法在强化学习中的综述
发布日期：2024-08-02 07:47:51+00:00
作者：['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
分类：['cs.AI']
原文链接：http://arxiv.org/abs/2408.01072v1

摘要：自我对弈是指代理与自身的副本或过去版本进行互动，近年来在强化学习中获得了显著关注。本文首先阐明了自我对弈的基础知识，包括多智能体强化学习框架和基本博弈论概念。然后，提供了一个统一的框架，并在该框架内对现有的自我对弈算法进行了分类。此外，本文通过展示自我对弈在不同场景中的作用，弥合了算法与其实际应用之间的差距。最后，调查强调了自我对弈中的开放挑战和未来研究方向。本文是理解强化学习中自我对弈多方面景观的重要指南。

WikiEdge:ArXiv-2408.01072v1/abs

导航菜单

搜索