WikiEdge:ArXiv-2408.01072v1/abs
跳转到导航
跳转到搜索
- 标题:A Survey on Self-play Methods in Reinforcement Learning
- 中文标题:自我对弈方法在强化学习中的综述
- 发布日期:2024-08-02 07:47:51+00:00
- 作者:['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
- 分类:['cs.AI']
- 原文链接:http://arxiv.org/abs/2408.01072v1
摘要:自我对弈是指代理与自身的副本或过去版本进行互动,近年来在强化学习中获得了显著关注。本文首先阐明了自我对弈的基础知识,包括多智能体强化学习框架和基本博弈论概念。然后,提供了一个统一的框架,并在该框架内对现有的自我对弈算法进行了分类。此外,本文通过展示自我对弈在不同场景中的作用,弥合了算法与其实际应用之间的差距。最后,调查强调了自我对弈中的开放挑战和未来研究方向。本文是理解强化学习中自我对弈多方面景观的重要指南。