WikiEdge:ArXiv-2408.01072v1/abs
跳至導覽
跳至搜尋
- 標題:A Survey on Self-play Methods in Reinforcement Learning
- 中文標題:自我對弈方法在強化學習中的綜述
- 發布日期:2024-08-02 07:47:51+00:00
- 作者:['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
- 分類:['cs.AI']
- 原文鏈接:http://arxiv.org/abs/2408.01072v1
摘要:自我對弈是指代理與自身的副本或過去版本進行互動,近年來在強化學習中獲得了顯著關注。本文首先闡明了自我對弈的基礎知識,包括多智能體強化學習框架和基本博弈論概念。然後,提供了一個統一的框架,並在該框架內對現有的自我對弈算法進行了分類。此外,本文通過展示自我對弈在不同場景中的作用,彌合了算法與其實際應用之間的差距。最後,調查強調了自我對弈中的開放挑戰和未來研究方向。本文是理解強化學習中自我對弈多方面景觀的重要指南。