WikiEdge:ArXiv-2408.01072v1/abs

標題：A Survey on Self-play Methods in Reinforcement Learning
中文標題：自我對弈方法在強化學習中的綜述
發布日期：2024-08-02 07:47:51+00:00
作者：['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
分類：['cs.AI']
原文連結：http://arxiv.org/abs/2408.01072v1

摘要：自我對弈是指代理與自身的副本或過去版本進行互動，近年來在強化學習中獲得了顯著關注。本文首先闡明了自我對弈的基礎知識，包括多智能體強化學習框架和基本博弈論概念。然後，提供了一個統一的框架，並在該框架內對現有的自我對弈算法進行了分類。此外，本文通過展示自我對弈在不同場景中的作用，彌合了算法與其實際應用之間的差距。最後，調查強調了自我對弈中的開放挑戰和未來研究方向。本文是理解強化學習中自我對弈多方面景觀的重要指南。

WikiEdge:ArXiv-2408.01072v1/abs

導覽選單

搜尋