WikiEdge:ArXiv-2408.01072v1/abs

出自WikiEdge
跳至導覽 跳至搜尋
編輯
  • 標題:A Survey on Self-play Methods in Reinforcement Learning
  • 中文標題:自我對弈方法在強化學習中的綜述
  • 發布日期:2024-08-02 07:47:51+00:00
  • 作者:['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang']
  • 分類:['cs.AI']
  • 原文連結http://arxiv.org/abs/2408.01072v1

摘要:自我對弈是指代理與自身的副本或過去版本進行互動,近年來在強化學習中獲得了顯著關注。本文首先闡明了自我對弈的基礎知識,包括多智能體強化學習框架和基本博弈論概念。然後,提供了一個統一的框架,並在該框架內對現有的自我對弈算法進行了分類。此外,本文通過展示自我對弈在不同場景中的作用,彌合了算法與其實際應用之間的差距。最後,調查強調了自我對弈中的開放挑戰和未來研究方向。本文是理解強化學習中自我對弈多方面景觀的重要指南。