查看“WikiEdge:ArXiv-2408.01072v1/abs”的源代码
←
WikiEdge:ArXiv-2408.01072v1/abs
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.01072v1/abs|action=edit}} 编辑]</div> * '''标题''':A Survey on Self-play Methods in [[Reinforcement Learning]] * '''中文标题''':自我对弈方法在[[强化学习]]中的综述 * '''发布日期''':2024-08-02 07:47:51+00:00 * '''作者''':['Ruize Zhang', 'Zelai Xu', 'Chengdong Ma', 'Chao Yu', 'Wei-Wei Tu', 'Shiyu Huang', 'Deheng Ye', 'Wenbo Ding', 'Yaodong Yang', 'Yu Wang'] * '''分类''':['cs.AI'] * '''原文链接''':http://arxiv.org/abs/2408.01072v1 '''摘要''':自我对弈是指代理与自身的副本或过去版本进行互动,近年来在[[强化学习]]中获得了显著关注。本文首先阐明了自我对弈的基础知识,包括[[多智能体强化学习]]框架和基本[[博弈论]]概念。然后,提供了一个统一的框架,并在该框架内对现有的自我对弈算法进行了分类。此外,本文通过展示自我对弈在不同场景中的作用,弥合了算法与其实际应用之间的差距。最后,调查强调了自我对弈中的开放挑战和未来研究方向。本文是理解[[强化学习]]中自我对弈多方面景观的重要指南。
返回
WikiEdge:ArXiv-2408.01072v1/abs
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息