查看“WikiEdge:ArXiv-2408.01072v1/questions”的源代码
←
WikiEdge:ArXiv-2408.01072v1/questions
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.01072v1/questions|action=edit}} 编辑]</div> 作者面对的是[[强化学习]]领域中[[自博弈]]方法的研究问题。具体问题包括: #* [[多智能体强化学习]](MARL)中的复杂动态问题:在MARL中,智能体动作的相互依赖性引入了显著的挑战,因为环境对每个智能体来说都是非静态的。 #* 自博弈算法的分类和统一框架缺失:尽管自博弈在各种场景中有广泛应用,但目前缺乏一个全面的调查,特别是关注自博弈的[[理论安全性]]、[[算法框架]]以及[[PSRO]]系列算法的不兼容性问题。 #* 自博弈算法在实际应用中的挑战:自博弈虽然在[[围棋]]、[[国际象棋]]、[[扑克]]和[[视频游戏]]等场景中发展了超越人类专家的策略,但伴随着如收敛到次优策略和显著的计算需求等限制。
返回
WikiEdge:ArXiv-2408.01072v1/questions
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息