WikiEdge:ArXiv-2408.17180v1/methods
跳转到导航
跳转到搜索
工作方法
这篇论文的主要工作方法是开发了两个高级度量标准来量化零和竞争场景中的平衡,这些度量标准超越了简单的胜率。这些度量是基于胜利价值估计,通过Bradley-Terry模型进行强度评级近似,并通过向量量化进行对抗关系近似,显著降低了与传统胜利价值估计相关的计算复杂性。在这些模型的学习过程中,研究者识别出有用的组合类别并确定它们的对抗关系,这与人类玩家的经验相符,而不需要特定的游戏知识。该方法依赖于一种简单的技术来增强离散表示中的码本利用率,通过确定性的向量量化过程针对极小状态空间。该框架已在流行的在线游戏如《帝国时代II》、《炉石传说》、《荒野乱斗》和《英雄联盟》中得到验证,其观察到的强度关系准确性与传统的成对胜利价值预测相当,同时也提供了更易于管理的复杂性进行分析。