WikiEdge:ArXiv-2408.17180v1/methods:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
David留言 | 贡献
Saved page by David
 
David留言 | 贡献
Saved page by David
 
(未显示同一用户的1个中间版本)
第1行: 第1行:
<!-- 不要移除下面第一行,如果有编辑错误,请直接修改第二行以后的内容 -->
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17180v1/methods|action=edit}} 编辑]</div>
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17180v1/methods|action=edit}} 编辑]</div>
== 工作方法 ==
这篇研究论文的工作方法主要围绕开发和应用先进的度量方法来量化[[玩家对战]]([[PvP]])游戏中[[团队组合]]的平衡性。以下这部分的主要内容:
这篇论文的主要工作方法是开发了两高级度量标准来量化零和竞争场景中的平衡,这些度量标准超越了简单的胜率。这些度量是基于胜利价值估计,通过Bradley-Terry模型进行强度评级近似,并通过向量量化进行对抗关系近似,显著降低了与传统胜利价值估计相关的计算复杂性。在这些模型的学习,研究者识别的组合类别确定它们的对抗关系这与人类玩家经验相符,而特定的游戏知识。该方法依赖于一种简单技术增强离散表示中的码本利用率,通过量量程针极小状态空间。该框架已在流行的在线游戏如帝国时代II炉石传说荒野乱斗英雄联盟中得到验证,观察到的强度关系准确性与传统的成对胜利价值预测相当,同时也提供了更易于管理复杂进行分析
# '''团队组合平衡性量化''':
#* 研究的核心问题是如何量化游戏设置中的平衡性,特别是在PvP游戏中,分析预定义团队组合(如[[多人在线战斗竞技场]]([[MOBA]])游戏中的[[英雄组合]]或[[卡牌游戏]]中的[[牌组]])之间的强度关系对于增强游戏性和实现平衡至关重要。
# '''赢值估计的扩展度量''':
#* 开发了两种超越简单胜率的高级度量方法来量化[[零和竞争]]场景中的平衡。这些度量方法源自赢值估计,通过[[Bradley-Terry模型]]进行强度评级近似,并通过[[向量量化]]进行对抗关系近似,显著降低了与传统值估计相关的计算复杂性。
# '''[[神经网络]]与Bradley-Terry模型的结合''':
#* 通将Bradley-Terry模型与[[暹罗神经网络]]结合,从游戏结果预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
# '''向量量化在对抗表学习中的应用''':
#* 为了效处理赢值循环优势或非传递性,提出了一个[[对抗表]]。这涉及检查特定组合的实际赢结果与Bradley-Terry模型预测之间的差异,通过[[神经离散表示学习]]来学习对抗从而提高预测精度并提供对抗动态洞察,而需特定的游戏知识。
# '''提高码本利用率的新VQ Mean Loss''':
#* 在学习对抗表的过程中,发现传统的向量量化(VQ)训练导致码本利用率低下,尤其是在码本尺寸较小的情况下。因此,提出了一种[[VQ Mean Loss]]改善这一新用例的码本利用率
# '''平衡性度量的创新''':
#* 定义了新的游戏平衡度量方法,通过计算非支配组合的数量来面对简单胜率在计算上面临的挑战,这些方法包括[[Top-D Diversity]]和[[Top-B Balance]],前者考虑了给容忍胜率差距内可玩组合数,后者考虑了游戏中有意义的对抗关系数
# '''复杂度的降低''':
#* 通将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2),其中N是组合的数量,M是抗表的类别计数,显著降低了空间复杂度,这对于存储和为游戏设计师生成可行大小的平衡报告至关重要
# '''实际游戏验证''':
#* 该框架已在流行的在线游戏如[[帝国时代II]][[炉石传说]][[荒野乱斗]][[英雄联盟]]中得到验证,观察到的强度关系准确性与传统的成对值预测相当,同时也提供了更通用性。

2024年9月3日 (二) 10:45的最新版本

编辑

这篇研究论文的工作方法主要围绕开发和应用先进的度量方法来量化玩家对战PvP)游戏中团队组合的平衡性。以下是这部分的主要内容:

  1. 团队组合平衡性量化
  2. 赢值估计的扩展度量
    • 开发了两种超越简单胜率的高级度量方法来量化零和竞争场景中的平衡性。这些度量方法源自赢值估计,通过Bradley-Terry模型进行强度评级近似,并通过向量量化进行对抗关系近似,显著降低了与传统赢值估计相关的计算复杂性。
  3. 神经网络与Bradley-Terry模型的结合
    • 通过将Bradley-Terry模型与暹罗神经网络结合,从游戏结果中预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
  4. 向量量化在对抗表学习中的应用
    • 为了有效处理赢值的循环优势或非传递性,提出了一个对抗表。这涉及检查特定组合的实际赢结果与Bradley-Terry模型预测之间的差异,并通过神经离散表示学习来学习对抗表,从而提高预测精度并提供对抗动态的洞察,而无需特定的游戏知识。
  5. 提高码本利用率的新VQ Mean Loss
    • 在学习对抗表的过程中,发现传统的向量量化(VQ)训练导致码本利用率低下,尤其是在码本尺寸较小的情况下。因此,提出了一种新的VQ Mean Loss来改善这一新用例的码本利用率。
  6. 平衡性度量的创新
    • 定义了新的游戏平衡度量方法,通过计算非支配组合的数量来面对简单胜率在计算上面临的挑战,这些方法包括Top-D DiversityTop-B Balance,前者考虑了给定容忍胜率差距内的可玩组合数量,后者考虑了游戏中有意义的对抗关系数量。
  7. 复杂度的降低
    • 通过将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2),其中N是组合的数量,M是对抗表的类别计数,显著降低了空间复杂度,这对于存储和为游戏设计师生成可行大小的平衡报告至关重要。
  8. 实际游戏验证