WikiEdge:ArXiv-2408.17180v1/methods：修订间差异

←上一编辑

可视化wikitext

2024年9月3日 (二) 10:45的最新版本

编辑

这篇研究论文的工作方法主要围绕开发和应用先进的度量方法来量化玩家对战（PvP）游戏中团队组合的平衡性。以下是这部分的主要内容：

团队组合平衡性量化：
- 研究的核心问题是如何量化游戏设置中的平衡性，特别是在PvP游戏中，分析预定义团队组合（如多人在线战斗竞技场（MOBA）游戏中的英雄组合或卡牌游戏中的牌组）之间的强度关系对于增强游戏性和实现平衡至关重要。
赢值估计的扩展度量：
- 开发了两种超越简单胜率的高级度量方法来量化零和竞争场景中的平衡性。这些度量方法源自赢值估计，通过Bradley-Terry模型进行强度评级近似，并通过向量量化进行对抗关系近似，显著降低了与传统赢值估计相关的计算复杂性。
神经网络与Bradley-Terry模型的结合：
- 通过将Bradley-Terry模型与暹罗神经网络结合，从游戏结果中预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
向量量化在对抗表学习中的应用：
- 为了有效处理赢值的循环优势或非传递性，提出了一个对抗表。这涉及检查特定组合的实际赢结果与Bradley-Terry模型预测之间的差异，并通过神经离散表示学习来学习对抗表，从而提高预测精度并提供对抗动态的洞察，而无需特定的游戏知识。
提高码本利用率的新VQ Mean Loss：
- 在学习对抗表的过程中，发现传统的向量量化（VQ）训练导致码本利用率低下，尤其是在码本尺寸较小的情况下。因此，提出了一种新的VQ Mean Loss来改善这一新用例的码本利用率。
平衡性度量的创新：
- 定义了新的游戏平衡度量方法，通过计算非支配组合的数量来面对简单胜率在计算上面临的挑战，这些方法包括Top-D Diversity和Top-B Balance，前者考虑了给定容忍胜率差距内的可玩组合数量，后者考虑了游戏中有意义的对抗关系数量。
复杂度的降低：
- 通过将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2)，其中N是组合的数量，M是对抗表的类别计数，显著降低了空间复杂度，这对于存储和为游戏设计师生成可行大小的平衡报告至关重要。
实际游戏验证：
- 该框架已在流行的在线游戏如帝国时代II、炉石传说、荒野乱斗和英雄联盟中得到验证，观察到的强度关系准确性与传统的成对赢值预测相当，同时也提供了更好的通用性。

@@ 第1行： / 第1行： @@
-本文介绍了一种基于[[忆阻器]]的计算存储硬件加速器，用于片上训练和推理，重点关注其在设备变化、导电误差和输入噪声下的准确性和效率。
+<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17180v1/methods|action=edit}} 编辑]</div>
-利用商业可用的基于[[银]]的金属自定向通道（M-SDC）忆阻器的真实SPICE模型，研究将固有的设备非理想性纳入电路仿真中。
+这篇研究论文的工作方法主要围绕开发和应用先进的度量方法来量化[[玩家对战]]（[[PvP]]）游戏中[[团队组合]]的平衡性。以下是这部分的主要内容：
-硬件由30个忆阻器和4个[[神经元]]组成，利用[[钨]]、[[铬]]和[[碳]]介质的三种不同的M-SDC结构执行二进制[[图像分类]]任务。
+# '''团队组合平衡性量化'''：
-片上训练算法精确调整忆阻器导电性以实现目标权重。结果表明，训练期间加入适度噪声（<15%）可以增强对设备变化和噪声输入数据的[[鲁棒性]]，
+#* 研究的核心问题是如何量化游戏设置中的平衡性，特别是在PvP游戏中，分析预定义团队组合（如[[多人在线战斗竞技场]]（[[MOBA]]）游戏中的[[英雄组合]]或[[卡牌游戏]]中的[[牌组]]）之间的强度关系对于增强游戏性和实现平衡至关重要。
-即使在导电变化和输入噪声下也能实现高达97%的[[准确率]]。网络可以在不显著损失准确率的情况下容忍10%的导电误差。值得注意的是，
+# '''赢值估计的扩展度量'''：
-在训练期间省略初始忆阻器重置脉冲可以显著减少训练时间和能量消耗。使用基于铬的忆阻器设计的硬件表现出优越的性能，
+#* 开发了两种超越简单胜率的高级度量方法来量化[[零和竞争]]场景中的平衡性。这些度量方法源自赢值估计，通过[[Bradley-Terry模型]]进行强度评级近似，并通过[[向量量化]]进行对抗关系近似，显著降低了与传统赢值估计相关的计算复杂性。
-实现了2.4秒的训练时间和18.9毫焦耳的能量消耗。这项研究为开发用于[[边缘应用]]的[[片上学习]]的鲁棒和能效高的基于忆阻器的[[神经网络]]提供了见解。
+# '''[[神经网络]]与Bradley-Terry模型的结合'''：
+#* 通过将Bradley-Terry模型与[[暹罗神经网络]]结合，从游戏结果中预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
+# '''向量量化在对抗表学习中的应用'''：
+#* 为了有效处理赢值的循环优势或非传递性，提出了一个[[对抗表]]。这涉及检查特定组合的实际赢结果与Bradley-Terry模型预测之间的差异，并通过[[神经离散表示学习]]来学习对抗表，从而提高预测精度并提供对抗动态的洞察，而无需特定的游戏知识。
+# '''提高码本利用率的新VQ Mean Loss'''：
+#* 在学习对抗表的过程中，发现传统的向量量化（VQ）训练导致码本利用率低下，尤其是在码本尺寸较小的情况下。因此，提出了一种新的[[VQ Mean Loss]]来改善这一新用例的码本利用率。
+# '''平衡性度量的创新'''：
+#* 定义了新的游戏平衡度量方法，通过计算非支配组合的数量来面对简单胜率在计算上面临的挑战，这些方法包括[[Top-D Diversity]]和[[Top-B Balance]]，前者考虑了给定容忍胜率差距内的可玩组合数量，后者考虑了游戏中有意义的对抗关系数量。
+# '''复杂度的降低'''：
+#* 通过将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2)，其中N是组合的数量，M是对抗表的类别计数，显著降低了空间复杂度，这对于存储和为游戏设计师生成可行大小的平衡报告至关重要。
+# '''实际游戏验证'''：
+#* 该框架已在流行的在线游戏如[[帝国时代II]]、[[炉石传说]]、[[荒野乱斗]]和[[英雄联盟]]中得到验证，观察到的强度关系准确性与传统的成对赢值预测相当，同时也提供了更好的通用性。

WikiEdge:ArXiv-2408.17180v1/methods：修订间差异

2024年9月3日 (二) 10:45的最新版本

导航菜单

搜索