WikiEdge:ArXiv-2408.17180v1/methods:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
David留言 | 贡献
Saved page by David
David留言 | 贡献
Saved page by David
 
第1行: 第1行:
介绍了一种基于[[忆阻器]]的计算存储硬件加速器用于片上训练和推理重点关注其设备变化、导电误差和输入噪声下准确性和效率
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17180v1/methods|action=edit}} 编辑]</div>
利用商业可用基于[[]]的金属定向道(M-SDC)忆阻器的真实SPICE模型,研究将固有设备非理想纳入电路仿真中
这篇研究论的工作方法主要围绕开发和应用先进的度量方法来量化[[玩家对战]]([[PvP]])游戏中[[团队组合]]的平衡性。以下是这部分的主要内容:
硬件由30个忆阻器和4个[[神经]]组成,利用[[]][[]]和[[碳]]介质三种不同的M-SDC结构执行二进制[[图像分类]]任务
# '''团队组合平衡性量化''':
片上训练算法精确调整忆阻器电性以实现目标权重结果表明训练期间加入适度噪声(<15%)可以增强对设备变化和噪声输入数据的[[鲁棒性]]
#* 研究的核心问题是如何量化游戏设置中的平衡性特别是在PvP游戏中分析预定义团队组合(如[[多人线战斗竞技场]]([[MOBA]])游戏中的[[英雄组合]]或[[卡牌游戏]]中的[[牌组]])之间强度关系对于增强游戏性和实现平衡至关重要
即使导电变化输入噪声下也能实现高达97%的[[准确率]]。网络可以在不显著损失准确率的情况下容忍10%导电误差值得注意的是,
# '''赢值估计的扩展度量''':
在训练期间省略初始忆阻器重置脉冲可以显著减少训练时间和能量消耗。使用基于铬的忆阻器设计的硬件表现出优越的性能,
#* 开发了两种超越简单胜率高级度量方法来量化[[零和竞争]]场景中平衡性。这些度量方法源赢值估计,过[[Bradley-Terry模型]]进行强度评级近似,并通过[[向量量化]]进行对抗关系近似显著降低了与传统赢值估计相关计算复杂性。
实现了2.4秒训练间和18.9毫焦耳的能量消耗。这项研究为开发用于[[边缘应用]][[片上学习]]的鲁棒能效高的基于忆阻器的[[神经网络]]提供了见解
# '''[[神经网络]]与Bradley-Terry模型的结合''':
#* 通过将Bradley-Terry模型与[[暹罗神经网络]]结合,从游戏结果中预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
# '''向量量化在对抗表学习中的应用''':
#* 为了有效处理赢值的循环优势或非传递性,提出了一个[[对抗表]]。这涉及检查特定组合实际赢结果与Bradley-Terry模型预测之间的差异,并通过[[神经离散表示学习]]来学习对抗表,从而提高预测精度并提供对抗动态的洞察,而无需特定的游戏知识
# '''提高码本利用率的新VQ Mean Loss''':
#* 在学习对抗表的过程中,发现传统的向量量化(VQ)训练导致码本利用率低下,尤其是在码本尺寸较小的情况下因此提出了一种新的[[VQ Mean Loss]]来改善这一新用例的码本利用率。
# '''平衡性度量的创新''':
#* 定义了新的游戏平衡度量方法,通过计算非支配组合的数量来面对简单胜率计算上面临的挑战,这些方法包括[[Top-D Diversity]]和[[Top-B Balance]],前者考虑了给定容忍胜差距内可玩组合数量,后者考虑了游戏中有意义对抗关系数量
# '''复杂度的降低''':
#* 通过将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2),其中N是组合数量,M对抗表的类别计数,显著降低了空复杂度,这对于存储为游戏设计师生成可行大小平衡报告至关重要。
# '''实际游戏验证''':
#* 该框架已在流行在线游戏如[[帝国代II]]、[[炉石传说]][[荒野乱斗]]和[[英雄联盟]]中得到验证,观察到的强度关系准确性与传统的成对赢值预测相当,同时也提供了更好的通用性

2024年9月3日 (二) 10:45的最新版本

编辑

这篇研究论文的工作方法主要围绕开发和应用先进的度量方法来量化玩家对战PvP)游戏中团队组合的平衡性。以下是这部分的主要内容:

  1. 团队组合平衡性量化
  2. 赢值估计的扩展度量
    • 开发了两种超越简单胜率的高级度量方法来量化零和竞争场景中的平衡性。这些度量方法源自赢值估计,通过Bradley-Terry模型进行强度评级近似,并通过向量量化进行对抗关系近似,显著降低了与传统赢值估计相关的计算复杂性。
  3. 神经网络与Bradley-Terry模型的结合
    • 通过将Bradley-Terry模型与暹罗神经网络结合,从游戏结果中预测团队组合的强度。这种标量强度评级有助于更有效地识别最强或主导组合。
  4. 向量量化在对抗表学习中的应用
    • 为了有效处理赢值的循环优势或非传递性,提出了一个对抗表。这涉及检查特定组合的实际赢结果与Bradley-Terry模型预测之间的差异,并通过神经离散表示学习来学习对抗表,从而提高预测精度并提供对抗动态的洞察,而无需特定的游戏知识。
  5. 提高码本利用率的新VQ Mean Loss
    • 在学习对抗表的过程中,发现传统的向量量化(VQ)训练导致码本利用率低下,尤其是在码本尺寸较小的情况下。因此,提出了一种新的VQ Mean Loss来改善这一新用例的码本利用率。
  6. 平衡性度量的创新
    • 定义了新的游戏平衡度量方法,通过计算非支配组合的数量来面对简单胜率在计算上面临的挑战,这些方法包括Top-D DiversityTop-B Balance,前者考虑了给定容忍胜率差距内的可玩组合数量,后者考虑了游戏中有意义的对抗关系数量。
  7. 复杂度的降低
    • 通过将分析组合强度关系的复杂度从O(N^2)降低到O(N + M^2),其中N是组合的数量,M是对抗表的类别计数,显著降低了空间复杂度,这对于存储和为游戏设计师生成可行大小的平衡报告至关重要。
  8. 实际游戏验证