WikiEdge:ArXiv-2408.17180v1/methods

出自WikiEdge
於 2024年9月3日 (二) 03:52 由 David留言 | 貢獻 所做的修訂 (Saved page by David)
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)
跳至導覽 跳至搜尋
編輯

工作方法

這篇論文的主要工作方法是開發了兩個高級度量標準來量化零和競爭場景中的平衡,這些度量標準超越了簡單的勝率。這些度量是基於勝利價值估計,通過Bradley-Terry模型進行強度評級近似,並通過向量量化進行對抗關係近似,顯著降低了與傳統勝利價值估計相關的計算複雜性。在這些模型的學習過程中,研究者識別出有用的組合類別並確定它們的對抗關係,這與人類玩家的經驗相符,而不需要特定的遊戲知識。該方法依賴於一種簡單的技術來增強離散表示中的碼本利用率,通過確定性的向量量化過程針對極小狀態空間。該框架已在流行的在線遊戲如《帝國時代II》、《爐石傳說》、《荒野亂鬥》和《英雄聯盟》中得到驗證,其觀察到的強度關係準確性與傳統的成對勝利價值預測相當,同時也提供了更易於管理的複雜性進行分析。