WikiEdge:ArXiv-2409.07219v1/terms

出自WikiEdge
跳至導覽 跳至搜尋
編輯

這篇文章的術語表如下:

  • 均場控制(Mean Field Control):均場控制問題考慮在均場(或McKean-Vlasov)動力學下的最優控制問題,其中控制過程影響狀態過程的分佈。
  • 時間不一致性(Time-Inconsistency):當一個決策者在不同時間點可能做出不同的最優選擇,即使初始條件和目標函數未發生變化,這種現象稱為時間不一致性。
  • 共同噪聲(Common Noise):在多智能體系統中,如果存在一個影響所有智能體的隨機因素,這個隨機因素被稱為共同噪聲。
  • 非指數折扣(Non-exponential Discount):在決策過程中,未來收益或成本的當前價值不是通過指數函數來計算的折扣方式。
  • 閉環策略(Closed-loop Strategy):閉環策略是指控制規則依賴於當前狀態的策略,它不需要知道整個狀態的歷史路徑。
  • 隨機最大原則(Stochastic Maximum Principle):隨機最大原則是解決受隨機擾動影響的最優控制問題的一種方法,它將隨機過程的動態與最優控制理論結合起來。
  • 動態規劃原理(Dynamic Programming Principle):動態規劃原理是一種解決多階段決策過程最優化問題的方法,它通過將問題分解為一系列簡單的子問題來逐步求解。
  • Wasserstein空間(Wasserstein Space):Wasserstein空間是概率測度構成的度量空間,其中的度量是基於概率測度之間的Wasserstein距離
  • 非局部Riccati方程(Non-local Riccati Equation):非局部Riccati方程是一類包含狀態和控制的動態系統的方程,其特點是方程中包含對狀態和控制的非局部(即在整個時間區間上)依賴。
  • 主方程系統(Master Equation System):主方程系統是描述均場控制問題中閉環均衡策略和價值函數的一組方程,它提供了問題的一個等價描述。