WikiEdge:ArXiv-2409.07219v1/terms
跳转到导航
跳转到搜索
这篇文章的术语表如下:
- 均场控制(Mean Field Control):均场控制问题考虑在均场(或McKean-Vlasov)动力学下的最优控制问题,其中控制过程影响状态过程的分布。
- 时间不一致性(Time-Inconsistency):当一个决策者在不同时间点可能做出不同的最优选择,即使初始条件和目标函数未发生变化,这种现象称为时间不一致性。
- 共同噪声(Common Noise):在多智能体系统中,如果存在一个影响所有智能体的随机因素,这个随机因素被称为共同噪声。
- 非指数折扣(Non-exponential Discount):在决策过程中,未来收益或成本的当前价值不是通过指数函数来计算的折扣方式。
- 闭环策略(Closed-loop Strategy):闭环策略是指控制规则依赖于当前状态的策略,它不需要知道整个状态的历史路径。
- 随机最大原则(Stochastic Maximum Principle):随机最大原则是解决受随机扰动影响的最优控制问题的一种方法,它将随机过程的动态与最优控制理论结合起来。
- 动态规划原理(Dynamic Programming Principle):动态规划原理是一种解决多阶段决策过程最优化问题的方法,它通过将问题分解为一系列简单的子问题来逐步求解。
- Wasserstein空间(Wasserstein Space):Wasserstein空间是概率测度构成的度量空间,其中的度量是基于概率测度之间的Wasserstein距离。
- 非局部Riccati方程(Non-local Riccati Equation):非局部Riccati方程是一类包含状态和控制的动态系统的方程,其特点是方程中包含对状态和控制的非局部(即在整个时间区间上)依赖。
- 主方程系统(Master Equation System):主方程系统是描述均场控制问题中闭环均衡策略和价值函数的一组方程,它提供了问题的一个等价描述。