WikiEdge:ArXiv-2409.07219v1

出自WikiEdge
跳至導覽 跳至搜尋

本文的基本信息如下:

編輯
  • 標題:On time-inconsistent extended mean-field control problems with common noise
  • 中文標題:時間不一致的具有共同噪聲的擴展均值場控制問題研究
  • 發佈日期:2024-09-11T12:19:52+00:00
  • 作者:Zongxia Liang, Xiang Yu, Keyu Zhang
  • 分類:math.OC
  • 原文連結http://arxiv.org/abs/2409.07219v1

摘要:本文討論了一類在非指數折現下存在共同噪聲的時間不一致均場控制(MFC)問題,其中McKean-Vlasov動力學的係數依賴於狀態和控制的條件聯合分佈。我們研究了這些擴展MFC問題的閉環時間一致均衡策略,並提供了其表徵的充分必要條件。此外,我們推導了一個主方程系統,為我們的問題提供了等價表徵。然後,我們將這些結果應用於時間不一致的線性二次(LQMFC問題,利用非局部Riccati系統的解來表徵均衡策略。為了說明這些發現,提出了兩個金融應用。最後,還討論了一個非LQ的例子,其中閉環均衡策略可以被明確表徵和驗證。

章節摘要

編輯

本文研究了一類具有共同噪聲的時變不一致的均場控制(MFC)問題,這類問題在非指數折扣下存在,其中McKean-Vlasov動態的係數依賴於狀態和控制的聯合條件分佈。我們探討了這些擴展MFC問題的閉環時變一致平衡策略,並為這些策略提供了一個充分必要條件。此外,我們推導出了一個主方程系統,為我們的問題提供了等價的描述。然後我們將這些結果應用於時變不一致的線性二次(LQ)MFC問題,以非局部Riccati系統的解來表徵平衡策略。為了說明這些發現,我們提出了兩個金融應用的例子。最後,還討論了一個非LQ的例子,其中閉環平衡策略可以明確地表徵和驗證。

  1. 引言:介紹了均場控制(MFC)問題及其與均場博弈(MFG)的聯繫,以及MFC問題在不同背景下的處理方法。討論了時間一致性問題,並提出了本文研究的動機和貢獻。
  2. 問題描述:定義了符號和預備知識,包括集合和函數、積分和概率、Wasserstein空間中的微分等。提出了受控條件McKean-Vlasov SDE,並對其係數進行了假設。
  3. 閉環平衡策略的特徵:給出了閉環策略的充分必要條件,並推導出了主方程系統。證明了在一定條件下,主方程系統提供了平衡策略和值函數的等價描述。
  4. 時變不一致的LQ擴展MFC問題:專注於LQ類型的擴展MFC問題,並提供了主方程系統解的存在性。討論了兩個金融應用的例子,包括條件均值-方差投資組合選擇和具有共同噪聲的銀行系統風險模型。
  5. 非LQ MFC問題的例子:研究了一個非LQ MFC問題,其中主方程系統可以求解,閉環平衡策略可以明確地表徵和驗證。
  6. 技術證明:提供了前面章節中一些主要結果的詳細技術證明。

研究背景

編輯

這篇文獻的背景主要集中在以下幾個方面:

  1. 均場控制(Mean Field Control, MFC)問題的重要性
    • 均場控制問題,或稱為McKean-Vlasov動力學的最優控制問題,近年來因其在多個領域的廣泛應用和均場理論的新進展而受到越來越多的關注。
    • 均場博弈(Mean Field Game, MFG)問題相比,均場控制問題考慮的是合作情形,其中所有參與者共同優化社會最優解,從而實現社會規劃者的最優控制。
  2. 時間不一致性問題
    • 在現實生活中,一個決策者可能會偏離之前認為最優的決策,導致時間不一致的行為。例如,當成本函數涉及非指數折扣時,決策過程本質上是時間不一致的。
    • 為了解決時間不一致性問題,通常採用時間一致規劃下的個人間均衡方法,要求決策者考慮未來自我的行為,並通過博弈論思維尋求控制策略,以確保所選策略的時間一致性。
  3. 共同噪聲下的均場控制問題
    • 在存在共同噪聲的情況下,均場相互作用通過狀態-控制條件法則的依賴性發生。特別是,本文關注由非指數折扣引起的時間不一致性問題,並致力於在均場模型中描述閉環均衡策略。

綜上所述,這篇文獻的背景強調了在均場控制領域中對時間不一致問題的研究,以及在共同噪聲影響下的均場控制問題的複雜性。作者提出了一種新的研究方法,旨在為這類問題提供閉環均衡策略的描述和驗證。

問題與動機

編輯

作者面對的是時間不一致的均場控制(MFC)問題,特別是在存在共同噪聲非指數折扣的情況下。具體問題包括:

  1. 時間一致性問題:在非指數折扣下,決策制定本質上是時間不一致的,即今天確定的最優控制可能在未來不再是最優的。
  2. 均場控制問題的複雜性:在均場控制問題中,需要考慮所有代理(agents)共同優化社會最優解,這增加了問題的複雜性。
  3. 均場模型中的共同噪聲影響:在均場模型中,代理間的交互通過聯合狀態-控制條件法則依賴性發生,這使得問題更加複雜。

研究方法

編輯

這篇論文的工作方法主要圍繞解決時變不一致的擴展均場控制問題,特別是那些在共同噪聲影響下、非指數折扣的條件下的問題。以下是這部分的主要內容:

  1. 時變不一致性(Time-Inconsistency
    • 論文首先定義了時變不一致性的概念,即在連續時間決策框架下,一個在當前被認為是最優的控制策略,在未來可能不再是最優的。
  2. 擴展均場控制(Extended Mean-Field Control, MFC)
    • 研究了一類在共同噪聲影響下的MFC問題,這些問題的特點是狀態和控制的係數依賴於狀態和控制的條件聯合分佈。
  3. 閉環時間一致性均衡策略(Closed-Loop Time-Consistent Equilibrium Strategies
    • 論文提出了閉環時間一致性均衡策略的概念,並為這些擴展MFC問題提供了一個充分必要條件,用以表徵這些策略。
  4. 主方程系統(Master Equation System
    • 導出了一個主方程系統,該系統為問題提供了一個等價的表徵,並且可以用來推導出閉環均衡策略和相應的價值函數。
  5. 線性二次型(Linear Quadratic, LQ)MFC問題
    • 將上述結果應用於時變不一致的LQ MFC問題,並以非局部Riccati方程系統的形式表徵了均衡策略。
  6. 金融應用案例(Financial Applications
    • 通過兩個金融應用案例,即條件均值-方差投資組合選擇和帶有共同噪聲的銀行系統性風險模型,來說明理論結果,並討論了得到的均衡策略的金融含義。
  7. 非LQ型MFC問題(Non-LQ MFC Problem
    • 研究了一個非LQ MFC問題,其中主方程系統可以被求解,閉環均衡策略可以被明確表徵和驗證。

研究結論

編輯

根據提供的文獻內容,這篇論文的主要結論可以概括如下:

  1. 時間一致性均衡策略的刻畫:論文針對帶有共同噪聲的時變不一致均場控制問題,提出了閉環時間一致性均衡策略,並給出了這類策略的特徵化條件。
  2. 主方程系統:研究者推導出了一個主方程系統,該系統為均場模型中的閉環均衡策略和相應的價值函數提供了等價的刻畫。
  3. 非局部Riccati系統的建立:在時變不一致線性二次型均場控制問題的框架下,論文建立了一個非局部Riccati方程系統,並證明了該系統解的存在性。
  4. 金融應用實例:通過兩個金融應用實例——條件均值-方差投資組合選擇和帶有共同噪聲的銀行間系統性風險模型,論文展示了理論結果的應用,並討論了得到的均衡策略的金融含義。
  5. 非線性二次型均場控制問題:論文還研究了一個非線性二次型均場控制問題,其中主方程系統可以被求解,閉環均衡策略可以被明確地刻畫和驗證。

術語表

編輯

這篇文章的術語表如下:

  • 均場控制(Mean Field Control):均場控制問題考慮在均場(或McKean-Vlasov)動力學下的最優控制問題,其中控制過程影響狀態過程的分佈。
  • 時間不一致性(Time-Inconsistency):當一個決策者在不同時間點可能做出不同的最優選擇,即使初始條件和目標函數未發生變化,這種現象稱為時間不一致性。
  • 共同噪聲(Common Noise):在多智能體系統中,如果存在一個影響所有智能體的隨機因素,這個隨機因素被稱為共同噪聲。
  • 非指數折扣(Non-exponential Discount):在決策過程中,未來收益或成本的當前價值不是通過指數函數來計算的折扣方式。
  • 閉環策略(Closed-loop Strategy):閉環策略是指控制規則依賴於當前狀態的策略,它不需要知道整個狀態的歷史路徑。
  • 隨機最大原則(Stochastic Maximum Principle):隨機最大原則是解決受隨機擾動影響的最優控制問題的一種方法,它將隨機過程的動態與最優控制理論結合起來。
  • 動態規劃原理(Dynamic Programming Principle):動態規劃原理是一種解決多階段決策過程最優化問題的方法,它通過將問題分解為一系列簡單的子問題來逐步求解。
  • Wasserstein空間(Wasserstein Space):Wasserstein空間是概率測度構成的度量空間,其中的度量是基於概率測度之間的Wasserstein距離
  • 非局部Riccati方程(Non-local Riccati Equation):非局部Riccati方程是一類包含狀態和控制的動態系統的方程,其特點是方程中包含對狀態和控制的非局部(即在整個時間區間上)依賴。
  • 主方程系統(Master Equation System):主方程系統是描述均場控制問題中閉環均衡策略和價值函數的一組方程,它提供了問題的一個等價描述。