WikiEdge:ArXiv-2409.06585v1/methods

出自WikiEdge
跳至導覽 跳至搜尋
編輯

這篇文獻的工作部分詳細介紹了如何開發和評估用於預測髖關節置換的時序圖卷積神經網絡模型(TG-CNN)。以下是這部分的主要內容:

  1. 背景與動機
    • 論文首先介紹了髖關節置換手術對改善患者生活質量的重要性,並強調了提前預測髖關節置換的可能性,包括減少疼痛、及時干預、優先手術或康復以及可能延遲關節置換需求的物理治療
  2. 方法論
    • 研究者採用了時序圖卷積神經網絡(TG-CNN)模型,通過從40至75歲患者的一級保健醫療事件代碼構建時序圖,以預測髖關節置換風險。
    • 通過年齡性別多重剝奪指數匹配髖關節置換病例和對照組,模型在9187個病例和9187個對照上進行訓練,預測一年內的髖關節置換。
    • 模型在兩個未見過的數據集上進行驗證,重新校準以處理類別不平衡問題。此外,還進行了消融研究,並與四種基線模型進行了比較。
  3. 數據收集與處理
    • 使用ResearchOne電子健康記錄(EHRs)數據,包括臨床和行政數據,涵蓋151,565名患者的記錄。
    • 對患者的EHRs進行時間窗口化處理,以預測一年內發生的髖關節置換。
    • 選擇了最常見的512個Read Codes來構建基於時序圖的EHR表示,同時包括了體質指數BMI)作為預測因子。
  4. 模型架構
    • 使用TensorFlow構建了一個定製的3D CNN Keras層,利用稀疏線性代數處理512×512×100大小的時序圖表示。
    • CNN層的輸出經過展平、批量歸一化,並與LSTM層(捕獲長期模式)、dropout層、密集層和人口統計特徵(如果包括)進行連接。
    • 最終,模型使用分類交叉熵損失和sigmoid函數針對分類目標進行優化。
  5. 評估與校準
    • 遵循TRIPOD-AI聲明報告模型開發和預測模型。
    • 在訓練集上進行5折交叉驗證以選擇超參數,並基於驗證集的平均準確率優化模型。
    • 使用10%的測試數據集進行模型重新校準,以確保預測概率與測試集中結果的真實發生率相匹配。
    • 在重新校準後,使用第二個未見過的測試集來驗證模型的性能。
  6. 結果
    • 展示了模型在訓練集和測試集上的性能,包括AUROCAUPRC和校準斜率。
    • 對不同模型變體進行了消融研究,以評估模型層、正則化技術和人口統計及處方數據的包含。
  7. 討論與結論
    • 討論了TG-CNN模型在預測髖關節置換風險方面的有效性,以及如何通過識別患者軌跡中的模式來潛在地改善對髖關節相關疾病的理解和管理。
    • 強調了模型在臨床決策支持工具開發中的潛力,包括促進信任、輔助患者-臨床醫生討論、提供個性化醫療和增強患者安全。