WikiEdge:BioRxiv-2022.09.01.504602

出自WikiEdge
跳至導覽 跳至搜尋
  • 標題:A Principal Odor Map Unifies Diverse Tasks in Human Olfactory Perception
  • 中文標題:一個主要的氣味地圖統一了人類嗅覺感知中的多種任務
  • 發佈日期:2022-09-03
  • 作者:Lee, B. K.; Mayhew, E. E.; Sanchez-Lengeling, B.; Wei, J. N.; Qian, W. W.; Little, K.; Andres, M.; Nguyen, B. B.; Moloy, T.; Parker, J. K.; Gerkin, R. C.; Mainland, J. D.; Wiltschko, A. B.
  • 分類:neuroscience
  • 原文連結https://www.biorxiv.org/content/10.1101/2022.09.01.504602

摘要:將分子結構映射到氣味感知是嗅覺研究的一個關鍵挑戰。在這裏,我們使用圖神經網絡(GNN)生成一個主要氣味地圖(POM),該地圖保留了感知關係,並使得對新的氣味物質的氣味質量進行預測成為可能。該模型在描述氣味質量上與人類一樣可靠:在一個包含400種新氣味物質的預測驗證集上,模型生成的氣味剖面比訓練小組的平均值(n=15)更接近中位數的小組成員。通過應用簡單、可解釋、理論根源的轉換,POM在其他幾個氣味預測任務上超過了化學信息模型,表明POM成功地編碼了結構-氣味關係的一般化地圖。這種方法廣泛地使氣味預測成為可能,並為數碼化氣味鋪平了道路。 一句話總結:氣味地圖實現了人類級別的氣味描述性能,並推廣到多種氣味預測任務。

問題與動機

作者的研究問題包括:

  • 如何將分子結構映射到氣味感知上,這是嗅覺領域的一個關鍵挑戰。
  • 如何生成一個能夠保留感知關係並用於新氣味分子氣味質量預測的主氣味圖(Principal Odor Map, POM)。
  • 如何確保模型在描述氣味質量時與人類評價者一樣可靠。
  • 如何應用簡單、可解釋且理論上有根據的轉換,來超越現有的化學信息學模型在多種氣味預測任務上的表現。
  • 如何確保模型能夠泛化到其他嗅覺任務上,並且對結構-氣味關係中的不連續性具有魯棒性。
  • 如何通過前瞻性驗證測試,評估模型在預測新氣味分子時的表現。
  • 如何處理化學材料中的雜質對氣味感知的影響,以及這些雜質對模型性能的影響。
  • 如何利用POM探索未知的氣味空間,並預測潛在的氣味分子。
  • 如何將POM應用於多種氣味預測任務,並與現有的化學信息學模型進行比較。

背景介紹

這篇文獻的背景主要集中在以下幾個方面:

  1. 人類嗅覺感知的分子結構映射
    • 將分子結構映射到氣味感知是嗅覺領域的一個關鍵挑戰。
    • 視覺聽覺領域中較為直接的物理屬性到感知特性的映射不同,化學結構到嗅覺感知的映射存在許多不連續性。
    • 傳統的化學信息學方法,如功能團計數、物理性質、分子指紋等,在描述氣味空間方面存在不足。
  2. 圖神經網絡在氣味感知建模中的應用
    • 通過構建消息傳遞神經網絡(MPNN),一種特定類型的圖神經網絡(GNN),可以將化學結構映射到氣味感知。
    • GNN能夠優化分子片段權重,以適應特定氣味應用,與傳統的指紋技術相比,能夠更好地捕捉氣味相關的特徵。
    • 神經網絡已經在多個感知領域(如自然圖像、面部和聲音)中實現了預測建模的突破,並自然地產生輸入數據的高維、數據驅動的中間表示。
  3. 主氣味圖(POM)的構建與驗證
    • 通過訓練模型,生成一個主氣味圖(POM),它能夠保留感知關係,並實現對新氣味物質的氣味質量預測。
    • POM在多個氣味預測任務上的表現超過了化學信息學模型,表明它成功編碼了一個泛化的結構-氣味關係圖。
    • 該方法不僅能夠預測氣味,還為氣味的數碼化鋪平了道路。

章節摘要

這篇論文是關於人類嗅覺感知圖神經網絡模型研究,其主要內容可以概括如下:

  1. 引言
  2. 結果
    • 構建了一個消息傳遞神經網絡(MPNN),用於將化學結構映射到氣味感知。
    • 該模型(稱為「主要氣味地圖」或POM)在預測氣味質量方面與人類評價者一樣可靠。
    • POM在多個氣味預測任務上超越了現有的化學信息學模型。
  3. 方法論
    • 為了訓練模型,研究者們匯總了約5000個分子的參考數據集,每個分子都有多個氣味標籤。
    • 模型通過跨驗證預測性能達到了高準確度。
  4. 實驗與驗證
  5. 討論
    • 提出了一種新的、數據驅動的人類嗅覺高維地圖,並驗證了其有效性。
    • 討論了該模型在實際應用中的潛在影響,以及如何通過增加訓練數據來提高模型性能。
  6. 結論
    • 該研究提出的POM為氣味和分子空間之間的關係提供了一個直觀、可解釋的地圖。
    • 該地圖不僅在描述氣味方面達到了人類水平的表現,而且可以推廣到其他多種嗅覺任務。

研究方法

這篇論文通過構建圖神經網絡(GNN)模型來探索分子結構氣味感知之間的關係。以下是該研究方法論的主要組成部分:

  1. 圖神經網絡(GNN)
    • 構建了一個消息傳遞神經網絡(MPNN),這是一種特定類型的圖神經網絡(GNN),用於將化學結構映射到氣味感知。
    • 分子中的每個原子通過其價電子、度數、氫原子計數、雜化狀態、形式電荷和原子序數來描述。
    • 每個鍵通過其度數、芳香性和是否在環中來描述。
    • GNN通過優化片段權重來為氣味特定應用調整,與傳統的分子指紋技術不同。
  2. 數據集構建
    • 通過結合GoodscentsLeongwell的香料和香水數據庫,創建了一個包含約5000個分子的參考數據集,每個分子都有多個氣味標籤。
    • 模型在交叉驗證預測性能上達到了AUROC=0.89。
  3. 氣味預測任務
    • 使用GNN的最後一層直接預測氣味質量,而倒數第二層作為主要氣味地圖(POM)。
    • POM旨在忠實地表示已知的感知層次結構和距離,擴展到新的氣味分子,並在結構-氣味距離的不連續性上具有魯棒性。
  4. 模型驗證
    • 設計了一個前瞻性驗證挑戰,將模型預測性能與個別人類評估者進行比較。
    • 訓練一組受試者使用Rate-All-That-Apply方法(RATA)和55個詞彙的氣味詞典來描述他們的氣味感知。
    • 對400個新氣味分子進行了測試,以評估模型在沒有重新訓練的情況下的性能。
  5. 質量控制(QC)
  6. 模型泛化能力測試
    • 設計了一個額外的挑戰,構建了41個新的三元組,測試模型對結構-氣味不連續性的處理能力。
    • 通過人類評估者對三元組中分子之間的感知距離進行評分,驗證了模型的預測。
  7. 氣味空間探索
    • 利用POM坐標,將大約500,000個潛在氣味分子繪製在POM中,揭示了一個比當前香料目錄大得多的潛在氣味分子空間。
    • 展示了POM在多個氣味預測任務中的有效性,包括氣味可檢測性、相似性和描述符適用性的預測。

這篇論文的方法論分析結果表明,通過使用GNN模型,研究者能夠創建一個能夠以人類水平描述氣味並泛化到多種氣味預測任務的主要氣味地圖(POM),為氣味預測和數碼化鋪平了道路。

研究結論

根據提供的文獻內容,這篇論文的主要結論可以概括如下:

  1. 構建了一種新的氣味感知模型:使用圖神經網絡(GNN)生成了一種名為「主氣味地圖」(Principal Odor Map, POM)的模型,該模型能夠保留感知關係,並能夠預測新氣味分子的氣味質量。
  2. 模型的可靠性與人類描述相當:在對400種新氣味分子的前瞻性驗證集上,模型生成的氣味剖面與訓練小組的平均值(n=15)的匹配度比中位數小組成員更高。
  3. 模型在多種氣味預測任務上表現優異:通過對模型應用簡單、可解釋且理論上有根據的轉換,POM在多個其他氣味預測任務上的表現超過了化學信息學模型,表明POM成功編碼了結構-氣味關係的通用映射。
  4. 模型泛化能力強:POM不僅能夠忠實地表示已知的感知層次結構和距離,還能擴展到新的氣味分子,並且對結構-氣味距離的不連續性具有魯棒性,同時能夠泛化到其他嗅覺任務。
  5. 模型預測性能強:在所有測試的氣味標籤中,模型在58%的標籤上超過了中位數小組成員的表現,並且在具有明確結構決定因素的氣味標籤(如大蒜和魚腥味)上表現最佳。
  6. 模型對化學類別的處理相對均勻:無論是小組成員還是模型,在處理含硫分子等化學類別時表現最為強勁。
  7. 模型對不連續性的處理能力:通過設計額外的挑戰,證明了POM能夠克服結構-氣味關係中的不連續性。
  8. 模型在大規模氣味空間探索中的應用潛力:通過POM,研究者能夠探索一個包含約500,000種潛在氣味分子的氣味空間,這比當前香水目錄所覆蓋的空間要大得多。
  9. 模型的實用性和局限性:模型在預測有機分子的氣味方面表現強勁,但不包括鹵化物或包含新元素的分子,且需要定期重新訓練以納入新數據。

這些結論展示了POM作為一種新的工具,不僅能夠以人類水平的性能描述氣味,還能夠泛化到其他多種嗅覺任務,為化學、嗅覺神經科學心理物理學領域的研究者提供了新的研究工具。

術語表

這篇文章的術語表如下:

  • 圖神經網絡(Graph Neural Networks, GNN):一種用於處理圖結構數據的深度學習模型,能夠學習分子結構到氣味感知的映射。
  • 主氣味圖(Principal Odor Map, POM):通過圖神經網絡生成的,能夠保留感知關係並用於預測新氣味分子氣味質量的模型。
  • 信息傳遞神經網絡(Message Passing Neural Network, MPNN):一種特定類型的圖神經網絡,用於將化學結構映射到氣味感知。
  • 氣味描述(Odor Description):人類對氣味特性的描述,通常通過訓練有素的小組進行評估。
  • 氣味強度(Odor Intensity):氣味的強度或濃度,影響氣味特性。
  • 氣味檢測閾值(Odor Detection Threshold):能夠檢測到氣味的最低濃度。
  • 氣味相似性(Perceptual Similarity):不同分子氣味之間的相似度。
  • 氣味標籤(Odor Labels):用於描述氣味特性的詞彙,如「奶油味」、「草味」等。
  • 氣味空間(Olfactory Space):所有可能的氣味組成的空間,包括已知和未知的氣味。
  • 氣味預測任務(Odor Prediction Tasks):使用模型預測氣味特性的任務,如氣味檢測閾值、相似性和描述符適用性。
  • 氣味感知(Olfactory Perception):人類對氣味的感知能力,涉及大腦對氣味分子的反應。
  • 氣味質量(Odor Quality):氣味的特性,如香味、臭味等。
  • 氣味譜(Odor Profile):描述特定分子氣味特性的集合。
  • 氣味描述性能(Odor Description Performance):模型或人類在描述氣味時的準確性和可靠性。
  • 氣味預測模型(Odor Prediction Model):用於預測氣味特性的計算模型。
  • 氣味感知距離(Perceptual Distance):在感知空間中,兩個氣味之間的距離。
  • 氣味等級(Odor Hierarchy):氣味之間的層級關係,如某些氣味是其他氣味的子類。
  • 氣味類別(Odor Category):根據氣味特性將氣味分組的分類。
  • 氣味強度平衡(Intensity-Balanced):氣味樣本在強度上的平衡,確保測試的一致性。
  • 氣味污染(Odor Contamination):化學物質中的雜質對氣味感知的影響。
  • 氣味描述一致性(Odor Description Consistency):不同個體或模型在描述同一氣味時的一致程度。