WikiEdge:BioRxiv-2022.09.01.504602
跳转到导航
跳转到搜索
- 标题:A Principal Odor Map Unifies Diverse Tasks in Human Olfactory Perception
- 中文标题:一个主要的气味地图统一了人类嗅觉感知中的多种任务
- 发布日期:2022-09-03
- 作者:Lee, B. K.; Mayhew, E. E.; Sanchez-Lengeling, B.; Wei, J. N.; Qian, W. W.; Little, K.; Andres, M.; Nguyen, B. B.; Moloy, T.; Parker, J. K.; Gerkin, R. C.; Mainland, J. D.; Wiltschko, A. B.
- 分类:neuroscience
- 原文链接:https://www.biorxiv.org/content/10.1101/2022.09.01.504602
摘要:将分子结构映射到气味感知是嗅觉研究的一个关键挑战。在这里,我们使用图神经网络(GNN)生成一个主要气味地图(POM),该地图保留了感知关系,并使得对新的气味物质的气味质量进行预测成为可能。该模型在描述气味质量上与人类一样可靠:在一个包含400种新气味物质的预测验证集上,模型生成的气味剖面比训练小组的平均值(n=15)更接近中位数的小组成员。通过应用简单、可解释、理论根源的转换,POM在其他几个气味预测任务上超过了化学信息模型,表明POM成功地编码了结构-气味关系的一般化地图。这种方法广泛地使气味预测成为可能,并为数字化气味铺平了道路。 一句话总结:气味地图实现了人类级别的气味描述性能,并推广到多种气味预测任务。
问题与动机
作者的研究问题包括:
- 如何将分子结构映射到气味感知上,这是嗅觉领域的一个关键挑战。
- 如何生成一个能够保留感知关系并用于新气味分子气味质量预测的主气味图(Principal Odor Map, POM)。
- 如何确保模型在描述气味质量时与人类评价者一样可靠。
- 如何应用简单、可解释且理论上有根据的转换,来超越现有的化学信息学模型在多种气味预测任务上的表现。
- 如何确保模型能够泛化到其他嗅觉任务上,并且对结构-气味关系中的不连续性具有鲁棒性。
- 如何通过前瞻性验证测试,评估模型在预测新气味分子时的表现。
- 如何处理化学材料中的杂质对气味感知的影响,以及这些杂质对模型性能的影响。
- 如何利用POM探索未知的气味空间,并预测潜在的气味分子。
- 如何将POM应用于多种气味预测任务,并与现有的化学信息学模型进行比较。
背景介绍
这篇文献的背景主要集中在以下几个方面:
- 人类嗅觉感知的分子结构映射:
- 图神经网络在气味感知建模中的应用:
- 主气味图(POM)的构建与验证:
- 通过训练模型,生成一个主气味图(POM),它能够保留感知关系,并实现对新气味物质的气味质量预测。
- POM在多个气味预测任务上的表现超过了化学信息学模型,表明它成功编码了一个泛化的结构-气味关系图。
- 该方法不仅能够预测气味,还为气味的数字化铺平了道路。
章节摘要
这篇论文是关于人类嗅觉感知的图神经网络模型研究,其主要内容可以概括如下:
- 引言:
- 结果:
- 构建了一个消息传递神经网络(MPNN),用于将化学结构映射到气味感知。
- 该模型(称为“主要气味地图”或POM)在预测气味质量方面与人类评价者一样可靠。
- POM在多个气味预测任务上超越了现有的化学信息学模型。
- 方法论:
- 为了训练模型,研究者们汇总了约5000个分子的参考数据集,每个分子都有多个气味标签。
- 模型通过跨验证预测性能达到了高准确度。
- 实验与验证:
- 讨论:
- 提出了一种新的、数据驱动的人类嗅觉高维地图,并验证了其有效性。
- 讨论了该模型在实际应用中的潜在影响,以及如何通过增加训练数据来提高模型性能。
- 结论:
- 该研究提出的POM为气味和分子空间之间的关系提供了一个直观、可解释的地图。
- 该地图不仅在描述气味方面达到了人类水平的表现,而且可以推广到其他多种嗅觉任务。
研究方法
这篇论文通过构建图神经网络(GNN)模型来探索分子结构与气味感知之间的关系。以下是该研究方法论的主要组成部分:
- 图神经网络(GNN):
- 构建了一个消息传递神经网络(MPNN),这是一种特定类型的图神经网络(GNN),用于将化学结构映射到气味感知。
- 分子中的每个原子通过其价电子、度数、氢原子计数、杂化状态、形式电荷和原子序数来描述。
- 每个键通过其度数、芳香性和是否在环中来描述。
- GNN通过优化片段权重来为气味特定应用调整,与传统的分子指纹技术不同。
- 数据集构建:
- 通过结合Goodscents和Leongwell的香料和香水数据库,创建了一个包含约5000个分子的参考数据集,每个分子都有多个气味标签。
- 模型在交叉验证预测性能上达到了AUROC=0.89。
- 气味预测任务:
- 使用GNN的最后一层直接预测气味质量,而倒数第二层作为主要气味地图(POM)。
- POM旨在忠实地表示已知的感知层次结构和距离,扩展到新的气味分子,并在结构-气味距离的不连续性上具有鲁棒性。
- 模型验证:
- 设计了一个前瞻性验证挑战,将模型预测性能与个别人类评估者进行比较。
- 训练一组受试者使用Rate-All-That-Apply方法(RATA)和55个词汇的气味词典来描述他们的气味感知。
- 对400个新气味分子进行了测试,以评估模型在没有重新训练的情况下的性能。
- 质量控制(QC):
- 对50个刺激物进行了气相色谱-质谱(GC-MS)和气相色谱-嗅觉测定(GC-O)质量控制程序,以匹配气味感知与其因果分子。
- 根据QC结果,对模型性能的影响进行了评估。
- 模型泛化能力测试:
- 设计了一个额外的挑战,构建了41个新的三元组,测试模型对结构-气味不连续性的处理能力。
- 通过人类评估者对三元组中分子之间的感知距离进行评分,验证了模型的预测。
- 气味空间探索:
- 利用POM坐标,将大约500,000个潜在气味分子绘制在POM中,揭示了一个比当前香料目录大得多的潜在气味分子空间。
- 展示了POM在多个气味预测任务中的有效性,包括气味可检测性、相似性和描述符适用性的预测。
这篇论文的方法论分析结果表明,通过使用GNN模型,研究者能够创建一个能够以人类水平描述气味并泛化到多种气味预测任务的主要气味地图(POM),为气味预测和数字化铺平了道路。
研究结论
根据提供的文献内容,这篇论文的主要结论可以概括如下:
- 构建了一种新的气味感知模型:使用图神经网络(GNN)生成了一种名为“主气味地图”(Principal Odor Map, POM)的模型,该模型能够保留感知关系,并能够预测新气味分子的气味质量。
- 模型的可靠性与人类描述相当:在对400种新气味分子的前瞻性验证集上,模型生成的气味剖面与训练小组的平均值(n=15)的匹配度比中位数小组成员更高。
- 模型在多种气味预测任务上表现优异:通过对模型应用简单、可解释且理论上有根据的转换,POM在多个其他气味预测任务上的表现超过了化学信息学模型,表明POM成功编码了结构-气味关系的通用映射。
- 模型泛化能力强:POM不仅能够忠实地表示已知的感知层次结构和距离,还能扩展到新的气味分子,并且对结构-气味距离的不连续性具有鲁棒性,同时能够泛化到其他嗅觉任务。
- 模型预测性能强:在所有测试的气味标签中,模型在58%的标签上超过了中位数小组成员的表现,并且在具有明确结构决定因素的气味标签(如大蒜和鱼腥味)上表现最佳。
- 模型对化学类别的处理相对均匀:无论是小组成员还是模型,在处理含硫分子等化学类别时表现最为强劲。
- 模型对不连续性的处理能力:通过设计额外的挑战,证明了POM能够克服结构-气味关系中的不连续性。
- 模型在大规模气味空间探索中的应用潜力:通过POM,研究者能够探索一个包含约500,000种潜在气味分子的气味空间,这比当前香水目录所覆盖的空间要大得多。
- 模型的实用性和局限性:模型在预测有机分子的气味方面表现强劲,但不包括卤化物或包含新元素的分子,且需要定期重新训练以纳入新数据。
这些结论展示了POM作为一种新的工具,不仅能够以人类水平的性能描述气味,还能够泛化到其他多种嗅觉任务,为化学、嗅觉神经科学和心理物理学领域的研究者提供了新的研究工具。
术语表
这篇文章的术语表如下:
- 图神经网络(Graph Neural Networks, GNN):一种用于处理图结构数据的深度学习模型,能够学习分子结构到气味感知的映射。
- 主气味图(Principal Odor Map, POM):通过图神经网络生成的,能够保留感知关系并用于预测新气味分子气味质量的模型。
- 信息传递神经网络(Message Passing Neural Network, MPNN):一种特定类型的图神经网络,用于将化学结构映射到气味感知。
- 气味描述(Odor Description):人类对气味特性的描述,通常通过训练有素的小组进行评估。
- 气味强度(Odor Intensity):气味的强度或浓度,影响气味特性。
- 气味检测阈值(Odor Detection Threshold):能够检测到气味的最低浓度。
- 气味相似性(Perceptual Similarity):不同分子气味之间的相似度。
- 气味标签(Odor Labels):用于描述气味特性的词汇,如“奶油味”、“草味”等。
- 气味空间(Olfactory Space):所有可能的气味组成的空间,包括已知和未知的气味。
- 气味预测任务(Odor Prediction Tasks):使用模型预测气味特性的任务,如气味检测阈值、相似性和描述符适用性。
- 气味感知(Olfactory Perception):人类对气味的感知能力,涉及大脑对气味分子的反应。
- 气味质量(Odor Quality):气味的特性,如香味、臭味等。
- 气味谱(Odor Profile):描述特定分子气味特性的集合。
- 气味描述性能(Odor Description Performance):模型或人类在描述气味时的准确性和可靠性。
- 气味预测模型(Odor Prediction Model):用于预测气味特性的计算模型。
- 气味感知距离(Perceptual Distance):在感知空间中,两个气味之间的距离。
- 气味等级(Odor Hierarchy):气味之间的层级关系,如某些气味是其他气味的子类。
- 气味类别(Odor Category):根据气味特性将气味分组的分类。
- 气味强度平衡(Intensity-Balanced):气味样本在强度上的平衡,确保测试的一致性。
- 气味污染(Odor Contamination):化学物质中的杂质对气味感知的影响。
- 气味描述一致性(Odor Description Consistency):不同个体或模型在描述同一气味时的一致程度。