编译 | 曾全晨
审稿 | 王建民
今天为大家介绍的是来自Joel D. Mainland和 Alexander B. Wiltschko团队的一篇论文。将分子结构映射到气味感知是嗅觉领域的一个关键挑战。作者使用图神经网络生成了一个气味映射(POM)方法,它保留了感知关系并能够对先前未经表征的气味进行气味质量预测。该模型在描述气味质量方面与人类一样可靠。通过应用简单、可解释、理论基础的转换,POM在几个其他气味预测任务上优于化学信息学模型,表明POM成功地编码了结构-气味关系的广义映射。这种方法广泛地实现了气味预测,并为数字化气味铺平了道路。
神经科学中的一个基本问题是将刺激的物理特性映射到感知特征。在视觉中,波长映射到颜色;在听觉中,频率映射到音调。相比之下,化学结构到嗅觉感知的映射尚不清楚。同样,为了更好地理解嗅觉编码,嗅觉领域需要一个更好的映射。气味感知与气味分子结构之间的关系充满了不连续性;这可以通过Sell三元组来说明,这是一组分子的三个成员,在这组分子中,结构相似的一对与感知相似的一对几乎不同(图1A)。分子的结构-气味关系中的这些不连续性表明,在最近的气味建模工作中使用的标准化学信息学表示法——如功能团计数、物理性质、分子指纹等——是不足以映射气味空间的。
图 1
气味映射表示感知距离和层次关系
为了生成与气味相关的分子表示,作者构建了一种信息传递神经网络(Message Passing Neural Network,MPNN),它是一种特定类型的图神经网络(Graph Neural Network,GNN),用于将化学结构映射到气味感知中。每个分子被表示为一个图,每个原子由其价态、度、氢原子数、杂化、形式电荷和原子序数来描述。每个键由其度、芳香性和是否位于环中来描述。与传统的指纹技术(fingerprinting techniques)不同,传统技术在一定键半径范围内为所有分子片段分配相等的权重,而图神经网络可以为气味特定应用优化片段权重。作者使用图神经网络的最终层来直接预测气味特性,使用模型的倒数第二层作为主要气味映射(Principal Odor Map,POM)。这个POM可以(i)呈现了已知的感知层次和距离,(ii)扩展到了样本外(以下简称为“新颖”)的气味,(iii)对结构-气味距离中的不连续性保持稳健性,(iv)推广到其他嗅觉任务。作者精选了一个包含约5000种分子的参考数据集,每个分子都由多个气味标签(如奶油、草木的气味)来描述,通过结合Good Scents(GS)和Leffingwell & Associates(LF)风味和香味数据库来创建(图1B)。作者展示了在交叉验证集上AUROC最高的模型的结果(AUROC = 0.89)。此外,作者展示了在Morgan指纹(fingerprint)基础上的气味空间的结构丧失了(图1E),而气味映射保留了相对感知距离和层次关系(图1F)。
模型在前瞻性验证任务中表现优于中位数的评审员
为了测试模型是否适用于新的气味物质,作者设计了一个前瞻性验证挑战,通过将模型的预测性能与个体人类评审员进行基准测试。在嗅觉领域,没有可靠的测量气味感知的仪器方法,经过训练的人类感官小组是气味表征的黄金标准。气味感知在不同个体之间存在变异性,但是组平均的气味评分在重复测量中是稳定的,并且代表我们建立新的气味物质的实际气味特征的最佳方法。作者训练了一组被试,使用“rate-all-that-apply”(RATA)方法和一个55词的气味词汇表来描述他们对气味物质的感知。在培训过程中,词汇表中的每个术语都与视觉和气味参考相配对。仅邀请在20种常见气味物质的预测试中达到性能标准的受试者加入评审小组。为了避免琐碎的测试情况,作者对400种新气味物质的集合应用了以下选择标准:(i)分子在结构上必须彼此不同;(ii)分子应涵盖最广泛的气味标签范围;(iii)分子在结构或感知上必须与任何训练示例不同。在400个分子中,有77个由于不达标准而从最终的前瞻性验证集中删除。作者在剩余的323个分子上评估了模型的性能。为了衡量模型的性能,作者将其归一化的预测与归一化的评审员均值评分进行了比较(图2中的A和C)。图2为单一分子的原始评分和预测示例,代表了相对GNN和随机森林(RF)性能以及评审员评分趋势。虽然在个体评审员和模型在匹配评审员均值评分的能力方面存在很大的分子间差异,但模型输出在53%的分子上比中位数的评审员更接近评审员均值(图2中的E和F)。值得注意的是,评审员在对每种气味评分时都能闻到气味,而模型的预测仅基于分子结构。
图 2
作为基准比较,作者在相同的数据集上训练了一个基于计数指纹(cFP)的RF模型(图2B)。这个基准模型仅在41%的分子中超过了中位数的评审员。GNN模型在总体上展现了与人类水平相当的性能。当按气味标签细分性能时,模型在除麝香以外的所有标签中都在人类评审员的分布范围内。这种按标签的视角表明,GNN模型在除麝香以外的所有标签上均优于先前的在相同数据上训练的最先进模型。对于给定的标签,预测性能取决于该标签的结构-气味映射的复杂性。因此,模型对于描述有明显结构决定因素(例如大蒜的含硫化合物和腥的胺类化合物)的标签(如大蒜和鱼腥)表现最佳,而对于麝香等标签表现最差,因为麝香包含至少五个不同的结构类别(大环、多环、硝基、类固醇型和直链型)。相反,评审员对于给定标签的表现取决于他们在气味背景下对该标签的熟悉程度。因此观察到对于描述常见食物气味(如坚果、大蒜和奶酪)的标签,评审员之间存在较强的一致性,而对于麝香和干草等标签,一致性较弱。模型的性能还取决于给定标签的训练示例数量;有足够多的示例,模型甚至可以学习复杂的结构-感知关系。通常情况下模型对于拥有许多训练示例的标签的性能很高(图3B),但对于训练示例较少的标签,性能要么很高(如鱼腥),要么很低(如臭氧)。
图 3
POM的扩展能力
图 4
图 5
为了测试POM是否能够在结构-气味距离的不连续性下保持稳健性,作则会设计了一个额外的挑战,其中构建了41个新的三元组(图4A和B),并由评审员进行验证(与图1A和4C相同)。在每个三元组中,锚定分子是已知的气味物质,并与一个结构相似的新颖气味物质和一个结构不相似的新颖气味物质配对,其中结构不相似的气味物质在两者中对于锚定分子来说更感知相似。为了可视化模型的内部逻辑,作者对分子中的每个节点进行了小的更改,并观察哪些扰动对模型预测产生了较大的影响;在具有较深红色突出显示的节点中的扰动影响较大(图4A)。显性相似性评分在90%的三元组中与气味配置距离一致(图4D)。模型在50%的情况下正确预测了这种逆直觉的结构-气味关系(图4E),而RF模型在81%的情况下失败(图4F)。
可靠的结构-气味映射使我们能够大规模地探索气味空间。作者编制了一个约50万个潜在气味物质的列表,这些物质的经验性性质对科学或工业来说目前是未知的,大多数之前从未被合成过。由于分子在POM中的坐标可以直接从模型计算得出,因此可以在POM中绘制这些潜在气味物质(图5A),揭示了一个可能的气味分子空间,该空间比目前的香水目录要大得多。使用训练过的人类评审员连续嗅闻时间需要大约70人年才能收集这些分子的数据。作者展示了POM的有意义解释,通过提取直观的几何测量,并将其映射到几个嗅觉预测任务(图5B)。任何一组气味描述符的适用性都对应于将POM坐标投影到与这些描述符相对应的轴上;气味强度(可检测性)对应于该投影的大小,气味相似性对应于不同分子的此类投影之间的距离。应用于POM的简单线性模型使用这些几何解释,在多个已发布的数据集中,与化学信息学支持向量机(SVM)模型相比,在气味的多个特征方面都具有可比或更高的性能(图5,C至E)。
结论
目前我们尚未普遍接受一种方法来量化和分类气味感知。在这里,作者提出并验证了一个基于数据驱动的、高维度的人类嗅觉映射模型。该映射重新呈现了由单一分子引发的气味感知类别的结构和关系。它在气味描述方面具有前瞻性的预测准确性,超过了个体人类预测,而且它可以广泛地应用于各项嗅觉感知任务中。
参考资料
Brian K. Lee et al. ,A principal odor map unifies diverse tasks in olfactory perception. Science3 81,999-1006(2023).
DOI:10.1126/science.ade4401