科学家给人工智能视觉、听觉,现在他们赋予人工智能嗅觉。22个计算机科学家团队的最新研究提出了一套能够根据不同分子的化学结构预测它们的气味的算法。
预测颜色很简单:以波长为510纳米发出光线,大多数人会说光线看起来是绿色的。然而,要想弄清楚某个特定的分子闻起来是什么味儿,可就非常困难了。22个计算机科学家团队的最新研究提出了一套能够根据不同分子的化学结构预测它们的气味的算法。这样的程序将如何得到广泛应用仍有待观察,有可能该算法可以帮助香水制造商和食品生产商设计出精确定制的新型气味。
这项最新的预测气味的研究是从纽约洛克菲勒大学的嗅觉研究者 Leslie Vosshall 和他的同事们最近的一项研究开始的,研究中49名志愿者闻了476瓶纯气味的气体并作出评价。对每一瓶气体,志愿者需要用19种描述中的一个来标记该瓶气体的气味,描述词包括“鱼”,“大蒜”,“甜的”,“烧焦的”,等等。不仅如此,他们还需要为每个气味的愉悦程度和刺激程度评级。该研究创建了一个包含研究中使用的所有气味分子的超过100万数据点的大型数据集。
2年前,计算生物学家 Pablo Meyer 还在洛克菲勒大学时,他看到了使用计算机科学预测人们如何评估气味的机会。除了在 IBM 的 Watson 研究中心工作外,Meyer 还主导了一个名为 DREAM 的挑战赛,参赛者是计算机科学家团队,挑战的主要内容是解决尚待解决的生物医学问题,例如基于临床变量预测前列腺癌治疗的结果,或基于乳房X射线成像数据检测乳腺癌。Meyer 说:“我在研究生院时就发觉了,嗅觉方面的问题仍然是很大的未知数。”尽管研究人员已经在人体中发现了大约400种不同的气味感受器,但这些气味感受器如何共同作用来区分不同的气味,这在很大程度上仍然是一个谜。
2015年,Meyer 和他的同事们成立了 DREAM 嗅觉预测挑战赛。他们将洛克菲勒研究组的数据集分为三个部分。参赛团队得到三分之二的气味的志愿者评级数据,以及产生这些气味的分子的化学结构。他们得到的还有对每个分子的超过4800个描述符,例如包含的原子,原子的排列,几何形状,等等,这些描述符组成一个超过200万数据点的单独数据集。然后参赛者使用这些数据来训练他们的计算机模型以预测这些化学结构具有的气味。剩余的数据(包括两组69个评级数据及相应的化学信息)用于测试模型预测的结果,即模型预测人类平均如何评价气味及49位志愿者中每个人如何评价气味的效果。
来自全球的22个团队参与了挑战。根据 Meyer 和他的同事今日发表在 Science 上的报告,许多团队都做得挺好,其中有两个团队的结果特别好。其中一个是密歇根大学计算机科学家 Yuanfang Guan 带领的,他们的模型在预测个体受试者如何评价气味上做到了最好。另外,由亚利桑那州立大学 Richard Gerkin 领导的另一个团队的模型在预测所有参与者平均如何评价气味上做得最好。
Meyer 说:“我们现在知道,我们可以非常具体地为气味的描述特征指定它的结构特征。”例如,具有硫基团的分子倾向于产生“大蒜味”,具有与香草醛类似的化学结构的分子,会让受试者闻到“面包一般的”气味。
Meyer 建议可以将这样的模型用于帮助香水或香料制造商合成新的分子,调整分子结构以发出特定的气味,例如檀香味或柑橘味。但是,多伦多大学生物心理学家,同时也是长期研究香水和香味的专家 Avery Gilbert, 说他不确定这个新的研究有什么作用。Gilbert 说这个新的研究有用的一点是它创造了一个非常大的数据集。但是,他说,用19种描述来形容不同的气味太过局限了。“这些属性的数量实在太少。”他说。已经有其他研究使用80个甚至更多的类别来描述不同的气味。
也就是说,即使当前的研究表明,计算机可以预测人类会用19个描述词中的哪一个来描述特定的一种气味,但假如有更多的类别,相同的人工智能程序能否做出同样好的预测尚不清楚。
Gilbert 说:“如果有不同的描述词,可能需要用不同的模型来更好地预测。所以,我不确定这些研究什么时候能实现。”也许这个挑战赛的作用主要是提醒人们,气味感知仍然是人类科学家和人工智能的一个挑战性问题。