诺贝尔化学奖,为何也青睐人工智能? | 新京报专栏

▲戴维·贝克、德米斯·哈萨比斯和约翰·江珀。图/诺贝尔奖委员会官网

2024年的诺贝尔化学奖,也给了人工智能。

10月9日,瑞典皇家科学院宣布将本年度诺贝尔化学奖授予三位科学家,其中,一半授予美国华盛顿大学的戴维·贝克,以表彰其在计算蛋白质设计方面的贡献,另一半则共同授予英国伦敦谷歌旗下人工智能公司“深层思维”的德米斯·哈萨比斯和约翰·江珀,以表彰其在蛋白质结构预测方面的贡献。

无论贝克的蛋白质设计发明,还是哈萨比斯和江珀的蛋白质测定的发现,都极大地开拓了人类对蛋白质的认知。蛋白质不只是生命的基本物质,而且还有更多的作用,如充当激素、信号物质、抗体和不同组织的组成部分。而深入了解蛋白质,将给人类带来更多更大的益处。

人类可以创造蛋白质

2003 年,贝克成功地使用一个人工智能模型设计了一种不同于任何其他蛋白质的新蛋白质。之后,他的研究小组创造了一个又一个富有想象力的蛋白质,包括可用作药物、疫苗、纳米材料和微型传感器的蛋白质。

早在1998年,贝克团队设计了称为罗塞塔(Rosetta)预测蛋白质结构和设计蛋白质的软件。它可以通过修改氨基酸序列来设计出具有特定功能或性质的蛋白质,如增强蛋白质的稳定性、改变蛋白质的结合亲和力等。

2003年,贝克团队让罗塞塔计算哪种类型的氨基酸序列可以产生所需的蛋白质。罗塞塔不辱使命,搜索了所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。然后,设计出了一个全新的与现在所有已知的蛋白质完全不同的蛋白质,称为Top7。

而且,Top7的结构是自然界中并不存在的独特结构,它有93个氨基酸,比以前设计生产的任何蛋白质都大。

这个发现的重要意义在于,人类可以像自然一样创造蛋白质,但不同于自然创造蛋白质是随机的,而是有目的的,能够研发有针对性和有效的药物。例如,研发破除细菌耐药的抗生素,以及治疗癌症和艾滋病的药物。

预测蛋白质结构的新方法

此次共享一半诺奖的哈萨比斯和江珀,则创建了一个人工智能模型,从根本上改变了AI模型对蛋白质结构的测定。

在蛋白质中,氨基酸以长链的形式连接在一起,这些长链折叠形成三维结构,对蛋白质的功能起决定性作用。从20世纪70年代以来,研究人员一直试图从氨基酸序列中预测蛋白质结构,但这似乎难于上青天。

为了解决蛋白质结构检测问题,1994年,以美国马里兰大学约翰·莫尔特为首的一些科学家启动了一个名为蛋白质结构预测关键评估(CASP)项目,之后发展成为一项竞赛。

几年前,研究人员在CASP竞赛中人工预测蛋白质结构最多只能达到40%的准确率。但哈萨比斯团队借助他们的AI模型阿尔法折叠对蛋白质的预测准确率达到了近60%,能够预测过去已经鉴定出的几乎所有2亿种蛋白质的结构。而要全面了解蛋白质的功能,必须对其结构的预测准确率达到90%。

之后,哈萨比斯和江珀联手研发了新的AI模型阿尔法折叠-2。2020年,他们带着这一AI模型参加CASP,评估结果时几乎让所有人震惊,他们明白生物化学50年的挑战已经结束。在大多数情况下阿尔法折叠-2的性能几乎与X射线晶体学一样好。

这个发明的意义在于,人类有了预测蛋白质结构的新方法。过去,测定蛋白质三维结构有三大手段,X射线晶体学、核磁共振技术和冷冻电镜三维重构技术。这些方法都有其优点和缺陷,不同的研究对象需要采用不同的方法。

阿尔法折叠的横空出世,几乎克服了现有的几种测定蛋白质结构的弱点,在准确性、速度、效率,以及适用性上都体现了优势。

这项发明的重要意义,同样体现在研发药物、诊治疾病方面。如艾滋病病毒表面突起蛋白gp120主要与人免疫T细胞表面蛋白结合,如果进一步确定gp120蛋白的结构,就可以设计出阻止其与T细胞结合的药物,以防治艾滋病。

此外,更要看到的是,今年的物理学奖和化学奖都授予了与人工智能相关的研究结果,这或许意味着,人工智能不只是未来人们工作和研究的工具,还是人类社会发展不可或缺的利器。

撰稿 / 张田勘(科普作者)

编辑 / 徐秋颖

校对 / 贾宁