人工智能正颠覆蛋白质结构的传统认知

在最近发表于《自然·通讯》的一篇文章中

该团队成员包括来自弗吉尼亚大学的,比如数据科学学院院长菲尔·伯恩、该学院的资深科学家卡姆·穆拉以及弗吉尼亚大学的应届校友伊莱·德雷森。

他们的研究对有关蛋白质结构关系(即相似性和差异性的模式)的传统观念发起了挑战,并且通过这种方式,发现了许多被传统方法遗漏的微弱关系。

具体来说,作者报告了一个计算框架,这个框架能够以新颖、灵活且细致入微的方式大规模地(跨越无数蛋白质)检测和量化此类蛋白质关系,这种方式将基于深度学习的方法与一种被称为 Urfold 的新概念模型相结合,让两种蛋白质尽管具有不同的拓扑结构或“折叠”,却仍能呈现出结构相似性。

伯恩、穆拉和德拉伊森与斯特拉·韦雷特尼克合作开展该项目。所有作者都是伯恩&穆拉计算生物科学实验室的成员,该实验室隶属于数据科学学院以及弗吉尼亚大学的生物医学工程系。

该出版物是伯恩实验室多年来开发这种名为 DeepUrfold 的人工智能驱动框架工作的成果,从而能够对 Urfold 结构关系理论进行系统且大规模的探索。

通过 DeepUrfold,伯恩实验室团队在整个蛋白质领域中检测到了那些原本在进化或其他方面被视为毫无关联的蛋白质之间微弱的结构关系。

在捕捉和描述这些遥远关系的过程中,DeepUrfold 以“社区”的视角来看待蛋白质关系,摒弃了将蛋白质划分到单独且互不重叠的“箱子”里的传统做法。

总之,这些新的方法论或许能够促使研究人员摆脱以静态、几何的术语来思考蛋白质的相似性,转而采用更综合的方法。

伯恩是数据科学学院的创始院长,他在科学界以其研究而闻名,包括范围更广的结构生物信息学和计算生物学。在他职业生涯的早期,他共同领导了 RCSB 蛋白质数据库的开发,这是一个实实在在的蛋白质结构信息宝库,帮助推动了该领域的变革,并为当代像 AlphaFold 这样的人工智能进步铺平了道路。

穆拉在弗吉尼亚大学的数据科学学院和生物医学工程系任职,在结构和计算生物学领域有着广泛的背景,包括基于 RNA 系统的生化及晶体学研究,还有 DNA 的分子生物物理学。他从分子进化的视角看待生物系统,并探索这些领域与数据科学的交叉点。

在伯恩的指导之下,德拉伊森在弗吉尼亚大学获得生物医学工程博士学位,目前在旧金山加利福尼亚大学担任计算生物学博士后学者。维雷特尼克一直都是弗吉尼亚大学的高级研究科学家,专注于计算生物学,以及蛋白质折叠的结构、功能和进化情况。