人工智能赋能科研 中国科大团队推出最高效蛋白质口袋生成算法之一

小分子和蛋白质之间的结合相互作用是人体中最重要和广泛的分子间相互作用。在药物发现和生物医疗领域,设计与小分子结合的功能蛋白质具有重要意义。记者11月18日从中国科大获悉,中国科学技术大学认知智能全国重点实验室刘淇指导博士生张载熙和哈佛大学医学院Marinka Zitnik 课题组合作,设计了深度生成算法PocketGen,用于生成与小分子结合的蛋白质口袋序列和空间结构。相关研究成果于2024年11月15日发表于《自然·机器智能》(Nature Machine Intelligence)期刊。

近年来,在人工智能的帮助下,科学家们创造出了一个又一个全新的蛋白质,帮助研发出新的靶向药物、更小的生物传感器。美国华盛顿大学David Baker教授因其在蛋白质设计领域的开创性贡献获得2024年诺贝尔化学奖。PocketGen承担的任务与David Baker实验室的生成模型RFDiffusion和RFDiffusionAA类似,但在蛋白质的生成效率和成功率方面取得了进一步突破。

PocketGen主要用于生成与小分子结合的蛋白质口袋序列和空间结构。蛋白质口袋是蛋白质上适合与特定分子结合的空腔,每个蛋白质口袋都是一个特定的结合点位。当小分子与之紧密结合后,会引起蛋白质的构象变化,进而激活或者调节蛋白质功能。

要想设计蛋白质口袋,传统方法是通过能量优化和模板匹配,但是计算效率慢、成功率低。现有的基于深度学习的模型又并非专为研究蛋白质-小分子相互作用而设计,可能无法充分描述蛋白质与小分子结合口袋区域之间的特征。PocketGen的成功开发为该问题的解决提供了新的方案。

该算法由双层图Transformer编码器和蛋白质预训练语言模型两部分组成。两者分别对应蛋白质的结构信息和序列信息。通过两个部分同时进行信息处理和不断迭代,最终生成所需要的蛋白质口袋。

PocketGen在计算效率和蛋白质口袋设计的成功率方面表现亮眼,是目前全球最高效、最高成功率的蛋白质口袋设计算法之一。在实验中,PocketGen模型不仅在亲和力和结构合理性等指标上超过传统方法,在计算效率方面也有大幅提高(相比传统方法提高10倍以上)。审稿人也对该工作给予高度评价,认为“与最先进的方法相比,该方法显著提高了结合亲和力和有效性,表现出更快的性能和更高的成功率。”

PocketGen推进了深度生成模型用于功能蛋白质设计,为进一步理解蛋白质设计规律并开展生物实验验证奠定了基础,未来在药物开发、生物传感器、酶催化等领域具有广泛的应用前景。

“人工智能方法在解决药物研发和生物工程领域重要科学问题上的优势已经展现,接下来,我们计划设计一款将人工智能和传统方法结合起来的模型,更好地发挥不同的方法的长处。”张载熙博士说。(通讯员 聂诗琦 记者 汪乔)