清华大学申请蛋白质结构预测专利,有效提升了不存在或没有足够多同源序列的蛋白质序列的结构预测精度

金融界2024年2月19日消息,据国家知识产权局公告,清华大学申请一项名为“蛋白质结构预测方法、装置、电子设备及存储介质“,公开号CN117558337A,申请日期为2023年9月。

专利摘要显示,本发明提供一种蛋白质结构预测方法、装置、电子设备及存储介质,其中的方法包括:获取待进行结构预测的目标蛋白质序列;将目标蛋白质序列输入至蛋白质序列预训练模型,得到目标蛋白质序列对应的蛋白质表示;基于预先训练的蛋白质结构预测模型,对蛋白质表示进行处理,得到目标蛋白质序列的三维结构。该方法通过在预训练阶段引入同源序列信息来增强目标蛋白质序列的表示,同时又在实际预测阶段舍弃同源序列的输入,减小了模型的模块复杂度,增强了模型对于输入任意单条目标蛋白质序列的表示能力,实现了从单条蛋白质序列到其对应表示信息的建模,有效提升了不存在或没有足够多同源序列的蛋白质序列的结构预测精度。

本文源自金融界