天津贝芸申请用于分子虚拟筛选的集成回归模型及生成方法、预测方法专利,提高标注效率和模型性能

金融界2024年11月28日消息,国家知识产权局信息显示,天津贝芸科技有限公司申请一项名为“用于分子虚拟筛选的集成回归模型及生成方法、预测方法”的专利,公开号CN 119028480 A,申请日期为2024年10月。

专利摘要显示,本发明涉及计算机辅助药物设计技术领域,具体公开了用于分子虚拟筛选的集成回归模型及生成方法、预测方法,生成方法包括:从超大规模化合物库中随机选取K个分子作为训练集;训练回归模型;使用训练后的回归模型对超大规模化合物库中未选取的分子进行预测,获得综合预测结果;从综合预测结果的阳性预测池中选择预测得分最高且标准差最大的K个分子,加入训练集;再次训练回归模型;训练次数达到迭代次数,选取预测性能最好的多个的回归模型,得到集成回归模型。本发明通过在得分最高的化合物中选择预测值标准差最大的化合物进行标注,以将精力集中于那些最具挑战性或者最不确定的样本,从而提高标注效率和模型性能。

本文源自:金融界

作者:情报员