“数据+计算”成为医药行业新范式,如何应对研发到落地重重阻碍?

“长期以来,药物研发周期长、成本高、成功率低等问题困扰着整个行业。如今,通过数据、计算与机器学习技术的不断迭代,药物研发团队能够设计出选择性更高、活性更优的分子,从而减少筛选候选药物所需的时间和成本,并增加药物研发项目进入临床开发的成功率。这一突破性进展不仅为药物研发带来了全新的思路和方法,也为解决全球性的医药难题提供了坚实的支撑。”近日,在启明创投联合投资企业、全球计算药物研发领军公司薛定谔(Schrödinger,NASDAQ:SDGR)举办的结合物理建模与机器学习:加速结构化药物发现研发分享会上,启明创投主管合伙人梁颕宇指出。

当前,数据与计算的结合已渗透于制药领域的全流程。启明创投合伙人陈侃举例解释,高通量筛选等技术能够产生大量高质量生物学和医学数据,利用人工智能和机器学习可以解析这些数据,发现新的生物学机制和药物靶点;计算机模拟和虚拟筛选能够更广泛地探索化学空间,找到最优药物化合物;在临床试验方面,去中心化试验和数字孪生系统可以模拟并准确预测试验结果,加速并优化以患者为中心的临床试验设计;通过大数据帮助生成真实世界的临床数据研究。这些“干实验”技术的进展,是对传统“湿实验”方法很好的补充,并且已经越发广泛的得到制药行业从业者的认可。相信在不久的将来,能够将药物研发从高成本、低成功率逐渐转变为更像科技行业的新研发范式。

此次研讨会是薛定谔在中国内地举办的首次线下活动,旨在搭建小分子药物研发交流社区,助力企业深入了解如何运用领先的计算技术来加速药物发现。薛定谔公司由Richard Friesner和Bill Goddard于1990年创立,至今已有30多年历史。薛定谔专注于开发和应用先进的计算方法,旨在改变科学家设计治疗方法和材料的方式,其主要应用场景是化合物筛选。薛定谔的计算药物研发平台能够准确预测分子的活性,并利用AI将筛选数十亿个分子的时间缩短至几天,大大提高了药物发现的速度和成功率。2020年,薛定谔在纳斯达克成功上市,成为行业内首家计算药物研发上市公司。

计算机驱动的药物研发

药物研发是一项周期长、投资高、风险大的系统工程。

作为本次活动的特邀嘉宾,硕迪生物(NASDAQ:GPCR)化学高级副总裁雷晖博士指出,小分子药物具有发展历史悠久、能够更好控制生产成本、分子相对较为稳定等特征。值得关注的是,同为启明创投的被投企业,硕迪生物的小分子药物管线主要专注于难成药的 GPCR 靶点,其药物分子的设计大量利用了薛定谔的计算平台的辅助,并已在临床试验中取得积极结果。

现代小分子药物研发中最重要的基础手段是筛选(Screening)。要进行筛选,首先必须发现针对某种疾病指征药物的靶点(Target),如受体、酶、转运蛋白或离子通道、信号蛋白、结构蛋白、微管蛋白、肌动蛋白等;其次,还需要一个小分子库(Library),提供足够数量的分子以进行筛选,从中找到一个或多个符合要求的苗头化合物(Hit),经过多次结构优化得到先导化合物(Lead)和候选化合物(Candidate),再通过系统的临床试验充分验证其安全性与有效性。

因此,药物研发是一个非常昂贵且冗长的过程。薛定谔资深首席化学家邹叶芬博士指出,通常小分子药物的研发周期为10到17年。初期阶段涉及设计和合成成千上万个分子,其中大约10个分子可能会进入临床试验,最终只有一个或更少的分子能够通过临床试验,成为市场上的药物,供公众使用。

在传统的小分子药物研发过程中,面临着两大主要挑战。薛定谔应用科学首席科学家胡小虎博士表示,一方面,化学空间非常庞大,如何在这个广阔的化学空间中进行快速搜索是一个问题。另一方面,即使在早期发现了苗头化合物,如何将其优化成具有更佳性能的分子是另一个挑战,这是一个多参数优化的问题,即如何同时优化所有性能。

近年来,随着大数据和计算机技术的不断迭代,AI在药物发现领域取得了显著进展,为新药研发注入了新的活力和创新动力。通过数据挖掘、机器学习和深度学习等技术,AI可以加速药物发现和设计过程,提高研发效率和成功率。AI还可以在药物筛选过程中帮助识别具有潜在疗效的候选药物,从而降低研发成本和时间。

“现代科学的发展,让数字化学成为可能,使药物研发从计算机辅助向计算机驱动发展。”邹叶芬指出。

邹叶芬进一步解释道,在传统制药行业中,科学家通过分析实验数提出假设,设计分子来验证假设,并多次循环进行调整以达到理想的分子特征。然而,化学家通常会合成较容易合成的分子,以最快速度验证假设,这导致设计的化学空间受到限制。同时,在多参数的复合优化中,由于无法同时准确预测多个参数,只能逐个参数进行优化,从而导致单独的DMTA(设计-合成-测试-分析)循环增加。每找到一个新的SAR(结构-活性关系)都需要综合设计,这样就增加了循环次数、成本和时间。

通过在设计和合成之间引入建模步骤,可以在分子设计完成后利用计算机综合预测各种参数,只选择综合参数最优的分子进行合成和测试。这样不仅能够在计算机上探索更大的化学空间,还能显著减少DMTA循环的次数和时长,同时提高成功率。

以AI为代表的数字化手段促进了小分子药物研发的发展。一项发表在Nature上的研究指出,AI在药物研发中可以创造多个价值。对24家以AI为发现战略核心的公司的研究发现,其管线快速增长,年均增长率约为36%。根据专利、出版物和公开声明的时间,多个AI支持的项目在不到四年的时间内完成了整个发现和临床前旅程。

得益于数字化手段在制药上的良好表现,当前医疗行业对AI应用的规模持续增长。华经产业研究院数据显示,2021年中国AI制药市场规模为1.6亿元,同比增长100%,预计2023年市场规模将达到4.14亿元,2019-2023年复合年增长率(CAGR)为57.41%,总体市场增速较快。

完善准确性验证

在市场高速发展的背景下,不少药企纷纷布局包含机器学习、深度学习、大数据在内的AI领域。毕马威数据指出,10大生物制药公司在2013-2023年AI相关交易中占比41.5%,最终推动了整个生物制药市场的AI投资增长。在此期间,辉瑞、罗氏和阿斯利康分别以28、27和25笔交易领跑。此外,从2013年至2022年,AI交易在并购和合作交易总额中的比例达到了24%的复合年均增长率。

薛定谔高级客户经理沈彥甫(Maurice)指出,制药公司与软件技术平台的商业模式主要有三种。第一种是授权模式,制药公司通过授权使用软件技术平台的工具,直接利用这些技术加速内部研发。第二种是合作模式,软件技术平台与制药公司合作共享知识产权,技术平台的科学家直接解决合作制药公司面临的设计挑战。对于同时兼顾软件与制药的公司来说,第三种方式是软件技术平台会有完全自主的一些项目,独立开展研发。

虽然计算机技术为制药行业带来了广阔的前景,但当前的发展仍面临诸多挑战。一方面,软件本身还有优化的空间。

薛定谔对接技术产品经理及资深首席科学家章宇奇指出,软件包含的筛选数据库往往不够大。如果筛选的数据库量越小,找到有活性分子的概率就越低。如果将数据库规模从几百万扩大到几亿、几十亿、甚至几百亿,从概率学的角度来看,找到有活性分子的数量和性质会显著改善。另一个传统虚拟筛选的问题是常用的打分函数往往不够准确。在做基于结构的虚拟筛选时,通常使用一些分子对接软件。然而,大多数分子对接软件都是基于刚性蛋白的假设,只评估固定结构下蛋白与小分子的作用,忽视了蛋白和小分子之间的统计热力学过程,无法准确模拟水分子或溶解作用。因此,单纯依赖分子对接的打分函数往往不够准确。

另一方面,作为计算模拟工具,软件预测结果不一定完全准确。因此,相关专业领域的专家必须在复杂的药物开发过程中对这类模型进行全面验证。

章宇奇进一步表示,可以通过计算化学的方法预测结果并与实验室的数据进行比较,以评估模型的准确性。例如,在使用自由能扰动(FEP)方法时,先进行可行性预测。如果发现预测结果与实验数据正相关,他们就会有信心认为模型可以用来预测效能(potency)。

此外,章宇奇坦言,计算化学的目的绝不是取代药物化学家,二者之间是合作关系。人工智能不应取代人类的工作,而是作为强有力的工具。计算化学能够帮助筛选更多的创意,通过计算方法,可以筛选出成千上万甚至上亿个分子,这些工作薛定谔都是由完善的工作流处理,科学家可以同时完成许多任务。这在很大程度上减少了昂贵的人力成本。