生态圈不断扩大,智谱AI投资生成式AI蛋白质设计平台百奥几何
21世纪经济报道记者 闫启 北京报道
近日,前沿数字生物企业百奥几何宣布完成新一轮融资,本轮融资的投资方除了将门创投、盛景嘉成、高榕创投等投资机构外,还出现了国内AI大模型独角兽智谱AI的身影。
值得一提的是,此前面壁智能、生数科技、无问芯穹等多家AI行业里的备受VC们追捧的明星创业公司的融资中都有智谱AI的参与。专注于做大模型的中国创新,又较早探索商业化落地的智谱AI,正在努力打造自己的AI生态圈。
智谱AI CEO张鹏此前曾表示,“我们希望打造一个大模型生态,在这个生态中我们与合作伙伴携手共进,把生态圈越做越大,这是我们更长远的商业化目标。”据不完全统计,截至目前智谱AI已经投资了十多家AI相关创业公司,其大模型产业投资案例的质量和数量处于行业领先位置。
智谱AI首次布局数字生物领域AI公司
智谱AI此次参与投资的百奥几何,是专注于打造生成式 AI 蛋白质设计平台,赋能整个生物制造领域。其核心团队是生成式 AI 在分子生成领域的开拓者,早在 2021 年就将扩散模型用于分子的三维结构生成 ,是最早将扩散生成模型用于分子三维结构生成的团队,其中关键论文 GeoDiff 是 2022 年 AI 领域引用量排名前 50 的论文之一。
人工智能的进步,尤其是大规模 AI 模型的出现,正引领生物制造迈向数字化和智能化的新时代。这一变革得益于高通量的基因合成、测序、编辑等前沿生物技术,它们正推动生物学数据呈现指数级增长,为 AI 的应用开启新的广阔天地。去年 12 月召开的中央经济工作会议以及今年的两会特别提到要大力发展数字经济,加快发展人工智能,打造生物制造等若干战略性新兴产业和未来产业新赛道。技术突破与政策利好频频出现,生物制造赛道已处在爆发前夜。
近年来,以 ChatGPT、Sora 为代表性的生成式人工智能技术快速发展。在生命科学领域, Google DeepMind 开发的 AlphaFold2 在蛋白质结构预测取得了革命性进展之后,今年基于扩散生成式模型的 AlphaFold3 技术能够扩展到对所有生命分子的结构以及它们之间相互作用进行预测,引起了业界的广泛关注。
最近,百奥几何发布了最新的生成式 AI 蛋白质设计大模型 GeoFlow,可以同时用于抗原-抗体复合物结构预测和抗体设计两项关键任务。与现有的 Transformer架构不同,GeoFlow 采用了几何深度学习基础模型,能够更好地在三维空间上对原子-原子之间的关系进行建模。在生成模型选择上,GeoFlow 采用了最新的流匹配模型。与扩散生成模型相比,流匹配生成模型的训练和推理更高效,也更鲁棒。在抗原-抗体复合物结构预测任务上,GeoFlow 的效果达到了与 AlphaFold3 同样的水平,是业内第一个接近AlphaFold3 水平的生成式 AI 大分子设计模型。
百奥几何 CEO 唐建博士表示:“经过一年半的发展,百奥几何已经完成了蛋白质生成式 AI 大模型和高通量蛋白质湿实验验证两大基础平台的搭建, 并且在抗体、多肽、疫苗、酶设计多个项目上得到了成功验证。未来百奥几何将持续优化平台,加速自有产品的落地。”
不止于股权投资,通过各种形式和大模型产业相关方交朋友
对于此次投资百奥几何,智谱 AI 表示,去年发布 Z 计划以来,面向大模型生态上下游的企业,公司会提供投资和技术支持。百奥几何团队在蛋白质分子发现与设计领域有深厚的专业积累,也是大模型发挥价值的很多的产业落脚点。
据了解,智谱AI针对大模型创业者,智谱AI推出 Z 计划,该计划将联合生态伙伴发起总额10亿元人民币的大模型创业基金,专门支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等各方面。
在张鹏看来,“仅仅只有强大基座模型是不够的,只有打通大模型产业生态圈上下游,与客户、不同生态位的合作伙伴一道,才能推动中国人工智能产业全面发展。我们希望智谱的‘朋友圈’越来越大,好朋友越来越多。”
此外,针对学术界,智谱AI分别联合CCF中国计算机学会、中国中文信息学会社会媒体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。自成立以来,两只基金为来自全国30余所高校参与的41个研究项目累计提供了超1000万元现金和算力资源的科研支持。针对开源社区,智谱AI成立了大模型开源基金,计划累计用 1000 张 GPU、1000 万人民币和 1000亿 tokens 来支持人工智能开源社区建设。
2024年,大模型应用将进入落地期,一方面垂直领域大模型的商业化应用正在加速,另一方面多模态大模型涌现,应用场景将更加丰富。智谱AI希望做的就是能用通用智能水平比较高的基座模型去赋能,让大家去做行业应用。
所谓行业模型、通用模型之间的差别和关系到底是什么?在张鹏看来,“就是L0层(指基础模型)、L1层(指行业模型)和L2层(面向更加细分场景的推理模型)。三者并不独立,行业模型(L1)和细分场景的推理模型(L2)理论上来说应该是基于通用模型(L0)增强出来的。而L0和L1之间的界限也并不是那么绝对。”
基于此,智谱AI提出了大模型行业内的首个合作伙伴计划,面向生态开放商业合作资源和底层技术能力,与全球顶尖合作伙伴共建千行百业大模型,打造产业智能新生态。
张鹏表示,“我们做好L0的层面,赋能伙伴和客户做好L1和L2。中国的人工智能事业要繁荣、要发展,需要所有的参与者、产业链上下游合作伙伴、开发者社区和学术界的共同努力。”