看不见的大模型,看得见的生产力

在大模型领域,智源是全球唯一没有背靠大厂的非企业研究机构,也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。“过去每次科技平权都能催生重大产业机会”,既有企业从业经验又有研究机构背景的新任智源院长王仲远,对科技赋能产业的体会更深。国家对人工智能的定义也更加具体:人工智能是发展新质生产力的重要引擎。

功夫下在风口之前

一次两次,月之暗面CEO杨植麟在2024北京智源大会现场被参会者围了至少三次,一年前OpenAI创始人山姆·奥特曼在智源大会视频发言时,现场的躁动同样明显。

2023—2024年,AI科学家、科技大厂CEO、明星初创企业创始人聚在各种场面为大模型布道,台上的不管是不是技术咖,或多或少都听过智源的名号,不少还直接参与过智源当年的大模型研究项目。百度CTO王海峰曾担任智源理事、智谱AI创始人唐杰曾任智源副院长、杨植麟参与过悟道的研发。

这些AI弄潮儿不是当下才与智源结缘,智源也不是在大模型风起后才投身其中。

2019年,智源开始布局大模型,2020年组建悟道攻关团队、启动大模型研发。2021年3月首发悟道1.0大模型,6月又拿出了悟道2.0,智源用1.75万亿的参数创造了当时“世界最大”大模型纪录,是OpenAI彼时最先进的大模型GPT-3参数量的10倍。

科研讲究体感,要提出问题,作出判断。“人工智能大模型时代即将到来”的判断,给了智源毫无保留的勇气,就连“大模型”这个中文词汇,都是智源最先提出的。

何为大模型?智源研究院理事长黄铁军认为要具备三个条件:规模要大,参数达百亿规模以上;涌现性,能够产生预料之外的新能力;通用性,不限于专门问题或领域,能够处理多种不同的任务。

2023年大模型进入公众视野,悟道系列模型已升级到3.0版本,涵盖语言、视觉、多模态等基础大模型,并全面开源。当时斯坦福大学关于基础模型的讨论中,智源与Google、微软、Facebook(现Meta)等科技巨头并列,成为世界大模型研究的代表性机构。

“历史上多数研究成果的出现是偶然事件,没人能规划出来,所有努力都是为了提升概率——汇聚优秀的研究人员,为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。”智源研究院创始理事长张宏江给图灵奖获得者Yann LeCun自传写的序言,更像智源后发先至的原因。

要做系统工程

2018年初,北京市出台《北京市支持建设世界一流新型研发机构实施办法》,进行科技体制的飞跃式改革。12月,在科技部和北京市委市政府的指导和支持下,智源正式成立。

此前,科研管理流程复杂,从立项建议到指南发布再到经费申请、评审通过,周期漫长,难以适应强竞争环境下日新月异的科研需求。按照这种体制,研究机构2020年10月提出立项建议,最快2022年才能正式展开大模型研究。智源模式从立项到推出大模型,只用了不到5个月。

这是一种介于大学和企业的新型研发机构。新在不以论文为最终评价指标,不以产品为评价指标,而是要做创新性系统;新在把清华、北大、Facebook人工智能实验室、百度等不同机构以及企业的学者聚在一起办大事;新在瞄向大问题,保持对重大科学问题的敏锐眼光,进行前瞻布局。

“高校模式已经运行了几十年,较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发,但更倾向于研发与业务强相关的。智源会做3—5年甚至更长时间才能看到成果的研究项目。”王仲远在接受北京商报记者专访时表示。

当下,智源的信心还在于国家对人工智能的笃定。2024年3月,中共中央政治局常委、国务院总理李强在北京调研时明确:人工智能是发展新质生产力的重要引擎。

新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生。“过去每次科技平权都能够催生重大产业机会,大模型可以带来新的科技平权。”王仲远坚信。

打个比方,大模型是“智力”的载体,以AI为中心的浪潮是智力运营,最底层是技术软硬件系统,最上层是AI应用,大模型处于两者中间,扮演“树干”的角色。大模型的意义是将“智力”变成像水、电、网一样的公共服务,通过云计算向大量企业或个人提供AI服务。

这是一个系统工程,“需要集中投入资源、集中人力,不能很多人在做但各做一摊,而是要形成一个技术体系”。黄铁军举例。“发展人工智能就如同炼钢和发电,需要一整套技术体系来保证生产出高质量的钢、以比较低的成本稳定地发电等。”黄铁军说。

要比产业走得更超前

智源搭建的技术体系包括:大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。这些成绩和智源的愿景目标等一起挂在智源大厦一楼的墙上。

愿景目标分成机制体制、产业发展等五大板块,总结起来就是创新。“智源要做最前沿的人工智能技术的研发,去引领和预判人工智能的发展,要比产业走得更超前。”王仲远详细解释,“智源会做高校做不了、企业不愿做的研发,做3—5年甚至更长时间才能看到成果的研究项目。”在他看来,当大模型技术能力达到一定程度后,会分出两大方向,“一个方向去跟产品结合,推动应用,发挥商业化价值。另一方面,有少量的几家机构持续做最顶尖的大模型的迭代和优化。不管企业还是研究机构,应该继续去攻坚技术”。

比如多模态,国内绝大部分的企业都选择DiT架构进行研发。“这是因为DiT是已经被验证的路线,智源希望把不同模态的信息,比如文字、图像、视频、语音,从一开始就放在一个模型里训练。”王仲远用人脑比喻,“这种多模态大模型能够看到世界、理解和推理。未来,大模型跟硬件结合,也就是具身智能,能够进入物理世界服务人类。”

企业贴近市场,向上找场景,研发机构聚焦核心技术突破,向下做加持,智源属于第二种,和应用与场景离得较远,却用开源的方式做产业界的后盾。

“人工智能不等同于大模型,它只是人工智能的一个流派。”王仲远向北京商报记者解释。当下的智源也对类脑研究、数字心脏等其他人工智能技术全力以赴,这意味着人工智能在其他产业的想象空间没有上限。

北京商报记者 魏蔚