黄铁军:智力革命已经打响,开源开放生态终将胜利

黄铁军北京大学计算机学院教授、人工智能研究院副院长

以下观点整理自黄铁军在CMF宏观经济热点问题研讨会(第73期)上的发言

本文字数:2176字

阅读时间:6分钟

一、大模型的特点

经过六七十年的发展,人工智能形成了很多技术路线,大模型是其最新进展。大模型以联结主义和神经网络学派为基本支撑。联结主义学派的发展始于上世纪四十年代,他们试图建立一个神经网络,能够通过给出训练数据,建立输出和输入间的映射关系。比如人脸识别,输入的是照片,输出的是人的ID或者名字。从数学上讲,在神经元足够多的情况下,只要是三层神经网络,任意输入、输出之间的映射关系都可以建立。但问题在于,要建立一个复杂庞大的映射网络,需要的连接数量也是巨大的。

例如,在一个简单的三层神经网络中,假设每层有100个神经元,则会有1万个数据样本,迭代1万轮,要想收敛到这样的一个分类识别系统,需要2万亿次调整。这就是大模型训练需要耗费大算力的原因,只有将连接权值调整到合适的状态,它才能按照预想方式工作。

大模型主要具有以下几个特点:

1、规模大

关于什么是大模型有很多争论,现在基本收敛到一个共识,即网络参数至少要达到百亿规模,一般需要几百亿的规模才会产生预想的智能。

2、涌现性

传统AI只能给出封闭、确定的答案,而大模型不仅规模要大,而且一定要能涌现出预料之外的新能力。当网络参数达到数百亿时,大模型就成为了一个复杂系统,会像其他的物理系统一样产生“涌现”现象,出现融会贯通的能力。虽然现在还无法解释其原理,但这种能力确实存在,这也是最让大家最兴奋的地方。

3、通用性

大模型的应用不限于专门的问题和领域,这从经济角度来说是特别重要的。如果大模型能够解决通用问题,它就具有了很好的边际价值和推广性。

北京智源人工智能研究院自2018年成立后,很快切入大模型的赛道,是国内最早布局大模型的机构,聚焦于探索大模型背后的技术体系。大模型这个中文概念也是2021年智源研究院发布1.0版本的大模型时提出来的。

2021年6月,我们思考了一个问题:大模型到底意味着什么?当时我们提出,如果要让大模型的能力足够强,服务足够及时,就一定要尽可能地吸收全量数据,建立24×7训练、24×7服务的运营体系。这样的体系在全球范围内屈指可数,不会超过五个。因为大模型归根结底是一个数字形式的智能服务,存在一定的垄断属性,再加上对大规模和实时数据的要求,运营难度是非常大的。

2022年2月,智源开始研究谁有可能拥有这种运营能力。当时美国普遍认为是Google,或者是OpenAI+微软。去年11月ChatGPT发布,OpenAI占据了先发优势,不过Google也紧随其后。当前中国已经有十多个模型在运营了,但我认为这只是短期的状态,长期内会收敛到最多两三个。

二、大模型对于人类的意义

大模型开启了智业革命的时代,纵观人类历史,只有两件事可以与之相提并论。

相较工业革命而言,如今我们面临的是全新的革命,即智业革命。工业革命替代人的体力,而智业革命替代人的智力,因此它可以与工业革命相提并论。

相较电力这种革命的产业形态而言,电力让能源以流通的方式进入家庭和企业,智力革命也是如此。大模型相当于发电机,它不是产业中最主要的产品形态。在未来的几年甚至几十年内,智力运营系统将会源源不断地为社会提供智力。

今年,国家成立了国家数据局,这是因为智能的源头是各种各样的数据。但数据只是一个生产要素,要将这种生产要素转换成经济社会发展的动力还需要依靠智力,并通过大模型训练智力。因此,将来可能会出现像国家电网一样的国家智网或国家智云,作为基础设施,为千行百业、千家万户提供服务。

自2021年起,智源研究院的研究重点从一个个具体的大模型转向通过协同创新的方式,为这个时代构建一个先进的技术体系。智源的FlagOpen飞智大模型基础软件开源系统是由智源牵头,多家共建的大模型开源开放软件体系,将进一步推动智力革命。

总结来说,当前ChatGPT已经拥有了很强大的智能。未来3年,除了语言模型会被广泛使用之外,视觉、听觉、具身、行动等通用智能的技术路线也会出现,并且影响会更大。

未来10年,智力革命会广泛普及,就像工业革命解放的是体力,电力革命解决的是能源流通的问题一样,它将构建一个全新的生态体系,这需要全社会共同努力,而开源开放将成为联合各方的基本方式。

未来20年,AI技术还会快速发展。目前以ChatGPT为代表的是以数据驱动的静态的智能,而未来的智能将是以时空环境驱动的具身智能,能够进行实时感知、实时决策、实时行动。如此来看,当前的神经网络还有很大的进步空间,它将不再是一个Transformer,而是类似于人脑的脉冲神经网络。我认为,到2045年,无论是从物理载体还是从能力上来说,超越人类的电子大脑和智能系统都会出现,经济发展将迎来一个新的黄金期。与此同时,这也将带来更大的安全问题,甚至比电力时代要大得多。因此,要同等重视AI安全和人类面临的风险。