☰

智源研究院理事长黄铁军：解决算力和数据问题，中国大模型将迎来能力跃升

央广网北京7月11日消息（记者黄昂瑾）当前，以大模型等为代表的人工智能技术快速发展，正深刻改变着人们的生产方式和经济形态。在2024（第二十三届）中国互联网大会期间，北京智源人工智能研究院（以下简称“智源研究院”）理事长黄铁军在接受央广网记者采访时指出，随着算力和数据问题的解决，中国大模型的发展有望迎来能力的跃升。

“智源研究院在今年5月正式推出了智源大模型评估体系，并对国内外140余个开源和商业闭源的语言及多模态大模型进行了全方位的能力评估。评估结果显示，在中文语境的条件下，国内头部大模型的能力已接近国际一流水平，但存在能力不均衡的情况。”黄铁军表示，“中国大模型的发展，需要解决算力资源短缺和高质量中文数据语料库短缺和使用难的问题。随着算力和数据问题的解决，中国大模型的发展有望迎来能力的跃升。”

据介绍，针对算力问题，智源研究院推出了面向大模型的异构算力集群“操作系统”FlagOS，集异构算力管理、算力自动迁移、并行训练优化、高性能算子于一体。向上支撑大模型训练、推理、评测等重要任务，向下管理底层异构算力、高速网络、分布式存储。

在数据方面，黄铁军指出，目前，在开源语料中，中文语料占比不足十分之一，今年6月，智源研究院推出了多行业中英双语数据集IndustryCorpus 1.0和千万级指令微调数据集InfinityInstruct，解决数据量少和质量不高的问题。同时，智源研究院正在牵头与多家单位共同建设北京市人工智能数据运营平台，支持开源开放、积分共享、数算一体三种模式，解决数据使用难的问题。

“智能是从数据中学到的，从根本上讲，数据是来自于环境。所谓生物的智能是我们适应环境的一种能力，它是对环境的某种表达或映射，智能的具体意义是人在什么环境下具有什么样的行为、遇到挑战应该怎么应对，这就叫智能。”在本届大会人工智能大模型主论坛上，黄铁军介绍道。

黄铁军指出，业界普遍认为从2017年底、2018年初开始，以Transformer架构出现为代表，进入了大模型时期。实际上不仅仅是Transformer，之前有很多进展，其中最重要的是词向量技术。“简而言之，词向量技术把语言中的每一个词、每一个概念，用一个高维向量来表示。所以在人工智能的大脑里面，每个词是一串数字，长度至少是1024，现在也有更长的，上万都可以。”

“人工智能理解的语义是1024维的高维空间，每一个词在高维空间中都有自己的位置，这个位置决定了它和其他词之间的关系，表示了它的语义。”黄铁军补充称，对于人工智能来说，一个词就是一串数字，这串数字是根据词与词之间的关系算出来的，一个词的含义取决于这个词在海量上下文中的位置。

以GPT大模型为例，黄铁军进一步解释称，“Transformer架构最初是为机器翻译设计的，GPT把它用于计算海量语料中蕴含的语义，即用前K个单词预测第K+1个单词。为什么这种训练方法能够发现海量语料背后的语义？因为智能的本质就是根据已知预测未来。这个K可以很大，原来是几千，后来变成几万、几十万，甚至于更长，那么长的一串词的训练，一个一个训练，+1就是平移训练。”

“今天互联网产生了海量的数据，这些数据被大模型转换成了智能、转换成了智力，智力像电一样会流通，为每个人、千家万户提供服务。”黄铁军指出，“2030年之前，我们每个人都会像今天用电、用网一样方便，以很低的成本用智力，这是一个新的时代。”

此外，黄铁军对央广网记者表示，大模型参数规模高速度增长，智能越来越强，达到甚至超越人类智能的AGI有望在可预见的未来到来，潜在的AGI误用和失控风险大幅增加。他指出，应对AI安全风险，需要对AGI水平和能力分级。

对此，黄铁军把AGI按能力分成五个级别，即第0级，AI认知水平低于人类；第1级，认知水平超越人类；第2级，感知能力超越人类；第3级，感知和认知能力同时超越人类；第4级，机器从具备意识进化为具备自我意识；第5级，AGI的认知不再源于人类知识，AGI神经结构超越人类大脑，形态和智力水平都超出了人类想象，可能适应不同的物理环境，开始宇宙智能进化的新历程。

黄铁军认为，国际社会应该对人工智能模型训练、分发、运营，模型能力阈值，系统开发和部署，形成全面的治理机制，从而开展有效监管。同时，加强对AI安全技术的研发与投入，有效应用技术手段对潜在AI安全风险进行监测、识别、隔离、消除。

“随着大模型的智能水平越来越高，安全风险也会越来越大，所以对于安全的重视也应该跟人工智能和大模型的发展同步提高。”黄铁军表示。

智源研究院理事长黄铁军：解决算力和数据问题，中国大模型将迎来能力跃升

相关资讯