关于AI和大模型,工信部、上海市、商汤科技等重磅发声

以“模速空间——开发者的模力之源”为主题的2024全球开发者先锋大会3月23日在上海开幕。本届大会上,工业和信息化部副部长王江平、上海市副市长陈杰、美国国家工程院外籍院士沈向洋、商汤科技董事长兼首席执行官徐立等围绕大模型为代表的生成式人工智能等前沿技术发声。

工业和信息化部:努力繁荣开源生态 持续完善开源的顶层设计

王江平在致辞中表示,在开发者贡献共享精神的推动下,开源已全面融入软件生产过程。工业和信息化部努力为软件开发者营造良好的开发环境,做好服务保障,充分发挥开源生产方式的作用,共促软件产业高质量发展。

一是要努力繁荣开源生态,持续完善开源的顶层设计,发挥全国性开源基金会的作用,打造开源文化传播的活水泉、优质开源项目的策源地和优秀开源人才的育苗池。

二是打造优质的软件产品,鼓励开发者紧跟新技术的发展趋势,洞察千行百业痛点、难点和需求变化,充分释放新时代开发者的智慧和才能,打造更多高水平的软件产品。

三是深化行业应用,坚持好软件是用出来的,不断地完善配套政策,开放高端场景和数据资源,支持千行百业利用软件加快数字化转型,努力培育新业态、新模式,加速形成新质生产力。

四是要深入开展国际合作,支持广大开发者和软件企业以更加开放的姿态,深入交流、广泛合作,充分利用国内外开源组织的平台,踊跃发声,积极贡献,不乏创新活力。

“近年来,我国软件产业始终保持高速增长,2023年底产业规模超过12万亿元,有力支持了经济社会数字化的转型。我们积极培育以开放、共建、共享、共治为代表的开源生态,开源理念已在我国深入人心。”王江平表示,开源基础设施初步齐备,优质的开源项目、活跃的开源社区、优秀的开源贡献者不断涌现。中国已成为全球开源生态的重要的参与方和贡献力量。

上海:探索大模型新型开源和推广模式

大会期间,陈杰在发表致辞时表示,上海将进一步发挥超大城市的综合优势,加快建设具有更高影响力的人工智能高地。

一是加强核心技术的突破,推动智能芯片关键技术和应用适配,打造更多元开放的智能计算生态,支持通用大模型和垂直大模型的研发,积极推进大模型和具身智能的融合发展。

二是进一步加大开源开发的力度,探索大模型的新型开源和推广模式,推出更多具有示范性、标志性的应用场景,牵引大模型在金融、教育、医疗等典型领域的垂直应用。

三是加快培育创新创业的生态,深化载体建设,提升服务能级,完善标准体系、安全准则、伦理规范。

陈杰表示,人工智能是上海重点发展的先导产业,长期以来上海集聚资源,加快打造世界级的产业集群。

“我们的创新成果在不断涌现。上海人工智能实验室开发的‘书生浦语’大模型开源发布,24款大模型也进行了备案,多款人形机器人也即将发布。”陈杰表示,“产业的载体也在持续拓展,徐汇的模速空间已经成为创业的热土,两万平方米的载体已经投入使用,吸引了60多家大模型企业入驻,形成了算力调度、开放数据、评测服务、金融服务、综合服务等全方位的创新创业的保障,产业生态也持续完善。上海率先发布了支持大模型的若干政策、举措,推动了大模型语料联盟的实体化运作,开源一系列高质量的语料数据。”

沈向洋:大模型将横扫所有垂直行业 算力是门槛

“通用人工智能时代,我们的机会到底在哪里?每个人讲来讲去都是一个词——AGI,以大模型为代表的通用人工智能。”沈向洋表示。应该如何思考通用人工智能,沈向洋提出了五个方面的见解。

一是重新思考人机关系。大模型出现以后,实际上迫使人们重新思考人机关系。计算机经历了几十年的发展,真正的赢家是做人机交互。

二是大模型将横扫所有垂直行业。“以A100为参考,通用大模型没有万卡,不上万亿参数的话,基本上就不太好意思说是通用模型。”沈向洋表示,行业大模型大致上可能是千亿卡的训练规模。未来,最有意思的是个人大模型,个性化参数以后,云、端等可以结合起来。

三是算力是门槛。“你需要非常强大的算力,千卡、万卡都是钱堆出来的。”沈向洋表示,“现在讲的最多的是Scaling Laws(尺度定律)。随着参数的增加,你对算力的需求几乎是平方的关系,随着参数的增加,数据量也在增加。如果干GPT 3.5的话,可能要一万张卡;干GPT 4的话,可能要两万五千张卡;干GPT 4.5的话,可能要五六万张卡;大家弄GPT 5的话,可能要十万张卡。”

四是AI的社会冲击。它有对民众的冲击、公司的冲击、政府监管的冲击和社会发展的冲击。

五是智能的本质。虽然通用人工智能蓬勃发展,但大家对智能的本质没有一个清晰认识,深度学习理论非常欠缺。沈向洋表示,“很多人相信尺度定律,但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”

商汤科技:AI模型有知识、推理、执行三大能力层

“最近大家在讨论一个热词——新质生产力。对于开发者来说,生成式AI是带来生产力工具、生产力突破的最好行业。”徐立表示。徐立带来了商汤科技对于AI 2.0时代的新质生产力工具的理解。

徐立把作为生产力工具的AI模型分成能力圈的三层。这三层之间互有依赖,但又不完全是相关的。

第一层是知识层。世界的知识被灌输到大模型能力中。今天很多生产力工具、代码解决的是知识层的问题。“你提出问题或者你需要它补全,需要它解决一些问题,背后的道理是世界上没有新鲜事,你做过的事情前人做过,所以你可以完成任务。”徐立说。

第二层是推理(演绎)。有了世界知识之后,从一个起点再往前演进。“你可以通过AI的过程,逐步把这个事实推理出来,给出更多的可能性。知识和演绎构造出来的两层,是作为生产力工具的大模型最重要的两层。”他表示,但从推理层面来说,目前成长还相对有限,这也是后面要集中突破的能力之一。

第三层是执行,即如何跟这个世界互动、反馈。

“这三层可以组成一个完备的、对世界提供生产力工具的大模型。”徐立表示,映射到大模型的代码上,知识是世界知识的全面灌注,中间的推理是用更高阶的思维逻辑导出一些知识所不具备的。最后是执行,某种意义上是具身智能的大脑,在执行上会有很大的突破。

责编:岳亚楠

" Type="normal"@@-->

校对:王蔚

" Type="normal"@@-->