“人工智能教母”竟也不懂通用人工智能!

您是不是对通用人工智能,也就是 AGI 感到困惑?这正是 OpenAI 一心想要创造的东西,并且是以“造福全人类”的那种方式。您可能得把他们当回事,因为他们刚刚筹集了 66 亿美元以更接近这一目标。

但要是您还在琢磨 AGI 到底是啥玩意儿,您可不是一个人。

在周四举行的 Credo AI 负责任人工智能领导力峰会上的一场广泛讨论中,经常被称作“人工智能教母”的世界知名研究员李飞飞说道,她也不知道 AGI 是什么。在其他时候,李飞飞谈到了她在现代人工智能诞生中的角色,社会应该怎样保护自身免受先进的人工智能模型带来的影响,以及为什么她认为她新的独角兽初创公司 World Labs将改变一切。

但当她被问到对“人工智能奇点”的看法时,李飞飞和我们其他人一样迷茫。

“我来自学术人工智能这个领域,接受的是更严格以及基于证据的方法的教育,所以我真的不晓得这些词都意味着啥,”李飞飞在旧金山一个挤满人的房间里说,旁边有一扇大窗户,俯瞰着金门大桥。“坦白说,我甚至不知道 AGI 是什么意思。就像人们说的,见到了你就知道了,我想我还没见到。事实是,我没有花太多时间思考这些词,因为我认为有很多更重要的事情要做……”

要是说有谁知道通用人工智能(AGI)是什么,那很可能就是李飞飞。2006 年,她创建了 ImageNet,这是世界上第一个大型人工智能训练和基准数据集,对催化我们当前的人工智能热潮至关重要。2017 年至 2018 年期间,她在谷歌云担任人工智能/机器学习首席科学家一职。如今,李领导着斯坦福以人为中心的人工智能研究所(HAI),她的初创公司 World Labs 正在构建“大型世界模型”。(如果你问我,这个术语几乎和 AGI 一样令人困惑。)

OpenAI 首席执行官山姆·奥特曼(Sam Altman)去年在接受《纽约客》的一篇人物报道时尝试定义了 AGI。奥特曼将 AGI 描述为“相当于你可以雇佣为同事的中等水平的人类”。

显然,对于一家市值 1570 亿美元的公司而言,这个定义还远远不够好,不足以让其朝着这个方向努力。因此,OpenAI 创建了五个级别,用于内部衡量其向 AGI 迈进的进展。第一个级别是聊天机器人(比如 ChatGPT),接着是推理者(显然,OpenAI o1 处于这个级别),然后是代理(据说接下来就是这个),再是创新者(能够助力发明创造的人工智能),最后一个级别是组织型(能够承担整个组织工作的人工智能)。

还是感到困惑?我也是,李也是。而且,这一切听起来都比一个中等水平的人类同事能做的要多得多。

在演讲的早些时候,李说她从小就对智能的概念着迷。这促使她早在研究人工智能能带来收益之前就开始了相关研究。

“2012 年,我的 ImageNet 与 AlexNet 和 GPU 相结合——许多人称这是现代人工智能的诞生。它由三个关键因素驱动:大数据、神经网络和现代 GPU 计算。一旦那一刻到来,我认为对于整个人工智能领域以及我们的世界来说,生活都不再相同。”

当被问及加利福尼亚州那份有争议的人工智能法案 SB 1047 时,李谨慎发言,以防重提纽森州长上周否决该法案才刚刚平息的这场争议。(我们最近与 SB 1047 的作者交谈过,他更热衷于与李重新展开争论。)

“你们当中的一些人或许知道,我一直都直言不讳地表达了自己对这项[SB 1047]法案的担忧,该法案已经被否决,但当下我正在深入思考,并且怀着极大的兴奋期待着,”李说。“纽森州长邀请我参与 SB 1047 之后的下一步工作,我感到非常荣幸。”

加利福尼亚州的州长最近招揽李以及其他人工智能专家,组成一个特别工作组,以帮助该州给人工智能的部署制定保障措施。李表示,她在这个角色里运用基于证据的办法,并会尽全力倡导学术研究和争取资金投入。然而,她也希望确保加利福尼亚州不会惩罚技术专家。

“我们得真正留意对人类和咱们社区的潜在影响,而不是把担子压在技术本身……要是一辆汽车有意无意地被滥用还伤了人,我们惩罚汽车工程师,比如说福特或者通用汽车的工程师,这没意义。光惩罚汽车工程师可没法让汽车更安全。我们需要做的是继续创新以采取更安全的措施,同时也要把监管框架完善好,不管是安全带还是限速方面,对人工智能也是这样。”

这是我听到的反对 SB 1047 里比较好的一个论点,这个法案原本是要惩罚那些拥有危险人工智能模型的科技公司。

尽管李正在给加利福尼亚州的人工智能监管出主意,但她也在旧金山打理着她的初创公司 World Labs。这是李头一回创办初创公司,她是少数领导前沿人工智能实验室的女性之一。

“我们离一个高度多样化的人工智能生态系统还很遥远,”李说道。

在接下来的几年中,她满怀期待地要让“空间智能”更贴近现实。李表示,当今大型语言模型所基于的语言或许历经了一百万年才得以发展,而视觉和感知可能花了 5.4 亿年。这意味着创建大型世界模型是一项复杂得多的任务。

“这不仅是让计算机能看见,而且真正让计算机理解整个 3D 世界,我将其称为空间智能,”李说道。“我们不只是看到东西就给其命名……我们实际上是看到就付诸行动,去在世界中导航,去彼此互动,而缩小看到与做到之间的差距需要空间知识。作为一名技术专家,我对此非常兴奋。”