鲸世界|李飞飞与她创造的新独角兽
图片来源:李飞飞社交媒体
蓝鲸新闻10月14日讯(记者 朱俊熹)当瑞典皇家科学院宣布将2024年诺贝尔物理学奖授予两位AI先驱后,不仅公众大为震惊,连获奖的"AI教父"Geoffrey Hinton本人在接到获奖通知时也不敢相信,直言"我怎么确定这不是一个诈骗电话"。
并非所有人都认可这一授奖,有计算机科学专家表示,"诺贝尔奖委员会不想错过这波人工智能的热潮,所以巧妙地通过物理学的渠道把Geoffrey Hinton推了上去。"诺奖委员会还在社交媒体上发起投票:你知道机器学习模型是基于物理学方程吗?结果过半的人选择了"不知道"。
在短暂的惊讶后,AI行业内便开始了庆祝。Geoffrey Hinton的众多学生、前同事、同行纷纷为两位获奖者送上祝福。其中,同样在人工智能领域立下开创性贡献的"AI教母"李飞飞在社交平台X上表示,"这真是令人无比兴奋!AI的深远影响才刚刚开始。"
AI正逐渐成为多学科交叉的领域。如果说Geoffrey Hinton是从心理学跨界进入AI,在研究神经网络时还参考了一些物理学原理,那么李飞飞的经历与物理学的关联则更为明显。无论是早年求学,还是如今下场创业,她的人生轨迹中时常出现AI与物理学的交汇,而她对AI发展的贡献同样伟大,还间接帮助了Geoffrey Hinton的项目。
如今,Geoffrey Hinton对AI的研究已经得到诺贝尔物理学奖的承认,那么我们有理由期待,在未来几年内,李飞飞也可能会与这个全球最重要的科学奖项发生更直接的联系。
图片来源:李飞飞社交媒体
更像物理学家的"AI教母"
李飞飞身上跟着很多头衔:斯坦福大学计算机科学系教授、斯坦福以人为本人工智能研究院院长、美国国家工程院院士、前谷歌副总裁……但她曾在公开场合表示,比起工程师,她觉得自己更像一位物理学家。
16岁时,李飞飞跟着父母从中国移民到了美国。原本的高知家庭一下陷入经济上的困顿,必须依靠繁重的体力劳动为生,还未成年的李飞飞也得去餐厅刷盘子补贴家用。高中毕业后,普林斯顿大学向李飞飞发来了全额奖学金,她最终决定前往并主修物理学专业。
在本科期间,李飞飞着迷于阅读物理学家的传记。她发现,爱因斯坦、薛定谔、玻尔等伟大的人物到了职业生涯晚期时,都开始转向探讨人类的精神世界和生命奥秘。这让原本坚定走物理学道路的李飞飞突然对自己的追求产生了怀疑,不自觉地追随先驱的脚步开始思索生命的意义这类命题。
"对我来说,人类生命的基本问题就是智能。带着这样的探寻目光,我步入了神经科学的世界。在几次神经科学领域的实习经历中,更加确定了对智能的热爱。于是,我从硬核的原子世界、物理世界,转向了对智能的探索。"李飞飞后来在一档播客节目中提到。
到了硕博阶段,李飞飞决定转到加州理工学院攻读人工智能和计算神经科学。也是在那一时期,她选择将计算机视觉作为研究方向。现如今行业已经知道数据、算力、算法是AI的三大基础,而计算机视觉相关的图像数据正是最重要的数据分类之一,这一领域当时尚属冷门,计算机能够识别的物体种类极其有限。而业界大多观点认为算法才是计算机视觉的核心,李飞飞却意识到要想让机器认知到更大的世界,或许还需要一个庞大的数据集。
计划创建大规模图像数据集的李飞飞很快遭到了同行劝阻、人手不足、缺乏经费等多重困难。她和团队最终依靠亚马逊众包平台,将海量的图片标注工作分发给全世界近5万名人员,才将项目完成时间从19年大幅缩短到两年半。2009年,日后影响整个AI行业发展的ImageNet数据集正式面世。初始版本共包含320万张标记图像,分为超五千个类别,之后进一步扩展至1500万张图像。
但ImageNet数据集并没有立刻获得行业内的广泛关注,李飞飞为此还组织了大规模图像识别挑战赛,希望能提升ImageNet的名气。而转折点就发生在2012年举办的第三届比赛上,也是在那时,李飞飞和Geoffrey Hinton的道路产生了交集。
那届ImageNet比赛上,Geoffrey Hinton和他的两位学生Alex Krizhevsky、Ilya Sutskever设计了一种新的神经网络算法AlexNet,以高达85%的识别准确率夺得了当年ImageNet挑战赛的冠军,创下了计算机视觉领域的世界纪录。AlexNet基于80年代就已提出的深度卷积神经网络,但当时这套算法被业界视为"老古董",直到经过ImageNet数据集训练后才重获关注。AI领域的深度学习革命也自此开启。
担心AI失控的AI先驱
时间来到2015年,Geoffrey Hinton的学生Ilya Sutskever与李飞飞的学生Andrej Karpathy出现在了同一个名单上:OpenAI的联合创始人。
创立初期的OpenAI是一家非营利性组织,以构建安全且有益的通用人工智能为使命。Ilya Sutskever担任首席科学家一职,Andrej Karpathy则是研究科学家,两人都推动了OpenAI在深度学习领域的发展。Ilya Sutskever更是领导了从GPT-1到GPT-4等多个大语言模型及ChatGPT项目的研发,为OpenAI的崛起做出了巨大贡献。
今年2月,Andrej Karpathy率先离职,转为创办一家AI+教育公司。主导了去年OpenAI"宫斗"的首席科学家Ilya Sutskever也于5月宣布离职,启动自己的创业项目。
造成Ilya Sutskever与OpenAI首席执行官Sam Altman之间矛盾爆发的关键在于,Sam Altman急于推动商业化,而Ilya Sutskever更担心AI技术的安全与风险,于是在去年年底联合董事会"罢免"了Sam Altman。但那场震惊全球AI业界的风波以Ilya Sutskever的妥协告终,Sam Altman很快便重返公司。自那之后,OpenAI频繁出现高管人事动荡。截至目前,原来的11位创始团队成员仅剩3位。
本月初,OpenAI完成了新一轮66亿美元的融资,推高公司投后估值达1570亿美元。作为融资条件,OpenAI需要在两年时间内转型为一家营利性企业,不再由非营利性董事会控制。这再度引发了对OpenAI是否会将商业追求凌驾于安全性之上的担忧。
作为Ilya Sutskever的老师,Geoffrey Hinton在发表诺贝尔奖获奖感言时也力挺学生,称"我特别为我的一名学生解雇了Sam Altman而感到自豪"。这位AI泰斗还对人工智能可能造成的威胁发出警告,担心比人类更智能的系统或将最终掌控一切。就在去年,时任谷歌副总裁的Geoffrey Hinton宣布从谷歌离职,理由是想要不受约束地谈论AI的风险,并表示对自己一生的工作感到后悔。
与Geoffrey Hinton相似,李飞飞也经常在各种活动中呼吁关注AI可能引起的社会灾难风险。去年李飞飞出版自传时,Geoffrey Hinton在推荐语中写道,"她对自己帮助释放的AI技术的巨大潜力和危险提供了紧急而清晰的描述。在这个关键时刻,我们迫切需要她来呼吁人们采取行动,共同承担责任。"
2017至2018年期间,李飞飞曾担任谷歌云AI首席科学家。她称这段经历"刷新了自己的认知",让她看到AI技术的社会意义。除了能够推动社会的发展,AI也可能带来侵犯隐私、虚假信息、取代人力等负面影响。因此从谷歌离开,重返斯坦福后,李飞飞推动创办了斯坦福以人为本人工智能研究院。这所机构希望能充当政界与科技界间的沟通桥梁,推动AI研究、教育、政策等方面的发展,以造福全人类。
但是,李飞飞和Geoffrey Hinton这两位先驱在面对一项AI监管法案的态度上却出现了分歧。作为美国首批最重要、最严格的AI法规之一,加州SB 1047法案旨在对功能强大的前沿AI模型进行安全测试,将波及OpenAI等在加州部署业务的AI企业。
Geoffrey Hinton与众多AI从业者对此联名表示支持,称前沿AI公司合理防范大模型可能的危害是可行且适当的,SB 1047法案代表了向前迈出的重要一步。李飞飞则单独撰文称,她并不反对人工智能治理和立法,但AI政策必须促进开源开发,提出统一且合理的规则,建立消费者信心,而SB 1047未达到这些标准。
当地时间9月30日,加州州长Gavin Newsom正式否决了SB 1047法案,认为该法案可能过于宽泛,会给AI公司带来负担。他还补充道,将会与包括李飞飞在内的多位专家合作,为加州制定可行的AI模型防护措施。
瞄准三维物理世界的空间智能
今年5月,斯坦福官网上李飞飞的个人介绍页面显示,从2024年初到2025年底处于"部分休假"状态。在职业社交平台领英上,她的最新履历也变为"新手",从1月起开始全职做一些"新事物"。
不久后,李飞飞的新事业就得到了解密:一家专注于空间智能的AI初创公司。李飞飞是其联合创始人兼首席执行官。团队规模并不算大,公司现有24人,包括李飞飞在斯坦福的学生和多位华人科学家。
尽管尚未发布任何产品或技术的突破,李飞飞这家名为World Labs的初创企业却在短短几个月内迅速成为新的独角兽。World Labs官网显示,公司已筹集到超过2.3亿美元的资金。领投方为硅谷知名风投机构Andreessen Horowitz、NEA和AI风投基金Radical Ventures,其他投资者包括Adobe、AMD、英伟达等大公司,以及Geoffrey Hinton、Andrej Karpathy、谷歌首席科学家Jeff Dean等个人。
李飞飞曾多次解释她所选择的空间智能这一创业方向。在她的研究生涯中,视觉智能一直是其热情所在。但现在她认为,仅仅看见是不够的,真正的看是为了更好地行动和学习。而空间智能就是从二维进入到三维,在物理世界中进行感知、理解和交互。
在一场TED演讲中,李飞飞展示了一张"猫伸出爪子要把装有牛奶的杯子推下桌子"的图片,来阐述空间智能的工作原理。她解释称,在看到图片的一瞬间,人类大脑就会开始分析玻璃杯的形状、在空间中的位置,以及与周围物体的关系,并产生"想要行动的冲动"。这种冲动就是具有空间智能的生物的本能,能够将感知和行动联系起来。
李飞飞团队目前正在收集一个包含了行为和动作的三维ImageNet数据集,用于训练计算机和机器人如何在三维世界中行动。他们在机器人语言智能方面已取得一些成就,能够根据口头指令让机械臂执行各种任务,例如打开抽屉、用面包等材料制作三明治等。
如果以实现达到甚至超越人类智能的通用人工智能为终极目标,现在的大多数AI还处于能够与人类互动的初级阶段,下一个门槛是如何让AI具备高级推理能力。业界许多主流观点认为,可以通过构建更大、更复杂的模型来提升推理能力,就像OpenAI在9月发布的o1推理大模型。
但李飞飞在最新的访谈中提到,如今的大语言模型和一些多模态模型在底层表示形式上仍然是一维的,与空间智能的方向完全不同。这只是生成式人工智能革命的第一章。在她看来,动物和人类等智能生物拥有在世界中互动、创造文明、甚至随心所欲地完成各种任务的能力,将这些能力转化为原生的三维技术,才是释放潜在AI应用洪流的关键。
就像她在学生时代阅读到的那些物理学巨匠,李飞飞的发言也常常蕴含一些哲学意味。"这也回到了我所追寻的北极星——为什么选择空间智能,而不是平面像素智能?我认为智能的进化路径必然会转向可操作性。"