谷歌AI负责人迷茫:怎么减少内斗和人才流失,拿什么赶超OpenAI

4月9日消息,据美媒theinformation报道,谷歌人工智能部门的主管德米斯·哈萨比斯(Demis Hassabis)对公司在推动人工智能商业化上的新策略深表失望,并曾在两个AI部门合并成立新实验室时考虑过离职。他向同事透露,谷歌在追赶OpenAI的Sora项目方面可能面临着重重挑战。

以下是翻译内容

今年3月初,在度过数周的艰难时刻之后,谷歌AI部门Google DeepMind负责人哈萨比斯试图重振团队士气。此时,谷歌刚发布Gemini,这款基于哈萨比斯团队研究的聊天机器人,被视为谷歌与OpenAI ChatGPT竞争的有力武器。然而,Gemini因错误回答用户问题而遭到公众嘲讽。

据知情人士透露,哈萨比斯在一次团队会议上强调,他们负责开发谷歌内部的底层AI技术,而把这些技术交给亿万用户的责任则由公司其他同事承担。他还提到,为避免再出现尴尬,谷歌员工需要加强沟通。

这一事件也暴露出谷歌在AI领域的内部矛盾尚未解决。哈萨比斯领导的DeepMind与另一AI实验室谷歌大脑(Google Brain)之间长期存在着摩擦。一年前,为整合资源,谷歌匆忙将这两个实验室合并,并交由哈萨比斯统领,但二者之间的紧张关系并未得到缓解。

与此同时,在这家拥有18.2万名员工的科技巨头中,哈萨比斯正在适应新职位所带来的挑战。DeepMind在谷歌内部曾享有一定独立性,专注AI研究而非商业化。而现在,他需与其他领导者紧密合作,把DeepMind的技术转化为产品。据两位近期与他交流的人士透露,这种新的工作模式让这位富有远见的创业者感到沮丧。

为提升纯AI研究在谷歌的影响力,哈萨比斯近期进行了团队重组。3月,他重新调整了管理团队,让更多研究主管能够直接与他沟通。如今,普什米特·科利(Pushmeet Kohli)、赖亚·哈德塞尔(Raia Hadsell)以及祖宾·加赫拉马尼(Zoubin Ghahramani)等负责不同AI领域的谷歌高管都直接向哈萨比斯汇报工作,而非之前的科雷·卡武克乔卢(Koray Kavukcuoglu)。卡武克乔卢虽然曾负责监督规模庞大的Gemini项目,但如今他获得了一个新的头衔——谷歌DeepMind首席技术官。

DeepMind发言人阿曼达·卡尔(Amanda Carl)表示,谷歌大脑与DeepMind的合并顺利,最新重组有助提高效率。哈萨比斯在全体会议上的评论旨在阐明DeepMind在技术开发中的角色,并非推卸责任。她否认哈萨比斯对新工作感到沮丧,并称:“近30年来,DeepMind一直是哈萨比斯的梦想,谷歌依然是我们实现使命的完美伙伴。”

从纸面上讲,哈萨比斯已经拥有击败OpenAI所需的所有关键要素。

他领导的团队由顶尖机器学习研究人员组成,但OpenAI和其他公司一直试图挖角他的精英成员。他还管理一个专门团队,负责将DeepMind的科学成果整合到Gemini项目中。然而,直接负责Gemini项目的关键人员变动频繁,包括约阿尼斯·安东卢(Ioannis Antonglou)和阿米莉亚·格莱泽(Amelia Glaese)在内的多位高级员工已离职,转投OpenAI或自立门户。

谷歌正积极研发下一波AI产品。Gemini项目中,一个专门团队正在研发能自动执行计算机任务的智能主体,甚至吸纳了知名AI初创公司Adept的联合创始人安莫尔·古拉蒂(Anmol Gulati)。但DeepMind也在该领域失去了一些核心人才,如资深计算机科学家达恩·威尔斯查(Daan wierstra),他在谷歌收购DeepMind之前就加入了该公司,然而今年早些时候,他选择了离开,并加入了由DeepMind前研究人员创立的Holistic。

DeepMind背后还有谷歌庞大的数据中心网络和数十亿产品用户的支持,为推广新AI产品提供了广阔的平台。有传言称,谷歌与苹果正就增强iPhone功能(例如Siri)进行合作谈判,若协议达成,哈萨比斯的产品将有机会接触到更多用户。

技术上,DeepMind正在缩小与OpenAI的差距。尽管Gemini在某些方面优于OpenAI的GPT-4,但GPT-4的模型较早推出,使OpenAI能收集到大量有价值的数据来优化模型。同时,OpenAI的文生视频服务Sora引起极大关注,哈萨比斯近期对一位同事表示,他认为谷歌在这一领域赶超对手尤为困难。

一家大公司

2022年11月,ChatGPT的问世在人工智能界引发巨大反响,给谷歌带来了震撼。

长期以来,谷歌一直拥有全球领先的两支机器学习队伍。谷歌大脑不仅是大语言模型的开拓者,也是Transformer(转换器)技术的缔造者,正是这项技术成为了构建ChatGPT的核心。同时,DeepMind在AI领域取得了举世闻名的成就,其开发的人工智能系统在国际象棋和围棋等复杂游戏中屡获佳绩。然而,这两个团队在共享代码和计算资源等方面经常发生冲突。更重要的是,它们都没能推出像OpenAI那样能够引爆网络的产品。

ChatGPT发布几周后,谷歌CEO桑达尔·皮查伊(Sundar Pichai)指令谷歌大脑和DeepMind的管理层放下各自的分歧,联手开发名为Gemini的AI模型。

同时,皮查伊还开始准备更大的计划——合并这两大AI团队。然而,哈萨比斯对这次重组显得不太热情。他私下向一位同事透露,对领导新合并部门并不自信,甚至考虑离开谷歌,筹资创立一个全新的研究实验室。这样的举动无疑将使他从日常繁琐的管理事务中解脱出来,专注于自己钟爱的研究工作。

但当皮查伊于2023年4月正式命令合并两个团队时,哈萨比斯还是接受了新职务。在当月的一次会议上,他向员工详细说明了合并的情况,并强调了合并对DeepMind员工的诸多好处,比如更广泛的服务器访问权限,以及两支团队研究人员合作的机会。

然而,据会议中的三位参与者透露,哈萨比斯的发言显得缺乏热情,似乎对合并并不太感兴趣。这让许多谷歌研究人员大感意外,因为就在几个月前,哈萨比斯还在努力限制DeepMind和谷歌大脑之间的合作仅在Gemini项目上进行。

这次重组并没有为谷歌的AI领域带来期待中的和谐,新团队在资源分配上依然存在冲突。谷歌把原本致力于通用人工智能(AGI)探索性研究的员工调整到了Gemini项目,该项目迅速扩大到约1000名员工。同时,公司还完全关闭了一些AI项目,让很多内部员工倍感沮丧。

与此同时,OpenAI继续从谷歌挖走关键AI人才,这让哈萨比斯很不高兴。据最近与他交谈的一位人士透露,哈萨比斯抱怨谷歌的薪酬政策无法阻止研究人员被这家初创公司丰厚的待遇所吸引。之后,DeepMind提高了研究人员的薪资,部分得益于一个特别的股票奖励计划。然而,哈萨比斯对于同事们在媒体上过度渲染一些关键人员的离职事件表示失望。

在展示AI研究成果的压力下,哈萨比斯和他的团队可能过度夸大了他们的成就。去年12月,谷歌发布了备受关注的Gemini。然而,其视频演示的误导性引发了批评,为这项技术蒙上了阴影。视频中令人印象深刻的是,模型似乎能够即时回应语音提示,但实际上存在延迟,而且视频所示的生成提示与实际生成的回应用词不一。据一位参与者透露,哈萨比斯在随后的全公司会议上表示,他希望这次演示能“鼓舞人心”,展示这项技术最终能达到的目标。

另一个项目AlphaGeometry也遭受类似批评。今年1月,DeepMind宣称该AI系统能“以接近国际数学奥赛金牌水平解决复杂几何问题”。然而,研究自动推理的纽约大学教授欧内斯特·戴维斯(Ernest Davis)指出,这未提及其明显的局限性。例如,该AI只能处理二维几何形状,对面积等概念理解有限。

DeepMind的早期投资者弗兰克·米汉(Frank Meehan)对当前情况表示担忧,认为这些争议分散了哈萨比斯对AGI研究的关注,可能是其“持续感到挫败”的原因。他还指出,OpenAI在生成引人注目的视频方面取得显著进展,而谷歌在一些图像生成问题上却遇到难题。

然而,哈萨比斯依然坚信AGI的到来。参与Gemini项目的一位人士透露,为了更好地衡量哈萨比斯长期目标的进展,DeepMind正在开发针对AGI的新基准。另有人士称,团队希望Gemini不仅能强化谷歌产品,也能帮助他们推动研究进步,提出新方法和算法。

纽约大学心理学和神经科学教授加里·马库斯(Gary Marcus),曾将AI初创公司卖给优步,他对哈萨比斯的能力充满信心。他认为哈萨比斯能在DeepMind的研究和为谷歌产品提供动力间找到平衡。“如果有谁能把事情做成想要的样子,那就是哈萨比斯。但谷歌是大公司,压力自然大。我们只需耐心等待,看看最终结果如何。”(小小)