和奥特曼最铁的OpenAI联合创始人,为什么离职?

最近关于OpenAI“散伙”的标题党新闻刷屏了,也就我们了解的一些情况分享下。

目前公开的信息,是联合创始人兼总裁GregBrockman休Sabbatical(学术休假)到年底,他自己也发了个twitter解释;联合创始人兼SuperAlignment负责人JohnSchulman离职并加入了Anthropic;去年加入的产品副总裁PeterDeng也离开了OpenAI。

Greg是最早的几位cofounder之一,先担任公司CTO,然后担任了公司的总裁,一直是SamAltman最铁的同伴,在去年11月的政变中,也非常支持Sam,在董事会解雇SamAltman几小时后,他就直接选择了辞职,也一直在帮助SamAltman串联同事。并且Greg和Greg的太太,努力说服Ilya最终反对董事会,对结束政变起了非常大的作用。目前看起来,Greg休的是Sabbatical,这个是欧美公司和学界给资深员工的一种福利,每隔5-10年不等,可以休3个月到1年的带薪假,因此是否是离职,目前还没有明确的说法。

即使Greg离职,我们认为,对于OpenAI未来模型的研究,包括GPT5和GPT6的实际影响也是可控的。Greg一直以来给人一种solocoder的感觉,大部分时候都是一个人在做开发,或者只带很少的specialtaskforce。最早之所以会由Mira接管CTO,也是因为Greg不喜欢管理团队,只喜欢编程开发。

早期,Greg作为超级工程大牛,奠定了从OpenAI从一开始,到GPT4的整个Infra基础架构和模型训练框架,传说那时候他一个人手搓出了一半的Infracode。Greg还非常喜欢自己一个周末闭关放一个大招,比如引发巨大争议的GPT3API,就是Greg自己一个周末写出来的,然后周一交给团队调试。ChatGPTPlugin也是类似的被Greg一个周末搞出来的。GPT4之后,Greg对于模型research参与的就比较少了,他的重心更多放在了产品开发,另外也会充当救火队员,解决一些项目和工程的紧急问题。

同时,也有很多猜测,Greg的solo风格造成过一些OpenAI内部的分裂,比如Dario之所以带领了一半GPT3的核心研究人员离开OpenAI并创立Anthropic,就是因为Greg没和团队商量,就一个人搞出了GPT3API,可能造成模型安全的问题。而11月董事会之所以开除Sam,也猜测和Greg激进的推广ChatGPTPlugin和GPTStore,而没有严格遵守safetyreview有关。如果Greg最终离职,可能也是和这个因素有关。

真正离职的JohnSchulman,被称为ChatGPT之父,是Policy-basedRL领域的超级大神,以其在ProximalPolicyOptimization(PPO)和ReinforcementLearningfromHumanFeedback(RLHF)方面的开创性工作而闻名。他曾在加州大学伯克利分校获得计算机科学博士学位,师从强化学习大佬PieterAbbeel,随后在OpenAI担任研究科学家,推动了多项关键技术的发展,尤其是PPO,是JohnSchulman及其团队在2017年提出的一种新型强化学习算法。这一算法通过引入限制策略更新的变化范围,从而显著提高了强化学习算法的稳定性和效率,奠定了ChatGPT,乃至我们这波整个AGI浪潮的基础。John也一直担任OpenAIposttraining团队的负责人,Ilya离职后也接任了SuperAlignmentTeam的leader(SuperAlignmentTeam感觉有点被诅咒了,两人负责人都离职,重要成员JanLeike也离职了)。

John的离职,推测更有可能是文化和研究理念的不合。John一直和Ilya走得比较近,也是非常纯粹的researcher,同时对于safety和alignment也有很强的追求。目前OpenAI逐渐从一个纯粹的研究机构,向一家商业化公司转变,SuperAlignment也是命运多舛。虽然John离开了,但是OpenAI的posttrainingteam还有非常多顶级天才的研究人员,相信他们会接过John的衣钵,继续探索AGI的未来。只是这个未来,是否还有人类存在的空间?

另外一个离职的高管Peter,1年前才加入,主要也是负责产品。OpenAI本身survive的难度很高,内部优胜劣汰非常残酷,Peter应该也是比较正常的离职。他加入之后OpenAI推出的新产品都不能算很成功,尤其是GPTStore。