☰

和奥特曼最铁的OpenAI联合创始人，为什么离职？

最近关于OpenAI“散伙”的标题党新闻刷屏了，也就我们了解的一些情况分享下。

目前公开的信息，是联合创始人兼总裁GregBrockman休Sabbatical（学术休假）到年底，他自己也发了个twitter解释；联合创始人兼SuperAlignment负责人JohnSchulman离职并加入了Anthropic；去年加入的产品副总裁PeterDeng也离开了OpenAI。

Greg是最早的几位cofounder之一，先担任公司CTO，然后担任了公司的总裁，一直是SamAltman最铁的同伴，在去年11月的政变中，也非常支持Sam，在董事会解雇SamAltman几小时后，他就直接选择了辞职，也一直在帮助SamAltman串联同事。并且Greg和Greg的太太，努力说服Ilya最终反对董事会，对结束政变起了非常大的作用。目前看起来，Greg休的是Sabbatical，这个是欧美公司和学界给资深员工的一种福利，每隔5-10年不等，可以休3个月到1年的带薪假，因此是否是离职，目前还没有明确的说法。

即使Greg离职，我们认为，对于OpenAI未来模型的研究，包括GPT5和GPT6的实际影响也是可控的。Greg一直以来给人一种solocoder的感觉，大部分时候都是一个人在做开发，或者只带很少的specialtaskforce。最早之所以会由Mira接管CTO，也是因为Greg不喜欢管理团队，只喜欢编程开发。

早期，Greg作为超级工程大牛，奠定了从OpenAI从一开始，到GPT4的整个Infra基础架构和模型训练框架，传说那时候他一个人手搓出了一半的Infracode。Greg还非常喜欢自己一个周末闭关放一个大招，比如引发巨大争议的GPT3API，就是Greg自己一个周末写出来的，然后周一交给团队调试。ChatGPTPlugin也是类似的被Greg一个周末搞出来的。GPT4之后，Greg对于模型research参与的就比较少了，他的重心更多放在了产品开发，另外也会充当救火队员，解决一些项目和工程的紧急问题。

同时，也有很多猜测，Greg的solo风格造成过一些OpenAI内部的分裂，比如Dario之所以带领了一半GPT3的核心研究人员离开OpenAI并创立Anthropic，就是因为Greg没和团队商量，就一个人搞出了GPT3API，可能造成模型安全的问题。而11月董事会之所以开除Sam，也猜测和Greg激进的推广ChatGPTPlugin和GPTStore，而没有严格遵守safetyreview有关。如果Greg最终离职，可能也是和这个因素有关。

真正离职的JohnSchulman，被称为ChatGPT之父，是Policy-basedRL领域的超级大神，以其在ProximalPolicyOptimization（PPO）和ReinforcementLearningfromHumanFeedback（RLHF）方面的开创性工作而闻名。他曾在加州大学伯克利分校获得计算机科学博士学位，师从强化学习大佬PieterAbbeel，随后在OpenAI担任研究科学家，推动了多项关键技术的发展，尤其是PPO，是JohnSchulman及其团队在2017年提出的一种新型强化学习算法。这一算法通过引入限制策略更新的变化范围，从而显著提高了强化学习算法的稳定性和效率，奠定了ChatGPT，乃至我们这波整个AGI浪潮的基础。John也一直担任OpenAIposttraining团队的负责人，Ilya离职后也接任了SuperAlignmentTeam的leader（SuperAlignmentTeam感觉有点被诅咒了，两人负责人都离职，重要成员JanLeike也离职了）。

John的离职，推测更有可能是文化和研究理念的不合。John一直和Ilya走得比较近，也是非常纯粹的researcher，同时对于safety和alignment也有很强的追求。目前OpenAI逐渐从一个纯粹的研究机构，向一家商业化公司转变，SuperAlignment也是命运多舛。虽然John离开了，但是OpenAI的posttrainingteam还有非常多顶级天才的研究人员，相信他们会接过John的衣钵，继续探索AGI的未来。只是这个未来，是否还有人类存在的空间？

另外一个离职的高管Peter，1年前才加入，主要也是负责产品。OpenAI本身survive的难度很高，内部优胜劣汰非常残酷，Peter应该也是比较正常的离职。他加入之后OpenAI推出的新产品都不能算很成功，尤其是GPTStore。

和奥特曼最铁的OpenAI联合创始人，为什么离职？

相关资讯