阿里通义千问技术骨干周畅将离职创业 | 36氪独家
作者 | 邓咏仪 周鑫雨
编辑 | 苏建勋 杨轩
36氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。
36氪了解到,周畅目前还在阿里云系统中,尚未正式离职。但36氪从多方独立信源处得知,周畅已确定要创业。一位消息人士对36氪表示,周畅或将投身于AI应用领域。
而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云CTO周靖人。
对于上述信息,36氪向阿里云求证,截至发稿,暂无回复。
周畅为“通义千问”的大模型负责人,他于2012年本科毕业于复旦计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,而后加入阿里巴巴。他先后在达摩院任职算法专家,再到通义千问的大模型负责人。其专攻领域为深度学习、图挖掘和分布式计算,他在机器学习、数据挖掘、数据库领域国际顶级会议上发表30余篇文章,并担任NeurIPS/ICML/KDD/WWW等学术会议的审稿人。
阿里是国内最早成体系地投入在大模型领域里投入研发的大公司。2019年,阿里就在BERT路线的基础上推出了预训练大语言模型structBERT,而后在2021年推出了多模态大模型M6,再到如今的通义大模型家族。
达摩院下属的通义实验室,也是如今大模型圈内的“人才高地”。如前不久官宣创业的前字节模型技术研发负责人杨红霞,已加入Salesforce的前任实验室负责人司罗、通义视觉实验室负责人徐盈辉等等,都出自达摩院体系,这都是培养起阿里大模型团队的第一批顶尖AI人才。
周畅则是完整经历过阿里大模型演变历程的核心技术骨干。在2020-2021年间,他带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上曾取得突破。
而更早之前,他曾研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,这些技术都有落地到实际应用场景中——比如在手淘多个个性化推荐场景下,让效果获得大幅提升。
进入2024年,国内大模型行业已经进入走过萌芽期,基础大模型层已经格局出现——玩家包括大厂如阿里、字节、腾讯,创业公司如智谱AI、Minimax、月之暗面、百川智能等。市场普遍将关注度放在了AI应用一侧,关注大模型如何落地到千行百业中,这也会带动新一波AI人才的创业热潮。