李开复谈大模型布局,十年内不套现
5月13日,创新工场董事长兼CEO、零一万物 CEO 李开复对外发布千亿参数 Yi-Large 闭源模型,同时将此前发布的 Yi-34B、Yi-9B/6B 中小尺寸开源模型版本升级为 Yi-1.5 系列。
采访中,李开复表示,今天的模型在非常快速地基于Scaling Law(尺度定律)进行演进,大家只是针对一年三个月前的GPT-3.5优化应用,而GPT-4已经改写了应用所具有的能力,所以从业者要不断预测未来技术会怎么走。不是基于今天的技术能做什么,而是预测半年后、一年后的技术有多强大。
今日,李开复明确了零一万物在大模型混战中的战略布局——既做2C也做2B业务,既做基础大模型也做具体应用。最新一轮融资中,零一万物估值近十亿美元,为中国六家大模型独角兽之一。
此前,零一万物发布面向C端用户的一站式AI 工作平台“万知”,类似微软Office 365 Copilot,可以做会议纪要、周报、写作助手,也可以速读文档,帮用户做PPT。2B业务方面,目前零一万物与世界500强达成合作,对外提供API接口。
具体落地场景中,零一万物生产力产品负责人曹大鹏谈及零一万物的独特性时表示,零一万物产品战略相较其他公司有三点不同:第一,只做AI-First的应用,即该应用如果没有AI就不成立;第二,坚持全球化;第三,坚持TC-PMF理念。
PMF(Product-Market Fit,产品市场契合)曾是初创企业追求的核心目标,但随着大语言模型成为新的创业焦点,仅仅追求产品与市场契合远远不够。李开复认为,移动互联网时代,用户规模增长所带来的边际成本很低,但是在大模型时代,模型训练和推理成本构成了每一个创业公司必须面临的增长陷阱。
因此,PMF 这一概念已经不能完整定义以大模型为基础的AI-First 创业,应当引入 Technology(技术)与 Cost(成本)组成四维概念——TC-PMF。“技术成本*产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统 PMF 难上一百倍。” 李开复表示。具体表现在零一万物大模型方面,主要在于将推理成本做到最低,点燃普惠点,通过“模基共建”尽量实现用最少的芯片、最低的成本,训练出能力范围内最好的模型。“模基共建”中的“模”是指模型,“基”是指AI Infra,即基础设施层技术。
从生产力角度来讲,零一万物的差异性在于面向白领与知识工作者在工作中遇到的真实痛点。曹大鹏以零一万物在海外推广的产品举例称,零一万物海外独立产品在2023年9月推出时,带有Chat with Doc功能,ROI已达1以上,加上付费订阅制的要求,目前该产品今年预期将会有一亿人民币的收入规模。
零一万物平台增长和商业化的负责人蓝雨川表示,AI1.0时代有大量公司做项目交付,但赚到一次性的钱之后便没有后续。零一万物今天的思路更像云平台——提供API技术能力以及一系列工具,帮助合作方轻便上线,同时提供行业解决方案,针对各行各业应用场景进行优化,这是零一万物API平台发展的方向和目标。
至于“模应一体”,即既做基础大模型又做具体应用,黄文灏表示,近期他与OpenAI、Anthropic、xAI等很多同行交流,发现在海外模型应用割裂感较国内市场更强。一方面,优秀的研究员们以AGI为目标,认为现阶段应用没什么价值,AGI实现以后,整个商业形态会有很大变化,所以行业应更专注于模型能力。为部署一些应用而消耗大量算力,实际会阻碍追逐AGI的进程。
另一方面,黄文灏表示,做应用的人会觉得模型能力的提升给用户带来的体感不是那么明显。花费大量资金去追求模型性能或指标上的提升,实际并没有解决很多用户的问题。这两类观点是目前海外对于“模应一体”的主要分歧,也是黄文灏所认为的割裂感所在。
相较而言,黄文灏对记者表示,硅谷更偏向于追逐梦想,国内更脚踏实地,但“割裂”确实是所有大模型公司都要碰到的问题,这里面最难的是在组织和人才层面如何配合打通,例如产品经理需要了解模型能力的边界,技术人员需要了解产品的具体需求到底是什么。“基础模型的泛化能力很强,但专门进行一个应用的优化,反而是一个相对来说比较困难的问题。”黄文灏称。
国内大模型公司聚集了目前一级市场大量资金,此前月之暗面传出创始人套现动作,对此,李开复表示,不点评具体公司的情况,但他创立零一万物时便向投资人承诺,10年内不套现,且最好的套现方式是“赶快上市”。
李开复表示,如今国外大厂都在做产品更新,包括OpenAI不久后也会有技术更新的发布,所以今天并列世界第一是最低宗旨,它只是一个开始。“之后随着国外模型进步,我们也会进步,希望能够在彼此互相敦促之下,让全世界的用户都能享用到最好的模型。”李开复表示。