AI浪潮 李开复再造独角兽
创新工场董事长兼CEO李开复发起的大模型公司零一万物日前上线「Yi」基础模型,多项数据居各榜单前列。图/中新社
零一万物小档案
创新工场董事长兼CEO李开复发起的大模型公司零一万物日前上线「Yi」基础模型,多项数据居各榜单前列,在「AI 2.0」时代成大模型通用底座有力竞争者。在发起不到8个月后,该公司估值已逾10亿美元跻身独角兽行列。
零一万物官网显示,公司首款中英语开源「Yi」大模型正式上线,发表参数规模6B和34B的基础模型,开放免费商用申请。
36氪引述知情人士表示,「Yi」于11月2日在Hugging Face低调上传模型,近期零一万物更完成由阿里云领投的新一轮融资,估值已超10亿美元。
由于李开复3月才公开招募团队,可说不到8个时间就打造出一只独角兽。报导引述李开复说法,在完成融资前零一万物训练成本已负债数千万美元,反映出创新工场押注大模型带动的「AI 2.0」时代决心。
「Yi」大模型主打200K最长记忆窗口、卓越推理能力以及与现有市场具区别性的尺吋,零一万物官网介绍,「Yi-34B」预训练模型在多项评测中全球领跑,MMLU等评测取得了多项SOTA国际最佳性能指标表现。在评估中文的C-Eval排行榜上,「Yi-34B」以平均81.4分列榜首,超越阿里云9月发表「Qwen-14B」的72.1分,「Yi-6B」以72分列第三。
零一万物公布评测结果显示,「Yi-34B」在常识推理能力和阅读理解能力上均大幅领先全球开源模型,在数学与代码能力上居领先。
零一万物指出,「Yi」模型尺吋轻巧灵活,「Yi-34B」以更小模型尺吋评测,超越Meta的「LLaMA2-70B」、阿联创新研究院的「Falcon-180B」等大尺吋开源模型,对开发者更友好。报导指出,当前市面上常见7B、13B等规模,李开复认为34B是黄金比例,对厂商训练成本更友好。
李开复表示,目前GPU短缺,团队将模型从6B推向大规模时减少试错成本,以不追求大的心态,将「Yi-34B」训练成本下降4成,别的友商若要用2,000张GPU,零一万物只要1,200张。李开复指出,完成「Yi-34B」预训练同时,已启动下一个千亿参数模型的训练。预计在几周内有新内容发表,如「Yi」系列的对话模型、数学模型等会陆续推出。