智谱AI给大模型价格战再添一把火
6月5日,智谱AI推出第四代GLM系列开源模型GLM-4-9B,并对清言App和MaaS大模型开放平台bigmodel.cn发布了一系列更新。
GLM-4-9B系列共包含四个版本,分别为基础版GLM-4-9B(8K)、对话版GLM-4-9B-Chat(128K)、超长上下文版GLM-4-9B-Chat-1M(1M)和多模态版GLM-4V-9B-Chat(8K)。其中,对话版模型支持多轮对话、网页浏览、代码执行、自定义工具调用等多个功能。
这款模型预训练数据量为10T,是ChatGLM3-6B模型的3倍以上。ChatGLM3为智谱AI的第三代对话预训练模型,ChatGLM3-6B则是其中的开源模型。性能方面,第四代模型中英文综合性能相比前代提升了40%,而上下文从128K扩展到了最高1M tokens(约为200万字)。此外,其多语言、多模态等能力也有所提升。
在国内大模型独角兽阵营中,智谱AI是少数走企业端路线的公司,并及时跟随DeepSeek的降价步伐,积极参与到DeepSeek掀起的大模型API价格战中。
GLM-4-9B发布后,智谱AI宣布再次降价,有意给大模型价格战再添一把火。
目前,其MaaS开放平台已全线接入新模型。其中,GLM-3-Turbo的接入价格从5元/百万Tokens降为1元/百万Tokens,GLM-4V(图生文)从100元/百万Tokens降为50元/百万Tokens,CogView3(文生图)则从0.25元/张降为0.1元/张。
企业权益相关的服务体系中,各类模型降价更为明显,最低价格逼近普通权益的60%。GLM-4-Air和GLM-3-Turbo最便宜可至0.6元/百万Tokens,GLM-4V(图生文)最低30元/百万Tokens,性能更强的GLM-4-0520最低为60元/百万Tokens,降幅达40%。
据智谱AI COO张帆介绍,当前企业客户除了要求模型性能和服务成本之外,对于私有化部署和业务场景的价值转化也有高期待。
对于模型性能和成本的需求,该公司现阶段主要是通过模型迭代和降价来实现。针对私有化部署,其MaaS平台上线了微调功能,允许企业客户利用自有数据对模型进行训练。
智谱AI还将目标瞄准了制造、大消费、汽车等领域。此外,团队在MaaS平台也嵌入了智能体API,为开发者群体提供AI工具。
清言App的进展则在于推出了多智能体协作系统“清言Flow”,强调多轮、多态的对话交互模式,而非单一智能体对话。智谱AI CEO张鹏透露,目前该App已经拥有超过30万个智能体活跃其中,日均Tokens调用量达到400亿次。
就创业公司而言,这算是一个不小的调用量。有媒体报道,字节跳动旗下“豆包”的日均处理量为1200亿Tokens,其涵盖网页和App端总体日活超200万。
不同于行业中普遍认为企业端市场规模天花板太低的论调,智谱AI仍然选择在此投入更多精力。当众多独角兽角逐用户端超级应用之时,这家公司想借降价分得更多企业市场蛋糕。
在张鹏看来,当前大模型的Scaling Law并未失效,AI技术的增长进入了一个全新的阶段。这意味着,大模型技术的创新依旧是突飞猛进的进行时,甚至还有速度越来越快的迹象。
不过,这条技术曲线的陡峭距离让更多人体会到AI“有用”还有很长的路要走,对未来的想象力只有化为现实的生产力才具有真正意义。