☰

智谱AI加入视频生成大战

作者 | 刘宝丹

编辑 | 黄昱

AI大模型的能力已经从语言卷向多模态。继快手和爱诗科技发布视频生成工具后，智谱AI也亮出了自己的大招。

7月26日，智谱AI CEO张鹏在公司Open Day上宣布，AI生成视频产品清影（Ying）正式上线，只需30秒就可以生成6秒视频，而且是1440x960清晰度的高精度视频。

目前，清影已经在清言App、PC和小程序端同步上线，所有C端用户都能通过清影免费体验到AI文生视频、图生视频能力。同时，清影API也同步上线大模型开放平台bigmodel.cn供企业和开发者调用。

对智谱AI来说，清影的推出无异于在C端市场又增添了一枚重要棋子，这也是智谱AI成立五年来对多模态能力的一次检验。

智谱AI成立于2019年，由清华大学知识工程实验室（KEG）技术成果转化而来，是国内最早研发大模型的企业之一。公司的愿景是实现通用人工智能（AGI），而多模态是必经之路。

会上，张鹏表示，“为什么要做多模态这件事，视频生成并不是孤立来看，是放到整个技术和产品发展路线当中来看，我们认为它是AGI必须走的路径。”

公司很早就确定要做TO B业务，对于C端战略，张鹏年初表示，TO C也会去做，但目的比较明确，把闭环做起来，给未来也留下一个可能性。他判断，TO C应用可能未来也是一个要爆发的点。

显然，清影就是这一战略思维下的产品。

在C端层面，智谱AI已经打造了清言APP，这是一个人工智能助手，帮用户解决工作学习生活当中的实际问题，做生产力提效。根据公司定位，清影不会单独成为一个独立产品去商业化落地，它是智谱清言产品打造的视频创作智能体。

具体来看，用户输入一段文字后（Prompt），可以选择自己想要生成的风格，包括卡通3D、黑白、油画、电影感等，配上清影自带的音乐，就可以生成充满AI想象力的视频片段。

除了文本生成视频，清影还可以实现图片生成视频，即输入一张图片+相应的提示词，清影大模型将根据提示将图片转变为视频画面。

清影在图生视频带来了更多的新玩法，包括表情包梗图、广告制作、剧情创作、短视频创作等。同时，基于清影的“老照片动起来”小程序也会同步上线，只需一步上传老照片，AI就能让凝练在旧时光中的照片灵动起来。

随着清影的上线，国内AIGC赛道将迎来更加激烈的竞争，尤其是在具备多模态能力的C端产品领域。

7月6日，快手宣布，基于自研的视觉生成大模型产品可灵AI网页端正式上线，普通用户可以登录网站进行功能试用，创作者单次生成的文生视频时长增加至10s；7月24日，爱诗科技发布视频生成产品PixVerse V2，可实现单片段8秒。

MiniMax也公开表示，视频可能下个月会出来，在星野和海螺AI里面也可能会有应用场景。华尔街见闻获悉，月之暗面内部也在做多模态，并且可能很快就会对外公布进展。

清影上线是一个重要信号，在AI大模型的全球技术迭代中，智谱AI已经亮出了手里的多模态武器。接下来，清影将接受残酷的市场考验，它和清言APP也将朝着杀手级应用更进一步。

相关资讯