一举发布两款大模型,字节跳动加入AI视频生成“战局”

9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,一举发布了两款视频生成大模型并首次面向企业市场开启邀测,正式宣告进军AI视频生成领域。与今年2月OpenAI发布的Sora相同,字节所发布的的“豆包”大模型只需输入简单的提示词或图片,一条接近实拍的影视级AI视频就可自动生成,并且能实现自然连贯的多拍动作和多主体复杂交互。

据了解,本次所发布的模型具体为豆包视频生成-PixelDance和豆包视频生成-Seaweed。除视频大模型外,字节跳动还发布了豆包音乐大模型、同声传译模型等产品。

据了解,豆包大模型原名“云雀”,在2023年8月通过《生成式人工智能服务管理暂行办法》备案,是首批能正式上线面向公众服务的8家大模型之一。2024年5月15日,豆包大模型在火山引擎原动力大会上正式发布。

自发布以来,豆包大模型发展趋势向好。据火山引擎总裁谭待透露,5月以来,豆包大模型日均调用量整体呈现爆发式增长。截至今年9月,豆包大模型的日均Tokens(表示和传递信息的标识符)调用量超过1.3万亿,整体增长超10倍。除语言模型外,目前豆包文生图模型日均生成图片也达到了5000万张,此外,豆包目前还日均处理语音85万小时,相当于7万天的广播节目播出时长的总和。

值得一提的是,虽然豆包通用模型TPM(每分钟Tokens)、RPM(每分钟请求书)达到国内最高标准,但其推理定价却大幅低于行业价格,这一度掀起了国内大模型领域的降价潮。使得阿里、百度、腾讯等大模型厂商纷纷宣布对主力模型进行降价,目前降价仍有延续之势。

今年9月19日,阿里宣布阿里云百炼平台上的三款通义千问主力模型再次降价,产品的降价幅度在50%至85%之间不等。

对此,谭待在发布会当天表示:“这样大幅的降价背后,其实大量的创新应用随之不断涌现,这也是几个行业里面模型调用量在突飞猛进的关键。其他厂商也在跟随我们的步伐,不断把模型进行降价,大家共同努力让应用的生态更加繁荣。”

事实上,自今年2月Open AI推出Sora以来,国内外已有十多家公司发布或更新视频生成模型。今年6月,快手发布可灵大模型,是国内首个对标Sora的视频生成大模型产品,截至目前已经经历了9次迭代,今年9月9日,快手还宣布启动“可灵AI电影共创计划”,联手9位导演使用可灵AI生成9部电影。9月19日,阿里也宣布通义万相视频生成功能上线。通义万相视频模型支持最长5秒、每秒30帧、分辨率为720P的视频生成。