「盘中宝」巨头将首次发布这类模型等最新产品,该技术具备商用潜力,生产力工具蓄势待发,这家公司相关技术能力已有落地应用
财联社资讯获悉,9月24日,“2024 火山引擎AI创新巡展”将落地深圳。本次巡展中,火山引擎将公布豆包大模型的最新增长情况,首次发布视频生成模型等最新产品,带来更多模型家族的能力升级,以及火山方舟、扣子专业版、HiAgent 平台、AI全栈云等产品的最新进展。
一、视频大模型迎来Sora时刻,生产力工具蓄势待发
国产大模型快速更新迭代,过去一个月时间内,国内主流大模型基本上都更新了模型版本或发布新应用产品,各大模型厂商持续打磨产品,推出了针对效率办公、创意创作、智能搜索、实时互动等场景的功能,大模型技术加速融入用户的生产和生活。视频生成是当前大模型在多模态方向上的前沿应用,豆包大模型推出视频生成模型,将进一步丰富大模型应用场景,为内容创作、娱乐、广告营销等多个行业带来全新的增长机遇。
浙商证券表示,中文语境下,国内模型文生视频表现优于国外。根据SuperCLUE的测评结果,在中文环境下,国内外多模态能力总体水平差距不大,海外模型在基础认知能力方面领先,国内模型应用能力有优势,国内文生视频模型整体表现好于国外。德邦证券指出,视频大模型迎来Sora时刻,生产力工具蓄势待发。视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。
二、相关上市公司:万兴科技、捷成股份、当虹科技
万兴科技音视频多媒体大模型天幕,聚焦数字创意垂类创作场景,以音视频生成式AI技术为基础,涵盖文生视频、文生3D视频、视频AI配乐、数字人播报等近百项音视频原子能力,同时支持全球不同语言,致力于为全球用户提供音视频创作完整解决方案,相关能力已在filmora、播爆等产品上落地应用。
捷成股份研发的AIGC一键成片系统ChatPV,基于多模态大模型能力,可将视频片段、图片、音频等素材,根据提示词自动生成视频脚本、广告词、分镜脚本等,并根据视频脚本和分镜脚本自动摘取相关素材生成完整的视频,根据创作者要求一键生成高质量视频,极大提升了视频创作者的工作效率和内容生成效果。
当虹科技多模态视听大模型整合了视频、音频、图像、文本和三维模型等跨模态内容的推理与生成能力,包括文本生成、文生视频、图生视频等生成式算法。