Sora惊艳发布,文生视频跨越式突破

OpenAI发布Sora模型,1分钟文生视频效果惊艳。2月15日,OpenAI发布文生视频模型Sora,展示出许多亮点:1)视频生成长度可达1分钟,远超其他文生视频模型。2)3D空间的一致性,Sora可以生成具有动态镜头运动的视频,随着摄像机的移动和旋转,人物和场景元素在三维空间中保持连贯运动。3)长期连续性和物体持久性。可以在单个视频中生成同一物体的多个镜头,一个主题即使暂时离开视野也能保持不变。4)能够向前后扩展视频,以及连接两个视频。5)模拟数字世界,Sora能够模拟人工操作,例如控制Minecraft游戏中的玩家。我们认为Sora相比此前其他文生视频模型,已经跨越到实用生产力工具,1分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频,或将带来新一轮内容创作产业革命。

AIGC应用空间广阔,算力需求或呈量级提升。Sora是一种扩散模型,与GPT模型类似,Sora使用transformer架构,将视频和图像表示为称为Patch的较小数据单元的集合,类似于GPT中的token。Sora建立在OpenAI在Dall E和GPT模型的基础上。目前Sora暂未对外开放使用,仅OpenAI CEO Sam Altman在X平台上与评论互动生成视频,我们认为算力的限制可能是目前Sora暂未开放使用的重要因素。随着AIGC技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透,视频创作效率或迎来显著提升,同时视频相对于文字、图像的交互数据量级将有巨大提升,或对应算力需求的高速扩张。

谷歌发布Gemini1.5 Pro,上下文长度达百万token。2月15日,谷歌推出Gemini 1.5 Pro,支持长达100万个token,远超当前其他基础模型,可以一次性处理大量信息,如1小时的视频、11小时的音频、超过3万行代码或超过70万个单词。Gemini 1.5 Pro是一个中型大小的多模态模型,相同基准测试下其性能与此前谷歌最大的Gemini-1.0 Ultra相似,即使上下文窗口增加,Gemini1.5 Pro也能保持高水平的性能。我们认为,谷歌Gemini1.5的推出进一步促进了大模型技术的良性竞争,产业发展趋势欣欣向荣。

投资建议:

算力侧:中科曙光、浪潮信息、海光信息、利通电子、新易盛、高新发展、中际旭创、工业富联、寒武纪、神州数码、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓维信息、烽火通信等。

映射应用:万兴科技、紫天科技、虹软科技、大华股份、海康威视。

风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。

本文源自券商研报精选