☰

Sora惊艳发布，文生视频跨越式突破

OpenAI发布Sora模型，1分钟文生视频效果惊艳。2月15日，OpenAI发布文生视频模型Sora，展示出许多亮点：1）视频生成长度可达1分钟，远超其他文生视频模型。2）3D空间的一致性，Sora可以生成具有动态镜头运动的视频，随着摄像机的移动和旋转，人物和场景元素在三维空间中保持连贯运动。3）长期连续性和物体持久性。可以在单个视频中生成同一物体的多个镜头，一个主题即使暂时离开视野也能保持不变。4）能够向前后扩展视频，以及连接两个视频。5）模拟数字世界，Sora能够模拟人工操作，例如控制Minecraft游戏中的玩家。我们认为Sora相比此前其他文生视频模型，已经跨越到实用生产力工具，1分钟长度有望大规模应用在短视频领域，扩展视频的能力也有望制作长视频，或将带来新一轮内容创作产业革命。

AIGC应用空间广阔，算力需求或呈量级提升。Sora是一种扩散模型，与GPT模型类似，Sora使用transformer架构，将视频和图像表示为称为Patch的较小数据单元的集合，类似于GPT中的token。Sora建立在OpenAI在Dall E和GPT模型的基础上。目前Sora暂未对外开放使用，仅OpenAI CEO Sam Altman在X平台上与评论互动生成视频，我们认为算力的限制可能是目前Sora暂未开放使用的重要因素。随着AIGC技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透，视频创作效率或迎来显著提升，同时视频相对于文字、图像的交互数据量级将有巨大提升，或对应算力需求的高速扩张。

谷歌发布Gemini1.5 Pro，上下文长度达百万token。2月15日，谷歌推出Gemini 1.5 Pro，支持长达100万个token，远超当前其他基础模型，可以一次性处理大量信息，如1小时的视频、11小时的音频、超过3万行代码或超过70万个单词。Gemini 1.5 Pro是一个中型大小的多模态模型，相同基准测试下其性能与此前谷歌最大的Gemini-1.0 Ultra相似，即使上下文窗口增加，Gemini1.5 Pro也能保持高水平的性能。我们认为，谷歌Gemini1.5的推出进一步促进了大模型技术的良性竞争，产业发展趋势欣欣向荣。

投资建议：

算力侧：中科曙光、浪潮信息、海光信息、利通电子、新易盛、高新发展、中际旭创、工业富联、寒武纪、神州数码、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓维信息、烽火通信等。

映射应用：万兴科技、紫天科技、虹软科技、大华股份、海康威视。

风险提示：技术迭代不及预期、经济下行超预期、行业竞争加剧。

本文源自券商研报精选

Sora惊艳发布，文生视频跨越式突破

相关资讯