Sora登场对AIGC意味着什么?
OpenAI2月16日凌晨发布“王炸”文生视频大模型Sora,再次引爆科技圈。在OpenAI官网分享的演示视频中,Sora可以直接输出有多个角色、多种场景和运镜的画面。这对比一年前 AI 生成的视频,简直是天差地别,其视频长度方面就“碾压”同行。
方正证券分析师郑震湘领导的团队在题为《AI巨轮滚滚向前》报告中直言,文生视频大模型Sora震撼登场,AIGC新时代已至。Sora完美继承DALL·E 3的画质和遵循指令能力,并利用了GPT扩写,具备超长生成时间(60s)、单视频多角度镜头、理解物理世界三大突出优势:
方正证券在报告中指出,英伟达正式发布Chat With RTX,AI加速普及,通用人工智能时代也正加速来临。在高性能AI处理器的加持下,AI+N类终端的时代浪潮已至,AI改变的不只是 PC 与手机,科技赋能将全方位渗透,消费电子也将迎来全新的增长机遇:
报告称,核心公司业务进展近况进一步印证了现阶段块发展两个核心要素:AI方向的持续产品迭代、庞大的国产化算力需求。预计在AI 算力需求高景气的背景下,国内AI算力产业链将在2024年迎来更加快速的发展。
AIGC 新时代已至
方正证券在报告中指出,从Runway、Pika 到 Sora,文生视频大模型频出,视频长度从表情包长度的3s、4s 到主流短视频长度的60s,模型对物理世界的理解愈加接近现实,已具备强大的商业化落地价值,创作内容产业革命来临,AIGC 新时代已至:
报告称,Sora震撼效果的原因主要有:1)训练端:基于 Transformer 架构的扩散模型,降维并通过Patche 进行训练;采样的灵活性与独特的训练路径(原始 尺寸、时长训练);利用DALL·E 3 re-captioning 功能,给训练用的视频素材都加上高质量文本描述;2)输入端:利用 GPT 先将用户输入的提示词精准详尽扩写,再将扩写后的提示词交给 Sora:
方正证券认为,AI大模型的发展正不断加速AGI通用人工智能的到来,纵观整个AI产业链,硬件和软件的配合才能更好地实现多种终端应用的价值化落地,可以预见的是,未来的 AI 时代又是生产力的爆发式革命:
方正证券认为,手机、MR、机器人等新品迭出,诸多新品亮相,AI终端时代来临。英伟达、AMD、高通分别推出GeForceRTX 40 SUPER 系列、锐龙8000G 系列、骁龙XR2+ Gen 2 等高性能处理器,性能水平实现跃升,助力AI加速渗透PC、汽车、智能家居等终端场景:
报告指出,MR为AI最佳落地终端,高度赋能MR 内容与硬件,泛社交、B 端应用拓展也拥有想象空间:
方正证券认为,英伟达以及AMD等核心公司的业务进展近况进一步印证了现阶段板块发展两个核心要素:AI方向的持续产品迭代、庞大的算力需求:
报告称,AI浪潮也在推动光模块、交换机配套升级 :
本文主要来源于方正证券报告《AI 专题:AI 巨轮滚滚向前》分析师:郑震湘(S1220523080004)佘凌星(S1220523070005)钟琳(S1220523070006)刘嘉元(S1220523080001)华尔街见闻有删节