☰

又一陸版「Sora」！影像生成模型「可靈」開放邀測體驗

在可灵上输入提示词：「一只戴眼镜的小白兔坐在咖啡馆的椅子上看报纸，桌上有一杯热咖啡」。（图／取自每经网）

大陆近期纷纷推出自行研发的影像生成模型，继北京生数科技4月发表「Vidu」，大陆短影音应用程式「快手」近日也推出影像生成大模型「可灵」，据陆媒报导，目前在快手的剪辑应用程式「快影」开放邀测体验。

据每经网8日报导，可灵为快手AI团队研发，具备诸多优势，包括生成大幅度合理运动，模拟物理世界特性，具备强大概念组合能力和想像力，生成的影像分辨率高达1080p，时长高达2分钟，且支持自由的宽高比。

可灵与Open AI今年2月发表的「Sora」采用相似的技术路线，结合多项自研技术创新，效果对标Sora。

报导指出，可灵使用的是与Sora一样的Diffusion Transformer架构，该架构能巧妙融合时间与空间的资讯，对影片数据进行综合分析和处理，无论是快速移动的物体、剧烈变化的场景，还是复杂的人物动作都能被精确捕捉，使生成的影片内容动态性十足，同时具有很高的物理世界真实感。

此前，大陆清华大学联合北京生数科技有限公司4月发布文字描述生成影片的人工智慧模型「Vidu」，同样以Sora为竞争标竿，目前Vidu能够一键生成长达16秒、画质1080P的高清影片内容。

相关资讯