又一陸版「Sora」!影像生成模型「可靈」開放邀測體驗

在可灵上输入提示词:「一只戴眼镜的小白兔坐在咖啡馆的椅子上看报纸,桌上有一杯热咖啡」。(图/取自每经网)

大陆近期纷纷推出自行研发的影像生成模型,继北京生数科技4月发表「Vidu」,大陆短影音应用程式「快手」近日也推出影像生成大模型「可灵」,据陆媒报导,目前在快手的剪辑应用程式「快影」开放邀测体验。

据每经网8日报导,可灵为快手AI团队研发,具备诸多优势,包括生成大幅度合理运动,模拟物理世界特性,具备强大概念组合能力和想像力,生成的影像分辨率高达1080p,时长高达2分钟,且支持自由的宽高比。

可灵与Open AI今年2月发表的「Sora」采用相似的技术路线,结合多项自研技术创新,效果对标Sora。

报导指出,可灵使用的是与Sora一样的Diffusion Transformer架构,该架构能巧妙融合时间与空间的资讯,对影片数据进行综合分析和处理,无论是快速移动的物体、剧烈变化的场景,还是复杂的人物动作都能被精确捕捉,使生成的影片内容动态性十足,同时具有很高的物理世界真实感。

此前,大陆清华大学联合北京生数科技有限公司4月发布文字描述生成影片的人工智慧模型「Vidu」,同样以Sora为竞争标竿,目前Vidu能够一键生成长达16秒、画质1080P的高清影片内容。