商汤将开放首个人物影片大模型Vimi 支援聊天、唱歌、舞动等互动场景

香港经济日报4日报导,当前生成式AI技术急速发展,虽然让照片中的人物动起来已非新鲜事,但商汤科技指出,目前市面上相关产品的实际应用仍存在挑战,辟如人物动作、表情动作无法精准控制,效果不稳定,且时长有限,只能生成3至4秒短片等,无法满足广大短片创作者的需求。

为解决以上痛点,商汤科技研发的人物影片生成大模型Vimi,可控制照片中人物上半身的自然肢体动作,并自动生成与人物相符的头发、服饰及背景变化。商汤科技表示,该模型也可生成合理的光影变化,让人物动作和视觉效果更为流畅自然。

而且,Vimi可稳定生成长达1分钟的单镜头人物类短片,画面效果亦不会随着时间变化而降低品质或失真。针对喜爱自拍的用户、创作者等需求,该模型还支援聊天、唱歌、舞动等多种娱乐互动场景。模型更获颁WAIC展览展示最高荣誉「镇馆之宝」殊荣,成本届大会最具创新的展品。