照片变视频,商汤Vimi可控大模型亮相WAIC 2024

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(以下简称“WAIC 2024”)在上海开幕,同时发布了《人工智能全球治理上海宣言》,并宣布联合国工业人工智能联盟卓越中心成立。逾千名联合国代表、政府官员、国际组织专家、业界领袖及投资者,围绕“共商共享,善治善智”主题,深入探讨AI发展、安全与治理。

据悉,WAIC 2024上公布八大镇馆之宝,包括商汤Vimi可控人物视频生成大模型 、联想集团笔记本YOGA Book 9i AI元启、特斯拉赛博越野旅行车 、智谱AI基座大模型、智能飞行器展区展出的三家电动垂直起降航空器(eVTOL)、阿里云通义灵码等创新产品。其中,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型—Vimi入选WAIC展览“镇馆之宝”,成为本届大会最具创新展品。Vimi基于商汤日日新大模型,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

“Vimi可控人物视频生成大模型,突破现有技术瓶颈。Vimi不仅精准控制人物表情,更在半身范围内自然调节肢体动作,自动生成适配的发型、服饰及背景,光影效果流畅自然,打造唯美画面。”商汤科技相关负责人表示,只通过一张人物照片,Vimi能持续生成1分钟高质量视频,不受时间影响,满足长时间视频创作需求。据了解,Vimi基于商汤日日新大模型,融合深厚视觉技术,精准解析复杂人物图片,通过AIGC技术,实现和谐视频内容创作,现已在官网开放预约。

值得一提的是,WAIC 2024于7月4日至6日举行,展览规模创历史新高,企业、展品、新品数量均达巅峰。具身智能展区亮点纷呈,超40款智能机器人,含约25款人形机器人亮相。大模型领域同样吸睛,文生图、视频等模型齐聚。大会重视AI全球治理与国际合作,特设高级别会议,汇聚全球政产学研精英,共商AI治理大计,打造国际合作新高地。

文、图|记者 潘亮