辉达又出手!发表新AI模型Fugatto 「可改声音」

AI领头羊辉达(Nvidia)又出招。(示意图:shutterstock/达志)

AI晶片巨头辉达25日秀出全新AI模型Fugatto,可生成音乐和音讯,不仅能修改还会生成全新声音,此模型主要锁定音乐、电影和电玩制作人,但还没有公开发表的计划。

辉达的新模型能根据文本描述,生成音乐与音效,还能让声音产生新奇的变化,例如小号这种乐器会发出狗叫声。

此新模型与其他AI技术的差别在于,能吸收和修改既有音讯,像是将钢琴曲转换成人类歌声,或让录好的话语改变口音及情绪表达。

辉达的全新AI模型是照开放原始码数据训练,但是否公开以及公开方式,辉达表示还在讨论。

OpenAI 今年初推出影像生成工具Sora,脸书母公司Meta10月初发表类似工具Movie Gen,新创公司Runway开发Gen-3 Alpha,都是透过文本提示生成声音或影像,辉达的Fugatto也加入这个行列。