微软近日提出了一项新的专利,专利的名称为「用于合成音讯的人工智慧模型」。专利说明微软正在发明一种智慧音讯合成技术,用于为各种媒体如电影、电视节目、游戏,甚至现场录音创造声音、音乐和其它音讯元素。
专利提到了游戏中的动态时刻,可以创造出配合玩家行动的乐谱,可以使用视觉、音讯和文本特征来设置参数,以指导众多的AI模型构建音讯乐谱。
微软的新专利描述详细介绍了众多的AI引擎,这些引擎的任务是根据提供的数据进行音讯播放。可以分析人类的表情和情绪,收集位置数据,分析形势等等。AI可以学习图片、影片、电影、现场活动,并产生一组音讯,可以用适当的声音效果和音乐为视觉效果分层。
这种高科技的人工智能可以为媒体创作开辟许多新颖的作法,可以用一个巨大的、不断增长的音频乐谱库来制作电影、游戏等,例如为英雄的出场设计一首史诗般的管弦乐曲,为宠物的离去谱写一首忧伤的曲子,为枪声和爆炸开发音效,所有这些都可以委托给人工智能的算法。