在嘈杂背景中分离特定声音,AI助美国公司攻克声学难题
来源:环球时报
【环球时报综合报道】如何在嘈杂的背景中分离特定声音,一直是声学领域的难题,也被人们称为“鸡尾酒会问题”——站在满是人的房间里,手持鸡尾酒,努力辨识宾客对话。如今,美国一家公司正利用AI技术提供新的解决思路。
据雅虎新闻网5日报道,美国“波浪科学”公司创始人基思·麦克尔文多年前在协助美国政府处理一起战争罪案件时对解决“鸡尾酒会问题”产生了兴趣。麦克尔文称:“我们试图弄清是谁下令屠杀平民。一些证据包括一群人同时说话的录音——那时我才了解‘鸡尾酒会问题’是什么”。他说,“我当时成功地从语音中去除环境噪音,但当我开始尝试从不同人的说话声中分离目标声音时,发现这是一个非常困难的问题”。
为此,麦克尔文在2009年创立了“波浪科学”公司。该公司最初使用阵列波束成形技术(array beamforming)来分离声音,但该技术成本太高且在许多情况下无法取得良好效果。经过10年的长期研究,麦克尔文最终利用AI技术找到了解决办法。
报道称,麦克尔文编写了一款人工智能程序,可以通过分析声音在到达麦克风之前如何在房间里反射,定位其原始来源,并借此筛选出干扰声音。该技术的首次应用就帮助破解一起谋杀案,此后包括英国在内的多国政府也对这一技术进行了测试。目前“波浪科学”公司正在向美国军方推销该技术,美国军方已将其用于分析声呐信号。(周扬)