脸书「翻译年糕」再进化!导入人工智慧分析前后文

实习记者黄肇祥综合报导

Facebook 的「翻译年糕」现在不只想当一块年糕,脸书想让它成为「哆啦A梦」啦!不过并不是让它将拥有百宝袋,而是将抛弃过去短句单字的翻译方式,改用神经机器翻译(Neural Machine Translation),让系统自动依据上下文意思进行翻译。

▲脸书为贴近在地文化,将翻译改为「翻译年糕」可爱的名称。(图/翻摄网路

为了让脸书上 20 亿人能够不受限于语言自由沟通,脸书团队希望提升翻译品质,但这并不是向简单的工作,因为我们终究是人类,各种口语化用法对于翻译系统而言是一大挑战。因此脸书团队将使用卷积神经网路(Convolutional Neural Networks,CNN)、递回神经网路(Recurrent Neural Networks,RNN)等系统来提升翻译品质。

过往脸书的翻译系统并非无法使用,但它只能分辨单一词性与短句,因此一旦拉长对话,或者使用几个明显意涵不同的单字,翻译就会呈现凌乱、无法理解的状况,新的神经网路系统会考虑上下文之后再进行翻译,脸书提供两组由土耳其文翻译至英文的示范,我们可以明显的发现,下图的英文翻译是优于上图的。

▲上图的翻译句型不符合我们常见的文法,下图则比较接近。(图/翻摄脸书)

脸书人工智慧研究(FAIR)团队在三个月的时间内,先是运用 CNN 系统推出英文翻译至德文法文两组系统,翻译品质分别提高12%、14.4%,此外研究团队也希望持续进化这项功能,让系统而根据其他条件翻译出更精准的意思,例如运用文本附带的图片,加以判断文章内容

▲Google 翻译早在去年就开始使用神经机器翻译系统。(图/记者洪圣壹摄)

不过神经机器翻译,微软与 Google 在 2016 年就已经开始使用,Google 小姐也早已具备神经机器翻译系统,脸书在这个项目上显然落后对手一拍,不过现在加紧脚步跟上,脸书的功能将有机会比 Google 翻译更常被使用,毕竟他们可是拥有超过 20 亿使用者长期驻扎啊。