Google:机器学习让Google翻译变强,但双向即时翻译仍有挑战
若要说 Google 对人类踏足跨地域的最大贡献,那么第一个会想到的是 Google Maps,另外一个会想到的是近年成长相当迅速的 Google 翻译,而在去年导入机器学习技术之后,Google 翻译仿佛吃了大力丸,效率倍增,稍早 Google 向台湾媒体说明了机器学习究竟为Google翻译带来哪些改变,但是要真正让手机变成翻译年糕,还是有挑战。
毋庸置疑的,AlphaGo 对上南韩棋王李世石一役后,让「人工智慧」这个看似艰深难懂的技术受到更多人讨论。Google台湾董事总经理简立峰表示,近年来,Google发展重点从「行动第一(Mobile-First)」转向「人工智慧第一(AI-First)」,将机器学习技术应用到使用者日常运用的Google产品和服务中,以改善既有技术、发展跨领域机器学习技术,为使用者带来更快速、更聪明、更便利的服务。
人工智慧的分类包括Super-Human、Par-Human、Sub-Human,Google 翻译就是属于Sub-Human的范畴,而 Google 无人车与 DeepMind 旗下的 AlphaGo 其实就是 Super-Human 的领域。
对 Google 来说,人工智慧并非全新技术,而且其实在旗下的 Google Search、Gmail、YouTube、Chrome、语音辨识、图像搜寻等功能,以及这两年最受欢迎的无人车当中的视觉运算技术,都是人工智慧技术的一环。
对 Google 翻译来说,目前全球每月拥有超过 5 亿的活跃用户,使用 Google翻译的次数每天超过10亿次,每秒于全球完成 1,000 亿个字词翻译,字词跟字词之间,还有复杂的语言差异、语调问题,当然也是要透过机器学习来达成。
目前网路上有 50% 的内容是以英文呈现,但全球却只有 20% 的使用者是以英文为其主要语言,其中网路上并没有印度语以及阿拉伯语言的内容,但这两种语言就占了接近 3 亿使用者,从中可以看到人类对 Google 翻译的需求。
Google 翻译产品经理 Julie Cattiau 指出,其实 Google 翻译刚推出时是以片语式机器翻译(Phrase-Based Machine Translation)作为主要运算方式,透过收集搜寻索引来建构翻译模型,并以统计方式将共同出现过的词汇记录下来,套用到翻译服务中;一直到 2016 年 9 月 Google 导入神经机器翻译技术(Nature Machine Translation)之后,透过端对端的机器学习系统,让 Google 翻译能与时俱进,才快速发展,强调是过去十几年来无法达到的。
从 Julie Cattiau 回应来看,Google 翻译应用程式支援多达 103 种语言,93 种手写输入语言词组,整个系统至今年 4 月导入 26 组语言组合之后,共可翻译 41 组语言组合,包括英文翻译中文、英文翻译泰文、英文翻译日文、英文翻译韩文、英文翻译俄罗斯文、英文翻译印度文、英文翻译法文、英文翻译德文、英文翻译西班牙文、英文翻译葡萄牙文、英文翻译土耳其文、英文翻译越南话等等双向翻译,几乎是以倍增的形式在成长。
Google台湾董事总经理简立峰表示,机器学习可以看成是大数据应用的延伸,人工智慧的发展主要就是延续资通讯科技从云端运算、行动网路、大数据分析等一系列进展演进而来。
以翻译来说,透过导入机器学习技术,不但翻译的语言组数快速成长,翻译的辨识效率也比以往还要更升级,这都是因为透过神经网路机器学习之下的翻译系统不在是片段的翻译,而是一次翻译整个句子,借由具备多层神经元的深度神经网路,让系统得以学习去辨识句子中的模式和结构,最后翻译出的语法更趋近日常对话、更顺畅且易于阅读的结果。
Julie Cattiau 表示,导入神经机器翻译技术之后,Google 翻译现在仅需要一套系统就能完成多元语言翻译,简化了过去需要建构多个不同翻译系统造成可观的运算成本的问题。
此外,透过Zero-Shot翻译让翻译系统自行学习,不需额训练就能自动翻译另一种全新语言。简单来说,以往的翻译模组可能只有英文跟日文、英文跟韩文,日文跟韩文之间的翻译,透过 Zero-Shot 技术,不仅可完成英日、日英、英韩、韩英的互译,还可以直接完成韩日互译,这也是大数据应用搭配机器学习的成果。Julie Cattiau 指出,目前推出的 16 组语言组中,共有 10 组语言组已经采用 Google 神经机器翻译系统(GNMT)。
另一种机器学习的应用是 Google 翻译中的即时镜头翻译 (Word Lens),借由即时视觉翻译功能,使用者只需要拿手机镜头对向文件,就可以立刻取得翻译结果。
Julie Cattiau 指出,考量到现实世界中的字母可能会反射、有污垢、脏污等因素,让Google翻译用「假」字母来模拟各式反光、点来模仿现实生活中图片呈现的情境,以训练机器的演算法来辨识出日常生活中每个语言,现已支援中英文对翻,并且支援 31 组语言辨识。
除了镜头翻译之外,Google 翻译同样提供双向翻译的功能,目前支援 32 种语言组合的双向对话,使用者只需要再选定语言组合后,点选「语音」图示,即可让两个说着不同语言的使用者无障碍的对话,不过虽然现有 Google Cloud 的运算技术已经到位,但是碍于资料库的搜集以及多种可能的因素,目前双向翻译还不能做到真正双向即时翻译。
Google 翻译功能其实非常多,除了上述功能,还提供离线模式跟触控翻译,前者支援 52 种语言,后者支援支援 103 种语言。Google 表示,目前台湾是全球 Google翻译(Android版)成长最快的市场,当中 Android 版版本用户平高年成长 2 倍,iOS版版本用户平高年成长60%。
谈到下一步,Google翻译希望能适时地截断或舍弃来源句子里的单词,并且加强数字与日期翻译,同时为简短、罕见字串、稀有名词与品牌进行更正确的翻译成果。