用台语打造AI翻译系统 Meta陈鹏仁:开民宿伯父想买
Meta日前发布用闽南语(台语)与英语互译的AI软体,主要幕后功臣为陈鹏仁,出生于台湾的他,曾在新北市板桥居住20多年,毕业于台湾大学资讯工程学系,在台工作1年多后即加入Meta公司前身脸书的纽约办公室。
在Meta工作近10年的陈鹏仁,主要负责AI相关,脸书的地点打卡功能精进就由他操刀,4年前研发文字翻译,1年半前转为研究语音对语音翻译。
陈鹏仁接受媒体访问时坦言,这套系统获得媒体关注感到十分意外,新闻报导出来后,伯父透过父亲询问是否有贩卖,因为伯父经营民宿,不太懂英文,如果有这套软体,未来接待国外观光客会方便许多。
他谈到,闽南语是很复杂语言,尽管开发团队成员大多听得懂、会讲台语,但牵涉到七声八调,开发难度大增,翻译系统发出来的声音有时候腔调不对,需要找出新的研究课题设法解决,这是开发闽南语翻译系统比较特别部分。
在研究过程中,陈鹏仁和团队也有进行使用者意见调查,找出语音到语音翻译系统有哪些特性,因此接触到一些闽南语使用者,对于这项专案都非常热情,提供很多建议。团队甚至找来一名闽南语老师,协助团队更精准翻译闽南语。
被问及在美国工作如何让小孩学会闽南语,陈鹏仁表示,有跟太太讨论如何把闽南语带到日常生活中,让小孩自然而然熟悉这个语言。他的大女儿目前约4岁半,小女儿约1岁半,有透过一些辅助教材让她们熟悉闽南语,例如睡前读闽南语绘本,或跟小孩一起听闽南语儿歌及流行音乐。
陈鹏仁透露,现在有越来越多以闽南语为主的Podcast,讲一些有趣素材,自己平常走路或送女儿去学校时会收听。YouTube上也有很多自媒体用闽南语介绍有趣事情,透过这些方法可以维持听力。说的部分在家里跟小朋友讲,保持对闽南语的熟悉度,遇到有些字真的不会讲,台湾也有很多相关网站可以查询。
他说,在工作上可以做一个专案,打造出自己听得懂的翻译系统,觉得很幸运也很开心,过程中也学习更多闽南语知识,例如本来不知道七声八调怎么讲,一方面是为了工作,另一方面是自己也想了解。
陈鹏仁强调,对翻译系统而言,语料收集是很困难的部分,即使有语料资料,但授权不明确就难以使用。如果能引起外界更多重视,在推动闽南语翻译系统和AI应用落地会有很大帮助,毕竟这不是单一机构或个人可以完成的事情。
提到翻译系统下一步规划,陈鹏仁表示,希望继续提升精准度,解决闽南语变调问题,因为闽南语有声调和各种不同语气来表达问句或肯定句,都不是透过文字可以表达,会是接下来研究重点。
媒体提问未来是否可能纳入如客家话或原住民语等其他台湾在地语言,陈鹏仁表示「有可能」,对于接下来要选择哪些语言,Meta团队还在讨论,客语确实是考虑的语言之一,会评估不同因素来决定哪些语言优先发展,再继续扩张。(编辑:潘羿菁)1111027