宏达电打造机器人语意大脑 「疾管家」可望国、台、客语都通
▲宏达电打造机器人语意大脑,「疾管家」可望国、台、客语都通。(图/记者洪巧蓝摄)
宏达电(2498)旗下健康医疗事业部DeepQ团队今(31)日宣布,推出新一代AI自然语言处理平台命名为T-BERT(Taiwan Bidirectional Encoder Representations from Transformers),使得电脑能同时三声道读听写国语、台语及客语,并可望应用在「疾管家」抗疫机器人上面。
宏达电运用多年来累积各领域的研发经验,包括VR/AR、AI人工智慧、区块链及自然语言处理等前瞻技术,积极投入抗疫,将相关技术与疾管署和卫福部合作,开发「疾管家」抗疫机器人,已超过200万名使用者,发挥防疫抗疫积极效用。
宏达电DeepQ总经理张智威亲自领军,推出新一代AI自然语言处理平台T-BERT,采用Transformer网路架构,从左到右、从右到左,双向读取段落文字,透过编码器分析文字特征,结合为台湾研发的AI加速运算技术,大幅提升语意判断的精准度至93.7%。
张智威表示,过去在台湾,同时支援国台客语的自然语言处理平台尚不存在,未来计划将T-BERT模型开源释出,并继续扩充规模,以回馈学界与促进产业发展,并将陆续把该技术导入产品端,像是可以让疾管家未来能够支持国台客语问答。
张智威指出,自然语言处理平台必须能够处理在地语言,才可实践相关语意分析应用,因此DeepQ AI团队与台湾大学廖世伟教授合作,应用深度学习模型与巨量资料处理的2个技术,针对台湾市场,打造出可支持国语、台语及客语的AI平台。
张智威进一步指出,DeepQ AI团队,让AI不断阅读巨量语意资料库,训练AI模型判断语意,不过要让电脑可以学习如此巨量的资料,计算复杂且耗时,因此DeepQ团队同时使用超过64颗GPU运算,运用平行运算技术架构,提升60倍的运算速度,将AI模型的学习时间有效缩短至6小时。
张智威强调,除了国语之外,T-BERT训练也加入台语、客语文献,而目前研发的AI模型已能将国语新闻自动分类成9大类别,像是财经、国际等类别,准确度达93.7%,但相对台语、客语语料库规模较小,团队则采用两阶段的微调训练,让台语、客语新闻分类准确度也能达到满意的准确度。