阿里巴巴AI模型在阅读测验SQuAD 以82.44高分击败人类

美国史丹福大学发起SQuAD问答测验。(图/翻摄自SQuAD官网,下同)

大陆中心综合报导

阿里巴巴与微软近日都参加了由美国史丹福大学发起的SQuAD(Stanford Question Answering Dataset)问答挑战赛,他们各自使用自家研发的人工智慧(AI)阅读系统来回答问题,在经历10万条问题的随机测验后,双方都在测验中击败人类所创造的最高分数82.304,刷新纪录

据《CNET News》报导,人类过去在SQuAD测验拿下最高的成绩是82.304分,这次阿里巴巴研究部门 iDST所开发的人工智慧(AI)机器学习模型,在回答完一份由10万条题目所组成的题目库问题后,在 1 月 5 日以82.44分的分数首度超越人类,接着微软在相同的测验中,在1 月 3 日以82.650分同样超越人类记录

报导指出,阿里巴巴旗下资料科学技术研究所(Institute of Data Science and Technologies,iDST)首席科学家Luo Si表示,很荣幸能见到这历史性的一刻,未来也会将此技术应用在各种不同的领域上,「这项科技可以应用在客服美术馆导览,甚至是回答病患医疗问题。」

▼阿里巴巴与微软并列第一,分别以82.4跟82.65分打破人类最高纪录82.3分。

报导提及,这项测试吸引了Google、Facebook、IBM、微软、卡内基梅隆大学、史丹福大学等研究单位参加。另外,许多单位也会在一年内,多次参加测验来了解AI系统进步的进度,例如微软在 2017 年 12 月 17 日得到 82.136 的成绩,而阿里巴巴则是在同年 12 月 28 日获得 79.199 分。

另据《中评社》17日报导,微软亚洲研发中心助理主管周明(Ming Zhou)表示,史丹福大学问答数据集的结果具有很重要的意义,但人类仍然比机器更擅长理解语言复杂性以及分辨细微的差别,「自然语言处理领域依然存在不少挑战,需要我们进一步努力,这个小小的成就只不过是个开始。」

SQuAD为世界公认最具挑战性的机器阅读测试之一,系统内建了大约500篇的维基百科文章,以这些文章为基础编辑出超过10万个问答,挑战者需要构筑机器学习模组来回答问题。这类的资料集一开始是为了机器学习研究所设计,用以建置解答预测模型。

▼近年来,许多国家都在积极发展人工智慧(AI)。(图/CFP)

版权声明:图片为版权照片,由CFP视觉中国供《ETtoday新闻云》专用,任何网站报刊电视台未经CFP许可,不得部分全部转载,违者必究!