阿里巴巴AI模型在阅读测验SQuAD　以82.44高分击败人类

▲美国史丹福大学发起SQuAD问答测验。（图／翻摄自SQuAD官网，下同）

阿里巴巴与微软近日都参加了由美国史丹福大学发起的SQuAD（Stanford Question Answering Dataset）问答挑战赛，他们各自使用自家研发的人工智慧（AI）阅读系统来回答问题，在经历10万条问题的随机测验后，双方都在测验中击败人类所创造的最高分数82.304，刷新纪录。

据《CNET News》报导，人类过去在SQuAD测验拿下最高的成绩是82.304分，这次阿里巴巴研究部门 iDST所开发的人工智慧（AI）机器学习模型，在回答完一份由10万条题目所组成的题目库问题后，在 1 月 5 日以82.44分的分数首度超越人类，接着微软在相同的测验中，在1 月 3 日以82.650分同样超越人类记录。

报导指出，阿里巴巴旗下的资料科学与技术研究所（Institute of Data Science and Technologies，iDST）首席科学家Luo Si表示，很荣幸能见到这历史性的一刻，未来也会将此技术应用在各种不同的领域上，「这项科技可以应用在客服、美术馆导览，甚至是回答病患的医疗问题。」

▼阿里巴巴与微软并列第一，分别以82.4跟82.65分打破人类最高纪录82.3分。

报导提及，这项测试吸引了Google、Facebook、IBM、微软、卡内基梅隆大学、史丹福大学等研究单位参加。另外，许多单位也会在一年内，多次参加测验来了解AI系统进步的进度，例如微软在 2017 年 12 月 17 日得到 82.136 的成绩，而阿里巴巴则是在同年 12 月 28 日获得 79.199 分。

另据《中评社》17日报导，微软亚洲研发中心助理主管周明（Ming Zhou）表示，史丹福大学问答数据集的结果具有很重要的意义，但人类仍然比机器更擅长理解语言的复杂性以及分辨细微的差别，「自然语言处理领域依然存在不少挑战，需要我们进一步努力，这个小小的成就只不过是个开始。」

SQuAD为世界公认最具挑战性的机器阅读测试之一，系统内建了大约500篇的维基百科文章，以这些文章为基础，编辑出超过10万个问答，挑战者需要构筑机器学习模组来回答问题。这类的资料集一开始是为了机器学习研究所设计，用以建置解答预测模型。

▼近年来，许多国家都在积极发展人工智慧（AI）。（图／CFP）

阿里巴巴AI模型在阅读测验SQuAD 以82.44高分击败人类

相关资讯

阿里巴巴AI模型在阅读测验SQuAD　以82.44高分击败人类