1+1+1+1+1+1+1=6?Google旗下AI数学不及格 因「题目看呒」

▲AI无法通过高中数学测验最主要的原因就是AI「看不懂」题目。(图/取自免费图库pixabay)

科技中心综合报导

「1+1+1+1+1+1+1=?」如果你的答案是7,那恭喜你比Google的AI还聪明。Google旗下DeepMind团队日前公布一项新的研究结果,让AI接受英国高中程度的数学测试,最终测验成绩仅拿到「E」也就是不及格。

Google旗下DeepMind团队本月初发表了一份名为《分析神经模型的数学推理能力》(Analysing Mathematical Reasoning Abilities of Neural Models)的研究报告,该团队试图训练神经网络算数学,怎知AI虽能打败世界棋王,却无法通过高中程度的数学测验。这40题数学题中,AI仅答对了14题,正确率仅35%,实实在在的不及格。

事实上,AI在此测验之前已做过充足的训练。DeepMind为其建立一个包含200万个题目的题库题型包括算数、代数机率微积分等。同时也派出循环神经网路(Recurrent Neural Network, RNN)及Transformer两大性能最优异的模型参与测试。

为什么AI无法通过高中数学测验呢?其中最主要的原因就是AI「看不懂」题目。DeepMind旗下的AI虽已拥有强大的机器翻译能力,但面对数学题目的复杂性语言多样性仍是败下阵来。如研究发现,AI最多只能计算出现次数为6次以下的数值,因此像「1+1+1+1+1+1+1=?」这样出现次数超过6次的数值,它就计算不出来,不过在计算更常更大的数字(如:-34+53-936),它仍能给出正确答案,对此,研究人员无法给出一个很好的解释,不过相信可能是因为AI神经网路会不断察看每道问题而做出正确解答。

人类来说,要解决数学问题,除需应用计算能力外,最重要的仍是理解题目、将文字图像转换为运算符号,因此依赖大数据寻求解题规律的AI碰上文字、加减乘除符号、函式等组成的问题时,会因看不懂题目而无法作答。另外,AI的推理能力也不及人类,面对数学题,人类会经由推理,从已知公式中找到最佳策略实际的运算过程也须经过工作记忆完成。简而言之,人类解数学题需动用许多知识技能,包括分类、演算等,而擅长模式比对、机器翻译的AI弹性远不及人脑

虽然现阶段要成为数学老师对AI来说极度困难,但目前AI已称霸相当多的领域。如DeepMind旗下的AI AlphaGo已接连打败围棋棋王李世乭、柯洁。去年AlphaZero又在《星海争霸2》(StarCraft II)的测试竞赛中以5比0强压世界顶尖职业选手。