继围棋之后 小精灵游戏被微软AI征服了

微软在部落格中宣布,旗下Maluuba公司所开发的AI系统在Pac-Man游戏中获得系统最高分。(图/翻摄微软部落格)

西洋棋、围棋与德州扑克之后,下一个被AI(人工智慧)征服的挑战是什么呢?答案是:小精灵游戏(Pac-Man)。微软在今年收购的一家深度学习(deep learning)新创公司,近日发表了最新研究成果,成功在小精灵这款游戏取得游戏最高分。看见电脑程式玩得比你我还厉害,真让人无颜见江东父老了。

根据微软官方部落格,他们在2017年1月收购的加拿大深度学习新创公司Maluuba,所研发的AI系统在Atari 2600版Pac-Man中成功取得999990的最高分。过往从没有人类或是AI系统曾达到此一分数,相当值得注目

位于加拿大蒙特娄MaGill大学的电脑科学系副教授Doina Precup表示,这是AI研究者的一个关键成就。因为AI研究者们一直在寻找各类型的游戏来测试所研发的系统,而Pac-Mac被发现是游戏当中最难攻克的一款。而不仅对于微软研发团队的成就感到印象深刻,Doina Precup更表示,他认为研发团队如何找出破解的方法,更是重要!

Maluuba采用的方法很特别。首先他们将过关的策略技巧分为独立的元素,例如「吃豆」跟「闪避敌人」,且不同的AI(研发团队称之为agents)则专注于不同的游戏任务。之后再由更高层的AI agent来决定要优先执行那一种任务。

举例来说,如果游戏中有100个AI agent期待往左移动来吃掉一个豆子,但只有3个AI agent决定要往右来躲避敌人。最终最高AI agent的决策会是往右移动,来避免撞上敌人而失败。

根据微软部落格,Pac-Man一直以来在AI研究广泛被使用,因为玩法具有不可预测性。而Maluuba则运用了强化学习(reinforcement learning)的技术,也就是针对某一个特定问题,让AI获得正面或者负面的回馈,来应对不可预测性。这一项技术被认为可以协助AI系统自动进行决策,因为提供了正面与负面的的案例,来协助AI系统建立起经验基础,与监督式学习(supervised learning,机器学习当中的一种)不同。