AI称霸电竞还要多久?从Master围棋60局连胜谈起

爱玩网 百万稿费活动投稿,作者 豪猪,未经授权请勿转载

岁末年初,沉寂了大半年的阿尔法狗(AlphaGo)又出来“搞事”了,在更新版本后,阿尔法狗化名Master,在网络围棋平台玩起“扮猪吃老虎”的游戏,接连横扫古力、柯洁、陈耀烨、常昊、朴廷桓、金志锡等多名顶级围棋选手,取得60胜0负的惊人成绩。

开发团队称,和年初挑战李世石时相比(v18版),最新版的阿尔法狗又有了巨大的进步,这一点也得到包括棋圣聂卫平在内的多个职业选手的承认。

结合阿尔法狗开发团队Deepmind在去年11月暴雪嘉年华上公布的《星际争霸2》人工智能开发项目,让人不由的在脑海中描绘出一副AI制霸电竞的恐怖图景:人类选手在AI的凌虐下苦苦挣扎,最终不得不退出电竞舞台。

这种情况会出现吗?在这里,笔者先说说自己的判断:有可能,但还需要很长的时间。为什么有这样的判断呢?我们还是得从目前流行的电竞游戏谈起。

面对网络神秘选手吊打一众名人,大家不约而同地想到了SAI那段极其相似的情节

三个重要的前提

目前主流的电竞游戏中,对抗性强、变数多、观赏性好的游戏主要是以《英雄联盟》、《DOTA2》为代表的MOBA类游戏以及以《星际争霸2》为代表的RTS类游戏(射击类游戏和卡牌类游戏由于其局限性,一般不适合作为展示AI的平台)。

相信不少玩家此前有看过《英雄联盟》及《星际争霸2》AI微操视频,在《英雄联盟》中,AI操作的角色拥有极为惊人的反应,不仅能躲开所有非指向性技能,甚至还可以精确计算指向性技能范围,让自己控制的角色始终游离技能范围之外。

在《星际争霸2》里,AI的表现更为恐怖。比如在20个机枪兵无损击杀20个毒爆的视频演示中,AI以惊人的微操技巧,控制每个机枪的走位、兴奋剂BUFF,同时保持着完美的“甩枪”频率,使毒爆根本无法近身——这一点目前最顶尖的职业选手也做不到。

另一个惊人的视频演示来自于100条狗以极低的战损搞定20辆坦克,在视频中,冲击坦克阵的狗群总能在坦克开炮的瞬间散开,使坦克每次攻击只能击杀一条狗——这已经超越人类操作的极限了。

人类真的有办法和AlphaGO这样级别的AI进行电竞对抗吗?

不过这里要指出的是,这些AI设计时都有一个非常关键的前提:游戏开放了API接口供AI直接读取数据。在这种状态下,AI可以获得当局对战的所有信息,相当于一个开了全图的职业高手

换句话说,当玩家在和AI对战的时候,不但你的一举一动都在AI的掌握之中,连你控制的单位要攻击什么目标(无论是你有意控制攻击目标,还是由游戏单位随机挑选),AI都可以在第一时间获取,并且在瞬间做出反应——这才是上文提到的100条狗完爆20辆坦克的真相。

显然,这种AI并不算是真正意义上的人工智能,甚至连“类人工智能”都算不上,它的无敌是基于作弊(开全图)以及人类根本无法达到的操作极限达成的。如果以这种标准来衡量,那不用阿尔法狗出马,现有的电脑AI就足以虐杀所有的职业选手。即使把AI“全知全能”的开图优势去掉,仅以惊人的微操(多线操作的情况下,有效的APM可以达到几千甚至上万)就足以打败大多数的职业选手——别的不说,只需要给AI脚本设置需要五线甚至十线操作的战术,每一线都相当于一个职业选手全力在操作,这种情况对手怎么招架?

输给这样的AI,我们会服气吗?

玩家同人创作的阿尔法狗娘——是不是感觉亲切了很多?

所以,在谈论AI能否称霸电竞时,我们至少要设置三个前提:

第一,AI获取游戏对战信息的方式要和人类玩家一样,人类玩家是通过眼睛观看屏幕——获取游戏信息——大脑对信息进行筛选判断——在最短时间内选择最优应对策略——执行(只不过人类可以简化中间判断的过程)。那么AI也得如此,任何绕过屏幕图像获取信息的方式都是“作弊”,因为信息判断流程越简练,需要的计算量就越少。

第二,AI的APM(单位时间点击操作)必须有限制,目前顶尖职业选手APM可以达到500以上,虽然很多是无效操作,但有一点可以肯定,AI能达到的微操极限一定是目前职业选手能够实现的。

第三,AI的计算能力不能是无限制的,无论是年初和李世石的对弈,还是最近几天在网络上与众围棋选手的30秒快棋对弈中,阿尔法狗的落子速度并不算快(甚至不少时候比职业选手慢很多)。这就证明了开发者有意识的限制阿尔法狗的设备性能——否则在需要大量计算能力的场合(比如围棋中盘局势判断),人类可能只能计算接下来5步落子的情况,而AI凭借堆砌硬件就可以算到10步甚至更多,那依然不是公平的比赛。

毕竟人类的脑容量就那么大,计算能力限制就在那里。至于为什么限制AI计算能力这点很重要,下文会提及。接下来,在这三个前提下,我们再谈围棋和游戏的差别。

围棋曾经被认为是AI无法超越人类的竞技,但这次造物主彻底输了

为什么是围棋?

首先我们要明白一点,阿尔法狗“制霸”围棋的壮举之所以能引起如此广泛的关注,关键还是“学习能力”。在此之前,IBM的超级电脑深蓝战胜国际象棋大师卡斯帕罗夫虽然也引发了舆论轰动,但归根结底,深蓝并不是人工智能。

它之所以能战胜卡斯帕罗夫,是因为研发人员把100年来60万盘高手对弈棋谱储存进深蓝的硬盘中,无论卡斯帕罗夫如何落子,电脑都可以从庞大数据库里找出对应的应对策略。

显然,这只能算“记忆力”(棋谱越多越厉害)和“计算力”(检索应对方式的速度),不能算“学习能力”。更何况,国际象棋每一步落子只有20种后续可能性,而围棋则高达200种——理论上,围棋棋盘上的可能局面数量高达3的361次方,再考虑到打劫、提子等变化,这个数字就更惊人了——如此多的可能性,且不说开发人员能不能收集这么齐全的棋谱,单是把这么庞大的数据输入到电脑里,需要的资源(包括时间,硬件等)都是天文数字

要不怎么会有“围棋自古无重局”的说法,就是因为围棋的可能性实在太多了。

那么,阿尔法狗靠的是什么新技术来解决这些问题呢?笔者不是专业人士,所以这里只能从自己理解的角度向大家说明,仅供大家参考。简单来讲,阿尔法狗使用了三种技术:第一种是能根据当下棋局的情况,对下一步可能的走法进行预测;第二种是提升决策的速度,允许AI尽可能快的前提下落子;第三种技术可以让AI根据当下局面判断胜率,从而找出最优选择。最后再使用“蒙特卡洛树搜索”算法将这三种技术连为一个整体。

打个不恰当的比方,阿尔法狗的学习方式有点类似试错:AI根据当前棋局的情况随便下几步,在对手应子,局势出现变化之后,AI重新选择应对方式,计算这些应对方式的胜率,并做出最佳选择。

如何判断这种走法“胜率”是不是最高呢?这就需要AI有对应的棋谱,知道如何应对。但棋谱毕竟是有限的,无法覆盖所有对局可能,怎么办呢?阿尔法狗的解决方案是自我学习——进行大量自我对弈练习,从而搜集尽可能多的对弈数据——其实这也有点类似“穷举法”,只不过以往对弈数据靠人类输入,而阿尔法狗可以自己创造罢了。

阿尔法狗的制霸,是建立在千百年来人类智慧与经验的肩膀之上

显然,这种带有精确记忆的自我学习方式是人类目前无法掌握的。即便如此,阿尔法狗还是有其明显的缺陷。正如前文所说,在限定了计算能力的情况下(储存空间就不限制了),阿尔法狗练习的越多,相应数据检索和计算就需要更多的时间,这又会拖慢AI反应速度,毕竟围棋在理论上超过3的361次方的变化,AI哪怕只储存其中十分之一变化,其数据库都惊人的庞大。此时,万一对手的落子情况不在数据库的储存范围内,那按上述的运行逻辑,阿尔法狗就要进行即时计算来寻求解决思路。

可是,以AI的目前的算法上看,这种即时计算需要的时间太久了,甚至有时候AI为了算出一步最佳走法,能“思考”几十个小时。为了解决这个问题,阿尔法狗就引入了快速决策的技术,但这项技术在面对这种情况(数据库没有棋谱)时决策的准确率会大大下降。阿尔法狗年初与李世石对弈的第四局就是个中典型:李世石下了一手此前AI数据库里没有的落子,导致阿尔法狗对局面进行重新计算,最终因为太过费时导致AI只能仓促应了一手,最终还是败给了人类。

讲白了,阿尔法狗的强大是有限制的,它和人类相比无非拥有更强的记忆能力(海量棋谱),稳定高效的学习效率(自我对弈积累数据)。如果把这些优缺点代入电竞领域,相信有不少读者发现AI的问题所在了。

AI电竞的两道门槛

我们先从阿尔法狗的信息收集方式说起,在围棋领域,阿尔法狗的图像采集方式十分简单,棋盘就361个点,每个点都是固定,对手如何落子一目了然,双方每落子一次就扫描一次。

但是电竞游戏不同,地形、单位、技能的颜色不一,不同单位在不同场景下使用不同技能时的颜色又不一样(光影效果,技能效果),这就需要AI有对应的“判断”。这还不算,每个单位在战斗中血量不同,各自拥有的BUFF/DEBUFF不一样,如果考虑单位当前坐标、移动速度的不同、技能释放预判的影响等等,AI的负担就相当重了——毕竟它无法直接读取图像背后的数据,只能首先对“看到”的图像进行数据化处理,这个处理的频率还特别高,至少要1秒1次(在激烈的战斗中甚至要0.1秒一次)。你说,这得耗费多少计算资源?更让AI头疼的是,目前电竞游戏大多有“战争迷雾”,这种完全不同于围棋的信息互动方式又进一步增加了AI判断局势的难度。

举例来说,AI在侦查的时候发现了对手一条狗,之后这条狗躲进战争迷雾里。在AI探索另一个方向的时候,又出现了一条狗。那么,对AI来讲,我如何确定这条狗是之前看到的那条呢?基于图形采集的信息可是没办法给每个单位编号的(因为外观都一样),那该如何判断对手的兵力?再比如,如果对手防侦查做的极好的情况下,那种假一波真运营,假运营实际偷鸡的打法,AI又该如何侦查如何应对?

就格斗游戏领域,以人类反应速度不可能战胜的高级AI理论上早已出现

对职业选手来讲要解决就简单了——蒙,比如教主这种变态选手,就经常不侦查(还蒙的挺准!),显然,这种不侦查也是基于海量经验基础上的直觉判断,这是AI还做不到的。

第二个问题是,RTS游戏和围棋在局势判断上的不同,在围棋里,每一步落子前AI都可以通过计算来判断最优解法,这些落子之间是有明确的逻辑关联的。无论AI在某一步的落子如何的不合常规、让人费解,我们都知道这一定是有伏笔的,只不过我们人类可能要到几十步之后才能察觉其中的奥妙。

可是在电竞游戏中,AI如何判断自己行为会不会对最终胜利带来帮助?尤其是有战争迷雾的影响,使AI每次的决策都不是即时性的,此时AI面临的选择就复杂了。比如说AI打算建防空防对手的空投。可是对方从头到尾都没从这个方向进行空投,或者发现了这个防空之后对手更换了空投位置,那这个防空的价值到底怎么估算?建还是不建?多建还是少建?

再比如AI赢得前线决战的胜利,但对手同时分了两路兵偷袭自己几个分矿并重创了经济,那么AI就要判断自己目前兵力是否应该长驱直入对手老家,还是回家固守补充经济。

如何选择,需要的更多的信息参考。但上文提到了,侦查这个行为本身需要时间,可是RTS游戏的战机往往是稍纵即逝。AI这种需要逻辑关联的判断机制,往往会贻误战机甚至导致最终失败。

这个问题,职业选手的解决方式依然简单粗暴:“蒙”。这个蒙不需要什么职业选手去确定什么逻辑关联,只要“觉得”自己应该这么做,选手就会付诸行动。因为人脑可以通过直觉的帮助来省略决策的步骤,从而实现眼睛看到图像信息——直接决策(中间判断的过程省略了)。但AI做不到,哪怕有限制的允许AI读取游戏数据接口(比如基于公平对战所能获取的信息),AI也一样要经历收集数据,建立模型,判断最优解法,执行的过程,这个过程是无法省略的。

同样,AI的计算能力是有限的,不可能出现十线同时进行顶级微操。那么问题就来了,在不同地点发生冲突的时候,AI如何判定哪一个地点的战斗需要分配主要计算能力,哪一个地点只需要次要计算能力呢?这个判断,可没那么好下。

当然,这些问题其实都可以通过增加AI的计算能力来解决,但这就等同于“作弊”了。这也是为什么笔者认为AI在很长的一段时间内无法称霸电竞的原因。那么问题就来了,这样的AI到底有什么用呢?

有什么用?当然是《终结者》或《西部世界》啊

不止是电竞,还有星辰大海

在去年11月的暴雪嘉年华里,谷歌Deepmind团队就“为什么开发星际2的AI”这个问题进行了解释。其中提到的很重要的一点是“帮助人类思考和决策”。

怎么理解这句话呢?这得从目前科技发展的现状谈起。

我们知道,虽然计算机性能在日新月异的发展,但摩尔定律已经接近失效,随着处理器制作工艺越精细,制作的难度呈指数型增长,处理器性能增长已经陷入瓶颈。换句话说,现行构架下的电脑理论上的潜力已经挖掘殆尽。而下一代的“量子计算机”距离面世还遥遥无期。

尽管目前多数计算机已经拥有远超人类的计算能力,但这还远不足以满足人工智能的运算需求。尤其是人类对自己大脑的决策机制还没有研究透,更不用说按照现有AI理论对这种“决策”模式进行模仿了。

目前AI的决策逻辑还是“经验主义”为核心,面对突发事件,AI只能从自己的数据库里搜索类似的解决方案,即便新的方案可以通过平时不断的情景模拟积累(类似阿尔法狗围棋的自我对弈),也无法保证覆盖所有可能的新情况。

满面春风的黄博士,自家“儿子”那么牛逼作为一介棋手想必也很得意吧

在计算机技术以及AI算法没有出现重大突破之前,要让AI按最接近人类的方式思考,所需要的计算力都是天文数字。且不说目前人类能不能造出这么多的计算机,单就体积而言,这样的AI占地面积得多大?能供几个人使用?

这种情况下,研发AI所面临的首要问题就是如何在有限资源的前提下,最大程度的实现AI的拟人化高效化的决策。这样的决策要保证AI拥有类似人类“直觉”决策的高效,也能弥补人类直觉决策的种种不足。

围棋也好,游戏也罢,都是为这个目的而服务。选择围棋,是因为这个棋类运动是目前开放式信息对抗游戏的巅峰。选择星际,则因为它是目前封闭式信息(战争迷雾)对抗游戏的里程碑,它的数据量远超围棋,当然是进一步调试和改进AI算法的最佳平台。

顺便一提,Deepmind团队早在2011年就尝试研发《星际争霸1》的AI(那时候暴雪也开放了游戏的数据接口),但最终以失败告终。

那么,这种拟人化和高效化的决策有什么用呢?从游戏角度,AI可以帮助我们优化各种战术,比如人类玩家想出了新战术,在过去可能需要大量的练习甚至要找熟悉的职业选手、战队教练进行反复的验证,这期间还得特别保密。但如果有AI的辅助,那么战术或者运营策略的优化显然更便捷了,单位多造少、如何操作、地形有什么影响、建筑学如何摆放等等,AI都可以替代人类进行几千上万次的重复验证,从而优化整个战术流程和操作细节。

当然,如果只让AI做这种事情太暴殄天物了。比如AI还可以在医疗领域发挥重要的作用:医生在治疗病人时依据的多是自己的经验,这种经验同样需要长时间的试错和实践积累。而且这种直觉你是很难精确描述——总不能医生开出一个治疗方案还要把自己基于哪一年在哪里看到的什么病例说出来吧——这其中还可能出错。

《攻壳机动队》中,人类在自己的大脑里植入AI芯片“电子脑”,增强自身信息处理能力

但是如果有了AI的帮助情况就同了,AI完全可以以数千万份的医疗文献、病例为基础,通过自我学习和虚拟实验,找出最佳的治疗方法。在拥有庞大的数据库、自我学习机制和计算力的前提下,如果AI还拥有像人类那样的快速判断机制(直觉),就能减少误诊的可能性,这才是AI的作用所在。

如果我们再拓展到其他领域,建筑,生物,军事,航空航天,AI都可以在很大程度上成为人类的帮手。

只不过要实现这一点,还是得由易到难一步步来,毕竟人类的“直觉”是经过几十万甚至上百万年进化才发展完善的,要让AI模拟这种快速决策的机制,还需要在大量的改进与优化。

但不管怎么说,AI的未来不止是电竞,还有星辰大海。

欢迎参加——爱玩网百万稿费征稿活动:当金牌作者,开本站专栏,领丰厚稿费,得专属周边!

游戏专栏投稿信箱:otaku@vip.163.com

欢迎关注爱玩APP【精选】板块,更多精彩等着你!