向文杰:人机交互的终极形态是脑机交互

杭州网讯12月18日-20日,2020本站未来大会在杭州盛大举行。大会以“洞觉 未见”为主题,汇聚了全球最强大脑,期盼以远见超越未见,去寻找打开未来的钥匙。

大会上,Rokid副总裁、产品技术中心总经理向文杰做了《下一代的人机交互》主题演讲。

从第一台PC出现,比尔盖茨让每个人办公桌上有了一台PC。接下来Smart Phone,乔布斯推动了手机普及,接下来是什么呢?

向文杰认为,当手机再往前演进的时候,下一代的产品一定不是一个更大屏幕的手机,这是不可能的。

Rokid公司生产了智能音响鼻祖,但是当时向文杰并没有把它理解成是一个音响,因为它是最简单、最自然的人机交互的方式。那未来会是智能音箱,还是一个什么样的设备呢?向文杰说,这就是他们一直探索的方向,“做出让更多人更容易使用的东西,我们理解的未来是这样的”。

向文杰认为,当人跟机器交互的时候,需要输入法吗?需要了解各个应用怎么用吗?实际上不需要,只要了解它需要听懂你的话。所以语音能力就要很强,就会变成它基础的配置。

未来的交互更多是通过语音,通过手势,更多通过更自然、更直接的方式交互。

带着自家公司量产的最新款AI眼镜亮相,向文杰仿佛已经实现了走向未来的基础操作。

据他介绍,这款AR眼镜,年初已经量产推向全球。到今天为止,在全世界50多个国家进行了推广,并且已经在当地开始售卖。国内各个省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安厅,也都开始推广。

他说,未来已经开始了,新产品接下来会越来越多的来到我们身边。

以下为向文杰演讲的部分内容:

大家好!

刚才听了一个非常烧脑的演讲,虽然没有太听懂,但感觉这一定是代表未来的。我接下来跟一个相对简单,也比较有趣的演讲。

大家可以看到我现在戴的这副眼镜,我其实戴的这副眼镜是已经量产的AI眼镜。我们过去这4年时间里一直在探索AI和AR这两个方向,并且不断打磨产品。这4年过程中我们发现一个有意思的事情,接下来我们面临的新时代快来了。就像今天“洞见”大会上讲的一样,未来十年一定会到来的。今天很多同学,很多行业还对这样一个新的产品,新的领域,只是听说过,没有了解过,所以今天我做一个简单小小的分享,让大家对这个行业有所了解。

实际上在现阶段很多的人对一个概念是分不清楚的,就是什么叫VR,什么叫AR,这个东西到底是干嘛的。我其实在演讲之前简单介绍一下,VR的话,大家现在已经非常普及了,接下来一年的出货量1千多万套,在游戏领域里、培训领域里非常普及。AR刚刚开始,AR已经进入了很长时间,但现在才刚刚开始。刚刚开始意味着什么,这个行业还没有被大众所普及,也没有被大众所认知,但是它现在已经被很多行业里开始利用起来了。我们现在所了解的,很多业内人士了解的是微软的AR,但在国内AR是蓬勃发展。

简单介绍一下我们这款AR眼镜,今年年初正式量产推向全球。到今天为止,它已经在全世界50多个国家都进行了推广,并且当地渠道商、经销商已经在当地开始售卖了。然后在我们国内各个省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安厅,其实全面都开始推广这样一款眼镜,它已经开始了,只是它接下来会越来越多的来到我们身边。

我举个简单的例子,我今天带了这个产品的小配件上来。这是我们独立研发的一款红外测温模组,今年疫情之年,大家习惯的是用一个很大的设备放在门口来进行防疫测温。但当我们这个产品刚刚推出时,我们把红外测温模组小型化,在全世界范围内给了很多公司、很多国家带来很多帮助。包括像新加坡、俄罗斯、德国,他们都大批采购这样的眼镜,用来干什么?用来在移动场景下实时检测检疫,做人体温度的测试。在我们国家更是,包括良渚博物院都已经大量采购。其实这样一个AI的时代已经开始了。

我接下来开始演讲,好像我们讲的是AR产品,Rokid公司追求的是人机交互。

我们拥有很好的技术,当我们拿着这个技术的时候,我们希望给到行业是什么东西。

今天我从很多大拿的演讲当中学到很多点,我们给到行业里面不止是效率、不止是创新,还有很多人文关怀,这是Rokid公司很大内核的点。我们需要用科技的变革给行业更好的效率,更好的人机交互体验,所以我们更强调体验,更强调交互设计。

这张图大家在无数地方看过,今天我用另外一个方式给大家解读一下。

当第一台PC出现的时候,比尔盖茨讲过一句话,让每个人办公桌上有一台PC,他做到了。从我们的角度来看,不仅是科学技术的进步,不仅是通讯的进步,里面带来一个点,覆盖的人群越来越广。

一开始的时候,小型机只有少量人用,当有了个人PC的时候,很多家庭里面有了一台PC。当它有了最早手机的时候,早期虽然做不到人手一台,到现在为止全世界范围之内,基本上可以做到人手一台设备。

接下来叫Smart Phone,大家看到的Smart Speaker这是我们公司2016年推出来的,大家可以叫智能音响,也可以叫智能机器人。我们为什么做它?我们相当于是一个智能音响的鼻祖,但是我们并没有把它理解成是一个音响,因为它是最简单、最自然的人机交互的方式。就是因为有了它,我们才能做出来未来让更多人使用,而且让更多人更容易使用的东西,这是我们最追求的方向和目标,我们理解的未来是这样的。

刚才讲演进的趋势有两个点,第一个点是获取信息的效率,移动互联网一定比互联网获取效率高,传统的PC一定比更产生的电报、电话这种获取信息效率高,再往前是什么?手机现在屏幕已经不可能变大了,现在有5G、6G,对应的载体是什么?有什么特点?是更大屏幕的手机吗?还是一个什么样的设备?这就是我们一直在探索的方向。

我们认为未来的设备有一个很大的特点,一定是便携的,像手机在身上随时可以用。当便携再往前一步的时候就是随身设备,应该没有一个设备比眼睛是更随身的设备,可以随时随地扩展眼睛的能力,现在很多手环、手表,便携式设备可以很快扩展个人的想象和能力,它可以快速获取信息。相比手机而言,虽然不可能取代手机,这个是不可能的,像手机也取代不了电脑。但是会产生一个情况,极大可能的扩展人类的想象空间和可能性。

第二,更友好的交互。现在讲交互相对少一点,可能设计师讲的多一些,因为我们是产品公司,更多会强调交互。刚才给大家看到的Smart Speaker有什么好处?在我们整个用户场景里面最大的好处是小朋友可以使用,没有文化的老人也可以使用,所有的人都可以用。为什么?因为它用的是最自然的交互手段,人和人之间肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是讲话。人机交互,语音一定是最自然的,手势一定是最自然的,还有更多自然的交互方式,以前的时候这些都不成熟。

大家知道AR这个行业不是现在产生的,50年已经有了,为什么现在越来越成熟了?越来越敢畅想10年以后让AR普及,就是AI助力。我们结合AI能力、AR能力,打造更好更自然的交互。

我们这里提出来一个论断,这是我们公司共同认同的点,当手机再往前演进的时候,下一代的产品一定不是一个更大屏幕的手机,这是不可能的。当到某一天大家戴上这幅眼镜的时候,今天没有机会让每个人体验一下,但是打个广告,大家可以去良渚博物院体验这款眼镜,我们通过这款眼镜让博物院各种各样的文物有更丰富的体验。带来的好处是当人机交互往前走的时候,不是唯一是手机的时候,是什么?让视野变得更宽阔,可以让空间里面随时随地显示你所需要的信息。当你跟它交互的时候,你需要输入法吗?需要了解各个应用怎么用吗?实际上不需要,你只要了解它需要听懂你的话,所以语音能力就会很强,就会变成它基础的配置。未来的交互更多是通过语音,通过手势,更多通过更自然、更直接的方式交互。这样的交互才是小孩会用的,老人会用的,所有人都会用的,只有这样才会不让科技把任何人抛下,让每个人享受科技,让每个人感受科技带来的乐趣。

今天大会刚开始的时候,我听到一句话,可能是丁磊讲的,我们的科技不仅仅是提升效率,另外更重要的是关注人文。这是我们想做的,希望把更好的科技,AI、AR的科技,这些能力集成到一个更好的产品里面,但是最终给到用户的应该是一个最好的交互,关注它,让他不用避免高科技带来的不会用,我很慌,我想避开它,这个东西太复杂了,我们希望用最简单、最自然的交互,让所有人使用它。

当这点实现的时候,人机交互的终极形态,再往前走一步就是脑机交互了,不是我们今天探讨的。从过去探索的4年来,在这个行业里面,科技的高速进步不断涌入,未来10年,非常值得期待。

到目前为止,AR眼镜在C端大家看到的非常少,这也是经常有人问我,你们说MR、VR、AR是什么区别。在产业互联网里面是非常流行的,包括大家看到的第一个就是良渚博物院。目前我们跟全国100多家博物馆开展了让博物馆现在所有展品变成信息化,变成可互动的,变成让所有小朋友到博物馆以后能get更多信息,不需要你有很强的操作能力,不需要有很强的理解能力,因为AR可以让你更容易理解它,理解这些沉睡在地下的文物,目前这件事情已经陆续开展了。接下来大家都能看到。

这是两会报道,现在很多媒体报道还是采用传统的手机、直播方式,未来的制博会是另外一种主流。在外贸里面变得越来越流行了。

工业领域,Rokid AR眼镜现在在德国是最主要的出口地,德国是工业4.0的提出国。AR设备作为工业4.0产业互联网核心的器件,现在正在被各个行业所接受,现在我们这款眼镜在德国出口量最大,因为他们的工业互联网需要这样的终端,需要一个终端,除了能够让他实时看到操作过程中的步骤,里面所具备的AI能够可以辅助这个工人看看他做的对不对,是不是有更好的策略,并且把整个过程记录下来进行AI分析,最后反馈给他,你可以做得更好。其实这件事情在德国开始了,在国内也开始了,我们跟中国石油、跟国家电网、跟国内很多大型汽车厂商都已经开始陆续合作了。

接下来在这些产业里面,AI会成为一个标配,成为产业工人的标配,会打造未来工业互联网时代超级工人必备的武器,这就是接下来这个行业里面马上会发生的。

最后就是公共服务。刚才讲到防疫,讲到包括大型活动的安保,包括乌镇互联网大会,包括阿里巴巴年会,都会采购这样的眼镜,作为现场安保重要的安保工具。为什么?它的AI能力让每一个现场的服务人员火眼金睛,具备识别问题的能力,实时保持前端和后台通信的能力。远远不仅限于上面四个领域,在很多行业都已经迅速普及。

我们为什么做AI,Rokid公司在杭州是AI和AR方面的独角兽,为什么会做AI?本质还是回到最早讲的交互。因为AR能很大程度上改善人的交互,让所有刚才讲的小孩、老人,所有人都可以利用这个科技,而不是对科技产生排斥。

AI在这个里面干什么?降低很多复杂操作,你不需要做了,用最自然的方式跟他交流、沟通就可以了。

分享之前,我看到有一位同学分享数字人,这也是我们在追求的方向。虽然我们还没有这个技术,但是我们完全可以合作起来,数字人也是基于AI技术实现了,AI技术无所不在。我们会把所有跟交互相关的AI技术整合到我们这个设备里面,让全世界所有人,各个语言的人,它可以听得懂16种语言的,这是因为AI技术的原因,这就是为什么AR发展了40多年没有落地,现在高速落地了,因为AI在发展,AI的发赋予它更好的交互能力、更好的体积、更轻便、更强的能力,所以说这就是AI让AR开始落地了,AI让AR在未来10年里面能够从不能落地,到工业里面、产业里面落地,最后再到C端消费者这边落地,这是接下来的趋势。

它能够做到我刚刚讲到的,AI更懂你,“懂你”意味着你很多事情不用做了,你讲话就好。可以把你流程优化掉,然后显示在你眼前,你跟它进行实时互动,我们现在做的事情,我们目前为止把它们两个结合得还是比较好,未来有很多的挑战。

这就是我们想要做的事情,很多同学对这个概念不是很了解,如果大家关注到普通人在使用高科技产品的时候感受的时候,大家应该能感受的。我们当时在做智能音箱时非常明显感受到,非常多的人对智能产品不敢用,躲的远远的,会对高科技隔离起来,包括电子支付也是一样。我们能做的事情是让这些复杂的东西简单,让它出现在你的眼前,让它以最自然的交互进行交互。让小孩、老人所有人,国内外所有人都可以快速进行交流,快速实现它的功能,这就是我们想通过这个眼镜来实现的事情。就像刚才讲的,这是我们的使命,这是我们想要做的事情,让每个人都能享受科技。

谢谢大家!

2020本站未来大会由杭州市人民政府和本站公司联合主办,杭州市商务局、杭州市经济和信息化局、杭州市滨江区人民政府、北京本站传媒有限公司以及本站(杭州)网络有限公司承办,中国移动总冠名。大会将进行三天的头脑风暴、涵盖了预见未来、新基建、人工智能、区块链、潮商业、UP生活以及和文化等论坛。