国内首份“空间计算硬件”的答卷,是怎么交出来的?

当两个惺惺相惜的男人相互吹捧起来有多肉麻?

“N+1=Misa” 谷歌安卓大屏业务亚太区负责人Dan把这个公式打在了大屏上,Misa是和他一样长着一脸大胡子,Rokid创始人兼CEO,据说俩人第一次见面,花了很长时间聊如何打理胡子。

“这里的N有无数种可能,1是代码。”不久前,在他牵头下,Rokid Station(全球版)通过了谷歌的认证,成为全球首款AR版便携式Android TV™设备。

在Dan上台前,Misa引用了苹果创始人乔布斯曾经引用过的一句名言:“真正在乎软件的人,应该打造自己的硬件。”这话的原始版权属于图灵奖得主Alan Kay。2007年,这句话为世界带来了iPhone。

数月前,打磨了8年的苹果头显Vision Pro面世。蛰伏许久的XR行业突然进入了一个崭新的“空间计算时代”。

被谷歌种草到日活三万

Rokid Jungle是Rokid每年一度最重要的发布会。Jungle有丛林的意思,Misa(祝铭明)喜欢称呼自己和手下是猴子。2013年,这只“猴子”受邀去硅谷参加Google的发布会,看着一群疯子戴着Google Glass,坐着降落伞来到现场。

体验完后,他迫不及待地在朋友圈写下感受,一是非常棒的创新,二是我们可以做得更好。“当时主要觉得Google Glass太工程师范儿了,是当玩具而不是产品来设计的。”祝铭明说。

后来的市场反馈也证明了这个判断是对的。不过,祝铭明确实是动心了。回国后,他辞去阿里M工作室负责人的职务,创立了Rokid。Rokid=Robot+Kid,这是他对“技术普惠所有人”的美好愿望。

但带领Rokid最先进入大众视野的并不是AR眼镜,而是智能音响。直到5年前的2018 Rokid Jungle,他们的第一款AR眼镜,已经量产的Rokid Glass才作为One more thing登场,却很快逆袭成为“主角”。

这款眼镜很长时间面向的是B端市场,目前开枝散叶最广的,是需要可视化的博物馆场景。之后因为疫情,搭载远距离红外测温和安防功能的Rokid Glass 2意外成了功臣——这是差点被祝铭明砍掉的一代产品,理由是“测温?太无聊了。”

谁也没想到,二代产品发布后5天,新冠来袭。

再后来,就是2021年消费级AR眼镜Rokid Air的故事了,中间那个Glass被悄悄拿掉,因为Rokid就是做AR眼镜的。

从2013年被谷歌种草,到今年刚好是10年,在发布会上,祝铭明公布了一系列最新数据,只为证明AR眼镜不是工程师的玩具,对普通人也是“有用的”:每天,有超过3万人使用Rokid的AR眼镜;Rokid AR眼镜用户最高月活跃度达到40%;Rokid AR眼镜用户的单日使用时长,已经超过一个小时……

死磕0.2克重量

除了放自己和Misa的自拍照,Dan还贡献出了女儿的两张照片。一张戴着Meta的Oculus,一张戴着Rokid Max。

他说自己为了体验VR眼镜,很早就在办公室设立了独立区域,第一次戴上头显的女儿特别兴奋,但VR头显的重量让小姑娘很难长时间佩戴,直到Rokid Max的出现。“现在她是Rokid的重度发烧友。”Dan说。

祝铭明也曾晒过两岁半儿子佩戴Rokid的照片,用来说明佩戴的舒适度和操作的友好。多年前,他曾抱着一个神秘的箱子拜访facebook,当着扎克伯格的面打开,里面是尚未量产的Rokid Glass,“当时刚好和他们的CTO是朋友,主要聊了下投资和XR方向的讨论。”

双方一致认为,XR会是未来发展的方向,但对于AR还是VR,产生了路线分歧。在祝铭明看来,需要佩戴厚重头显的VR有更强的沉浸感,却是反人性的,“不会有那么多人喜欢生活在一个罩子里”——去年,一个行业的新锐创业者也发表了类似的观点,强调自己一定要做AR,“扎克伯格定义的VR元宇宙,我猜他自己也不相信。”

这个人叫罗永浩。

一个不可否认的事实是,自VR头显诞生以来,都在死磕重量这件事。采用头显外型的Apple Vision Pro使用了镁铝合金,重量控制在了380克,超过了市面上绝大多数VR眼镜,但佩戴上去依然有明显的负重感。

初代Rokid Air的重量只有85克,今年发布的Rokid Max只有75克,全新的,带上一颗摄像头的Rokid Max Pro也只有76克。而一副普通眼镜的重量,通常不超过20克。

“我们内部是以0.2克为基本单位,每次变动超过这个数字,就要向我汇报。”祝铭明说。再考虑到消费者对价格的接受程度,意味着Rokid很难走“堆料”这条路,尽可能用最小的重量办最大的事。

于是,业界广泛认为需要两颗摄像头才能实现的SLAM及3D裸手交互,被压缩到了一颗,背后靠的还是对算法的优化。

两块磨刀石:AR和AI

做AR眼镜前,Rokid就明确了“AR+AI”双轮驱动的开发模式。“其实我们在2016年就开始了手势识别技术和单摄像头解决方案的摸索。”祝铭明说。

那一年,他们抢在谷歌前,发布了首款智能音响,搭载1300万像素摄像头的Alien,用户能够通过手势和它产生交互。

回过头去看,作为一家初创公司发布的首款产品,Alien的技术完成度是惊人的。以它为参考系,不仅能看到Rokid的技术演进,也能看到产品理念的延续。

比如,和现在死磕0.2克的重量一样,为了让语音控制更方便,他们自研了双音节唤醒技术,用两个词“若琪”而不是“小爱同学”“天猫精灵”来唤醒机器。

以它为代表的语音识别技术和对杂音的过滤技术后来被用在了Rokid Glass上,即使在嘈杂的生产车间,也能精准识别相关指令。

Alien还内置了定制的DLP (数位光处理)模组,打造了立体准全息投影,说明在那会儿Rokid就开始积累和打磨光学技术。

2018年,Rokid成立了北京实验室A-lab,主要负责语音交互系统开发,所有成员都是博士;在此之前,他们在硅谷有个R-lab,负责AR、应用等开发。对应的是祝铭明所说的:“Rokid成立第一天,就是AI和AR并行的。”

“不过音响模式是比较快成熟,可以进行产品化验证的东西。”他补充道。

这就不难理解,他在发布会上的动情。对他们来说,消费级个人空间计算平台Rokid AR Studio是名副其实的“十年磨一剑”,不仅有Rokid自研的全空间化AR操作系统YodaOS-Master,还基于单摄像头实现了SLAM、微手势交互、第一视角分享、视觉定位VPS能力等。

随之而来的是交互方式上的变革:这款产品不依赖手柄或遥控器,而是用眼睛、手势和声音实现实时操控。

AR眼镜有什么用?

Dan在演讲里提到的另一个男人,是原研哉。老爷子讲过一句话,科技越是进化就越接近生命的形态。还有一句和它相似的话,来自于麦克卢汉:“一切技术都是肉体和神经系统增加力量和速度的延伸。”

具体到AR眼镜,理想状态下,它增强的是包括眼睛在内的人类整个感知系统,帮助大脑理解世界,并且与之产生交互、协同。

解放双眼,打破信息交互和显示的物理局限,也是Rokid AR眼镜一直以来的卖点。

在推广Rokid Air时,他们主打“换一种姿势看世界”,将手机内容投射到眼镜端,不用低头接收信息。

到了Rokid Max,他们强调在超宽屏模式下,呈现出相当于6米外215英寸超高清大屏的效果。

这次的Rokid AR Studio,他们和苹果一样,将自身定位为“空间计算设备”。主推的“空间搜索”,直接打破了之前搜索信息的陈列方式,搜索结果直接呈现在三维空间中,根据结果的相关性从近到远排列,用户可以动态挑选所需的内容。

不过,双方的技术路径并不相通。苹果采用的是《头号玩家》里视频透视VST(Video See Through)方案,“用户看到的真实世界是用摄像头拍到的”,而Rokid选择的是《失控玩家》里的OST(Optical See Through)光学透视方案方案,“用户看到的世界就是真实世界”。

在影响体验的一些关键指标上,Rokid也做到了和苹果一致,像是90HZ无屏闪的高刷,解决了拖影和闪屏的问题。

即便如此,祝铭明也只给新品打了一个及格分。其中,交互能力做到了满意,空间计算的真正刚需场景还没完全摸索到,定价还不够亲民,革命性变化还不够。

“对于C端用户,哪些会受益于空间计算,我自己也没答案。”他说,“但我很享受在超宽屏模式下做code review。”

他们确实非常期待,并且在极力探索AR眼镜作为生产力工具,而不是此前影音娱乐设备的可能。唯有这样,AR眼镜才能从其他屏幕那里分割用户时间。

引领者的角色

在进入成立的第10个年头,Rokid的Slogan悄悄变成了“AR时代引领者”。而且祝铭明强调,引领者前面没有“中国”二字。

如何来定义“引领者”的角色?从技术和产品来说,Rokid确实在行业内率先提供了一系列解决方案,包括一套Station的外接设备,直接让AR眼镜摆脱手机的束缚,独立成为一个移动终端。

就融资而言,整个2022年,在资本市场不那么景气的情况下,Rokid获得了超10亿元融资。

令祝铭明压力最大的,是来自老家江西鹰潭余江的一笔投资。当时他的父母特别严肃地问他:“这钱是不是非拿不可?能不能不拿?”

鹰潭素有“眼镜之乡”的美誉,投资“未来的眼镜”倒也在情理之中。“拿这笔投资,主要也是找到了和家乡眼镜产业的结合点,比如销售渠道,所以还比较踏实。”祝铭明表示。

若论生态,娱乐方面,Rokid已经覆盖了国内主流视频平台,可以玩steam上的游戏,围绕手势操作也已经有钓鱼、飞镖、篮球等应用。办公方面,阿里云的无影云电脑为适配3D生态特别定制了空间大屏。

“引领者”的另一面藏在发布会外面的体验区。很少看到科技公司的发布会,到处是孩子的身影。他们和大人一样,乐此不疲地体验着新款产品,甚至比父母们更快上手。

也许站在未来某个时点回望,他们和Dan、祝铭明的孩子一样,就是AR的原住民。一副小小的眼镜改变了他们认识世界的方式。

如果将格局放大一点,这个引领者的角色其实早就不仅仅属于Rokid。

在去年10月和浙大学弟学妹的分享中,祝铭明特别强调了:“目前,据我所知国际上XR领域里,70%的顶级专家来自中国,而这其中大部分来自浙大。所以希望同学们对祖国要有信心、对自己要有信心。”

“其实,包括中国在内的东亚国家,对科技产品本身就比较热情高,欧美反而更理性看待,相对保守很多。”一直以来,祝铭明认为,以AR为代表的XR领域,中国有机会超过欧美各国。

而他特别提到母校浙大,也不是一种客套。1997年,祝铭明在浙大网络与媒体实验室求学时,直接参与了“敦煌数字复原”项目的第一代开发,这也为后来Rokid主攻博物馆场景埋下了伏笔。

更何况,浙大系是国内AR眼镜创业版图最大的一股势力。

当然,这些年政府主导的产业投资基金也在扮演引领者的角色。对Rokid来说,是余杭国投、余江工投。

当政府和产业表现出对新技术的极度渴求,这是科技创业者的福音。

文|梁应杰