Apple Vision Pro的一些启发
市面上对于Apple Vision Pro的解读有很多,但少有涉及AR/VR产品根本性问题的了解和洞察。
关于Vision Pro理想应用是“空间显示”?Elon Musk评价AVP,"我不明白为什么要将电视机挂在鼻子上“,其实这句评论没有贬低AR/VR,甚至还高估了。因为使用VR作为沉浸式大屏(3D)显示其实是个伪命题。过去25年里,AR/VR头显早有人尝试,并不是什么新鲜玩意,到如今显示技术得到长足发展,采用的屏幕规格越来越高。为什么你看不到飞机上VR观影的人?
这是直击灵魂的拷问。
Vision Pro能否成为“空间显示器”,关键不在你采用了哪种先进面板,不在显示质量、分辨率,也不在刷新率,而是一个人体工学的问题,在于人类视觉的底层机制变成了阻碍。Vision Pro 的R1再怎么强大,video数据流处理过程再怎么先进,画面延迟再低,用VST就无法解决运动状态下凝视画面,耳蜗-前庭-眼球协调的问题。只要看到的画面运动刷新和内耳检测到的旋转速度不一致,晕动症或多或少就会发生,并且因人而异,这就意味沉浸式VR头显佩戴久了一定会有一部分人不舒适。依靠摄像头的VST无法高频日常使用,证据就是你很少看到坐飞机使用头显。
解决方案似乎只有发展真正的光学透视,天然的OST过程,光子打到视网膜转化为视觉神经信号传输到大脑,才能真正消灭延迟。
还有众所周知的视觉辐辏冲突,人眼观察不同远近(不同焦点)、不同位置的物体,晶状体收缩扩张和眼球转动会同时“协作”。如果晶状体一直保持大小不变,固定一个焦点,长时间眼睛太难受了。VR最困难的变焦显示,难倒了Magic Leap,经过多年开发还是放弃了自己独有的FSD(Fiber Scaning Dislay)方案,也让Meta的硬件科学家们困在原地。按照之前国外对Vision Pro光学透镜 Pancake模组的分析,理论上是可以做到调焦显示的,但是苹果没有提,这说明技术不是一般的困难。然而,看久了固定焦点的虚像,眼睛会非常累,又是一个无法高频日常使用的核心难题。
关于重量。Vision Pro的重量明显“超了”,无法长时间佩戴。苹果的说法是已经使用了最好最轻的材料,无法再减重。很多人缺乏对Apple Vision Pro真正深入理解,苹果为了解决佩戴以往VR头显的周围视觉“交流”、动态环境安全性的问题、让VR能真正“出街”,开发了EyeSight方案,并且在硬件上做出了重大妥协,特别是重量上。
为了EyeSight,苹果设计OLED曲面外屏,使用了3D裸眼技术,并且覆盖一层曲面玻璃,EyeSight可以说体现了苹果对VR头显产品有异常深刻的洞察。但这些增重是否完全有必要,EyeSight硬件实现方案,能否继续改进?其实Meta很早也展开过相关“视觉交流”的方案探索,只是没有真正落地。
图为Meta “reverse passthrough system”的一张Demo图
还有,因为这块正面外屏的存在,需要重新调整摄像头、深度相机、dToF雷达的位置,相应的畸变矫正算法、数据融合、调整VST画面实时显示,算力、算法的要求更高更难了。
关于VR超大画幅和沉浸感,对于办公看文档、看电影,其实VR的优势并不明显。为什么,跟你去电影院不愿意坐前排是一个道理,视觉信息超过一定视角,人类的通常习惯是转头再凝视而不是转动眼球再凝视,所以理论上Vision Pro又一个应用场景是伪命题。
你眼前看到的真实世界其实是“拼凑”起来的,类似量子力学的非连续点粒子构成了世间万物,你看到的世界也是非连续的视觉信息。人眼视场角内最清晰的区域(视网膜中央凹)仅占2°,眼球通过扫视、跳动等微动作捕捉视觉信息,然后大脑快速将其“整合”在一起。
“佐治亚理工学院教授Thad Starner曾指出,受制于眼球运动的机械限制,显示屏的水平FOV不应超过55°,其中有效的眼动范围只有45°,而舒适的观看区域可能不超过10°到20°左右。
由于看电影是一个长时间凝视/无需转头的过程,在VR中看电影实际上不像VR游戏那样需要那么大的FOV。现实情况是,人眼盯着40°到50°高分辨率画面时,只用几分钟就会感觉视觉疲劳。因此,电影画面最好保持在20°水平,当画面超过30°时,用户可能会需要转头看,而不会转动眼球,这情况在电影院前排、或者大尺寸显示器上存在。”
换句话说,人眼主要注意屏幕中心30°范围的画面,在不转头的情况下,大FOV不仅没有带来沉浸优势,还带来了困扰。比如BirdBath这种主打“投屏显示”眼镜,发烧友使用它看文档、网页,需要转动眼球凝视虚像边缘的字体、画面像素信息的时候,体验就相当糟糕。
大FOV带来的沉浸感有不易察觉的代价。办公和看片,Vision Pro的沉浸大屏并不会让你长期觉得舒适,而这恰恰是苹果重点宣传的一个使用场景。
关于价格,个人非常赞同国外AR资深专家Karl Guttag的说法,Vision Pro 价格贵不是重点,重点是“真的有用”。
“对于评论AVP(Apple Vision Pro)价格的人,他们是从看待一项成熟技术而不是一项全新技术的视角出发。仅举一例,内存为4KB的Apple II初始零售价为1298美元(相当于2022年的6268美元),而最大内存为48KB的型号则为2638美元(相当于2022年的12739美元)。再比如,1979年我买了第一台录像机,价格约为1千美元,按通货膨胀率调整后相当于现在的4400多美元,一盘1.5小时的空白磁带约为10美元(相当于2023年的44美元)。问题不在于价格,而在于AVP是否会成为人们经常使用的设备。”
Oculus创始人Palmer Luckey的评价也非常有启发,
“在产品策略上,苹果瞄准了正确的市场。相比于追求低价,硬件质量、舒适度、人体工学、分辨率、高质量内容才是前期更重要的目标,而降价是后面才要考虑的。 每家公司擅长、适合开发的产品不同,如果苹果追求入门级市场,可能会是一个错误。苹果努力打造分辨率最高、人体工学最好的头显,面向的是早期采用者,而这也是适合当下的策略。实际上,现在这个阶段价格高低并不是关键,尤其是对于早期采用者并不重要,虽然Vision Pro售价高达3500美元,但即使卖到5000美元,也有人会买。 通过Vision Pro,苹果可以让XR头显在市场上获得更多关注,并刺激早期采用这之外的更多人的需求,然后再降价至人们买得起的水平。“
还有更多,比如扎克伯格还对竞争对手苹果AR发表了看法。他认为,
这段时间Vision Pro很热闹,但AVP的启发不仅仅是产品层面上,也少有人注意到下面这些事实和疑问:
苹果只不过发布了一个司空见惯的VST头显,Vision Pro的许多特点和关键创新,像竞品Meta 也提出过、实践过,Vision Pro并没有解决VST头显的许多重要问题:比如多焦点显示、重量、发热、续航、VST在暗光环境或过曝光线时画面对比度、全身追踪,并且价格过于昂贵。但Vision Pro就是成功引爆市场,全球媒体热议,这可能才是同行需要反思的地方。
先行者做不到的,Vision Pro也一样,为什么换成苹果头显大家就能接受?而且即使定价如此之贵。很多人评价Vision Pro就是“配置很高”,传感器数量上大幅超越友商,让眼球追踪的准确性可靠性明显提升,还带来了超大范围的手势识别;视觉/深度相机/激光雷达SLAM融合,人机交互和VST的画面(畸变)矫正无比丝滑和自然;还有桌面级性能的核心处理器M2,从硬件底层设计传感器数据处理芯片R1(专用集成电路芯片ASIC,类似iPhone 协处理器?),定制的多片式拥有非标曲面的Pancake模组,4K硅基OLED内屏,OLED前向(外屏)eyesight裸眼3D....等等。所以,问题是硬件堆料能否复制另一个Vision Pro,究竟是品牌起作用还是产品本身?
Apple Vision Pro发布会上并没有遵循行业“常规”,公布具体的像PPD、FOV、Pancake模组光学性能,并且要求Apple Store员工等不能提到VR等字眼。空间计算其实早就有人提出过类似概念,从苹果口中出来效果却完全不同,苹果不仅培训销售人员避讳使用和提及“VR”等字眼,并且发布会用两段定义了Vision Pro, “most advanced personal electronics device ever” + “a standalone spatial computer portable enough to use anywhere”。即最先进的个人消费电子设备,任意场景都适用的空间计算机。
库克相信,未来我们谁也离不开属于个人消费电子的“空间计算机”。这是从iPhone的逻辑延伸。
Oculs创始人Luckey提到了一个“社会工程”(social engineering)的概念,本意指的是通过大规模影响人们的态度和社会行为,让目标人群产生所需的特性本质上来讲,苹果不是通过工程设计来让人接受XR,而是通过社会工程,改变社会对XR的预期。换句话说,Vision Pro通过恰当的营销、名人带货,也可以改变人们对XR的固有印象,让头显技术比之前看起来更酷,即使Vision Pro并没有轻薄的外观。
沃尔特·李普曼在他的1922年的《公众舆论》(Public Opinion)一书中提出,人与环境之间的真实环境太大、太复杂,而且瞬息万变,无法直接认识。每个人都会建构自己的伪环境(pseudo-environment),这种伪环境是主观、有偏见且必定更精简的世界的心理形象,而在某种程度上,每个人的伪环境都是虚构的。人们“生活在同一个世界中,但在不同的世界中思考和感受”。李普曼说的“环境”可称为是“现实”,而“伪环境”更像是今天所谓的“建构现实”。人们“在被社会和文化世界创造的同时,也创造自己的社会和文化世界”。
社会建构主义(英语:social constructionism)是社会学和传播学中的认识论。大多数社会建构主义者都信奉“语言不是反映现实,而是构成(创造)了现实,即“没有事实,只有诠释。”
事实是:Apple Vision Pro是一款领先同行的产品,但整体来说,它并没能领先时代。
许多人相信历史是天才和英雄人物决定的,大众只是一群被赶着到处跟着跑的鸭子。中心化比去中心化好,让行业分工明细、开放的自组织演化不如由封闭的精英小圈子制定“标准”并进行“质量管控”,起码iPhone和iOS已经是肉眼可见的前例。
苹果对于用户的深度理解、对于产品创新的洞察,对于未来的想象力,组合起来就是一种魔力,也是扭曲现实力场的来源。投资者、行业巨头和创新企业、用户都在观望,姗姗来迟了很多年的Apple Vision Pro能够引导VR/AR真正走出极客小众,成为大众普及的消费电子产品。很多巨头等着别人试错成功后在后面摘果子。
深入研究Apple Vision Pro,可以明显地感知到:这家公司擅长从底层向上完全构建,自成一体,而非等着光学器件、显示屏、新式传感器、算法和算力芯片、应用开发慢悠悠“协同”发展,不同实力的厂商分散地制造一堆不同品相的垃圾。
就像苹果投入巨大、一直疯传汽车"泰坦“被取消,Apple Vision Pro的产品态度,把用户体验放在最高优先级,从不制造垃圾的信念,不发布不成熟的低用户价值的“新产品”,还有这家公司的营销手法,可能才是最最值得学习的。