“开始大家一直在吐槽苹果没创新、卖屏保,最后库克的‘one more thing’出来以后,我们场子直接炸了。”在视+AR商务总监李阳提供的视频里,第一财经记者看到,苹果CEO库克(Tim Cook)介绍Vision Pro后,观众席抑制不住地多次欢呼、鼓掌、惊叹,“终于来了”。

6月6日晚,李阳专程从上海赶往杭州,与50多位行业从业者一同在AR企业Rokid的总部观看这场盛会直播,为此他在第二天搭乘了早上第一班高铁回到上海,以免影响当天的工作,“还有人分别从深圳和北京飞过去,就为了一起看WWDC,有一个仪式感。”

组织这场观看活动的是Rokid的创始人兼CEO祝铭明,他对第一财经表示,这本来是公司内部组织的活动,但因为一些KOL想参与选择了对外开放,没想到一传十、十传百,最后不大的观看场地里,坐满了五六十个人。


业界对苹果的头显设备期待已久,从观看的热情可窥一斑。关于这款产品的讨论至今未歇,苹果的革新在哪里、对行业影响有多大、国内有能力做平替吗?

第一财经记者与行业内多家企业进行了交流,总体来说,尽管有一些佩戴体验、价格等方面的瑕疵,业界的共识是,Vision Pro注定是划时代的产品,“是未来空间计算设备真正意义上的起点”,对供应链、行业生态的意义重大,同时,国内想要模仿却并不那么容易。

“浪已经起来了”

业界此前将苹果的头显设备称为MR(混合现实),因为它既有VR(虚拟现实)的沉浸感,又有属于AR(增强现实)重视现实的部分。但库克在大会上介绍时,则直接将其描述为“AR platform”(AR平台),称Vision Pro“将我们带入空间计算时代”。

亮亮视野创始人兼CEO吴斐认为,如果站在未来看现在,Vision Pro将是划开AR时代最重要的一个分水岭,就像2007年我们见到的第一代iPhone一样。

“苹果的眼镜是目前行业所能看到的天花板水平了。”工业AR企业瑞欧威尔的联合创始人兼CEO李波也表示,从业内观察者的角度来说,这是一个划时代的产品。

有人将Vision Pro视为今年继ChatGPT之后又一令人振奋的科技产品。对此,视+AR创始人兼CEO张小军认为,Vision Pro在行业的重要性绝对不输ChatGPT之于AI行业,但其发展速度或许不及ChatGPT,超过2万元的售价,加之产能不足,它在用户端的渗透速度注定较慢。

作为熬到凌晨3点看发布会的一员,张小军当时的观看感受反而很平淡,对于苹果业内有着很高的期待,仅仅看发布会视频觉得功能都似曾相识。但从后续国内外众多用户真实的测评来看,张小军发现这款产品实际体验效果可能远远超过宣传片,“或许这才是对的,因为3D的体验永远不可能用平面的效果来展示。”

Vision Pro不缺赞美,但也并不完美,产品发布后苹果股价的下跌也可以说明一些问题。祝铭明认为,短期内不能指望行业有一个翻天覆地的变化,这太过乐观,或许再过两年供应链步入正轨、价格下来了、企业跟上来了、佩戴改善了,才是真正的未来,“乐观的情况是时代的浪已经起来了,但要影响到我们每一个人,还需要再给一点时间。”

作为第一批踏入AR行业的从业者,吴斐看到Vision Pro的亮相是无比兴奋的,但遗憾在于,“3500美元的高昂售价、极端的堆料、使用场景的匮乏,以及那只能从潜水镜片中看到对方眼神的VST 视觉穿透技术,大概率它难以成为被一拥而上的消费级产品。”

从众多国内外体验过真机的博主的反馈,也能发现Vision Pro目前存在的问题。苹果采用的是VST(Video See Through)方案,通过12 颗摄像头将外界的图像传到超高分辨率显示屏中,相对于OST(Optical See Through)可以裸眼看到现实的方案来说,VST虚拟场景视场角更大,不过,受限于相机性能,会存在采集现实信息丢失问题。

例如,相比现实环境,Vision Pro的显示仍有颗粒度和少许的模糊感,在光线较暗的时候会有噪点、动态模糊的问题,VST方案视场角已经相对较大,但看向边缘仍会有一点遮挡,这提醒着用户并不是真实的世界。

另外,综合多位博主测评以及从业者对第一财经的反馈, Vision Pro存在头重脚轻的问题,大概500克的重量意味着佩戴体验不算太舒适,尤其半小时以上的佩戴会觉得酸痛、闷热,眼睛也会有点疲劳。在这个基础上,有体验过真机的行业人士对第一财经表示,对于这款产品的期望值不能太高。


不过,抛开产品本身,亮风台市场总监洪雁菲认为,对业内来说苹果发布这款产品最值得关注的一点是“空间计算”的提出。虽然这在业内不是一个开创性的理念,但苹果把它推向了大众认知的层面,“也只有苹果这样级别的公司参与其中,才有可能带动时代的前行。”

“苹果的入场无疑给行业打了一剂强心针,大家看到了一个3D元宇宙时代的复合生态的发展路径,以及很多技术路径的可行性,堪称行业教科书。”诠视科技创始人CEO林瓊认为,未来各个行业都有在垂直领域找到相应技术与产品的落地机会。

这是苹果的“灯塔效应”,也是业界期待产品发布的原因之一,苹果的入场,意味着“下一个时代的序幕被拉开”,新一轮的应用和内容的浪潮已开始。

对行业的人来说,最怕的一件事是苹果打退堂鼓,“不管行业多优秀、多努力,别人都会说抱歉、这个行业没了。”祝铭明表示,只要苹果不缺席,这对行业就是最振奋的。

让设备去适应用户

从行业的角度,苹果这款设备的优越性到底体现在哪里?交流中,有行业人士认为,一直以来,AR、VR行业都在让用户去适应产品,但苹果做到了让设备服务用户,非常人性化和细节化。

“我们必须以体验为中心来设计产品,而不是以技术为中心,在这点上苹果起到了充分的示范作用。”洪雁菲认为,在技术实力的保障下,苹果把产品体验发挥到现阶段的极致。以苹果此次所强调的手势操控来说,以往被诟病的是手势操控不够自然,我们可能需要把手臂高高举起,悬在空中。但是苹果在性能强悍的传感器支持下,让用户实现了几乎无感的手势操控,交互真正变得自然。

张小军同样认为,Vision Pro在手势上的突破非常大,“以前行业的天花板是微软的HoloLens,但是依然会发现很多问题,因为只用了前面的一个很小的视场点去实现,手势需要你把手举起来、很僵硬,抬5分钟或许可以,但10分钟就难以忍受了。”苹果实现了手即便放在大腿上,用很轻的动作去捏拉,就可以实现交互效果。

此外,众多体验者赞叹的一点是眼球追踪,认为这“接近魔法”,只需要动动眼睛,看向的每个交互的元素都能回应目光,感觉就像用意念控制一切。

“以前所有的眼球追踪大概只能追踪到某一片屏幕的区域,但Vision Pro可以精准识别到字符。”张小军表示,这种百尺竿头更进一步的突破,看起来只有一点,但其实是非常难的,且又是非常重要的,因为只有突破了这个阈值,才能达到让设备去适应用户,而不是用户适应设备。

此外,苹果实现了一个功能是,在沉浸式观看时,如果有人走近,显示屏就会切入现实世界中这个人的影像,而在外界也可以看到,Vision Pro显示屏变得“透明”,显示出使用者的眼睛。张小军认为,苹果在头显设备上突出的一个价值观是“现实优先”,绝对不只是给用户呈现虚拟的内容,而是以现实为重,来做各式各样的体验和应用。


“关于空间计算设备最重要的一件事,就是不要把人丢在一个隔离的虚拟世界里,这不是我们对于下一代设备的想象,也不是人类的需求,我们永远要和世界去交互,和人去交互。”张小军说。

苹果实现的体验远不止这些, Vision Pro上的旋钮实现了对用户沉浸感的调节,在VR和AR模式之间自如切换,这是行业此前或许想过但没有做到的,“这重新定义了空间交互,创造了虚拟与现实的旋转门。”吴斐认为,这将是空间交互设备的一个新标准。

在苹果的引领下,国内从业者可以获取到一些可学习的点。李波认为,虽然公司是工业领域的产品,但对传感器的应用,以及交互的应用方式,瑞欧威尔都可以借鉴。

“不管是VST还是OST路径,最终都是AR,对用户的交互、场景的定义、应用的类型等等一定是可以互相学习的。”祝铭明表示。

我们有能力做平替吗?

在苹果发布Vision Pro后,3499美元、接近2.5万元的价格也引起了很多讨论,有声音认为,华强北很快就能将价格打下来,做出平替。

在这个方面,祝铭明对第一财经表示,“模仿是没问题,但是要真的模仿它的体验几乎是不可想象的。把全中国最好的公司算在内,我也没有信心能做出来。”

苹果Vision Pro的技术路线上很难去学习。“苹果定义的VST路线是因为它有强大的供应链、强大的芯片和算力,苹果通过VST方案实现的用户体验,到目前全球几乎没有第二家具备能力去复制,”祝铭明认为,“即便可以把Vision Pro的所有细节拆开来看,最核心的苹果自研的M2、R1芯片,就是最大的门槛。”

据苹果的介绍,此次发布的R1芯片是处理来自12个摄像头、5个传感器和6个麦克风的输入,以确保内容实时呈现在用户眼前,R1芯片能在12毫秒内将新图像传输到显示屏中,比眨眼快8倍。如果图像相比真实有更大的延迟,则会带来眩晕的体验。


VST路径简单来看,是通过摄像头拍摄外界环境,传输到用户的显示屏上,祝铭明解释到,这里要解决的计算量包括镜头的畸变、影像的延迟、数字空间坐标和真实世界对齐,还要与真实世界的像素、图像质量对齐。“这几件事就已经对芯片有很高的要求,更别谈空间定位、手势识别、各类传感器、眼球追踪,至少今天为止是没有第二家。”

林瓊补充提到,视觉传感是以像素为单位的空间传感技术,而像素级的图像处理是要消耗巨大算力的任务。要实现流畅的体验,高精度低延时的即时建图与定位算法对算力要求很高。此外要实现实时的三维环境重建,实现虚实结合,也需要极高算力,“我们深刻地理解到,要做好三维空间的感知交互,算力和算法是最核心的条件。”

“设计是能仿制的,也许4k也是能仿制的,但怎么能在这么小的设备上去处理高达12个相机的素材,而且如此低的延迟,前提就是你要有M2和R1这两个芯片的能力。”张小军认为,国内目前能够拿到的最好芯片,和苹果的这个芯片仍然是有代差的。

除算力外,在VST路径下,要达到苹果这样逼真的视觉效果,也需要非常优秀的计算机视觉处理。“把所有摄像头信号用非常高速、先进的算法融合在一起显示,且要允许精细化的眼球追踪以及手势交互,达到这样的精度、速度、稳定度是非常困难的。”张小军提到,这些能力企业都有,但做到这样的精准度和细腻度几乎还没有一家。

张小军对第一财经表示,苹果未来一定会推出平价产品,也一定会催生一个平替的市场。但目前来看,苹果这一代设备如果是消费级市场能接受的一个底线,对现在国内的厂商无疑是巨大的挑战。“只有堆到这种程度,才能够击穿一般消费者对这件事情的认知,让消费者买单,但我们甚至没有能力去堆这种料。”

不过,张小军认为,挑战是暂时的,随着产业链的更成熟、国内能力的提升,未来一定能解决。

最大意义是苹果的号召力

此次苹果发布Vision Pro,相比产品,对行业来说更重要的意义是苹果终于下场带来的信心,“苹果的出牌是C端应用的风向标”,这是苹果的市场号召力。

同时,行业认为,苹果更重要的不是激活原来行业内的人的信心,而是让原来这个行业之外的人能够进来。终端企业的信心之外,供应链、生态从业者能够树立起信心才是推动行业发展的核心。

“以前是我们在告诉供应链,我需要做什么,你们要做好什么样的准备,但我们做这件事只能是透支大家的信任,如果大家对这个行业没有清晰的前景认知,我们很难去推动。”祝铭明表示,接下来,供应链至少会重拾信心,有为未来布局的决心,行业接下来去铺供应链也更轻松。

供应链也有更大的可能会提前为未来的产业布局做准备。原来是终端厂商有什么订单可以做,但没有订单,供应链也不会提前投入。“如果是苹果这样的公司,他们甚至会先于终端厂商或者平台厂商去做一些投入,这是最大的区别。”祝铭明说。

如同此前走过的智能手机时代一样,苹果将供应链的能力带起来后,所有的人都将受益。整个供应链、整个产业一起发展才是效率最高的,但此前的企业很难领着整个产业往前走,祝铭明觉得,“对于这些供应链的厂商来讲,或许不是不相信这个未来,而是不知道这个未来会以什么样的方式来、在什么时候来,而苹果可以给到这样的信心。”

在生态上,苹果凭借其号召力同样会有很大的助力,祝铭明还提到,Rokid此前做了很多活动,目前有几千个开发者,但苹果一动员可能就是几十万个开发者,这些开发者一定会未雨绸缪,提前学习了解和尝试,而他们也会去教育市场,搅动整个市场。只要苹果把开发者的信心和热情动员起来,整个行业就是受益方。

在行业里,张小军长久以来的一个感受是,来来去去的人都是些老面孔,他认为,这或许也是一直以来行业不进步的一个原因,没有新鲜的血液。此次苹果下场,它带来更重要的变化,是让更多可能原来不相信这件事情的人,相信并且来做这个事,“以前AR、VR应用水平比较低,是因为真的没有好的应用策划创意、好的程序员和好的美术。”

张小军认为,在市场还没有很好的发展时,生态下的从业者不愿意投入资源、资金和能力进场,如果苹果设备做到让消费者接受,比现在行业里水平要高得多的人都会进来,这才是这个行业发展的希望。

在Vision Pro发布后,行业里非常多的讨论,张小军认为“大家是又激动又诚惶诚恐”的,激动在于,它确实是一款真正意义上让用户认可的AR产品,诚惶诚恐在于,大家的能力与苹果能力的存在多大的代差。

恐惧并不代表没有希望,“苹果树立了一个标杆,就会有进步的空间,至少不像以前没有人知道方向在哪里,行业像做布朗运动一样没有规则,现在至少有聚焦的方向。”张小军认为。