文/VR陀螺
当地时间 2 月 2 日,售价 3499 美元的 Apple Vision Pro 正式发售。

北半球的寒冬压不住大家想要一尝跨时代新品的冲动,发售当天一大早美国各大 Apple Store 便排起了小长队,吸引了来自全球各地的果粉、发烧友、网红博主与行业人士。
作为苹果开启空间计算时代新篇章的第一款硬件,Vision Pro 被苹果寄予厚望,近乎顶配的硬件配置、革命式的概念让其一次次刷屏各大社交媒体平台。
与此同时,大洋彼岸的国内 XR 厂商们也不甘寂寞。从去年 6 月 Apple Vision Pro 发布以来,VST 类头显代表包括玩出梦想、小派、创维和亿境等厂商纷纷跟随空间计算的脚步,提出自己的主张与业务布局;得益于产业轻薄型 AR 技术多年沉淀,OST 类眼镜代表 Rokid AR Studio 空间计算套装也在去年8月发布,以新品拥抱空间计算革命。
2024 年,是 XR 空间计算时代的落地之年,亦是 VST 与 OST 技术路径第一次以相同革命目标,走向更大共存市场的一年。两者没有拔刀相向的市场冲突,但却有着差异化的用户体验。借 Apple Vision Pro 上市,一场场关于 VST 与 OST 的未来议题也被带上舞台中央。
 Vision Pro的“亮点”与“热梗” 
Apple Vision Pro 是库克时代首款真正意义上的“代表作”,苹果在 XR 上探索长达 7 年之久的技术集合。
Vision Pro 的产品配置以及参数,相信大家已经耳熟能详。而在近日海外一众媒体的评测中,我们才真正看到了参数背后带来的强大体验。    
《The Verge》认为这是有史以来最好的 VST 头显,这可能意味着基于摄像头的混合现实透视可能是一条可行的路。并且其手眼追踪技术感觉就像魔法一样(当它起作用时);《华尔街日报》的记者评价这是其尝试过的最好的混合现实头显,并且比 Meta Quest Pro 和 Quest 3 先进得多。
图源:网络
当然,并非所有的体验皆完美。海外媒体不经官方审核、独立发表真实使用体验,在前几天也是刷屏网络。几大媒体评测共同使用 FaceTime 通话这一幕不禁令人捧腹大笑,感觉大家都在使用“90 年代的座机”进行视频通话一般。    
貌似苹果的 AI 图像技术需要进一步提升,不求做到美图秀秀那样的个性化美颜效果,只求还原“iPhone原相机”,毛玻璃滤镜求求你不要太离谱。
图源:网络
另外,正如陀螺君在此前《时代的“哥伦布”,Vision Pro八大风险关注点》中写道的那样,此前在 XR 产业上出现的各类核心技术难题,包含但不限于电池续航、佩戴设计、内容生态、屈光适配等,几乎也在 Vision Pro 上以不同形式,以及不同影响程度再次出现了。
Vision Pro 虽然电池采用了外接形式,但是头显内置了诸多核心元器件,如 M2+R1 的芯片平台、RAM+ROM、2×1.42 英寸Micro-OLED(网传尺寸)、多片式光学透镜、以及红外、RGB 相机等系列传感器,这使得产品重量达到了 600-650g(具体取决于 Light Seal 和头带的使用)。
基于 Vision Pro 的重量,于是乎网上出现了这样的“头部健身图”——旨在锻炼头部的承重力,趣味性十足。这是目前“VST 头显”类产品较难避免的负重问题,特别是一体式集成的产品,只能通过额外的头带增强人体工学设计,分散压力。
图源:网络
Vision Pro 除重量外,价格也是大家的经常用来调侃的点。苹果的高端市场战略,在 Vision Pro 上再次得到了展现,3499 美元的价格一跃成为苹果消费产品史上最贵的产品之一。   
并且,如果用户想要真正体验到 Vision Pro 带来的空间计算,用于办公等场景,也许还需要额外购买妙控键盘、鼠标、Macbook,构建一个更强大的空间计算套装。
是的,“只需支付‘非常低’的价格,你也可以拥有这一切。”
图源:网络
苹果的全球影响力是巨大的,在此也感谢苹果,Vision Pro 的 “评测”给大家带来了如此多的欢笑与“对产品新奇的思考”。
 VST&OST,空间计算的两条技术路径 
事实上,苹果力推的“空间计算”是一种将计算机以自然的方式融入物理世界的技术。具体是指通过 VR/AR 等设备利用计算机视觉处理摄像头和其他传感器获取的数据,从而获得关于环境的视觉信息,包括物体的位置、方向、运动甚至材质属性。并基于多个传感器的数据融合,创建准确且全面的环境视图。   
基于环境视图,VR/AR 设备可以利用空间映射技术创建环境的三维模型,以更精确地放置和操作数字内容。空间计算的主要优势之一是它能够理解环境的深度,使用户能够以真实且自然的方式与虚拟对象进行交互,按照与物理世界相对应的方式进行放置和操作。
简而言之,空间计算大致可以理解为 SLAM 技术、AI 算法与 MR 等传感技术的结合。在实现这一愿景的路上,目前,苹果的选择是 VST 头显路线。VST 即“视频透视(Video See-Through)”,是基于头显外部摄像头,采集环境数据,以视频形式在镜头前为用户提供环境视频的透视技术。代表产品还包括 Quest 3、PICO 4 等。
与 VST 并行的另一条技术路径为 OST,OST 即“光学透视(Optical See-Through)”,这是一种基于透明的光学镜片提供的环境透视技术。代表产品包括 Rokid AR Studio 空间计算套装、Magic Leap2、Nimo Glass 装等眼镜类型产品。
不同的技术路径,产品也存在较大差距。基于 VST 技术路径的头显类产品通常为一体式设计(AVP是个例外),头显端集成了核心处理器、近眼显示光学系统(屏幕+光学透镜)、RGB 相机、灰度相机(多个)、音频系统、电池等一系列组件,产品通常为 500g 起。致力于追求更高的性能运算、更大的 FOV、更精准的算法,以及更多元的交互。
而 OST 技术路径的产品,通常在原有的眼镜形态下做扩展,仅增加光学显示系统、音频系统、以及单个摄像头等轻量零部件。大部分 OST 产品设计一定程度上会减弱算法精度和 FOV 大小,但可以得到时尚的眼镜形态设计,以及轻量级佩戴体验,一般可以将重量控制在 100g 以内。性能方面,不少 BirdBath 方案的眼镜,如 Rokid Studio 空间计算套装将主机与电池外置,保持头部舒适佩戴体验的同时,提供性能运算。
VST 与 OST 两种技术路径各有优势,基于目前的产业阶段和市面上的产品来看,VST 的头显类产品重“综合性能”,包含但不限于光学、算法、运算等,而 OST 眼镜类产品重“外观佩戴”,侧重于探索未来产品形态,以及轻量级舒适穿戴体验。

 OST国内代表Rokid,用76g做空间计算  

硬件配置方面,Rokid Max Pro 采用 0.68'' Micro-OLED+BirdBath 的轻量级光学方案,可提供 50 度的 FOV,相当于 6 米外 215 寸虚拟大屏,分辨率为 1080P。FOV 不大,介于信息提示与普通 VR 头显之间,但足够去观影、游戏,带来相对沉浸体验,同时提供真实世界视野。
升级版的 Rokid Station Pro 带来了媲美传统 VR 头显的性能,其搭载高通骁龙XR+ Gen2 移动平台。相对于上一代,该平台续航提升了 50%,同时散热提升了30%,并提供 7620 毫安的电池。
光学系统与核心主板是支撑 AR 显示与使用的基础层面。不过,在 Rokid 看来,其更注重系统软件能力,而非纯粹的硬件堆叠。Rokid 创始人&CEO Misa 在接受采访时说,Rokid AR Studio 是团队耗时 4 年才实现的产品,为了使眼镜尽量轻,其空间计算能力主要通过系统软件实现。

Rokid 为此专门开发了 AR 底层系统 YodoOS-Master 。“或是目前最为完整的一套面向空间计算时代的 AR 空间操作系统。”Rokid 副总裁&XR 中心负责人王俊杰在去年的发布会这样说道。
目前,YodoOS-Master 2.0 已支持空间模式、手势、语音等多种交互方式,也同样支持 0DoF、3DoF 和 6DoF 三种交互方式。还支持多种开发工具协同、多生态的应用,形成了一个相对友好且开放的内容生态体系。
空间计算的一大前提是“环境信息感知”。为此,Rokid AR Studio 采用了单目 SLAM 方案,通过一个普通的 RGB 摄像头,实现空间信息的定位和捕捉。
按照 Misa 所说,这是 Rokid 的 AI 实力,正因为希望减轻眼镜的重量,所以采用了一颗摄像头的方案。而如何用一颗摄像头实现两颗摄像头的空间计算效果,厘米级的虚实贴合精度,背后是 Rokid 系统软件算法、AI 与硬件的深度融合计算。
事实上,Rokid 的战略打法并不罕见。通过软件创新带动硬件市场,也是大多数消费电子厂商的主要战略,这一点在不少大型手机厂商上也能看见非常明显的身影,OS 也是最能做出用户差异化体验的板块。
基础硬件与自研 AR 系统 YodoOS-Maste 的结合下,造就了 Rokid AR Studio 空间计算套装。应用场景方面,Rokid AR Studio 空间计算套装可支持与 Vision Pro 同样的 3D 空间视频、3D 照片的观看。拓展键鼠外设下,Rokid AR Studio 空间计算套装也支持多屏办公。不仅如此,在 200 余款应用的加持下,AR 游戏娱乐、影视剧观看等基本功能也囊括其中。   
观影娱乐——3D空间视频/照片
特别功能—空间搜索
游戏场景—AR打僵尸
这样一款支持空间计算的 OST AR 眼镜,将产品重量做到了 76 g,形成更轻薄眼镜形态。对比 Apple Vision Pro 至少 600g 的重量,Rokid Max Pro 削减了差不多 85% 以上,这是基于 OST 技术路径做分体式 AR 眼镜目前的一个较大优势。
另外一个相对优势则是成本。对于普通消费者而言,在购买第三块“大屏”电子产品时,价格将是影响消费决策的重要因素。苹果的高端产品战略,显然并不亲民,Vision Pro 合计 2.5 万元的价格,让人望尘莫及。
而国内的 AR 眼镜当然更亲民一些,成熟普通的 BB 方案眼镜价格普遍在 2000-3000 元区间,而在增加相关移动主机,以及摄像头算法后,价格也能控制在万元以内,具备更好的市场普及潜力。
 苹果拉动XR产业正向生长
 Rokid上半年空间计算消费级新品能否“接住”?
尽管 Vision Pro 价格颇高,产品体验也存在诸多尚待改善的方面,但苹果的入局,对于整个 XR 产业而言,却能带来诸多正向的推动作用。
Misa 在近日做客某科技论坛上,评价 Vision Pro 时表示:“苹果这次把很多可能性、想象力、生态的前景都展示了出来,但是对产品大家其实总觉得还是欠点火候。”
“我能讲的就是第一它真的太重。我大概戴了 20 分钟,我是有明显的酸痛感,酸痛到我后来活动了大概半小时。这是他最大的问题,现在海外的博主也反映了这个问题。”
“第二就是在有的交互场景里面,它还是相对比较粗糙一点,那个是我们比较早的体验版本,我不知道现在有没有改进,但我最近看的 review 里面这个部分也有问题,比如说他的那个人脸扫描成像,最后出来的效果不他好。还有人发了张照片跟扎克伯格当时的照片对比,我在朋友圈发了这张照片。当时就是这个效果,我以为他会改进,但实际上后面没改进。”
当然, Vision Pro 的发售对于Rokid 这样的 XR 公司来说,在供应链、用户教育、生态建设、技术启发将有很大帮助。比如生态,为 Vision Pro 开发应用的开发者,也可以很容易在 Rokid 的平台上开发类似的应用,Misa 透露目前 80% 在 Rokid 的开发者都是如此,代码迁移成本很低。
他还说道:“我们一年大概花 1, 000 万人民币左右去支持开发者和生态伙伴,听起来 1, 000 万好像对创业公司是个不错的价钱,但是苹果就完全不是这个数量级,整个行业会热闹起来。”
用户认知层面更是不言而喻,各大社交平台的热榜已经说明了答案,苹果强大品牌告诉了大家空间计算是什么,有什么用。而在苹果科普认知的同时,也给了更多 XR 厂商空间计算的消费市场缺口。特别是在Vision Pro 不光高价,还未在国内发售的这一时期。   
而在国内诸多做 XR 的厂商中,OST 技术路径的Rokid 无疑是不可忽视的佼佼者。据亿欧网近日发布的《2024年中国AR产业发展洞察研究》报告,Rokid、雷鸟创新、XREAL 和影目科技占据了国内 AR 市场 85% 以上份额。
其中,Rokid 在中国消费级 AR 眼镜产品出货量占比中,以 27.9% 的占比排名第一,据称,企业用户和消费用户服务用户数已突破 100 万。Rokid 的这份成绩单实际上是研发技术布局、内容生态建设、产品战略选择和市场营销推广的共同结果。
图源:亿欧报告截图
报告显示,Rokid 目前共有 314 项有效专利,主要涉及 AR 眼镜相关的产品工学设计、光学结构设计、感知交互技术等核心板块。创新技术专利的积累,为 Rokid 打造一条无形的品牌护城河,有利于企业打造更具差异化的产品,以及更长期的良性发展。
AR 内容生态一直是产业的痛点,缺乏优质原生 AR 内容将在很大程度上将限制用户体量。作为国内 AR 独角兽企业,Rokid 在内容生态的上,扛起了建设的大旗,基于自研 AR 空间操作系统 YodaOS-Master,Rokid 先后共举办了两场 AR 开发者大赛,最高开发者单笔奖金达到了 10W。与此同时,Rokid 还深入产学研结合,与多所高校合作,推出 AR 高校系列培训课程,年均投入千万预算的“若琪空间站”开发者助力计划等。
不光要将内容“加进来”,同时还要将产品“走出去”。在市场战略方面,2023 年 Rokid 还携手 Google 打造了全球首款 AR 版 Android TV 设备,通过 Rokid Station(全球版),用户可以在 Google Play 上下载 YouTube、Hulu、Disney+、TVer、AbemaTV 等海量应用。强大的谷歌内容生态,为 Rokid 出海打下了生态基础,让其可以驰骋亚马逊等海外渠道。
当然,Rokid 的 27.9% 的市场份额,除了其在 C 端的市场发力到位外,还离不开其 B 端业绩的支撑。结合 AI+AR,Rokid 的 AR 眼镜产品已应用在工业电网、油气化工、智能制造医疗和文旅等领域,产品销往 80 多个国家和地区。
此前 VR陀螺进行过实地走访,看到 AI+AR+工业数字化的转型案例。基于头戴式 AR 眼镜,其在工业应用中,可提供远程协助,员工培训等解决方案,进一步提供工作效率,保证工业安全。
Misa 多次在采访时表示,B  端是 Rokid 技术的试验田,正是因为 B 端有数量庞大、场景丰富的客户,Rokid 才能在技术上不断尝试和迭代。
在 OST 空间计算这条技术路径下,Rokid 从软硬件专利技术、自研AR 操作系统、内容生态策略、B+C 双业务打法展示着它的独特一面与深厚积累。空间计算新时代下,有望在苹果 Vision Pro 的市场刺激下,迎来新一波业务增长 。
据 VR陀螺获悉,Rokid 还将在 2024 年 上半年将举办 OpenDay,带来消费级全新空间计算新品。基于 Rokid 过往产品路线,以及相关技术布局,新品仍可能是基于 BirdBath 方案的 AR 眼镜,以及移动主机盒子的改进款。
全彩 Micro-LED+衍射光波导的方案可以将 AR 眼镜做到更接近眼镜的形态,进一步提高透光率,作为产品迭代方向毋庸置疑。但 Micro-OLED+BirdBath 的眼镜可以带来高清晰度,视觉体验更佳,成本更易控制,并且基于移动主机还能带来性能与算法融入,拥有更好的扩展性,似乎更符合当下做消费级空间计算 OST 产品的策略。
Rokid 下一代空间计算产品落子何方,原有的产品布局是否会被打破,空间计算时代该怎么把握市场机会,且让子弹再飞一会儿。
第一时间了解XR资讯  
  关注VR陀螺官网(vrtuoluo.cn)
VR陀螺的联系方式:
商务合作 | 投稿 :
六六(微信号 13138755620)
寻求免费曝光:
六六(微信号 13138755620)
投稿邮箱:[email protected]
活动详情请点击:

推荐阅读
继续阅读
阅读原文