查看原文
其他

专访 | 实域科技林树森:空间视频相机是这代人的「时空任意门」?

关注 XR 创业的 XR航海家 2024-04-18


引言:Apple Vision Pro 发售已两月有余,据媒体从供应链获得的消息,目前在美国市场实现单周销量约 1.5 万台,累计销量已逼近 40 万台。

作为主推功能之一,「空间视频」让更多用户从「看视频」到「走近视频」,彻底革新了影像体验。瞄准消费端未来设备数量的快速增长,不少团队已着手空间视频的拍摄和生成方案。近期我们邀请到实域科技,一家立志于为消费者营造身临其境影像效果的智能硬件公司。创始人林树森毕业于哈尔滨工业大学,是 XR 行业连续创业者,曾任知名全景相机创业公司 CTO,他将与我们分享探索「身临其境」道路上的故事和思考。

X 思考

空间视频是下一个 live photo 级别的机会,把珍贵的瞬间定格成饱含情感的「时空任意门」,等待未来的自己来开启、重温。 


本文正文共 4334 字,阅读时间约为 14 分钟


对话双方
「X」:XR 航海家
「林」:林树森(实域科技创始人)

1 信仰 XR,

持续开发多款产品追求「身临其境」

X:树森是怎么样一步步进入 XR 行业的?

林:从大学开始我就一直对虚拟现实融合这个命题非常感兴趣,所以从哈工大毕业我就开始创业,最早给大学校园网研发了一套虚拟世界软件,后来我加入了手游公司,我非常渴望能够创造出让大家沉浸的虚拟世界,但是当时受限于引擎和手机性能,游戏还是以 2D 产品为主,一边做一边研究 3D。

2015 年我观察到了 VR 行业第一波浪潮,我认为是虚拟现实融合能够超越游戏的终极解决方案,但是硬件和软件两边都没有准备好。比如那个时候移动端刚刚能跑得动《虚荣》这样的产品,米哈游刚刚发行《崩坏 2》,所以我们非常明确真正的三维空间体验还很远。

一个偶然的机会,我通过头显体验到立体视频,那个时候的机器分辨率其实不高,甚至可以用粗糙来形容,但是观看过程中我很明显感觉到,属于未来的内容形式已经有了雏形。在 3D 世界里的立体视频,你首先感受到的是和现实世界完全一致的「真实」,真实体积、距离、位置关系这些都是在二维内容里体会不到的。如果内容的质量提高,观看体验变好,一旦跨过了体验的奇点,这种「身临其境」的感觉就能正确地被展现。

对于一个做了多年游戏和虚拟世界的开发者来说,这种体验的诱惑实在是太巨大了。所以我开始思考原生的立体内容应该如何产生。我之前的经验主要在软件,所以想到硬件领域看看,跟我的同学和师兄一起创立了圆周率科技。


X:树森在圆周率科技做过哪些产品,具体的使用场景有哪些?

林:我们做了专业级全景相机 Pilot Era 系列与 Pilot One 系列,服务了一系列北美和欧洲的客户。重要的出货渠道之一是为谷歌街景采集项目提供设备,因为谷歌自己的采集设备很难兼顾边缘地区,所以它激励那些狂热的街景爱好者拍摄上传。

在国内,我们提供 8K 全景直播解决方案,你可能在视频平台看到过一些著名景点的全天慢直播,不少是采用了我们搭建的方案,而且当时特别受中国电信、中国移动等运营商的欢迎,因为正好能够匹配上他们 5G 建设和落地的推广需求。


X:圆周率科技和这一波 XR 的变化有什么机缘关系?

林:这几年一直在观察 XR 行业的变化,第二波浪潮几乎是国内外同时推动,Meta 推出 Quest 2 变成当年圣诞季的明星产品,字节收购 Pico 在国内大量营销,我们也和很多内容公司建立了业务合作,比如我们也做过 VR180 相机,我们发现 8K 分辨率的十万块的顶配机器卖不动,后面又出了一些一万块左右的减配机器。

但是在我看来,这两个平台都没有定义一个亲近消费者的影像消费模式。常见的影像内容大多还是 VR180,很昂贵的机器没有办法渗透普通用户群,只能由 PGC 统一采购然后用于一些大预算的精品项目上,但对用户数量增长的贡献也不大。Pico 以很贵的价格采购了 VR180 的体育比赛、演唱会的版权,希望通过这些内容获取新用户,事实证明没有取得好效果。

即便如此,看到我们自己的设备不断出货,被更多创作者使用,在更多平台上获取关注和赞美,证明我自己从过去到现在坚持的「身临其境」的路线和价值观是正确的。


内容空间化趋势不可逆,
Vision Pro 是消费场景关键发动机


X:为什么内容空间化是非常确定性的趋势?

:我觉得可能有很多数据和参数的分析,但是我想讲个我自己看空间内容的体验,是真真切切感受到「一刻抵千金」的体验。

很多宝爸宝妈都会记录小朋友的生活,但是单纯平面的照片其实挺难直观的回到那个瞬间。但是我拿我们自己的样机去拍测试片,我让我两岁半的女儿做模特。一年之后我重新把那段视频翻出来看,发现好像可以感受到女儿当时在身边的样子,特别是和长高了一点的现实情况对比之后,那种从空间里面跑出来,有种时空穿梭机的感觉。

空间视频的出框视觉,被访者提供
(示意图,平面无法还原真实视觉立体效果)

当下平面照片和视频的体验已经定型了,大家无非在卷从 90 分到 95 分的提升;而内容空间化是另一个维度的降维打击,现实和虚拟交错的震撼和感动是平面内容无法传递的。大家需要的是更容易、更频繁能够接触到完整体验的渠道,这是有了体感后就很难回去的体验。


X:在内容空间化的趋势中,
现在是什么时间点,你为什么选择现在进来?

:我们整个行业一直在等消费端和体验端的需求爆发。Vision Pro 目前的销售成绩证明了它是一款非常成熟的、断档领先的 MR 设备,不能用性价比的方式去评价它。而且它确实具备明显的品牌效应,很多路人也至少愿意尝试和了解它和它背后的科技细节,更多硬件厂商几乎一定会重视和效仿这个产品,包括它的功能,大家的下一代产品有可能就是有望在价格端真正普及的机会。

Vision Pro 的价值观非常重视人机交互关系,所以他们会定义出 persona(基于扫描真人形象,算法生成仿真虚拟人)的一整套逻辑。只花了一个月,persona 已经从「恐怖谷」效果,进化到了多人在线面对面、实时动捕的 spatial persona 交流场景。他们一定充分论证了,剩下的就是算法进化让体验越过奇点。

同样地,Vision Pro 独立定义了一个叫做「空间视频」的东西,它可以让用户便捷地拍摄观看立体视频。Vision Pro 需要 VST 来达到虚拟现实融合的产品定义,VST 离不开两颗高素质摄像头的稳定发挥,因此使用这两颗摄像头的「空间视频」必定是 Vision Pro 的基础能力之一,也将会成为所有后续追随者的标配

不管是用 Vision Pro 还是 iPhone 拍摄,体验也和拍摄普通视频完全一样,按一下拍摄键就好,在非头显上看就是普通视频,只有在头显中能显示立体效果。这种潜移默化的影响让我想到了苹果在 iPhone 去掉正面实体按键上十年的努力——减少到一个「home」键,用 taptic engine 取代机械按压、最终用结构光替代「home」键。十年之后,「空间视频」=「视频」,大家都会习惯用头显(包括 OST AR 设备)、手机、智能硬件来拍摄「空间视频」。


情感体验驱动而非纯拼参数,
空间视频相机更具普及基础


X:所以空间视频和全景视频、VR180 视频是不一样的全新的东西?

:首先立体空间感需要拍摄端至少两颗以上的摄像头通过视差合成实现。「全景相机」是多个镜头采集 360° 的 2D 画面,然后把 2D 画面弯成一个球面,营造出「沉浸感」或「包围感」,但它还是一个「面」,没有立体感。

空间视频和 VR180 视频都具备立体感,空间视频没有像 VR180 一样去强调画面的宽广(水平向接近 180 度),它集中在视野正前方 60°~80° 左右的范围呈现,这是一个不需要左右转头就可以看全画面的角度,不会给用户带来心理负担。

我们自己总结了一个「不可能三角」:沉浸感(摄像头的可拍摄角度)、立体感(多摄像头营造视差)、消费定价,在目前无法被同时满足。牺牲立体感,产品就会导向全景相机、运动相机这样的形态;牺牲消费定价,产品就会导向高价格的专业级、工业级产品形态,而非消费级;牺牲一点沉浸感,产品就会导向空间视频相机这样的形态。



X:空间视频相机跟其他两类相比,有什么样的产品特点?

:Vision Pro 带给我们的是第三条全新的路子,不要求卷硬件侧的极致参数,价格可以与常见的平面影像器材拉平,反而是更关注立体感和用户习惯无缝迁移。我原先以为苹果会用 LiDar 激光雷达预先扫描三维空间,用点云相关的数据辅助计算,后来发现并不需要这部分,所以对硬件模组没有什么额外的要求。

我们测算过,根据空间视频的最佳观赏角度、人眼对空间感的辨别水平,空间视频的最佳拍摄场景可能就是一个长宽高 3m x 3m x 3m 的立方体区域:人眼对物体有强立体感的距离区间是  0.5m-4m/5m 深(太近看不全/有重影,太远角度区别不大),在这个尺度上看左右眼睛不累的范围是两边共 3m;大多数房屋的层高是 3m……全部对应人日常生活最频繁接触物体、社交的尺度。

在这样的前提下,空间视频相机绝对适合记录我们身边发生的事情。Vision Pro 的宣传中也比较多提到朋友和家庭聚会这样的场景,就在这样一个触手可及的私人小世界里,把珍贵的瞬间定格成饱含情感的「时空任意门」,等待未来的自己来开启、重温。 


X:毕竟空间视频相机还是新事物,
你觉得会重现全景相机、运动相机品类的成功吗?

:之前和一些同行交流时,他们总是觉得影像硬件行业很卷,跟我表达了担忧。我的想法是,在平面内容时代,全景相机、运动相机领域出了很多大公司,比如 insta360、go pro、甚至大疆(革命了相机的机动能力);那么在内容空间化趋势浪潮下,空间视频相机当然也会出现大公司。

空间视频相机的形态也只是刚刚起步。沉浸感的牺牲是暂时的、容易赶超的、有成熟算法解决方案的。立体感的打造,空间视频王牌场景下的算法模式和风格调教,是具备壁垒的。未来广角模组成本持续下降,沉浸感的短板慢慢补上,空间视频相机有可能会成为克服「不可能三角」的全能产品


空间视频拍摄讲究多,
空间相机软硬件两手都要硬


X:现在空间视频的拍摄和观看体验怎么样?

:首先说观看,一开始只有 Vision Pro 原生支持,后面 Quest 很快跟上支持,但是不同设备上播放效果还是很不一致的,原因包括头显本身的显示素质差异、系统和原生应用的差异等。比如,目前只有 Vision Pro 从系统层面做了一个「伪 6DoF 效果」,透过一个边缘模糊的窗口看后面的画面,用户既符合看常规视频的熟悉习惯,又享受到可视画面随观看角度变化、物品看似突破窗口的奇特观感和体验。所以为了保证体验统一,厂商自己做软硬件体验整合是有必要的。

其次说拍摄,目前大量出货的拍摄设备只有 iPhone 系列,除此以外有一些更早的 VR 相机品牌勉强兼容这个场景。可以预见,随着 iPhone 更新,苹果生态的用户都将逐渐具备拍摄空间视频的能力;但是安卓用户可能就要寄希望于不同手机品牌对空间视频的策略,以及他们是否愿意大刀阔斧更改相机工业设计来适配了。

即便手机品牌适配,手机上摄像头的间距只能做得很近,所以它的等效瞳距很短,这样拍摄出来的近物比例远大于真实尺寸,和观看者的生活经验是不匹配的,立体感会弱很多,也可能会引起眩晕。因此,仅仅依靠手机来拍摄是不够的,想要真正好好拍的话,消费者是有购买专门空间视频相机的需求的。


X:根据你们的实践经验,
空间视频的拍摄和平面的有什么不同吗?

:这里面的讲究还是挺多的,营造立体感是一个全新的命题。

除了之前提到的距离太近,相机倾斜时拍摄的内容也极易造成眩晕。角度小还能通过算法补偿裁剪回来,角度大的话因为左右画面完全不在同一水平线,在水平角度下看就会很晕。

再比如,平面视频常见的 16:9 画幅可能并不适合空间视频内容创作,因为内容距离边缘很近会失去立体感,左右过长、上下过窄的画幅有效区域太小,并不利于视觉差效果的充分展示,也不利于垂直高度上完整的画面记录。我们觉得更靠近正方形的比例是不错的,也更有「任意门」的感觉。

不同比例下的模拟观看效果

还有一些具体拍摄场景的限制,比如运动场景中的防抖,双摄同步的难度显然成倍于单摄;自拍场景,消费者需要同时注意画面监视器和摄像头水平,不可能只靠手机做到。

我们在产品形态上都会考虑这些限制,有些功能确实在相对高端机型才出现,但我们基本上能够克服,目前也有了比较成熟的解决方案,最终会力争取得一个成本和性能的平衡。


X:透露一些目前产品的信息和后续的计划?

:目前我们集中精力研发一款平价性价比款 SKU,计划今年年中开模试产,年内上市。同步把 XR 端的软件应用开发做好,特别是编辑端,在平面端编辑空间视频会很复杂很不直观,我们希望在 XR 端直接编辑减少用户困惑。

后续我们计划不断深化立体内容拍摄体验,对产品形态和传感器做一些革新,优化设备平衡和立体感捕捉,兼容运动等更多场景。


X:定一个小目标?

让库克和扎克伯格都试用我们的产品,为我们的产品点赞!


END





继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存