神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:标准的白领工作就是坐在局促的小隔间,面对着一个或两个电脑屏幕点鼠标敲键盘。有没有可能在任何你想要的美景,比如黄山上,九寨沟旁工作,你的显示器有iMax影院那么大,可以同时打开十多个代码窗口,一目十行,同时还能一边跟同事的即时沟通,看自己的会议日程、各种 API 参考,以及展示“现实”世界的摄像头呢?一位VR的极客爱好者证明了这种可能性,而且就是用时下的VR设备。我们来看看他的体验。文章来自编译。篇幅关系,我们分三部分刊出,此为第一部分。
通过头戴设备向外望去的景观,在低轨道俯瞰地球
划重点:
当从海滩到近地轨道只有一键之遥时,“远程工作”就会玩出全新的维度
现在VR跟1980 年代那时候的个人计算机热潮很类似
动态、反应灵敏、身临其境的体验让我们的感官把模拟环境感知成我们所居住的空间
我漂浮在太空中,四周被银河系的壮丽景色环绕。一个电影院大小的屏幕就悬挂在我面前,屏幕略微弯曲,一切都处在完美的观看距离。八个不同的窗格闪烁着代码,这就是一颗技术宝石的各个刻面,透过这一个个刻面,让我们得以窥见那颗大脑,那颗每天负责移动上千万美元的系统的大脑。我的指尖是一张像绘图桌一样倾斜着的通信控制台,我跟同事的即时沟通、我的会议日程、各种 API 参考,以及展示“现实”世界的摄像头都在那上面。在我的左边,紧靠着那一排排的代码的,是一台两层楼高的竖向显示器,上面列出了手头工作的规范,下面则是时刻展示的Spotify 播放列表。我调高音量,美妙的音乐进入了我的心流。
这可不是欧内斯特·克莱恩(Ernest Cline)小说里面的片段——这就是我的日常。这一周内,我会在虚拟现实当中渡过 40到50 个小时,我上一周,以及过去 2? 年的每一(工作)周,都是如此。里面不仅仅只是为了乐趣和游戏——还有锻炼、冥想、创意、社交等很多——但就本文而言,我只关注工作。
是的,真的:每天要戴 8 到 10 个小时。不管是这项技术还是一般前提,我都遇到了大量质疑,很多人对软件评头论足,要不就是说它跟他们觉得“应该”的工作方式不相符。应该管用。尤其是 Reddit 上面有一对的摇头族。对于这帮人,我要驳斥他们:
大家说:“这不可能做到”,但总是被正在做住的人打断
— Puck
技术的时间线上布满了似乎注定要失败,但最终取得了巨大成功的概念和新奇事物。大多数都不是开始就“完全成形”,而且往往需要好几代的发展和适应。而且它未必适合所有人,这还不行——但现在不仅已经有可能,而且还是我使用工作计算机的唯一方式。
我的工作也跟 VR 没有关系;我做的还是过去的编程、信息系统开发以及办公室的工作,只是碰巧用VR来做。目前应用到任何计算机和沟通工作的策略和工具也将适用于未来的几乎所有的工作。当从海滩到近地轨道只有一键之遥时,“远程工作”就会玩出全新的维度。
我为什么要告诉你这些,你又为什么要关心这些呢?
要想回答这第二个问题,不妨回顾一下 1980 年代那时候的个人计算机热潮:当时的计算机极客铁粉看到了工具的巨大潜力,虽然他们(我们)花了很多时间去研究技术本身,但仍然抽出时间去帮助将最先进的技术转化为对普通大众有用的东西。当时并不是人人都喜欢笨重的米色铁盒(PC机箱)与调制解调器握手时令人宽慰的嚣叫声,但到了 2021 年,全世界有一半的人都随着携带着一台能连接上信息高速公路的时尚袖珍电脑。
现在,虚拟现实正处在“1980 年代米色噪音机器”阶段:是极客眼里的焦点,消费者感到新奇。即将到来的看起来会跟现在有很大的不同;尽管如此,DNA 已经成型,而且不需要再过 40 年就能改变世界。
至于第一个问题:自 2019 年 4 月以来,我就一直是一名全职的VR 员工,我在虚拟屏幕上干活的时长大约为 4500 小时。可以毫不夸张地说,VR 用户里面我最全球可以排在前几名。我用了很多时间去观察这个领域的发展,我不断揣摩未来的可能性。对未来的看法我并不固执,但我希望我所看到的值得跟大家分享。
我不会什么都讲——只是想让你们感受一下我是怎么让VR为我所用的,然后希望能唤起大家的思考、讨论,并追求其中的可能性。
一般大家用的“虚拟现实”是指用户佩戴的头戴设备,给他们呈现由计算机生成的 3D 环境。这跟现代视频游戏或模拟器见到的那种交互跟视觉反馈一样,只是由于尺寸、现场感以及360度的视野而互动性更强。
有些人喜欢玩酷一点,所以增加了几个时髦用于来说明模拟内容怎么跟物理环境融合,比方说“混合现实”(MR)或“增强现实”(AR),或者用“扩展现实”(XR)涵盖一切。不过本文将坚持用“VR”一词。
这只是一系列“虚拟”环境与抽象的最新迭代,是合乎逻辑的演进步骤。书就是概念性环境的极好例子:那就是由或真实或虚构的演员、事件、环境和想法构成的模型——只不过是静态的,被时间冻结了。剧院是一个更好的例证,场景是人造(虚拟)的,作为一种动态共享体验呈现给观众。
技术对这些共享体验的完善和传播贯穿了整个历史。现场剧院先是演变成电影,然后是电视,然后是动态/响应式视频(也就是游戏):从舞台到银幕再到 LCD。音乐或音频表演也是如此:现场表演催生了留声机与后续——家用立体声音响、音箱以及随身听,让音乐更贴近“用户”。
100 多年来,我们一直把虚拟音频绑定在我们头上,并最终达到可融入消费级虚拟视觉的地步。这些视觉效果为用户带来了空间和比例的错觉,从而轻松地将把物理动作转换为上下文丰富的命令。动态、反应灵敏、身临其境的体验让我们的感官把模拟环境感知成我们所居住的空间:我们的虚拟现实。
跟计算机生成的世界互动可带来引人入胜的神奇体验——但就定义而言,除非有什么东西可以将这些行为跟非虚拟的结果联系起来,否则就不是实质性的。有时候这种互动会很有用,比如进行重型设备训练或医疗程序的排练。本来就是非实质性的活动,比如唯一产物就是通信的,或者制作数字制品的活动,就不用考虑这些权衡——于是就进入到信息经济的计算机工作,也就是“我的办公室”。
使用的是计算机,但是……是在 VR环境下。这么做有几个原因,我会在后面介绍,但是,我想先来个免责声明来管理一下期望:在当前的“米色盒子”阶段,工作还是工作,会议还是是会议,VR之所以有价值是跟舒适度、生产力以及成本有关(以及我作为书呆子对技术的痴迷)。基本上一切都是用任何办公环境下都很常见的传统软件来进行:Google的产品、Zoom、Slack、电子表格、文字处理器、IDE 等。
笔记本电脑→Immersed→路由器→ WiFi →头戴设备→魔术
我用的是普通笔记本电脑,很强大但不是游戏 PC,而且规格远低于“VR就绪”。虚拟环境的生成用的不是计算机,它只跑常规的办公软件,但添加一个重要的附加功能:一个小型代理程序 Immersed,它把屏幕内容编码成视频流,并通过 WiFi 将其传输到头戴设备。
我目前的头戴设备是 Oculus Quest V2版(撰写本文时起步价是 300 美元),它会接收这些视频流并将其渲染成自己所制作的环境下的显示。这款设备采用无线连接,是独立式的,可以在没有 PC 帮助的情况下跑软件(大部分情况下),牺牲掉更高端的性能和图形,换取自由移动与可在任何地方设置的便利性。从 PC 的视频编码、通过 WiFi 传输,再在头戴设备上显示整个过程的平均耗时约为 3 毫秒,用的是几年前的 5GHz 接入点。0.003 秒这个时间远低于人的感知,基本上相当于瞬时。
这端时间我用的是三屏设置(我还有其他保存好的布局备用于不同类型的工作/焦点):工作主显,纵向的参考屏,相关活动任务的详细信息和材料放在这里(还有一个播放音乐的Spotify 窗口),另一个是小一点的,放置沟通、日历、代码文档等的横向显示器。
一切都跟比例有关:显示器比例对比,左边是3 个虚拟现实屏幕,大小从 2.4 米到7.6 米不等。右边是身高1.8 米的人站在桌子旁,右边是两个2.5 英尺(0.8 米)液晶面板传统显示器
其中一个显示器对应的是笔记本电脑的实际屏幕,另外两个是纯虚拟的——75% 的像素都是靠幕后的魔法变现的。笔记本电脑觉得那是真的,应用跑得也不错,但要想看到它们唯一的办法是通过头戴设备把它们变为现实。我还可以添加更多——Immersed 最多可支持五个这样的虚拟显示器——但我也用了一个屏幕内容管理器(也叫做“虚拟桌面”),这可以让这3个显示器像15个一样。我的视野和注意力就可以最大化。
眼睛看不完;东西太多了,眼睛用不完。
这些超大显示器的分辨率普通得出奇——1080p(参考屏、沟通屏)以及 4k(主屏)。导致点距从数字上没能给人留下深刻印象,尽管这仍然是路边广告牌显示屏的 25 倍以上。更高的分辨率不是不能用,但这是我在考虑了像素奇偶校验(更多内容见下文)、计算机性能以及时延之后做出的权衡。应用针对可读性和清晰度做了调整,强调的是信息密度而不是反锯齿或平滑度。其结果是写代码时我的主屏字符数为 511x129:66000 个字符可以放很多代码了,轻轻松松就可以相当于4到6个典型的 IDE 窗口的规模(这篇文章字数乘以1.5都可以一次性展示出来)。
输入是通过标准键盘和鼠标(我用的是轨迹球)——悬浮在每个应用界面上,或者像《少数派报告》那样挥挥手就能完成输入还不行(不过说实话,要是一整天都那样的话肯定会累坏的)。其他的工具工作得也不错,比方说语音识别或图形输入板效果也还可以,但不适合编程。我是靠触摸打字的,所以看不到键盘也没关系,但是有选项可以通过虚拟叠加把键盘融入到环境里面,或者(很快)通过头戴设备的跟踪摄像头打开“门户”去看看周围环境的视频(FaceBook 自己的 Horizon Workrooms 现在就用了这一功能)。
由于我只需要一个键盘、鼠标以及一个可以容纳自己的地方,所以我现在已经完全抛弃了传统的办公桌。一天当中有一部分时间坐在地板上我就可以干活了,其余时间则用了站立式的布置来休息一下。我会根据当前任务(比方说,看邮件或研究跟编写代码)的舒适度、效率进行调整,或者如果我需要锻炼或冥想休息,想对一些要解决的问题进行可视化,或者玩一下高尔夫的话,可以对整个空间进行重新改造。
落地椅、键盘托盘,还有一个很大的杯子
站立办公的配置
地板几乎空荡荡,靠近一面墙处放着少量电脑设备,紧挨另一面墙的则是一排书架。整个办公室没有一台可见的显示器
在介绍我的体验之前,先来点快速提示,大致按重要性/实用性排序:
找到眼睛适应的最佳位置。调整IPD(瞳距),对其镜头:包括左、右、上、下、距离和倾斜度。一次一只眼这样做调整。像素密度并不是均匀分布的——密度最高的在甜点中心,模仿的是小窝的那种敏锐度。
如果你需要矫正镜片,去弄副镜片插片:比戴眼镜好,而且我发现效果甚至比戴隐形眼镜还要好。对于像我这样高度散光近视 (-7.5)的人来说,镜片插片的价格逼近比我大多数的眼都要镜便宜,而且因为我整天都在工作,所以花这笔钱完全合理。
镜片要做好清洁。不管你要透过什么东西去看,确保能看透!这一点适用头显内外的镜片——跟踪摄像头需要一致的视野,也就是说不能够有污迹。
头戴设备使用前也要清洁:定期做一下消毒抗菌处理可保证健康和愉悦。防渗透的接触面也会有帮助(比方说,聚氨酯或硅胶界面)。
尽量让分辨率对等为目标:虚拟屏幕是图片的图片,这意味着头显的分辨率和像素密度是限制因素。虚拟渲染屏幕的像素密度跟头显的像素密度越接近,图像就越清晰。Quest 2 的分辨率为 1832x1920/单眼(Vive Focus 3 的分辨率为 24482/单眼)——显示器可以更大,但如果最大可见部分最接近 1:1的话,效果最佳。
不要白费工夫去模拟物理屏幕的配置了!虚拟显示器可以做成任何尺寸,摆放在任何位置,用不着对物理对等物进行模仿。墙壁、剧院、背景、桌面、环绕排名——一切皆有可能。
同等视场下,“又大又远”比“又小又近”看起来更舒适——占用的视觉空间一样,但因为会聚点的差异,对眼睛来说前者要轻松得多。
虚拟环境下人体工程学仍然适用:还是要避免长时间转动颈部、头部倾斜或其他的静态姿势。放点东西鼓励自己偶尔移动一下,不要长时间保持任何一种姿势。
好的 WiFi 非常重要:带宽要最大化,跳数要最小化。一个干净的 5ghz 频道可提供 866mbps,如果可能的话,应该直接让它直通头显跟计算机——或者至少让计算机跟路由器硬连线。
阅读(或观看)手册。了解一切都是怎么运作的,做好协作——耐心让环境做好调整,完美适配,你会收到超乎想象的回报。
译者:boxi