未来的大人和孩子都可以用这种方式自娱。由于这些幻象全部经由电脑处理而产生,并非真实的情境,因此也就无需受实物大小或发生地点的限制。在虚拟现实中你可以张开双臂,拥抱银河,在人类的血液中游泳,或造访仙境中的爱丽丝。
目前的虚拟现实还有不少缺点和技术上的失误,必须加以克服之后,才能使它具有更广泛的吸引力。例如,低成本的虚拟现实就深受阶梯状不规则图形的困扰。当影像移动的时候,这种锯齿状的图形显得更不稳定,因为它们看起来好像在移动,但却不一定与画面移动的方向一致。想一想水平线的样子,一条非常平直的水平线。现在稍稍把它倾斜一点,水平线中央就会出现一段锯齿形状,然后再倾斜一点,又出现第二个、第三个和更多的锯齿地带。这些锯齿看起来仿佛在移动,直到这条线终于倾斜成45度角,则线上相邻像素所组成的锯齿排成了一个楼梯形,一个挨着一个,简直难看极了。总是慢半拍
比这还要糟的是,虚拟现实的速度还不够快。所有的商业系统,尤其是许多电子游戏生产商即将推出的新产品,都有慢半拍的问题。当你转动头部的时候,影像会很快地改变,但是还不够快。图像总要慢半拍才出现。
三维电脑图形刚出现的时候,人们使用各式各样的立体眼镜来达到观看效果,有时是廉价的偏光镜片,有时则是较昂贵的电子快门,会轮流让双眼接收不同的影像。我还记得,我第一次操作这类装置时,所有的人——不是大多数人,而确确实实是每个人——生平第一次戴上这种眼镜、并在屏幕上看到立体图像后,都会把头转来转去,想看看图像怎么变。结果就和看立体电影一样,图像并没有改变。把头转来转去没什么用。
人们这种“扭动脖子”的自然反应正说明了一切。虚拟现实必须紧密配合对用户的动作和所在位置的感应,让观看者能够引发图像的变化,而不是完全由机器来控制。重要的莫过于电脑能跟踪头部的转动并能回应它的快速变化。图像更新的速度(频率响应)实际上比分辨率更为重要。由此可见我们的运动神经系统是多么敏锐,即使最轻微的反应迟钝也会破坏整个感官经验。
大多数的制造商大概都会完全忽略这一点,而把早期拼命强调图像的高分辨率的虚拟现实系统推向市场。这样做的结果是牺牲了响应速度。其实,假如他们减少图形显示,加强图像的防锯齿技术,并且加快响应速度,那么他们所提供的虚拟现实体验将会更加令人满意。
另外一个办法是,完全放弃为左右眼分别提供不同透视影像的头戴式显示器,而改用所谓的自动立体效果技术,让真实的物体或全息影像在空中浮现,使双眼一起收视。《星球大战》与全息术
到下个1000年中的某个时候,我们的孙子或曾孙将以一种新的方式观看足球比赛(如果还那样叫的话)。他们会在咖啡桌(如果还那样叫的话)旁来回移动,让8英寸高的球员在起居室(如果还那样叫的话)中任意驰骋,把一个半英寸高的足球踢来踢去。这个模式与早期虚拟现实的想法完全相反。无论你从哪个角度观看,都能享受极高的分辨率。无论你朝什么地方看,你看到的都是在空间浮动的三维像素。
在《星球大战》(StarWars)这部影片中,R2D2就用这种方式,把莉亚公主的影像投射在欧比王的地板上。美丽的公主变成了投射在空间中如幽灵般的幻影,从任何角度(原则上说)都能看得见。这种特殊效果,就像《星际旅行》和其他科幻电影中的类似效果一样,无意间造就了一批对全息一类技术麻木淡漠的观众。我们在电影中看过太多类似的镜头,因此误以为这种技术很容易。
事实上,发明白光全息术(今天这种技术普遍用在信用卡上)的麻省理工学院教授斯蒂芬.本顿花了二十多年的时间,借助于价值上百万美元的超级计算机的力量,运用了几乎无价的特殊光学仪器,再加上十几位出众的博士生孜孜不倦的努力,才得到了(与你在电影中所看到的)类似的效果。
全息术(holography)是匈牙利科学家丹尼斯.盖博于1948年发明的。用最简单的话来说,全息图像(hologram)就是把一个情境中所有可能的景象聚集在一个光调制模式下的单一平面上。随后,当光束通过这个平面、或被这个平面反射的时候,原先的景像会在空间中以光学方式重组,成为立体影像。100万倍的分辨率
在不断改进显示技术的精益求精的竞赛中,全息术一直是一匹实力难测、有可能后来居上的黑马。其中一个原因是全息术要求极高的分辨率。你的电视应该有480条可见的扫描线(也可以比这少得多),假如你的电视屏幕的高度是10英寸,那就是说你的电视机(在最佳状态下)每英寸有差不多50条扫描线。全息术需要的分辨率是每英寸5
条扫描线,即需要比你的电视机高出1000倍的水平扫描线。更糟的是,分辨率意味着在水平和垂直方向同时扫描,这样全息术所需要的分辨率就是今天电视的1000倍,也就是100万倍。你在信用卡甚至某些国家的钞票上能看到全息影像的原因之一,正是因为这种分辨率需要非常复杂、难以仿造的印刷技术。
本顿和他的同事们之所以在全息技术方面有所建树,是因为他们聪明地找出了人类的眼睛和感觉系统真正的需求,并把它与自然的全息图像所能制造的东西加以对照。既然人类的眼睛是影像的接收器,那么向它呈现大多它无法分辨的细节就是一种愚蠢的做法了。同样地,本顿注意到我们注视空间中正在形成的影像(从空间中取样)的方式,和我们注视电影中单个画面(以时间来取样)的方式如出一辙。慢动作的影像差不多是每秒30帧画面(60个扫描场)。由此,与其制造一个能够反映所有视点的全息图像,不如把它做成每英寸上有一个视点而省略掉中间的其他数据的影像。他成功了。
除此以外,本顿和他的同事们还注意到,我们的空间感在很大程度上是一种水平空间感。由于并列的双眼的视差,而且由于我们的视线总是沿着近平水平的方向移动,因此在我们对空间的感觉中,水平视差比垂直视差(上下的变化)重要得多,水平视差所捕捉的空间信号占了绝大多玖。假如我们的眼睛是一只叠在另一只的上面,或是我们经常在树上爬上爬下,情形或许不同。但事实却非如此。事实上,水平视差对视觉的影响太大了,本顿后来决定根本不去考虑垂直视差的问题。
因此,媒体实验室所展示的全息影像几乎都没有垂直视差。当我们向来访的人介绍本顿实验室外悬挂的一组全息样品时,他们根本没有注意到这些样品是没有垂直视差的。事实上,一旦我告诉他们这些图像没有垂直视差时,他们都会弯下腰来、再踞起脚尖反复地细看,最后才真的相信。
空间取样结合水平视差(完全忽略垂直视差)的结果是,在本顿小组的手中,与制造一个全分辨率的全息影像相比,如今只需要:%的电脑计算能力,就能得到这种新的影像。由于这个原因,他们制造出了全世界第一个全彩的、由有深浅明暗变化的形体所构成的实时全息影像。它自由地漂浮在空中,其大小和形状相当于一个茶杯或“矮胖”的莉亚公主。整体大于部分之和
显示的质量确实不单和视觉有关。它是一种典型地运用了其他感官体验的收视经验。各种感宫构成的整体的确大于部分之和。
在高清晰度电视刚刚萌芽的时候,当时在媒体实验室工作的社会科学家拉斯.纽曼进行了一个划时代的实验,测试观众对显示质量的反应。他安装了两套一模一样的高清晰度电视和录像机系统,放映一模一样的高质量录像带。不过,他在A组用的是录像机的普通音质和电视机的小扬声器,而在日组中,则使用了很棒的扬声器,可以播放出比CD还要好的音质。
结果令人吃惊。许多实验对象报告说日组的图像清晰得多。事实上,两组影像的品质完全一样。但B组的收视经验却好得多。我们倾向于把感官经验作为一个整体来加以判断,而不是根据各个部分的经验来加以判断。虚拟现实系统在设计上有时忽略了这个重要的观察结果。
在设计军事坦克训练器的时候,人们花了很多心血,来达到最高的显示质量(几乎不计任何代价),希望获得的效果是,当你注视显示器的时候,几乎就和从坦克的小窗口看出去一样。这个想法挺好,但在不断增加扫描线数目上进行了艰苦卓绝的努力之后,设计师才想到可以引入一种价格低廉、会稍稍震动的运动平“台。设计师又在此基础上增加了一些额外的感官效果——坦克的马达声和轧过地面的声音棗结果整体感觉十分逼真,设计师因此可以减少扫描线的数目,而不会影响整体视觉效果。无论如何,这个系统看起来和感觉起来很真实,已经超过了原来的要求。
经常有人间我,为什么我吃东西的时候要戴着眼镜,因为我显然不需要眼镜,也能看得见食物和刀叉。我的回答很简单,当我戴着眼镜的时候,食物显得更加美味可口。能够清楚地看见食物是饭菜质量的一部分。
“看”和“感觉”相得益彰。
4、看和感觉让电脑看得见
跟装了传感器(sensor)的现代盥洗室或户外泛光灯比起来,个人电脑对人的存在的感觉真是迟钝。便宜的自动对焦相机要比任何终端或计算系统都更清楚面前的景象,因而拥有比电脑更高的智能。
当你从电脑键盘上抬起手来的时候,键盘不知道你是因为思考而暂停、是自然的休息,还是跑出去吃午饭了。它分辨不出是在和你一个人讲话,还是它面前还站着另外6个人。它也不知道你究竟是穿着晚装或宴会装,还是一丝不挂。因为如此,所以当它正在屏幕上显示重要信息时,你可能正好背对着它;或是当它正在和你说话时,你可能正好走开,根本没听见。
我们今天的着眼点完全放在如何使电脑更容易为人使用上。也许现在是问这样一个问题的时候了:怎样才能使电脑更容易与人相处?打个比方,假如你不知道谈话对象究竟在不在场,你怎么和他们讨论事情呢?你看不见他们,不知道他们共有多少人。他们面带笑容吗?他们到底有没有集中注意力听你讲话呢?我们充满渴望地谈论人机互动和对话系统,然而我们却存心把参与对话的一方留在黑暗中。
现在是该让电脑看得见、也听得见的时候了。读你干遍也不厌倦
关于电脑视觉的研究和应用长期以来几乎完全是针对情景分析的。这种情景分析尤其用于军事上的目的,如无人驾驶车辆和智能炸弹。电脑在外层空间的应用也带动了科技的最新发展。假如你让一个机器人在月球上漫游,机器人只是把看到的影像传给地球上的操作人员还不够,因为即使用光速来传输,需要的时间仍然太长。假如机器人走到了悬崖边,等到人类操作员看到录像中出现悬崖,赶忙把口信传到月球上,叫机器人别再往前走时,机器人早就已经掉下去了。这只是情景分析的一个例子。在这种情况下,机器人必须根据它所看到的情景,自己下判断。
科学家不但越来越了解影像,并且已经开发出一些技术,比如说,能从明暗度推测形状,或把物体从背景中抽离出来。但是直到最近,科学家才开始审视电脑对人的识别能力,以改进人机界面。事实上,你的脸就是你的显示设备,电脑应该能够读取它。因此,它必须能辨认你的脸以及你独特的表情。
我们的表情和我们想要表达的内容息息相关。通电话的时候,我们不会因为电话线另一端的人看不到我们,就面无表情。事实上,有时候为了加强口语的分量和语气,我们会更多地调动脸部的肌肉,并伴有更夸张的手势。电脑可以通过感应我们的表情,接收到繁复而且并行的信号,因此令我们的口语和文字讯息都更加丰富。
使电脑能够辨认人的脸部和表情,这是一个令人生畏的技术挑战。尽管如此,在某些情况下,这一点还是完全可以实现的。在你和电脑一对一的情况下,电脑只需要知道操作电脑的人是不是你,确定坐在它面前的不是地球上任何其他人就够了。此外,把人从背景中分离出来也十分容易。
很可能在不久的将来,电脑就能看到你。1990年至1991年,海湾战争爆发之时,许多商务旅行都被禁止,因此电信会议大量增加。此后,越来越多的个人电脑都配置了价格低廉的电信会议设备。
电信会议的硬件包括一个架设在显示器上方中央的电视摄像头,以及能编码、解码和实时地把影像全部或部分地显示在电脑屏幕上的硬件和软件。个人电脑将会越来越充分地为影像通信做好充分准备,当初电信会议