Local EPUB Text
第16章 信息技术 从晶体管到神经元和蜘蛛软件
未知
第16章
信息技术
从晶体管到神经元和蜘蛛软件
如果你视力正常,那么你可以看到人的一根头发,它大约有50微米(50 000纳米)宽。这大约是人眼可以识别的最小尺寸(0.01毫米,即1微米)的5倍。我举个例子来说明。美国旧金山湾最宽处有20公里宽。再举一个例子,如果您站在丹麦首都哥本哈根眺望瑞典的海岸线,那么你能看到的最远距离大致有20公里。现在,让我们放大4亿倍。如果我们真的这么做了,那么一根头发看起来将会变成旧金山湾那么宽,或者有哥本哈根与瑞典之间的距离那么宽。在世界上,人类所能见到的最小物体将是直径只有上述距离的1/5(4公里)的一个点。
想象一根头发有20公里宽是非常奇怪的,但我仍想尝试一下,因为它将帮助我们认识一些非凡的东西。在此参照系中,1纳米将是0.4米,一个细菌细胞的直径可能约为10米。当我们与这个直径为10米的细菌保持一个安全距离时,可以看到一些与其他原子相连的氢原子。每个氢原子直径约为4厘米,看起来与较大的鹅卵石的尺寸差不多。一个电子的直径大约是1×10–14厘米,夸克的直径大约是4×10–15厘米,所以即使在这个荒谬的被放大的世界里,你也不可能什么都能看到。
在这个范围内,真正结构紧凑、体积小巧的电脑芯片会是什么样的呢?这里提供一个线索:1959年,理查德·费曼(1965年诺贝尔物理学奖得主)介绍了关于未来可能被压缩到芯片里的数据的数量级的观点。他说如果能够制造出一个计算机,其中1比特的物理表示只有100个氢原子那么大,即10纳米,那么在一个100 000纳米×100 000纳米的空间内,计算机芯片居然可以存储所有已经出版的图书的全文(截至作者写作时,大约是2 400万本书)。因此,在被我们放大的世界里,他所说的用“1”或“0”表示的1比特的大小大约有100个大的鹅卵石或者直径4米的点所占的空间那么大。
那么,再想想,在我们的参照系中电脑芯片会是什么样的呢?如果丹麦和瑞典之间的距离(20公里)对应头发的宽度(50 000纳米),那么费曼所说的整个芯片边长将达到40公里,或者是我在前面提到的旧金山湾宽度的两倍长。在现实世界中,它只有一根头发的两倍那么宽,简直是一个微不足道的颗粒。
因此,根据他的描述,毫不夸张地说,就是将2 400万本书浓缩进一颗尘埃之中。如果将所有这些书都印在纸上,那么这些纸的重量将达到80万吨。如果你把它们首尾相连排成一圈,其长度将达到英国伦敦与美国纽约之间的距离。当然,这只是费曼在1959年的一个假设。稍后,我们将发现他所说的是如此的现实。
为了做到费曼所描述的事情,你需要使用一种被称为晶体管的发明。事实上,你需要的正是天文数量级的微小的晶体管。
在我看来,晶体管是人类历史上最伟大的两项发明之一(另一项是一种特殊的轮子,我们称之为齿轮)。如果你戴着一个复杂的机械手表并上紧发条,那么里面将会有数量庞大得令人难以置信的或大或小的齿轮相互作用,在这个过程中,简单的机械能量转换成复杂的信息。它可能显示日期、时间、时区甚至月相等等。所有这些都来自简单的规则以及更简单的规则,这些简单的规则又通过所有这些齿轮的相对尺寸和连接来表示。分针齿轮转动60次,时针齿轮转动一次;时针齿轮转动24次,日期发生变化。类似这样循环往复。
现在,当你编写软件时,你也要遵守简单的规则。最常见的一个句式是“if ……then……else”(如果……,那么……,否则……)。为了对此进行解释,让我们假设你需要把汽车开到一个停车位上:
如果灯是绿色的,那么继续,否则停止。
晶体管就是能够表示这个简单规则的物理设备。它于1925年在加拿大获得专利,在此之前,任何试图制造计算机的尝试都是基于齿轮的,就像手表一样。有了晶体管,你就可以用我们两个最伟大发明的其中之一来替代另一个了。
令人惊讶的是,在人类发明出晶体管之后的22年里,没有人用它来做过任何有意义的事情。事实上,甚至没有人曾经听说过它。直到1947年,晶体管的第一个技术突破才出现,那就是贝尔实验室的工程师发现可以通过向锗晶体施加电流的方式来制造晶体管。如果没有电能,晶体是一个非常糟糕的导体,但是有了电能,电流可以很容易地通过。通过这种方式,锗可以成为控制设备里的电流的开关:
如果电源开启,那么它能导电,否则它不能。
晶体管最常见的应用之一是作为放大器使用。比如说,助听器里使用的就是晶体管,微型麦克风通过控制电流(或“基极”)来捕捉声音,然后用电池使更强的能量通过晶体管并驱动微型扬声器(见图16.1、图16.2)。
图16.1 晶体管原理图
注:操作的基本原理是电流通过设备,从“集电极”流向“发射极”,并被加在“基极”上的较小的控制电流控制。这个过程比轮子要复杂一些,但并不是复杂太多。实际上,具有球轴承的车轮的原理似乎比晶体管更复杂。
资料来源:马库斯·内贝林,光纤网络工程公司。
图16.2 作为放大器的晶体管
注:通过输入信号的小的变化来控制一个更强大的电流波动。
资料来源:马库斯·内贝林,光纤网络工程公司。
因为如果在其基极上施加电流(没有电流就不能导电)锗就可以导电,因此,锗被称为“半导体”,因为它“有时候是但不总是”导体。如果将多个晶体管连接在一起,你就会拥有一系列可以支持无数功能的开关。在某种程度上,这类似于手表,手表中许多齿轮相互作用、产生了较高的复杂性。但是,两者之间有一个巨大的区别。计算机芯片中的晶体管运行得非常快,每秒能够开启和关闭几十亿次。这个令人难以置信的速度能够产生的其中一个原因是电子信号移动得非常快(电子信号不是实际的电子,因为电子的移动速度相当慢,这里所说的是电场)。实际上,这些场以接近光速的速度移动,这相当于在一段时间内在地球赤道上运行了7.5次,而且这段时间不是1天、1小时或1分钟,而是1秒钟。
第一个晶体管的体积很大,不过没过多久,晶体管的体积就变小了。后来锗被硅和其他材料取代了,人们设想如果把它们和砷、磷、锑、硼、镓或铝等少量杂质一起处理(一种被称为“掺杂”的过程),这些材料像锗一样可以作为“半导体”,那么这将是一个好主意,因为与锗相比,硅的价格更便宜,而且硅也更容易处理。
于是人们产生了另一个想法:把晶体管制作得再小一点,这样就可以把许多晶体管放在只有指甲大小的芯片上。在那个创新想法提出并开始实际运行不久后,一些工程师开始计算,如果只是简单地将一切都缩小了——体积小、耗电少等等,那么它将如何运行。令他们吃惊的是,他们发现晶体管在一切都缩小之后还能运行得很好,而且它们的运行速度还可以比原先快得多。在相同的布局中,晶体管在单位面积上甚至不会产生更多的热量,并且由于低电容互连反而可以降低所需的功率。所以,工程师们开始将一切缩小,一旦他们开始把芯片做得更小,他们就会把它越做越小。
要生产这些芯片,你需要一个所谓的“晶圆”,它是由无缺陷的单晶硅组成的。用带有金刚石边缘的金属来切割这种干净的材料,可以获得一个完全光滑的表面。接下来还有一系列的程序,其中最重要的一个步骤是添加所谓的“光阻剂”。在这之后,你把一个模板放在晶圆上,它有一个类似于你想要的芯片内的电流流动和晶体管的格局。
举个例子,这在某种程度上类似于将一个模板放在物体表面上,然后在上面喷绘一个标志。不过,在芯片生产中,喷绘的材料既不是油漆,也不是喷雾,而是光。因此,你用一种带有复杂图案的光源在晶圆上喷绘(晶圆上面有光阻剂),然后产生化学反应。这些图案因此被烧蚀到晶圆表面,其余的光阻剂则会被冲洗掉,由此产生的产品就被称为集成电路。为了节省时间和金钱,我们可以同时生产许多电路。一个晶圆可以包含许多集成电路样式,在最终连接到外部接线和其他材料之前,你可以把它像“骰子”一样剪下来。最后,在出售之前,每个产品都需要完成测试,没有误差的那部分就是“产量”,其余的则是废料。
我之前提到过摩尔定律,该定律指出放置于芯片(或集成电路)上的廉价晶体管数量每一年半到两年就会增加一倍。显然,这个定律不能像牛顿定律一样永远成立。然而,戈登·摩尔在1965年的一篇论文中第一次描述到它时,将它追溯到1959年,可直到将近50年之后它仍然成立,这是相当神奇的。确实,这一观察结果非常吸引人,它实际上是一种自我实现——它成为这个行业的口头禅,既然你的竞争对手遵守了摩尔定律,那么你最好做得比他们更好。在20世纪70年代的某段时期,容量实际上是每12个月增加一倍。
工程师们是怎么坚持下去的呢?这种不懈的进步有很多驱动因素。例如,晶圆的尺寸增加了,芯片中的所有东西都变成了越来越小的规则的几何图形。与此同时,人们还尝试了不同的方法以便更好地利用空间。于是,出现了部分电路由几个不同的夹层叠加在一起而形成的情况,这就节省了平面面积,更好地利用了空间。到2000年,芯片中通常包含超过50种不同的化学元素,所有元素对于芯片速度及可靠性的改进都发挥着至关重要的作用。另一种用来提高越来越小的几何图形的生产能力的方法是使用波长越来越短的光线,因为波长较长的光线无法制造足够精细、精准的样式。这反过来又给创造新的光阻剂造成了巨大的挑战,因为这些光阻剂要适用于更短的波长。这是一项非常复杂的任务,在给定的波长投入生产之前,化学家们需要提前10年开始研究这个光阻剂项目。毕竟,光阻剂不仅对光的特定波长非常敏感,还必须提供高对比度和锐利的边缘。此外,它还需要能够黏附在晶圆上,以确保在清洗过程中不被冲洗掉。
挑战并没有就此结束。工程师们还需要研制比哈勃空间望远镜更为精确的光学仪器,并利用激光创造波长越来越短的光线。还有一个问题是要避免所谓的“隧道效应”,即当晶体管或导线彼此非常接近时,电子会在晶体管或导线之间自发地跳跃起来。为此,工程师们发明了隔离材料,可以应用在只有几个原子大小的空间里。
还有一个问题是关于时钟频率的。假设你想要做一系列的计算,于是发送电子信号,电场变化的速度大约为每秒30万公里,所以在一瞬间,一切都完成了。然后呢?接下来你要做下一系列的计算,这可能是建立在之前的计算结果上的。所以,你发送了新的脉冲信号。怎么做到的呢?你可以使用具有固定频率的晶体,就像当你的手划过一个水晶红酒杯潮湿的边缘时,它会发出声音一样。当计算机芯片启动时,晶体周围的电路就会产生随机的噪声,这将不可避免地包含晶体固有的振动频率,然后晶体就会随之开始振动,这些振动将放大晶体发出的电子信号。这些脉冲之间的时间间隔被称为“时钟频率”。第一台商业电脑——牵牛星8800(Altair 8800)使用英特尔8080处理器,其时钟频率达到了每秒200万转(2兆赫)。到1995年,其频率已经达到每秒1亿转。大约5年后,我们又突破了每秒10亿转的难关。2010年,一个芯片的标准是超过每秒30亿转(3千兆赫)。
要达到这个目标并不容易。每一个脉冲发生后,晶体管的连接都需要时间来适应新的状态。如果下一个脉冲在此之前到来,那么上一个脉冲信号就会被破坏。另外,如果晶体管运行过快,那么数据处理会产生更多的热量,这可能会破坏集成电路。发热是一个很严重的问题,这也是摩尔定律遭受到挑战的关键领域之一,因为芯片设计者无法做到让这些更快的芯片适应当前的热负荷,因此,它们需要通过多核来解决热负荷问题。
只要摩尔定律发挥作用,就意味着不管你什么时候读到这儿,在接下来的两年里,计算机容量的增长量都将会和世界上第一台计算机诞生以来的整体增长量一样多。
摩尔定律的作用可以持续多久?专家们不知道,因为他们只能将当时的想法延伸到未来。不过,在2010年,大多数专家说他们可以清楚地看到2020年,甚至2025年。在那之后摩尔定律还能发挥作用吗?他们一般会说,也许可以,也许不行。“我们都不知道在那之前还会出现哪些未知的发明。”科学家们这样说。
不过,有一件事情我们确实是知道的:如果集成电路的逻辑门小于5纳米,电子可以跳过,即使“门”是关着的(这个最小距离是费曼在1959年的文章中设定的最小距离的一半)。因为我们发现1纳米相当于氢原子直径的10倍,而大约50个氢原子的距离是芯片中的电子不能自发地或无意地征服的最小单位。因此,这就是我们现在使用的计算机芯片的概念。
再次想象一下,我们此刻在我之前描述的被疯狂放大的世界里,在那里一根头发足有20公里宽。现在是2020年,我们正在研究一个电脑芯片(见图16.3、图16.4),这里面可能有150亿~200亿个晶体管,并且其中最小的“门”只有5个氢原子那么宽。芯片里包含625个核心,时钟频率是73千兆赫,这意味着每秒钟发送730亿次电磁脉冲,并以每秒120万亿公里的速度穿过迷宫般相互连接的晶体管(当尺度被放大时,速度也被放大了)。这大概就是目前我们接受的集成电路的概念。
不过,已经有强烈的迹象表明,在2020年我们达到最终的芯片压缩水平之后将会发生什么。我可以想象,三维设计可以让摩尔定律在2020年之后再延续使用10年或20年,这也许就来到了2030年和2040年。
图16.3 IBM三维水冷芯片原型
注:这张图片展示的是一个组装前单层、三维的冷却原型的完整视图。其中,主动冷却领域位于原型中心的结构区域,其边长为1厘米,高为100微米,并且包含10万个垂直互连。
资料来源:瑞士苏黎世IBM研究所。摄影:夏洛特·博利格尔。
图16.4 IBM三维水冷芯片原理图
注:该图显示了夹层间的水冷技术,在此技术中,冷却结构直接集成到芯片堆中。IBM研究人员与弗劳恩霍夫研究所合作,研发了一种特殊的组装技术,通过使用这一技术,这些夹层可以通过一种高精度并且可靠的方式连接,使水流通过嵌在冷却容器中的三维堆栈。使水流(约20摄氏度)从其中一侧注入,并流经堆栈中各个电路层,最终从另一侧流出。
资料来源:瑞士苏黎世IBM研究所。
我之前曾提过,轮子是世界上最伟大的两项发明之一。你如果有一辆汽车和一辆自行车,就拥有6个轮子,但在现代的抽屉里、办公椅上和其他许多地方也有一些小轮子。如果我们把自己拥有的轮子都加起来,那么大概有至少几百个甚至上千个。它们都要被嵌入你的汽车、自行车,以及手表、机械引擎。
接下来我们来看看晶体管。曾经有人预计,2010年晶体管的产量会达到1×1019个。事实上,截至2010年,在如此之高的晶体管年产量之下,如果我们把它们均匀地分配,世界上的每个人都将得到大约14亿个晶体管。换句话说,如果你家里有4个人,那么你们将获得56亿个晶体管。如果你是一位极客,那么你这一年的晶体管的个人配额可能会接近1 000亿。人类生产晶体管的规模要远远大于其他元件的生产规模,并且每18~24个月晶体管的产量将翻一倍。
到2020年,一台标准计算机的功率将是2010年的30倍,如果摩尔定律在2030年还成立,那么它的能量将增强1 000倍左右。但是晶体管的产量会增长得更快,因为每个芯片含有的晶体管数量在增长,每个家庭和工厂拥有的芯片也在增长。
不过,当你买电脑或者智能手机的时候,显然你想要的不是晶体管,而是通过它来进行数据处理或者做其他事情。数据处理能力通常是在所谓的“MIPS”(每秒处理百万次机器语言指令)中计算。在1972年,IBM研发了“系统/370型号158–3”,它的容量为1 MIPS,人们已经目瞪口呆。每秒100万条指令!100万!随后IBM还表态绝不会止步于此。
因此,许多人开始问自己,如果你拥有一个或几个MIPS的容量,你可以做些什么呢?美国机器人专家汉斯·莫拉维克通过一个容量与人类大脑容量相当的机器人能做什么来做解释,这就很容易理解了:例如,一个MIPS就足以让机器人指出或者遵循一些非常简单的事情。这就是1972年一台IBM大型机的容量。
现在让我们乘以10。10 MIPS的容量相当于查找或者追踪类似激光制导炸弹一样的灰色调目标。1987年,摩托罗拉公司发布了拥有这种能力的芯片。第一次海湾战争期间(1990—1991年),我们见证了激光制导炸弹的精准度。
接下来设想,如果拥有100 MIPS的能力,汽车就可以慢慢地在自然地形中找到路。举个例子,这就可以通过1996年推出的英特尔奔腾Pro处理器来完成。这之后的4年,容量达到了1 000 MIPS,这足以引导多功能移动机器人穿越陌生的环境。
如果我们在100 MIPS的基础上乘以100(10 000 MIPS)的情况下,视觉就变成了三维的,机器人可以找到并抓住目标。事实上,在2005年我们就已经完成了这一步。2008年,英特尔推出的酷睿i7至尊版965EE处理器,其容量达到了76 000 MIPS。现在,所有人都关注的目标是100 000 000 MIPS,因为这正是目前所认定的人类脑容量的大小。
目前我们看到的并预期继续保持的增长速度促使新应用的创新以惊人的速度发展着。我来举个例子:我们试着将一台最新款的手机拿在手上,好好看一看,会觉得这简直太棒了,但在2000年IT泡沫破灭时,这样的事情是完全不可能发生的。然而,在今天,数以百万计的类似设备出现在日常生活中,人们早已司空见惯。
计算机性能的提高不仅体现在MIPS上,还体现在内存、数据储存、带宽以及便携式设备的电池寿命上。2009年春,贝尔实验室宣布了一项关于光纤传输速度的新的世界纪录。在一根7 000公里长的光纤上同时传输155种波长的光,其速度达到了每公里每秒10万兆比特,相当于每秒钟15.5万亿比特的有效载荷。这个速度足以同时承载10 430个未压缩的高清视频信号。
如果所有这些技术继续呈指数级增长,那么在未来的10年里,将会有新的、令人难以置信的IT产品以数亿美元的价格被销售,这是你现在几乎无法想象的。这些IT产品也许是一个藏有大量电影的小小的设备。
实际上,这些设想的场景里已经有一些技术在研发中了。美国加利福尼亚大学的科学家已经展示了如何在一个硬币大小的设备里存储相当于250张DVD的容量的数据,斯威本科技大学的微光子中心开发了一种新的“5D”技术,该技术使用一种彩色滤光片和偏光将两个维度的数据表现添加到DVD中,一个DVD的容量将达到正常容量的2 000倍。这样看来,所有值得看的电影就都可以涵盖在内了。让我们想象一下,我们如果拥有这一容量,就可以存储2 500部电影(从需要很少数据的经典电影到需要消耗更多数据的高清电影。)如果你是一个狂热的电影爱好者,并且你时不时地外出度假,那么你每年大概也就能看250部左右电影。所以,一个磁盘中的电影就够你看10年,而且当你都看完了以后,还可以再来一次。
一些新的IT解决方案和庞大的计算能力无关,反而和小传感器的效率有关。未来将有三种确认物体位置的主要方法:无线射频识别、全球定位系统和移动电话。当我写这一章的时候,我刚从外面滑雪回来。每次我靠近滑雪缆车的时候,这些小的传感器都会自动让我通过而无须出示票券。在最大的电梯里,它甚至会向操控人员展示我的一张人脸照片。这可能是因为我放在口袋里的信用卡大小的电梯季度卡上已经粘了一个小小的RFID(射频识别)标签。这是一种非常小又非常便宜的芯片,它包含一个晶粒大小的集成电路,为平面印制的金属天线所环绕。所有的信息都黏附在我这张塑料卡上,基本不会被注意到。
未来十大IT工具
(1)透明的智能手机。通过手机的透明屏幕你可以了解真实的世界,将你面前的世界描述出来并且概念化。
(2)电子纸。一种可以下载和显示任何媒体的柔软的、可弯曲的电子阅读器。
(3)家庭影院服务器。一个可包含数千部带有搜索功能和注释的电影的小型服务器。
(4)媒体墙。整面墙就像一个单色发光表面或者镜子,但是当你用手指触碰到它的时候它就会变成媒体屏幕。
(5)宽屏电脑显示器。一个有着几米宽的单一的平面屏幕,不工作时,它的部分屏幕甚至会变成透明的。
(6)汽车娱乐系统。后排座位和乘客座位上设有包含电影、电视、互联网的在线娱乐系统。
(7)无线监控。小的设备可以监控你所拥有的一切,让你在任何地方都能看到它。
(8)组成运算。这项技术能够轻松地将内容从任何智能设备投射到你身边的任何屏幕上(例如,从智能手机到媒体墙)。
(9)自动的房屋清洁器。当你不在的时候,它能自动清洁地板表面,并且清洁器自己就能在墙上的插座上充电。
(10)防盗窃物品。一旦报告物品被盗,它就会把自己的地理位置传送给警方,然后警方就可以追踪它了。如果汽车被偷,那么警察可以远程停车,如果盗窃者已经被截停,那么这个工具可以将他们锁在车里。
射频识别是如何发挥作用的呢?当我靠近电梯门的时候,有一个能向我发射无线电信号的传感器。这个信号在我的射频识别天线上产生一个电磁场,而来自这个电磁场的能量能使集成电路发回一个返回信号。这个返回信号包括我的个人订阅代码,在电梯门打开之前它就能被电梯系统的电脑所识别,所以我可以顺利进入电梯而不用等待。除此之外,电脑还会储存一张我的照片,这样电梯警卫就可以确认我的卡没有被偷(除非我因为戴着墨镜、头盔并有着一个蓝色鼻子而不可能被认出来)。射频识别技术和条形码技术一样,正如我滑雪的例子所显示的那样,你不需要把卡片放在扫描仪上,只要靠近就行了。现在,有射频识别功能的卡片越来越便宜,而且它们已经被制作得如此之小,你甚至可以把它们粘在活的蚂蚁身上。(事实上,一些想了解蚂蚁运动模式的科学家已经这样做了。我没有骗你。)如今,射频识别技术正被用在无数的消费品上,包括集装箱、包裹、停车罚单,甚至还被塞在猪和牛的耳朵里。它们也被用于收费公路(具有有效射频识别的汽车可以通过,其他的不可以)以及博物馆中的展品上等等。
未来,几乎每一种产品都将应用射频识别技术。之所以可这样断定,具体原因有以下几个。其一,它能让你在超市里装载货物,然后不用等待,自然通过出口。射频识别可以在自动阅读器上显示,你只需点击“购物清单”上的“接受”,便可在屏幕上弹出账单。通过这种方式,如果你不用手机,它就会给你的射频识别设备的付款卡发送账单。我们将看到射频识别爆炸式增长的另一个原因是,它们不仅可以识别产品,还可能触发其故事的发布。把你的智能手机对着它,你就可以阅读,看到或听到供应商在屏幕上告诉你的所有东西,这个屏幕足够大,人们可以阅读(记住:有很多老年人无法阅读包装上的小字体)。也许还包括其他人对同一产品的评价,就像共识评级那样。不难想象,射频识别、企业产品说明和评级的组合自然将会产生很大的影响。从这个角度来说,评级将是一切:企业道德和可持续性、度假胜地、餐馆、汽车、人以及这本书都可以被评级。评级已经走得很远了。如果你想要一个公司的透明度和道德评级,请查阅ISO 2600标准。酒呢?请查阅帕克购酒指南(和其他许多东西)。书呢?试试亚马逊网站。投资机会呢?问问银行。度假胜地呢?请访问tripadvisor.com网站。射频识别的第三个杀手级应用是洗涤说明。未来卫生间里的机器人不会把你的白衬衫和黑袜子一起洗,原因是它会检查射频识别标签,并识别哪些东西不能混合在一起。
第二个定位技术是GPS,也就是全球定位系统。这是基于环绕地球轨道的一组卫星来实现的,每个卫星都发射时间信号。全球定位系统接收机从这些卫星中读取信号,并利用这些组合来定位自己,其准确度通常可以达到5米之内(如果天气不好的话,其精确度可能稍低)。这些卫星虽然播送信号,但并不会从人们置于小船、私人汽车或者智能手机等地方的海量的GPS接收机中收到任何反馈。所以,就像你有时听到的一样,这些类型的卫星无法追踪“人们”,但是如果一个GPS接收器连接到一个发射器上(如嵌入在手机上),那么这个发射器就很有可能会发送它所在位置的坐标。
事实上,一旦你打开手机,你就向网络暴露了你的大致位置,因为GPS可以通过各种手机天线读取你的信号强度,这也使得手机成为第三个关键的定位技术。如果GPS只用一根天线来读取你的位置,所获得的信息是相对模糊的,但如果用三根天线同时读取,那么它们可以进行三维定位,精确地定位你的位置,所以这项技术经常被用来抓捕罪犯和恐怖分子。还有另一个非常实用的功能:显示哪里有交通堵塞。因为大多数人在开车时都开着手机,这就很容易在主要道路上(比如在高速公路)追踪统计汽车的数量以及车辆的行驶速度。通过这些信息,不仅可以即时发现哪里有交通堵塞,还可以预测堵塞发生的时间和地点。这些信息还可以通过无线电广播反馈给司机,汽车中的全球定位系统进而可以自动提醒司机并且重新规划路线。
将射频识别、全球定位系统和移动电话三者结合,创新的可能性将不可估量,由此衍生的商机也是如此。只要在你的智能手机上输入“出租车”,出租车就会收到你的坐标并且找到你,你觉得这怎么样?如果出租车是机器人的话,那就更厉害了。或者,当物品(比如你昂贵的相机)从它的原来位置被移走的时候,这种创新结合会通知其主人或者警察。或者,当你偏离了预期的路线的时候,它会通知你。你只要输入它们被授权的最远移动距离,或者显示所有授权的路线就可以。事实上,你的孩子可以携带一个追踪器,在到达学校、网球俱乐部或者任何其他地方时,追踪器都会给你发送消息。甚至还有带全球定位系统的割草机;汽车收音机会告诉你在你即将到达的地方将会发生的事情;即将过期的食品也会发出警告(只要把你的智能手机放在冰箱里,它就会列出一张你需要立刻食用的东西的清单。)
信息技术的基础创新也将持续改变电子媒体。人们希望无论何时都能够在移动设备上获得即时的通知和娱乐。也许会有两种这样的移动产品:智能手机和平板电脑/电子阅读器。前者适合被放在口袋里并且有两种模式(透明屏幕和普通屏幕),后者也有两个模式(一种带有适合室内使用的背光灯,另一种带有适合室外阅读的液晶电子阅读器界面)。另一种改变将是在线游戏的受欢迎程度不断增长,尤其是大型多玩家的在线游戏,数百万人可以同时在线与对手比赛或者与现实世界中的实时挑战者进行对抗,比如一场赛车的直播。当现实中开始拥有像高清电影一样质量的画面后,这样的游戏就会成为电影的无缝延伸。当你看完一部冒险电影时,你可以回到你最喜欢的现实场景并且开始亲身体验。也许这些可以被称为“电影游戏”。
此外,电视上的新闻和辩论可能会演变成视频会议,成千上万的此类节目将从大型电视节目中获取市场份额。举个例子,在一个有着20 000个付费用户的电视节目中,用户可以身临其境地“出现在那里”并且在提问环节亲身参与,这就像在其他视频会议中一样。这样看来,“电视会议”可能是个好词。
从某种意义上来说,3D芯片是多核芯片最有效的形式,这种芯片还可以再次被连接到多个3D芯片上,从而创造更多的能量,但这也不会是最终的范例,因为人类的创新能力是不可想象的。例如,你可以用光代替或者补充电流,将敏感的、超高性能的容错芯片和更安全的传统芯片结合在一起。也许最终的解决方案将是把用硅制成的快速、精确的容错芯片与其他用光学和纳米管制成的芯片结合,虽然这些芯片可能有较大的误码风险,但它也具有无法比拟的巨大的并行计算能力。
还有研究人员用DNA来执行一些计算机的功能。DNA是一种非常紧凑的储存信息的方法,因为它用32个原子来代表一些数据。这比我们今天的芯片架构所能做的显然要少许多数量级,即使它已经达到了终极形态。我们利用DNA的一个例子是计算出中国香港的景岭路和大涌桥路之间的最短路线,方法如下:
• 我们为该地区的每个路段都制作一条DNA链,并给它们设定可识别的碱基序列,再加上与这些路段成比例的长度。
• 我们现在用细菌来繁殖成千上万份这些序列的副本,然后把序列和用细菌繁殖出的序列副本混合在一起,最终会发现形成了很多不同长度的“线路”。
• 我们对结果进行筛选,把这些线路分开,每个线路的两端都分别代表景岭路和大涌桥路。
• 接着,利用凝胶电泳,我们找到最短的线路,然后识别它的序列。这就是我们要找的最短线路。
事实上,许多汽车里的全球定位系统都可以在几秒内完成同样的事情,这就告诉我们,用DNA来执行计算机的一些功能,要么还处于起步初期,要么可能没有我们想象的那么大的潜力。
最终的解决方案可能来自所谓的量子计算,它应用了一些在核物理中发现的深奥原理,其中一个粒子可能同时处于不同的状态和位置,并且与另一个遥远的粒子对称地连接在一起。在这里代表比特的粒子是电子,它们当然要比原子小得多,而且几乎比我们在硅基计算机中可能表示的最小量还要小得多。在量子计算中,一个单独的电子可以表示4种不同的情况,因为一个电子可以用4种不同的方式旋转。
你可以将量子计算机与拥有当今最好的主机的计算机进行比较,不过这就好比将一艘集装箱船与一只橡皮艇比较,或者将一艘宇宙飞船与一个纸飞机进行比较。事实上,如果我们把所有星系中的所有原子都放进一台拥有当今最先进技术的天文计算机中,然后要求这台计算机完成一项需要数十亿年的计算才能完成的任务,一台小型量子计算机瞬间就可以完成同样的任务。这就是量子计算机与最好的计算机之间的差别。然而,需要补充的是,量子计算机并非在解决所有类型的问题方面都具有这样的优势。它们表现最好的地方是一些涉及随机猜测的特殊查询问题。
这台小型量子计算机是什么样的呢?首先,一些从事量子计算的人认为最简单的出发点是使用大量的液体进行计算。他们中有些人还提出特别建议——将这种小型电脑安装在一杯咖啡里。据我们所知,在1998年确实有三个人制造了量子计算机。他们是来自洛斯阿拉莫斯国家实验室的艾萨克·庄、来自麻省理工学院的尼尔·格申斐尔德以及来自加州大学的马克·库比内茨。我们还知道他们用这个计算机做了哪些计算。它把1+1进行运算然后得到了正确的结果。后来,在2009年,研究人员成功地在固体物质上制造了一台量子计算机。
从理论上讲,这样一台计算机的数据处理能力要比当时所有人类和计算机的数据处理能力总和要高得多。然而,它将对宇宙射线极其敏感——这些微小的粒子以接近光速的速度从外太空到达地球。平均每秒钟就有两颗粒子从地球上任何一个人的头部穿过,这看似没有什么伤害,但通常会造成一些基因损坏。既然有这样的粒子通过,那么量子计算机芯片可以轻而易举地将电子从空间里(实际上是从计算机里)敲出来,因此它的表象就会有一点儿乱,我们有必要将量子计算机与周围环境隔离开来,同时还能找到与之通信的方法。例如,有人可能会把它放在一个专门的房间里,四面都围上8米长的铅板,但也会留一些通道。又或者,机器可以更多地直接暴露在宇宙射线之下,但是每个运算多次运行,然后将那些偏离主流的结果剔除出去。
你有没有想过蚂蚁的大脑有多大?我这么问的原因是蚂蚁有一个非常成功的高度组织化的社会,这使得蚂蚁的总生物量或多或少地等于人类总生物量。这些小昆虫成功地筑巢,采集食物,在复杂的环境中四处漫游,战斗,繁殖,等等。但是,蚂蚁的头部太小了,人们几乎看不见它。与它们相比,人类的大脑是巨大的。尽管如此,许多人还是把生活搞得一团糟,因为他们的“软件”出了问题。这表明,如果我们的大脑只有庞大的硬件,那么这样并不能保证成功,只有当硬件配备了优秀的程序时才会成功。这让我想到了一个问题:我们如何为一台硬件比我们强大得多的计算机编写软件呢?因为在相当短的时间内,最大的计算机将在性能上超越人脑,因此这确实值得思考。你如何对超过你的智能发出指令呢?
当然,这取决于计算机的用途。如果人们希望用它来生成对数表和计算质数,那我们可以使用50年前就已经拥有的计算机和软件。然而,对于一些更复杂和直接的任务,程序员已经开发了所谓的“人工智能”,即“AI”。
发明家兼科学家阿斯特罗·泰勒将人工智能描述为“尝试让计算机做它们在电影里做的事情”。虽然科学家和工程师已经在人工智能领域进行了30~40年的研究,但遗憾的是,在多数情况下,这种研究不过是一种令人沮丧和失望的经历。然而,在过去的10~15年里,我们取得了一些突破,主要是因为投资银行和对冲基金在系统的开发上投入了大量资金,而这些系统能够识别经济和金融市场的模式,我们希望能借此赚钱。然而,这些科学家和工程师们并不是唯一取得了成功的人。所有这些研发的人工智能系统中最有趣的一个是“TD–Gammon”,一款可以玩西洋双陆棋的软件。在比赛中,游戏给出的唯一信息是:规则、棋子的位置、获胜者的名字。显然,刚开始的时候它像个十足的傻瓜。但后来情况好转了,一段时间后,它学会了如何成为一个非常优秀的西洋双陆棋手。
还有一些其他的智能程序做着与人工智能类似的事情。例如,美国哥伦比亚大学自然语言处理小组与密特拉公司合作研发的程序bio–Gen,可以从海量的资料中读取新闻,然后生成一个每日新闻报道,这个报道看起来就像记者写的一样。
在这类可能不太有用的人工智能类别中,我们发现了像Brutus这样的程序,它所写的短篇故事,看起来好像是由一个专业的作家创作出来的。类似的程序还有百代唱片公司(EMI)作曲程序。给它听完某个作曲家的一段音乐后,这个程序就可以创作出听起来像是出自同一个作曲家之手的新曲。美国的认知科学教授道格拉斯·霍夫斯塔特对百代唱片公司的工作方式感到十分惊讶,于是他邀请了来自美国一所著名音乐学院的几位老师,并请他们分别听了一段肖邦的相对没有名气的作品以及百代唱片公司作曲程序受肖邦启发创作的新曲。然后道格拉斯问老师们能否在这两者之间辨认出真正的肖邦作品,大部分的老师都指向由百代唱片公司创作的那个曲子。在这里,软件居然打败了艺术家!
其他的程序可以创作艺术画、辨认笔迹、分析指纹、发现机场里精神紧张的人等等。翻译程序也是一个主要的应用,但实际上做到准确是非常困难的。搜索引擎阿尔塔维斯塔公司(Alta Vista)有一个自动翻译程序。如果你输入:“心有余而力不足”(“The spirit is willing,but the flesh is weak”),把它翻译成西班牙语,再把西班牙语翻译成英语,结果就是“酒精准备好了,但是肉很弱”(The alcohol is arranged,but the meat is weak)。翻译不是仅知道字体表面含义就可以了,它也是一个关于语义、语境、风格和幽默感的问题(我应该说,谷歌现在可以完美地处理上面提到的那句话的交叉翻译问题了。刚刚验证过了。)
还有各种各样的类似人类的程序。例如,科学家开发了一种软件,在这里我们可以寻找数学世界中有趣的理论和现象,并建立模型来解释这些现象。我最喜欢的程序是伊莉莎(ELIZA),它是为了好玩而制作的模拟心理学家提问技巧的程序。举个例子,如果你说“我的岳母不喜欢我”,它会这样回答:“为什么你认为你的岳母不喜欢你?”令人惊讶的是,那些与程序交换信息的人相信这些程序背后是一个活生生的人,并且感谢它的帮助。
一个周日的早上,当美国一家公司的副总裁坐在麻省理工学院的一个房间里使用电脑的时候,一个特别有趣的情况发生了。他在电传打字机上发现了一张纸条,上面写着:“把所有的信息输入电传打字机,并以句号结尾。”在开始之前,他想给一位叫博布罗的员工写信,以确认键盘是完好的。副总裁并不知道他要用的键盘不是用来和博布罗沟通的,而是用来和伊莉莎沟通的。于是就产生了下面的对话:
副总裁:你认为我今天早上能用电脑吗?
伊莉莎:你为什么这么问?
副总裁:我或许可以多做一些电信销售。
伊莉莎:你为什么那么不肯定?
副总裁:我的潜在客户从来没见过系统的演示。
伊莉莎:这对你来说很重要吗?
副总裁:当然。
伊莉莎:你似乎对此非常乐观。
副总裁:这真的有点儿滑稽。
伊莉莎:你的意思是,这很可笑吗?
副总裁:有什么理由让我现在不能使用电脑呢?
伊莉莎:告诉我更多关于你潜在客户的情况。
副总裁:请拨打我的电话号码491–1850
你可能注意到了,副总裁在最后一个句子后面忘记加上句号了,所以伊莉莎没有回答他。可他现在在等博布罗打电话给他,显然这没有发生,因为事实上博布罗在睡觉。这激怒了副总裁,他认为博布罗是在跟他开玩笑,他把博布罗从熟睡中叫醒,并问道:“你为什么这么讨厌我?”博布罗回答:“你说我为什么这么讨厌你是什么意思?”当他们两个人都知道真相的时候,两个人都笑了。
我在这本书的前面提到过,全世界大约出版了8万份大众期刊、4万份学术期刊、4万份新闻通讯以及25 000份报纸。这些信息堆积如山,却没有人能记录下来。这就是所谓的“数据挖掘”可以大有可为的地方。传统矿商寻找大宗商品,而数据矿商寻找的是信息。
构思这本书可能是解释这个问题的一个很好的方法。为了写作本书,我花了大约2个月时间用于读书,外加5个月的时间用于写作、编辑以及寻找复制许可等等,前前后后总共忙了7个月,或者说28个星期。我以前曾说过,在这一过程中,我的工作效率大约是1985年的10倍(这意味着早期的书内容范围更狭窄)。现在的问题是在接下来的25年里通过信息技术是否可以将生产力再提高10倍?
我可以想象这实际上是可以做到的。假设我们有一款软件程序叫速写者(SpeedWriter),它可以不断地扫描网页和电子书,就像现在一些搜索引擎所做的那样。不过,速写者的不同之处在于它可以理解扫描的事物,而不是机械地完成搜索指令。例如,它可以扫描所有关于食用红肉对健康的影响的研究,然后进行一个元研究,在所有这些研究的基础上得出一个全面的结论,而这个结论可能包括数以千计的独立研究。
好,假设现在是2035年。为了写这本书,我让速写者列出一个在增长理论中被引用最多的作家的名单。几秒钟之后,它列出一个单子,提供了该领域25位主要作家的名单,并且按照相关性进行了排序。速写者这个软件通过检查知名作家引用其他增长理论作家的频率来发现这些名单(“知名”是由他们在主要的科学出版物上发表的文章数量以及被其他作家引用的次数等指标综合决定的)。
下一步我请速写者直观地向我展示一下这些作家生活的年代以及他们每个人发表的最重要的作品的时间。速写者在一张图表中向我展示了这些信息。我要求它把作家按思想流派进行分类,它也做到了。我思考了一会儿,然后我输入:
• 写150页关于经济增长理论的书
• 一级结构:时间顺序;二级结构:思想派别
• 风格:学术类
• 20~40幅技术说明图片,5~10幅作者照片
• 弗里士–金凯阅读难度系数:25~30
• 完整资料来源的在线链接。
电脑在几分钟后就完成了原稿,我大致浏览了一下。我意识到它实在是太枯燥无味了,所以我让速写者找到所有至少包含了两个引用作者的奇闻轶事并且把这些故事放在时间线的适当位置上。此外,我要求它把风格改为“科普”,把阅读难度系数改成“50”。结果很快就出来了,而且情况好多了。我再输入“添加10~15个摘要框”,它也做到了。
“接近尾声了,”我想,不过我忽然有一个想法。我输入:“创建5~10个不同的30~300秒的关于作者的电影,解释他们最重要的贡献,包括同一时间活跃在该领域的两位作者争辩同一个观点。”
计算机找到了一些作者的照片并绘制出与他们相似的动画角色,以用于电影片段。“好了,我们差不多完成了,”我想。现在我需要的是一些互动,所以我又写道:“添加多选项的考试和辅导。”它照做了。我把结果上传到我的电子阅读器上,然后开始在花园里研究它。时间才过了一个小时,我就有了一个完整的互动多媒体书籍草稿。但是我已经为这项任务预留了三个星期,所以我将用这些时间来润饰草稿。这看起来毫不费力。
数据挖掘系统可以用于完成无数任务。它可以检查一个人是否知道哪些人曾参与犯罪活动,甚至这些人中是否有人知道谁曾经参与过。事实上,数据挖掘甚至可以自动根据伦理、社交网络、学术成就和许多其他变量自动对人们进行评价和简要描述。评级的整个概念本身也会因此发展。因为人们已经开始在网上对消费产品、餐馆、书籍等进行评级,未来的世界可能是几乎所有东西都要被用户/电子专家系统评价,在那里,即使是评级者,它本身也要被评价。
数据挖掘系统可以显示交通堵塞(通过读取智能手机的位置)并将此用于汽车的建议路线规划。它可以通过扫描博客以及其他更多的应用来发现人们对什么感兴趣。显然,也可以用这种技术来创建一个日报,并且为任何给定的服务对象量身定制一个完全符合其兴趣的周末娱乐计划。
除了人工智能,软件还有许多其他方法帮助我们了解周围的环境。其中一个叫“专家系统”的软件就是建立在收集人类专家如何做决策的知识的基础上的。其中一个例子是MYCIN——一个运行良好的疾病诊断程序,它以大量医生的手动输入为基础而运行。另一个智能软件是“神经网络”,它的目的是模拟大脑的运作方式。
然而,大脑实际上并不能像任何人类已经制造出来的软件一样可以远程工作。因为人类大脑大约有150 000~175 000千米的神经纤维缠绕在可以想象的最复杂的毛球上,并且每秒有数十亿的电子脉冲通过(记住,大脑每秒可以做100万亿次指令)。另外,它的形状也不是固定的。神经网络一直在改变形状并且在形成或脱离互联状态。所有这一切运动都是如此强烈,它占据了人体消耗的总能量的20%左右,尽管大脑只占成年人体重的百分之几,而且没有明显的移动。
考虑到这一复杂情况——人类很难搞清楚自己的大脑中究竟发生了什么,也就不足为奇了。此外,没有人能察觉到自己思考的机制,因为如果他能做到,那就会不断地分散他的注意力。总之,我们最近学到了很多关于人类大脑的知识。我们当然知道人类的智慧——它使得我们比动物聪明得多——主要分布在所谓的新皮质。这种新皮质由位于大脑外缘的6层结构构成,它只有2~4毫米厚,但由于我们的大脑中充满了褶皱和凹槽,实际上它有一个非常大的表皮——大约2/3的表皮隐藏在褶皱中,所以看起来没有那么大,总表皮测量时要像测量一张展开的餐巾那样。事实上,我们的大脑有这些奇怪的褶皱是为了增加表皮面积,这样大脑皮质就可能发展到现在这样大了。
这个餐巾一样的大脑表层里面大概有300亿个神经元,非常多。我可以用下面这个1厘米×1厘米的点来解释它:
如果那个点是我们从新大脑皮质中切下来的一块,那么我们就会发现这个点中大约有1 000万个神经元相互缠绕在一起。
然而,复杂性还远不于此。当我们从上往下看的时候,新皮质靠上的三个水平层主要接收来自下面的神经脉冲,特别是来自第四层的脉冲。你想象一下,如果视觉神经的脉冲从上面进入第四层,这些脉冲将在第三层、第二层和第一层依次产生大量的衍生信号。如果你用显微镜看,你会看到第一层的神经纤维主要依附在新皮质的表面,而所有更深的层则是从内向外或从外向内延伸的。
如果你仔细观察每一个神经元,你会发现它看起来既不像一根毛线又不像一根金属线,它更像一丛灌木。它们都通过一些分支(轴突)连接到其他的神经元上。事实上,平均每个神经元都连接着多达5 000甚至10 000个其他神经元。那么,让我们再次回顾一下我们1平方厘米的大脑表层,思考一下它包含了多少个神经连接。答案是,鉴于它有1 000万个神经元,那么在这个区域内大约有500亿~1 000亿个神经连接。
没有人能和这个量级的数字联系起来,所以这里有另一种观察它的方式。我们从新皮质中取出一块和句号同样大小的部分:
我希望你能看见我放在垂直箭头下的句号。直径相当于句号直径的圆柱形新皮层大约包含了1.4亿~2.8亿个神经连接。顺便说一下,蚂蚁的大脑包含了大约25万个细胞,可能有12.5亿~25亿个神经连接,所以其数量大概是我上面提到的句号的10倍。
如果这样的数字仍然难以理解,那么我们继续看一下肉眼所能看到的最小的物体,也就是0.01毫米——一根头发宽度的1/5。这样大小的人类新皮质的切片大概包含4万~8万个神经连接。没错,我们的大脑就是如此的紧密,这也解释了为什么昆虫的大脑那么小,而昆虫仍然可以在它们的环境中高速飞行。
顺便说一下,大脑是如此紧密,我们怎么能认为一个计算机芯片或一小部分的计算机芯片可以与之匹配呢?整个大脑新皮质看起来有150万亿~300万亿个神经连接。如果2020年的计算机芯片有150亿~200亿个,那么大脑新皮质包含的神经连接数量是远远超过芯片的,因为芯片比人类大脑小多了(毕竟大脑是一个3.5千克的3D芯片)。不过,计算机中的晶体管依赖于半导体的速度和电磁场的速度,而大脑中的神经细胞依赖于化学反应。前者——计算机硬件——工作的速度大约比神经元快1万倍。如果我们确实可以模仿大脑,那么我们可以用一些比生物大脑小得多的东西来工作。
但是大脑中的所有神经元到底发生了什么呢?就在几年前,研究人员得出结论,如果来自视觉神经的信号进入了新皮质的第四层,那么它们会向第三层发送信号,接着是第二层,最后才是第一层。所有这些都表明,第四层接收来自体内神经的原始数据,在接下来的两层中,这些数据被转换成某种可识别的模式。最终,当它和很多水平连接到达第一层时,数据被连接到来自大脑其他部分的各种信息存储,这样就有可能从这些信息中获得一个有意义的内容。
新皮质的神经元有着相同的结构并且或多或少都有相同的厚度,而神经纤维在所有地方看起来几乎都一样。同样,在显微镜下观察,新皮质有统一的结构,尽管它具备各种各样的功能。这和我们学到的知识相符,即如果新皮质的一部分受损,那么另一部分会接管它的工作,如果感觉器官的神经输入从新皮质的一个部位转移到另一个部位,那么一段时间过后,感觉器官仍会继续工作。
同样,我们知道人类大脑可以轻易地学习一些以前从未存在过的技能。大脑已经进化了几十万年,在没有汽车、钢琴和计算机的年代,大脑可以很容易地学会开车、弹琴、读书、写字。换句话说,新皮质被编码以接收感官方面的印象和发送运动指令,但这些指令的实际目的和新皮质没有关系——显然,这些指令或多或少得用与新皮质相同的原则解决所有的问题。但这些原则是什么呢?
大脑不使用数学公式或逻辑运算法则,这与计算机的运作方式是不一样的。大脑看起来更像一个电影服务器,它包含许多被压缩的电影,例如MPEG或者AVI格式的电影。越来越多的科学家认为新皮质的功能主要是储存大量来自生活的感观印象,当我们经历相同事情的时候它就会回放。
让我们先来看看数据是如何进入系统的:如果我们看到一张脸,新皮质就会接收大量的原始像素,但它们接着会被皮质的更高层转换成若干模式,这些原始像素的相对比例以压缩、程式化和概念化的形式被储存。这就形成了一种模式和现象,它们主要储存在皮层的外层,在那里像素可以被分类、重组,并与其他记忆相关联。举个例子,当我们看到一只公鸡时,首先大脑接收它感知到的原始的感观印象,它被认为是纯粹的声音和图像或气味。但在大脑皮质的下一层,这种印象转变成了一种略带傲慢、有点儿愚蠢的动物的形象——这总让我想起毕加索有时会采用的绘画方式。接着,在皮质的外层,“公鸡”这个词就会被连接到所有我们知道的词语里,这些词语可能是“鸟”“黎明”,甚至是“红酒烩鸡”。
顺便说一句,红酒烩鸡让我想起了我们在法国普罗旺斯度过的一个假期,在那里我们吃过这道菜……我们住在一个葡萄园里,那里也有一些非常新鲜的水果……我们还将这些菜带到了沙滩……在这里,我们洗了很多次澡,还有……
……还有现在我在我大脑新皮质最上层的相关记忆里冲浪,正如我所做的,我的大脑使用了大规模并行计算。那些我储存下来的“电影”被压缩成一定的比例、相对的距离、想法、符号和概念。换言之,虽然大量的信息因为压缩而丢失了,但我们在速度、储存空间上获得了优势,也许最重要的是,拥有了识别相似但不相同的东西的能力。例如,尽管我们从各个不同的角度看到一个人,我们仍然可以认出这个人。如果我们听到一段音乐,那么大脑新皮质会储存时间间隔以及每个声音细节之间的音调。如果我们走在街上,新皮质会储存发送给肌肉的运动指令以及来自我们脚上的感觉的相关组合信息。
令人印象深刻的图片
毕加索被贴上了后印象派的标签,但他所画的是给他留下印象的事物,而不是这些事物的视觉形象,这使他的作品引人入胜,就连大脑似乎也会把它的感觉转换成符号和印象。
这样我们就可以知道信息是如何反馈回系统的了。当我们要做一些事情的时候,新皮质会播放一些“电影”,预测短时间内将会发生什么。如果我们沿着街道走,它会播放一部“电影”,告诉我们应该如何使用我们的肌肉,当我们的脚接触地面的时候,我们就能想到脚的感觉以及它应该发出的声音。这部“电影”驱使我们继续走下去,如果一切都像电影预测的那样发生在我们的新大脑皮质中,那么我们就不需要意识到这些事情了,因为大脑会自动播放它。我经常自驾穿越瑞士,有时我妻子在途中给我打电话,问我走了多远。我不知道。“你经过伯尔尼了吗?”她可能会这样问。我还是不知道,因为我根本不考虑我的驾驶过程。它只是在我大脑中的某个部位播放的一部电影,而其他的部分则在思考其他事情。
我想到了另一个很好的例子,你可能从自己身上感受过:我敢肯定,你曾多次尝试走上坏了的自动扶梯。这是一种奇怪的感觉,因为即使你事先知道它坏了,但当你迈出第一步时,你还是差点摔倒了,因为大脑已经本能地准备好迎接一个移动的自动扶梯——它的感觉是:一旦迈出第一步,脚就会被拉着向前了。实际发生的事情和大脑中正在播放的电影不匹配。这也解释了为什么有大约10倍的神经连接由大脑发出,而不是由感觉神经细胞发出。
下面是第三个例子。试试看你能不能读完它:
I cnduo’t bvleiee taht I culod aulaclty uesdtannrd waht I was rdnaieg.Unisg the icndeblire pweor of the hmuan mnid, aocdcrnig to rseecrah at Cmabrigde Uinervtisy, it dseno’t mttaer in waht oderr the lterets in a wrod are,the olny irpoamtnt tihng is taht the frsit and lsat ltteer be in the rhgit pclae.The rset can be a taotl mses and you can sitll raed it whoutit a pboerlm. Tihs is bucseae the huamn mnid deos not raed ervey ltteer by istlef, but the wrod as a wlohe. Aaznmig, huh? Yaeh and I awlyas tghhuot slelinpg was ipmorantt! See if yuor fdreins can raed tihs too.
(实际上我不敢相信我在读什么。人脑有一种令人难以置信的能力,根据剑桥大学的研究,单词中字母的排列顺序并不重要,唯一重要的是它的首字母和最后一个字母放在正确的地方。其他字母的顺序可以完全打乱而不会对你的阅读造成任何影响。这是因为人脑不会阅读每一个字母,而是整体地阅读单词。很惊讶,对吧?是的,我居然总是认为拼写是很重要的!看看你的朋友是否也可以阅读这段文字。)
这些字母混乱得令人难以置信,但这些话是有意义的,所以大脑新皮质会猜测单词和句子的意思。我在9岁孩子的身上试过这些方法,他们也做得很好。当一台计算机可以不经过训练就读出它时,我们就成功了。
结论是,虽然计算机使用数学,但大脑做了一些与计算机完全不同的事情。例如,大脑根本不会去尝试计算一场比赛中网球会落在哪里,或者当你在滑雪板上滑行时身体应该如何移动。它只是简单地回忆以前的经历——你正确击球时的经历,或者你在滑雪板上优雅地摇摆时的经历。它回忆起以前的经历,这些经历的顺序和之前发生的顺序一样。你还记得字母表,但它不是倒序的,你也绝对不会一下子全背出来。你就像记住一部电影一样记住它。你也许会唱弗兰克·辛纳屈的《我的路》,但不会倒着唱。如果你回忆起在法国巴黎街头散步的情景,那么你会记住一些片段,而不可能在一瞬间回忆起所有的事情,就像你不能同时回忆起一部完整的电影一样。
大脑显然是像上文所说的那样运行的,所以你也就能明白为什么幻想在里面安装带有说明书的芯片教它如何说法语或者做积分运算是徒劳的,因为大脑无法解释它们。不过还有一些事情是我们能做的。我们可以增加新的感觉。我相信给我们配备一个雷达是有可能实现的,这个雷达可以连接到一个芯片上,通过金属臂固定在大脑上。大脑可能会在一段时间后识别信号中的模式,并学会在黑暗中进行观察。顺便说一下,类似的事情已经发生了。在美国,有位盲人把一个连接着照相机的芯片移植到他的舌头里。舌头里的神经会捕捉来自照相机的信号,然后将其发送给大脑,然后(坚持住)……过了一会儿,他就能通过舌头看见事物了……感觉不是很舒服,但请注意,这是真的:他通过自己的舌头看到事物了。
当计算机接近人脑时,我们有必要问一下它们将如何与我们进行比较和竞争。我认为我们可以将人类的智力活动分为以下形式:(1)收集数据;(2)解释世界;(3)表达天赋。显然,现实是这三者的巧妙结合。就像新大脑皮质在收集信息的同时回放电影一样,我们不断地把不同任务中的表现与精神技能结合在一起。这种能力实际上也就是让我们在复杂的世界中获得智慧和成功的能力。
在下面的表格里,我展示了我认为的人类智慧的一些关键技能。我将计算机经常打败人类的领域标注为灰色。浅灰色意味着在某些情况下它们会打败人类,而深灰色则意味着计算机通常都是非常优越的。
表16.1 2010年计算机与人类比较
上面的表格显示了2010年的情况,而下面的图表则展示了我认为在2030年可能出现的情况,那时计算机在能量消耗上超越了人类大脑,我们掌握了新大脑皮质的模拟。
表16.2 2030年计算机与人类比较
正如两组表格所示,我不认为在2030年之前计算机会带有任何情感,但是我认为它们会很擅长伪装自己。此外,它们还将在数据收集方面取得巨大进步,也会在追踪事情进展和标记值得注意的事项等方面遥遥领先人类。这种计算机快速而不知疲倦,加上检测重要相关性的能力大大提高,它们将会获得成功。
在表达天赋方面,2030年前的计算机将能够创作艺术绘画和音乐、撰写文学作品、设计房屋,并完成无数我们现在认为属于人类专属领域的创造性任务。它们还能以人类难以匹敌的速度和广度做更正式、更明确的工作。例如,它们将执行许多比人类执行效率高得多的军事任务,能够即时检测互联网上的连接数据,并以闪电般的速度创建结构化的报告。它们也可以和人类进行真实的对话,例如在技术咨询平台工作或当辅导员。
所以,它们将会非常聪明。我们知道计算机已经欺骗了人类,因为我们将计算机误认为其他人类。问题是什么时候我们能看到一台计算机没有经过特殊训练就在智商测试中取得惊人的成绩,是否有一天计算机能获得诺贝尔奖或者普利策奖。如果是这样,我们会把奖金或奖品给谁?或者我们会让电脑赢得最初为人类设计的奖品吗?
现实是,如今的IT界已经有许多活动接近新皮质所做的事情,现在不妨让我们体验一下未来会带来什么,事实上只要想想“产消者”的整个概念及其互动内容就可以大致了解。产消者是指消费者向生产者提供特定的或指示性的信息来为自己产品的生产做出贡献。例如,你可以在网上选择汽车的规格,或者通过互联网浏览习惯推送给你的供应商获得提示。在互动媒体中,记者、出版商或者制造商可以发布信息,这些信息会立即得到消费者10倍的响应。这与新皮质的行为非常相似,在新信息进入的地方信息表达预期将会达到其他地方的10倍。看来,这种互动在大脑和市场上都是非常有效的。
我认为谷歌公司开发的程序在所有实际用途上都开始效仿新皮质的部分功能。当你用一个拼写错误或者没有意义的词进行搜索时,作为回应,这个程序通常会询问“你的意思是……”,接下来会提供一个正确的拼写或者有切实意义的建议,而这种建议是建立在它的经验基础之上的。从某种意义上来说,它是在回放一些基于特定情况产生期待的电影,就像新皮质一样,这些功能都是建立在之前的基础上的。它以人类为导师,又反过来做人类的导师。
谷歌公司有几十万台定制的服务器,并且每周都会增加数千台。这些服务器被划分为集群,由在开源软件上运行的专有软件进行协调。这些服务器包含整个互联网的副本,它通过使用“蜘蛛软件”来不断进行更新,这些“蜘蛛软件”在网络中自动从链接爬行到链接,并复制它所找到的一切。这些服务器还更新书籍、科学杂志文章的数字拷贝,并使用一套数学算法为每一页以及每一个与不同搜索词和术语联系的来源制作索引和排序。对于这个任务,服务器也研究人们如何搜索并试图从中学习——换句话说,软件把人当工具,这是一种全新的、颠覆性的工具。
现在我想进行一次搜索。我输入:“石油生产什么时候达到顶峰?”在0.11秒之后,搜索引擎为我提供了与这个问题有关的大约52 000个相关链接。它究竟是怎么做到的呢?只用了0.11秒?原因是它使用了大量的并行计算。当我输入一个问题时,谷歌软件会将它同时发送到每一个服务器集群,在那里它的软件将用户的问题进一步地分配给各个服务器。这意味着,在这0.11秒中,有成千上万台,甚至是几十万台电脑在同时为我工作。然后,这些数据通过逆向级联,将得出的结果传输到上游,最终到达最高级别的排序和聚合发生的地方,最后发送给我。
我认为这和新大脑皮质的功能非常相似。它回放了记忆,正如我之前提到的,这就是为什么每当有数据传入大脑,它都会与更大流量的数据输出相匹配,以模拟接下来可能会发生的事情。
现在互联网搜索仍处于起步阶段。WolframAlpha(一个搜索引擎)倒是可以回答一些简单的问题,例如当你输入“湾流G150有多长?”时,答案马上会跳出来。它不会提供无数个网站供用户检索,而会给出一个具体答案:18.97米(实际上工厂声称它有17.25米)。我没有湾流飞机,所以我不能验证谁是正确的,但是我们正在进步。
在未来的20年里,我们也许会设法制造一台能真正复制我们新皮质的计算机。艾伦脑科学研究所——一个在2003年由微软联合创始人保罗·艾伦捐赠了1亿美元创建的非营利组织,一直致力于绘制脊椎和大脑图谱。它使用机器操作的方法将大脑分为成千上万个微小的、几乎透明的薄片,然后用数码相机对这些薄片拍摄,并用条形码进行编码。例如,像小白鼠那样大的一个小脑袋将被切割成大约25万个切片,每个切片都非常薄,当你在一块玻璃上看到一个切片时,它甚至不会比指纹更厚。这些切片一旦被安装在玻璃上,就被浸泡在含有不同的RNA链的溶液中,而这些RNA只能附着在特定的基因链上。在完成这项工作之后,再用化学物质和特定的抗体对这些切片进行清洗,这些化学物质和抗体能够黏附在RNA上,使大脑切片可见,从而向科学家展示基因在大脑各个部位表达的情况。
即使我们成功地对新大脑皮质进行一次真实的模拟,基因也不会复制我们的感觉或意识,因为它们并不存在于新大脑皮质中。我们为什么要这样做?模拟情感是在自找麻烦。如果计算机感到焦虑或有攻击性怎么办?在电影(和书)《2001:太空漫游》中,HAL 9000就这样做了,可结果并不好。
如果有一天,你能把所有出版过的书、音乐和电影都收集在一个相对便宜的小型服务器里,我也不会感到惊讶。我们可以取得如此大的成功,这一点可以从我们已经走了多远的事实加以证明。自20世纪50年代以来,计算机容量的增长已经超过了……稍等一下……10万亿倍。是的,10万亿倍。因此,信息技术仍在迅猛发展,而且有成千上万的神奇产品正在研发生产过程中,这并不奇怪。
当我还是个孩子的时候,人们主要使用由主机带动屏幕的中央计算机,这种计算机屏幕是被动工作的,所以有时也被称为主从式。第一台大师级的计算机居然比蚂蚁还笨。在集中式计算机之后出现了所谓的“客户端服务器”。这些大型的中央计算机连接许多智能终端,如个人电脑。
下一个级别是基于网络的计算,数百万计算机——大型机和小型机——通过互联网连接起来,并开始交流知识和资源。这一发展产生了巨大影响,因为它以前所未有的方式对社会进行改造。任何试图操纵人类的人都会在互联网上立即遭到博客作者和自媒体的反对。患有慢性疾病的病人在网络上相互联系,讨论他们的经历,最后常常反过来,他们告诉医生应该如何治疗,而不是医生告诉患者如何治疗。这就是我们现在的状况,那么,我们该何去何从?
我认为我们可以从两种角度——技术角度和客户角度——来看待它。从技术角度看,我认为我们正在加速发展,尽管这是一个由8个阶段组成的进化过程:
(1)主从式计算。只能由高度专业的专家操作的中央计算机。
(2)客户机–服务器计算模式。大型中央服务器连接分散的计算机,各台计算机都非常容易使用。
(3)网络计算。数以百万计的用户友好型计算机在互联网上相互连接。
(4)普适计算。计算机在环境中随处可见,通常是隐藏嵌入式的,或者手持移动式的。任何人都可以使用它们。
(5)自主计算。软件可以学习和执行直观和复杂的分析任务,如服务功能、研究、数据挖掘和环境扫描。
(6)虚拟计算。计算机网络在群组中工作,所需的部分计算是由对固定和移动计算机来说都实时在线的应用程序完成的。
(7)自修改计算。软件可以识别新软件的需求并且对自身进行编码。随之而来的是软件多样性的爆炸式增长。
(8)意识计算。软件可以意识到自身的存在。
第4阶段正在爆发,计算机随处可见,只不过它们经常隐藏或集成到其他系统中。普适计算或者普遍计算是更为专业的术语。如今,我们的数码相机、汽车、手机和各种各样的地方都有很强大的计算机。
最近的一个例子是电子书阅读器,例如亚马逊的Kindle,人们可以在这款产品的屏幕上阅读书籍和杂志,而不需要在纸上阅读。Kindle的使用不需要特殊的光照条件;阅读感受就像看着一张纸,而不是普通的电子屏幕,这实际上是在阳光直射条件下最容易使用的。Kindle的显示器由微小的球体组成,球体一边是白色的,另一边是黑色的,并且是由磁性控制的。我相信未来的电子阅读器将是可弯曲的,有内置的视频剪辑、网络链接,并定期更新,因此,下载一本书或杂志意味着访问一个生动的多媒体文件。
我在第8阶段提到了意识计算,但我不知道它是否真的会发生。事实上,我们怎么可能预料到呢?如果有一天,当你开始在电脑上做预算修改时,计算机忽然关掉了你的电子表格并且告诉你它今天更想玩游戏,我想你就会知道了。
不管怎么样,以上是从技术角度考量的。从用户的角度来看,我认为未来几十年将由信息技术和数字媒体结合的趋势主导:
• 更多的分类定价化。当产品变得更数字化时,产品就不再被绑定到实体容器中了。音乐不再与实体激光唱片绑定,因此你可以一次下载一首歌曲,而不用购买整张激光唱片。有了在线新闻,你可以重新定制订阅,这样你只能看到你想要的部分。
• 更原子化。推特的受欢迎程度表明,许多人都喜欢类似口语的单句的文本媒体形式。同样的,对于给定的软件或者给定的股票交易所,一年可能只想使用几次。
• 更即时化。越来越多的人期望,从他们意识到自己需要信息到得到答案只需要几秒钟。谷歌和维基共享资源就是在这方面拥有巨大资源的例子。商业人士和投资者期望有持续的针对性的信息流实时支持他们。
• 更便携化。无论何时何地,只要你需要它,就可以通过不同的屏幕类型(无论手机、iPad还是计算机)访问任何IT或者数字媒体。
• 更概念化。计算机将能够实时利用外部资源,向你展示你所遇到的任何事物的意义和背景。
• 更自主化。IT系统不仅能回答问题,还能做出决策,具有创造性。
• 更虚拟化。信息技术的利用使物质化的东西变得不再重要,甚至看起来有点儿多余。
• 更实时化。信息技术将为我们提供关于世界的信息,并将模型和游戏与现实世界中的实时事件完美地结合在一起。
也就是说,除了我之前提到的8个技术阶段,还存在8种应用趋势。然而,还有第三个角度,将行业划分为三个明确定义的角色。
• 信息实用程序公司。提供数据处理和储存等标准服务。
• 信息营销组织。了解客户的观点,帮助客户构建正确的IT产品组合,以防费用过高。这些产品将以“开放架构”为基础,这意味着这些产品中也可能包括IT公司及其竞争对手的产品。
• 创新IT公司。比如房地产开发公司、创业公司和咨询公司等。
所以,这些是我所能想象的未来几十年里IT界的主要驱动力。也许,我们应该更具体一点儿,看看IT部门未来可能会推出的一些产品。我们不妨从科幻电影中最常展示的机器人开始了解。
当我坐在家里和办公室工作的时候,时不时地,我不得不抬起我的腿给一个叫伦巴(Roomba)的小家伙腾出空间。这是一个机器人吸尘器。猫觉得它很好玩。我也认为它很有趣,因为这是机器人行业第一次真正在大众市场上获得成功。
我认为机器人可以被定义为一个由计算机控制的无人驾驶的物体,在现实世界里四处兜售。这对机器人行业来说就像吃豆人对整个电脑游戏的影响一样:这是第一次大的成功。但这个机器人并不比一只木虱聪明多少。当今最著名的机器人可能是《星球大战》中的角色C-3PO和R2-D2,它们让我们分别想起了一个跳动的男同性恋者和一个超天才的尼菲斯克真空吸尘器。这两个角色都表现出了极大的勇气(尤其是R2-D2),如果相处久了你就会开始喜欢它们。然而,它们在现实生活中并不存在。
另一方面,汽车和飞机也是如此。一些现代汽车比第一艘宇宙飞船拥有更强大的计算机能力。它们有防抱死制动系统、制动辅助系统和牵引控制系统,可以进行大量的计算(每秒25次或更快)以识别危险信号。此外,这些现代汽车还使用卫星导航、在线路况广播报道、雷达停车距离控制以及干扰距离控制系统。换句话说,它们通过不断地阅读来自车轮和引擎的反馈信息,再加上无线电信号、卫星信号和雷达返回信号来通知、协助和引导司机。尽管它们还称不上机器人,但它们已经非常聪明了。
月球上已经发现了水,我可以想象到,我们有望在未来在那里看到一个永久性的基地。部分原因是这个基地将是一个比轨道卫星更实用的空间观测站,因为当周围存在重力时,许多事情都会变得更容易。还有,月球上有大量的氦–3储备,这可能是理想的第二代燃料,可用于核聚变。太阳就一直在产生氦–3,并把它放射出来,不过地球上的氦–3就很少了,因为我们的磁场使它发生了偏转。然而,月球上到处都是这种重要的燃料。
在离地球更近的地方,最新的里尔喷射机实现了100%的“电传操纵”,这意味着有两台计算机控制着飞机。当喷气机引擎启动时,这两台计算机的每一个系统都要诊断所有的飞机系统,直到两台计算机产生相同的状态报告,否则飞机无法起飞。如果它们成功起飞了,那么其中的一台计算机将接管飞行。根据定义,这些计算机不是机器人,因为里尔喷射机是人工操纵的,不过这些计算机也做了一些你期望先进的机器人同样能做到的工作。然而,因为军用无人机是绝对无人驾驶的,所以有许多其他军用车辆的无人驾驶技术已经投入使用,但也有些还处在不同的测试阶段。其中的一些需要远程控制,而其他的可以自主操作(例如,监控车辆)。
计算机芯片在1995年就超过了苍蝇大脑的“智能”水平,所以今天我们在制造像苍蝇一样“聪明”的机器人上完全没有问题。一只苍蝇的大脑大约有10万个神经元,运算速度大概有100 MIPS。苍蝇擅长飞行,所以我们几乎不可能捕捉到飞行中的苍蝇。但事实上它并没有学习新事物的能力,所以你会看到,如果它落在我的手臂上,我试着拍打它,它就会飞走。但过了一会儿,它可能会再飞回来,落在同样的位置上。这得有多愚蠢?我试着再拍打一次,而且还会重复第三次。它居然什么都没学到。
下一阶段的水平类似于蜥蜴,它们在棍棒和石头间冲撞,它们的头部可以避免被多次撞击。这个我们现在也可以做到。其中的一个例子是美国国防部高级研究计划局(DARPA)一年一度的无人驾驶机器人挑战赛。第一次比赛于2004年举行,当时有很多来自不同大学制作的机器人汽车通过程序操控穿越240公里的沙漠。在15辆决赛机器人汽车中,没有一个完成比赛,表现最好的机器人汽车也只行驶了12公里,大约是全程的5%。一年之后,比赛再次进行,这一次有23辆决赛机器人汽车参赛,并且它们都成功地打破了12公里的行驶纪录——事实上,其中的5辆越界了(见图16.5)。2007年,美国国防部高级研究计划局城市挑战赛由11辆决赛机器人汽车组成,它们在没有与其他车辆相撞或违反交通规则的情况下,在城市环境中行驶了96公里,并且有6辆完成了比赛。这是一个非常快的进步。
图16.5 第二届无人驾驶机器人挑战赛的自动机器人汽车图像
资料来源:维基共享资源。
在技术领域有一个规则,那就是一个有吸引力的技术概念从在实验室的规模试验到被广泛采用大约需要25年的时间(尽管一些IT产品的销售要快得多)。考虑到机器人汽车的技术在2010年就已经基本成熟,所以预计它们可以在2035年左右被广泛使用是合理的。机器人驾驶卡车在高速路上行驶可以作为该方式的一个开端。例如,一辆从意大利到波兰的卡车,可能会被司机拖到意大利的高速公路上,然后司机会让这辆卡车自动驾驶仪。接着卡车自动驶往波兰,不需要任何人类司机,卡车在抵达时会停在路边的停车场上,在那里,波兰司机会找到它并开向最终的目的地。规则可能会规定,它必须在高峰时段停车,在晚上才能行驶。如果在路上它需要加油或者电池需要充电,它会自动进入一个合适的加油站,然后给自己接上电源,或者等待人工服务或机器人服务。
对于机器人来说,还有一个显而易见的大规模应用场景:购物。我个人把购物分成四类:
• 愉快购物。购买奢侈品、艺术或时尚品是令人愉快的体验。
• 扫码购物。对明确定义物品的替换/购买。
• 探索购物。寻找礼物或装饰物品,但你不知道该买什么。
• 补充购物。标准家居用品的日常采购。
我认为第一类最好采用老式的方法(因为它很好),接下来的两类通常采用在线购买(选择范围更广,搜索速度更快)的方式。然而,大多数购物都属于第四类,这就显得非常枯燥和耗时。机器人可以在仓库挑拣你的货物,然后把它们放到当地的加油站或者你的家里。因此所有的加油站都将由超市并购(因为汽车也将会变成电动的)。超市是完美的集散地。
下一个阶段是具有同等学习能力的机器人。换句话说,机器人将实时观察周围的环境,并对这种环境变化做出反应,然后在一定程度上预测周围环境对机器人自身的影响。
计算机行业可能会使用两种主要方式来培训如此精密的机器人。一种是“自上而下”,试图制订一系列的规则。人类已经开发出几乎可以模拟我们做的每一件事的软件和硬件。我们拥有具有监测功能(也有两个维度)的摄像头、用于监听的麦克风(立体声),能够感知甚至具有嗅觉的传感器。我们也有全球定位系统,它能够告诉我们所在的位置以及怎样到达目的地。此外,我们有精通几种语言的软件,它理解别人在说什么,以为人类服务的态度去翻译和沟通。我们还拥有可以大声朗读、计算、书写、搜索信息以及做其他许多事情的程序。我们拥有汽车停车辅助控制软件,以避免车辆间的相互碰撞。同时拥有能够识别和解释图像与物体的其他软件。我们如果把所有这些结合起来,就肯定有能力制造一个智能机器人吗?也许吧。但是如果我们试着把它们结合在一起,那么我们最终会开发出一个极其复杂的软件。
另一种培训的方式是大脑新皮质的模式;用“自下而上”方式培训机器人,机器人在开始时几乎什么事都做不了,就像我之前提过的西洋双陆棋。在这里,我们从一些算法开始,让机器人在错误中学习,并在做对事情时得到奖励,这就是大脑新皮质的模式。
自然界的生物是如何做到的呢?昆虫和贝类动物的大脑主要是硬编码,也就是说,几乎所有与它们能力相关的指令都是在基因中预先确定的。它们的DNA中只有数亿个碱基对,但足以让它们识别脑细胞是如何连接的。然而,人类大脑中这32亿个碱基对却并不足以说明我们大脑中的300亿个神经元是如何连接的。
但也不用担心,因为人类与自然界生物是不同的。我们物种的特征是具有调整和学习的能力,因此,我们的脑细胞只说明了极少数的脑细胞是如何连接的以及它们应该做什么。这就是为什么新生婴儿是完全无助的,即使他们有一个巨大的大脑。所有儿童的大脑中的大量神经纤维都是在学习的过程中开始形成的,尽管这是由他们的基因决定的。当一个人发展成长为一个专业领域的专家时,一般来说,其个人在该问题上有5万~10万条信息和经验。显然,每一条信息和经验都涉及大量的神经连接。
我认为“自上而下”的方法将主要用于机器人可能会变得危险的情况,尤其是当用作汽车或飞机使用时,它可能是最好的选择。然而,许多系统最终可能两种方式兼而有之。毕竟,绝大多数自学成才的人,也有许多硬编码的功能,例如反射、自动呼吸、心跳等等。也许机器人将建立在5%的自上而下的硬编码指令和95%的自下而上的新皮质模拟的基础上。
计算机的模拟大脑新皮质的10项主要任务
(1)汽车驾驶。人们在车上会感到无聊,道路变得拥挤可能导致车辆互相碰撞,最终陷入本可以避免的长时间交通堵塞、迷路或者是经济上不划算的开车出行。计算机此时可以发挥作用并可以做得更好,它让我们在开车的时候可以工作、读书、打电话、睡觉、上网或者看电视。有些时候我们仍然会手动驾驶汽车(特别是运动员),但是这只发生在我们认为它很有趣的时候。
(2)创建个人媒体。一台智能计算机可以为我们的兴趣建立一个详细的档案,然后通过定期浏览互联网和其他媒体上的所有资料,找到我们想要的东西。然后,计算机就可以撰写个人报纸,并制作个人广播节目和个人电视节目,其中包含我们感兴趣的所有东西。
(3)私人家教。在上学期间,大多数孩子都经历了某个科目的落后,而计算机可以在正常的教学时间之外作为他们的私人老师来工作。同样的现象也可以被成年人用来进行自我提升学习和补充训练。
(4)安全。智能计算机能够使用类似于警犬的嗅觉传感器、红外传感器以及眼睛来识别人类,并把人类解读为“属于”或“不属于”,以便对私人住宅、办公大楼、港口、停车场、机场、火车站和工厂等进行监视。
(5)分类。计算机可以进行非常精确的垃圾分类,同时对有时可能涉及的有毒物质具备免疫力。它也可以沿着路边或海滩行走,并捡拾垃圾。
(6)洗衣服。它还可以在私人住宅里对衣服进行分类、清洗、熨烫并晾干。
(7)洗碗。没有人喜欢洗碗,但几乎每个家庭和所有的餐馆每天都要洗碗。这项工作是在一个有限的物理区域内完成的,所以必须制造一台能够自动填充和清空的洗碗机。
(8)诊断。当医生与病人交谈时,智能计算机可以监测会诊情况。在病人离开之前,“万事通”计算机可以提醒医生他是否有遗漏或者可能做错的事情。
(9)同行评审。科学家在科学出版物上发表研究成果时,通常需要其他科学家发表批判性评论。智能计算机还可以参与到这项工作中,并且比任何一位科学家都拥有更大的背景知识优势。
(10)军事功能。计算机控制的汽车、飞机和伪装的“收听站”可以承担大部分军事侦察任务。在某些情况下,它们也可以接管战斗功能和控制战斗机,也就是通过远程通信来进行人为监测。最后,它们可以看透“战争迷雾”,正如卡尔·冯·克劳塞维茨所说的,在混乱与混沌中看清下一步该怎么做。
请注意,并不是所有这10个想法都涉及周围世界的物理导航,而且这些与人类在物理上没有什么相似之处。在机器人控制的汽车中,车身就是汽车;在机器人控制的飞机中,机体是飞机;而在机器人控制的安全系统中,传感器和摄像机是最基本的部分。
几乎和我谈论过机器人的每个人都会立刻并出自本能地断定,计算机绝对不会像我们一样,因为我们是“特殊”的。当然,从技术角度来看,我们绝对是这样的,很神奇。我们的大脑仍然比任何一台计算机强大得多,而且结构也比计算机芯片的布局紧凑得多。我们的身体在很大程度上能够修复自身的损伤,甚至可以复制自己。在我们身体的表面和内部有非常精确的触觉和温度“传感器”,我们的视觉、听觉和嗅觉具有惊人的准确度。让一个工程师把这些与机器相匹配,他也会晕倒。
想想机器人能做哪些我们做不到的事情。第一个问题涉及大脑的物理位置。机器人的大脑不需要停留在它们的身体里。相反,这些机器人可以通过无线连接到一台控制着它们的大型固定的电脑上。就像今天的军用无人机一样,其中一些飞行任务是由位于地球另一面的飞行员通过卫星控制完成的。如今,我们可以制造出一些机器人,将类似于碰撞控制这样简单的本能控制机制放置在其体内,但是大脑中要求较高的部分位于机器人体外一定的距离之内。事实上,机器人不仅可以通过电磁波吸引其他计算机智能,还可以将许多计算机的数据能力精确地组合成一个巨大的虚拟计算机。这种现象被应用在SETI项目中,它代表“寻找地球外的智慧生物”(“Search for Extra–Terrestrial Intelligence”)。通过SETI@home这个网站,在2010年,大约有30万台个人电脑相互连接,这使得其闲置的数据处理功能在不被使用的情况下可以自动地用于SETI项目。
与人类不同,机器人的另一个优点是,它能够在不丢失数据的情况下关闭大脑。因此,我们可以把它们送到遥远的行星进行为期一年的枯燥无味的太空冒险,那是人们不想去的地方,人们可能会在旅途中无聊到发疯。
还有数据复制的问题。我所学到的东西不会自动地被我的孩子继承,即使我被克隆了,我也不能保留大脑中的数据。我可能会留下一些东西作为我对社会文化和知识遗产的贡献,但是我的孩子(或者我的克隆人)不可能在生下来时就带着我的知识,人类唯一能传承的就是表观基因组,而这种传承与智力或知识无关。但是,西洋双陆棋可以被克隆到1 000个类似的西洋双陆棋中,如果它们能学到更多,那么它们就可以被克隆。人工智能的发展将比生物学习速度快很多个数量级。将一个成年人的专业知识教给一个新生儿至少需要30年的时间,而且大部分将会被新生儿遗忘。然而,计算机却可以轻松地在几个小时甚至更短的时间内复制大量的知识。
除此之外,你还可以使用那些最擅长学习的计算机,然后将其压缩成更小、更便宜的计算机,它们都是可以被复制的。而且,与人类不同,计算机什么都不会自动忘记。它们可以记住数十亿条信息且不遗漏任何一个细节,一台计算机不仅能在瞬间搜索自己的知识,还能搜索到其他成千上万台计算机储存的全部知识。不像我们,计算机会读心术,其速度比任何个人都要快得多,仅仅是因为电子晶体管的速度比我们大脑中的神经元快几百万倍。
计算机和机器人比人类拥有更多的优势。诚然,它们需要维护和更新,但在许多方面,它们比人类更容易打交道。例如,它们不需要休息、睡觉,吃爆米花、维生素,它们也不会感到焦虑和痛苦,因为它们有能力承担我们无法完成或不会完成的任务。这样的例子还包括清理下水道、寻找被盗的车牌、在矿山工作以及进行军事侦察等等。
所以,在比较机器人和人类的时候,我会说机器人有一些强大的优势。总而言之:机器人将比我们拥有更多的脑力,能够以比我们快几千倍的速度进行学习,有一个非常快的进化周期,能读懂彼此的思想,不会忘记任何事情,也不睡眠。一针见血!
计算机和机器人智能:超越人类的10个优势
(1)它们的大脑不必安置在它们的身体上。
(2)它们可以在数千公里的范围内实时传播精准的无线通信。
(3)许多计算机能够将其“脑力”结合起来,以解决特别艰巨的任务。
(4)它们的技术可以在几秒钟内被克隆。
(5)它们不会忘记事情。
(6)它们可以在几秒钟内搜索所有的知识。
(7)它们可以在不遗漏任何东西的情况下搜索其他计算机的知识。
(8)它们既不需要休息也不需要睡觉。
(9)你可以在不丢失任何数据的情况下把它们关掉。
(10)它们不会感到焦虑或痛苦。
机器人进入了我之前描述的信息技术发展阶段的第五阶段:自主计算。其他可能在该领域有重大发展的产品还包括智能监控系统,它能识别人类并说明他们在做什么。事实上,已经存在这样一个系统——安装在警车上的摄像头可以读取所有的车牌,检查这些车辆是否属于被盗汽车或被放在了其他汽车上。其他系统可以扫描机场的人们是否有情绪焦躁不安或发烧生病的迹象,还有一些系统可以观察餐厅员工的工作效率。这些系统接管了以前由人类开展的日常工作。就我个人而言,我认为它们最终可以完成很多与经营经济型酒店相关的工作。从柜台登记到房间送餐服务,一切都可以由电脑和机器人来运行。它也许不会很有魅力,但可能会很便宜。
然而,它们在自动化检索方面也有很大的市场潜力。电脑会接收专门的指令,然后会对整个互联网进行扫描,并在自己感兴趣的领域出现新内容时向我们提交相关报告。制作一个个人网站也很容易,上面有来自名胜古迹的视频(将你的凉亭囊括其中,如果有的话)、你的朋友在做什么、你的猫在哪里、你的股票表现如何,以及关于你最喜欢的音乐家何时会在你所在的地区举办一场音乐会或发布新的曲目的视频。我认为,这将向我们展示自动的、无所不在的计算与移动的、松散的、原子化的媒体体验的结合。
视觉搜索在谷歌地球上获得了一个新的维度,你可以在电脑或者手机上通过高分辨率卫星图片看到地球上的所有地方,人们也可以上传自己的照片,但在未来,人们可以利用数以百万计的网络摄像头通过互联网在移动设备上实时看到许多地方。
电信行业也在向前推进。未来,当我开车的时候,我可以在路过的地方看到有关交通堵塞和恶劣天气的图片;我还可以点击附近的餐厅、博物馆等场所的商业广告。当我到达火车站或者机场时,我可以用条形码扫描我的车票,随后我的手机就会告诉我该走哪条路。在城市里,我可以在我的手机上输入商店或品牌的名称,它将引导我根据一张由道路和箭头组成的地图穿过城市。
教学也会变得更有效。在瑞士,我的孩子们已经开始用笔记本电脑进行教学了,无纸化正在实现。老师可以随时把学生的屏幕放在黑板上让大家看,学生也可以通过写字和画画来说明他们的想法。学生可以把考试试题下载到他们的电脑里,并在离开教室之前将已做完的试题上传给老师。当他们在团队中工作时,还可以建立虚拟工作组,这样他们就可以在家里或任何有WiFi的地方同时在同一文件上工作。
普适计算尤其擅长满足这两种欲望:通过概念化计算来实现移动和情景感知。我们需要移动,因为总是被拴在办公椅旁是毫无乐趣的,我们需要情景感知,因为这样会让我们把时间用得更好,并且避免错误。
信息技术也越来越有利于实现物理世界的虚拟化。当然,仍然有很多东西无法被虚拟化(例如,一杯咖啡或者在海里游泳),但与信息有关的东西就可以。例如,现在我们有虚拟门票、虚拟图书、电子邮件、激光唱片、影碟、X射线、3D模型、在线会议和研讨会。这就减少了我们所需的物质数量。如果所有的书都是虚拟的,还需要图书馆吗?如果可以在网上购物,还需要实体商店吗?如果有电子银行,还需要银行分支网点吗?办公室呢?商务旅行呢?公司甚至开始在虚拟世界中测试发布产品,以便在决定制造产品之前评估需求。
我认为,当信息技术服务于社会目的时,我们确实需要实体店,因为许多人可能更喜欢在华丽的商业街购物,而不是在网上购物。但是,如果处理信息只是你必须克服的事情,那么虚拟化的方式就要好得多。在我们家,我们通过互联网订购许多生活用品,节省了大量的时间,也避免了很多麻烦。我们通过网络平台转账、购买电子书、下载音乐等。这样可以节省大量的物质和环境资源,节省时间,而且价格也更便宜。
虚拟化与资源节约
信息技术的创新帮助我们使用节约资源的虚拟产品来代替实物产品和服务。下面就是一些典型例子:
• 视频会议和移动电话取代旅行
• 视频下载取代视频租赁商店
• 电信取代办公室和日常交通
• 下载取代激光唱片和影碟
• 电子阅读器取代印刷出版物、书店和图书馆
• 电子邮件取代信件
• 在线目录取代物理目录
• 互联网取代目录和宣传册
• 网上购物取代实体商店
• 无线光缆取代铜线
有趣的是,IT部门本身也在虚拟化。每个商人都知道,运行和不断升级IT基础设施需要花费大量的时间和金钱。然而,就像金融界分散成多个大规模的公用事业公司并在大量的IT基础设施(如零售银行和在线经纪人)上开展业务,其他人负责具有创造性思维(如对冲资金和私人股本)那样,IT界也正在建造大型公用设施,比如提供大量的计算机和服务器,以方便成千上万的客户使用。这创造了两个非常成功的现象:“云计算”和“即服务”模式。
“云计算”是一个可供许多不同客户使用的计算机资源。这是外包吗?不,因为在外包中,你需要付钱给一个组织来负责硬件和软件的运行和维护。云计算提供的服务就像一个IT酒店,客户可以租一个房间,但并不拥有它。这就是所谓的“多租户系统”。然而,这是一个奇怪的酒店,因为可能会有陌生人分享你的床。在云计算中,你可以访问大量匿名电脑,这种操作甚至可以同时支持来自同一软件和硬件的不同客户端,但没有客户注意到这一点。目前,云计算已经培养了三种受欢迎的“即服务”商业模式,它们是:
• 基础设施即服务(IaaS)
• 平台即服务(PaaS)
• 软件即服务(SaaS)
这三种模式都是在不拥有任何IT资源的情况下获得IT支持(硬件和/或软件)。例如,亚马逊为电子数据储存提供了一个简单的储存解决方案,它的简单列队服务可以在不同的软件应用程序之间交换电子信息,还有它的弹性云计算服务(也叫EC2,这种服务可以让客户在亚马逊的计算机上运行他们的软件)。举个例子,你可能使用的是计算机的一部分,其他三个客户机也在使用这台计算机其他部分各自的功能。虽然回归集中式的服务器资源似乎与去中心化的趋势背道而驰,但它实现了以下几点:(1)将IT的实用性与创造性分离;(2)将对软件和硬件的访问原子化;(3)对新容量的即时访问。
这就是云计算和即服务给你的感觉:你希望创建一个在线服务,因此你打开一个网页浏览器,其中一些图标代表你所需的东西。它向你展示了服务器、防火墙、路由器、电缆、数据库、软件包等。通过拖拽鼠标,你表明了你希望它如何连接。在屏幕底部,你将会看到基于该配置的价格指示,显示你每月固定的IT成本。它还将包括一个可变的部分,这取决于你的数据存储和预估的流量。
你一旦确定配置正确,就把你需要的这些发送到你的电子购物车,然后转移到下一个问题:你的办公室需要的硬件。你可以订购不同的打印机和“瘦客户机”(小型计算机),也可以为最有创意的工作人员提供一些强大的设备。因此,这些计算机将自动和来自供应商的新计算机进行交换。你也可以把它移到购物车里。
尽管电子阅读器正在逐渐取代纸质书,你仍然需要一些打印机来获取法律文件和资料,所以你也需要订购一些打印机。打印机上的印刷纸将会放在一组秤上,当打印机需要向你发送更多信息时,它们会自动发出信号。甚至当打印机中的墨快用尽时,它也会自己订购。
如果你希望在自己的网站上投放一些广告,那么你可以拖动一个广告服务标志。这些广告服务标志将会根据点击量给你带来一些收入。即使它只是一个收入来源,也会被放进购物车里。这笔交易的收入将抵消你的成本。最后,如果你想让客户在你的服务网站上进行在线购物,那么你需要有一个完整的虚拟信用卡结算解决方案,并且你已为此做好了准备。你再次对购物车里的东西进行检查,然后点击“确认”。这就是在做生意了。
未来计算机所面临的十大挑战
在未来,我认为以下10个领域将对强大的硬件和精致的软件产生特别的需求。
(1)数据挖掘。不断地扫描和分析电子数据以及现实世界,并理解它。这可以持续用于非正式的观察或研究,或专门用于更严格和更正式的监视和分析。
(2)创建元研究。自动地将给定主题的所有已知信息汇总成易于阅读的报告。
(3)生物技术模拟。模拟蛋白质是如何产生并进行3D折叠的,或者模拟在整个细胞内,甚至整个生物体内发生的事情。以这种模拟为基础,创造新的医疗治疗和药物生产方法。最终,可以避免大多数新的治疗方法的现场试验,而只需用可靠的模拟来代替它们。
(4)机器人。对在物理环境中自主导航的机械设备进行训练和控制。
(5)情境感知。提高我们的实时认知能力,了解我们在哪里,周围发生了什么,我们看到的是什么,我们应该去哪里,或者是否存在关系到我们安全的任何风险和机会。
(6)软件开发。开发能够识别任务并编写更多软件来处理这些任务的软件。
(7)便携式电子眼。透明的便携式计算机/电话将照片和位置上传到网络上,然后进行解读,向你介绍你正在查看的内容。
(8)大型多人在线游戏。高清晰网络游戏,数百万人同时在虚拟世界中相互竞争。
(9)现实/虚拟游戏。在现实世界中玩游戏的能力,如在世界一级方程式锦标赛车中用虚拟汽车对抗真实的汽车。
(10)旧媒体的逆向工程。对旧电影和音乐进行修复,使其以高清/高保真,环绕声,彩色等形式进行录制。
在此做一个总结:我把IT列为未来几十年中7个最有意思的行业之一,因为它虽然已经发展得很好了,但与我们将要看到的情景相比并不算什么。计算机世界将越来越像一个生态系统,计算机甚至会开始编写自己的软件,也许还会意识到自己存在的事实。
人们将不再考虑收藏“一套”书籍、音乐或电影,而是会拥有有史以来最好的东西的副本。
美国在更复杂的芯片业务中占重要地位。一些软件公司——主要是苹果、谷歌、亚马逊等美国公司——已经建立起了强大的网络效应,它们一直以来都具有相对稳固的地位。软件的创意和商业中心主要集中在美国西雅图和加利福尼亚州,但是在博尔德、奥斯汀、波士顿和洛杉矶等地也有许多较小的集中区。在欧洲,软件开发中心遍及欧洲北部和中部地区。印度在新兴市场中有明显的领先地位。至于人工智能和机器人技术,美国匹兹堡和马萨诸塞州具有领先优势,而日本在实际生产小型商用机器人方面领先。