bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
前言
普通汽车终将退出历史舞台。得益于移动机器人技术的快速发展，汽车即将成为我们可以放心托付自己性命的第一代自主式机器人。在经历了数十年不断失败的尝试后，借助速度更快的电脑、可靠的硬件传感器，以及被称为“深度学习”的新一代人工智能软件，汽车可以获得与人类相似的能力，在无法预测的环境中自主安全驾驶。本书就是为了讲述这场变革。我们之所以对无人驾驶如此关注，原因有两
待学习
开始阅读
2
机器司机
在不远的将来，全球汽车博物馆里展览的汽车，都会变成21世纪初之前的那些光鲜靓丽的车型。就像历史的痴迷者来到一个历史遗迹后，会闪身钻入精心保存下来的中世纪小屋回廊里，参观博物馆的人也会钻进这些展览车辆的前排座椅里。这些参观者坐在方向盘后面，拨弄着内置GPS的显示器屏幕，游戏似的用他们的脚踩动着刹车，这一切恐怕会让体验者不禁感叹，21世纪初的人类竟然会用如此不便
待学习
开始阅读
3
迎接无人驾驶
一群热带鱼的行动过程十分值得观赏。它们组成紧凑而均匀的队形，扭动着明亮鲜艳的身体在水中游弋。这几十条不同的鱼可以一瞬间同时转向掉头，动作一致犹如一个整体。如果有个障碍物突然出现在鱼群的行进路线上，鱼群会分开绕过，然后迅速重新建立起它们先前的队形。鱼群彼此之间从不相撞，也不会触碰到浪涛裹卷而来堵在路上的异物——枝条、石子或珊瑚礁。在理想的将来，我们的街道和高
待学习
开始阅读
4
致命病症的特效药
关于汽车，有一个奇妙的讽刺，虽然汽车自从发明以来已经“谋害了”数百万人的生命，但我们的社会对于它造成的死亡人数仍视而不见，这或许是一种冷漠的默许。每年，全世界都有将近120万人死于车祸，这个死亡率相当于每年释放10个广岛级别的原子弹爆炸。与战争、暴力、毒品一样，汽车对人而言也有着致命危害。谋杀、自杀以及战争每年预计会造成160万人死亡；由毒品导致的死亡人数
待学习
开始阅读
5
阻碍无人驾驶技术发展的7个误区
如果不积极响应无人驾驶技术的发展，我们就会继续付出生命和时间的代价，继续承担污染的危害，继续丧失机遇。然而，并不是每个人都认识到了无人驾驶汽车的价值。在写作本书时，我们发现有些针对无人驾驶的误解还在广泛肆意传播，并且这些信息会被反对者拿来对抗无人驾驶的推广政策。我们将这些误解谣传总结成7个误区。具体如下： 1. 自动化驾驶技术会脱胎于当今的驾驶员辅助技术。
待学习
开始阅读
6
无人驾驶技术发展的时间表
无人驾驶汽车的推广并没有一个简单明确的时间表。实际上，向无人驾驶汽车世界的转变将是逐步推进的。汽车并不会在某个特定的年份一下子都变成无人驾驶。有两个原因：首先，无人驾驶汽车的应用会先发生在某些场所或某些国家；再者，汽车公司目前正在采取的策略分阶段自主化。如果他们成功了，人们可能需要在行驶过程中某段时间来驾驶，这也使得汽车向无人化的转变不可能存在一个明确的时间
待学习
开始阅读
7
便利的个人移动性
无人驾驶汽车对人类生活产生的影响中最不为人全面认识的一点，就是对于交通拥堵产生的影响，以及随之而来的弊端。一种乐观的局面是无人驾驶汽车可以提升城市交通系统的效率，致使私家车数量减少，进而减少拥堵，降低城市中交通出行产生的碳排放量。另一种对环境不利的局面是，在人们享受着个人移动性的便利的时候，平均而言，无人驾驶汽车实际上每年将会刷新出更高的车辆行驶里程，也就导
待学习
开始阅读
8
找停车位不再令人头疼
其实，我们很难明确指出一个城市为何令人着迷。就像是对于艺术由什么构成这个问题的争论一样，一个城市的吸引力来自哪里也不是人们能轻易解释清楚的，但是只要人们身临其境体验过，就能察觉出那个城市的独特韵味。在我们的经验里，那些引得人们去游览、定居并工作的城市多半有着深具活力的城市步行文化。街道上的行人越多，这个城市的热闹氛围也就越有趣，街道上餐厅和商场里的消费交易
待学习
开始阅读
9
更短的通勤时间和更少的花费
类似孟买、墨西哥城以及上海这样的城市，居住人口超过2000万人。到2050年，预计全球城市人口数量增长将会接近1倍，从目前的33亿人增长到64亿人。这些特大城市的纵深将会横跨几英里，街道上也会塞满各种车辆，因为居民每天不得不外出上班，并且还拼了命地想避免拥堵，最后反而更加拥堵。随着城市人口的扩张，市政府需要对空间利用做出更明智的规划。在无人驾驶汽车逐渐变得
待学习
开始阅读
10
社交和孤独感
虽然无人驾驶的便利性让人无法抗拒，但有时生活中的低效行为反而会有着积极的影响，例如传统的交通工具能促进社交互动的发生；廉价高效的个人移动性也可能会产生一些副作用，“孤独”就是其中之一。根据美国人口统计局的调查，每四个美国人中就有一个独自居住，而且自称“感到孤独”的人群数量每年也在持续增长。为了解释孤独感上升的原因，人们提出了多种可能的理论，有的说是家庭结构
待学习
开始阅读
11
汽车和代码
请等一下，现在的汽车不是已经自动化了吗？如今即使一辆廉价的轿车上也会装载复杂的传感设备，而那些设备在十年前只有喷气式战斗机才能安装。今天，一辆普通的汽车用于管理刹车、定速巡航以及动力传输的微处理器也多达上百个。有的软件模块还能在行人突然出现时，或者车辆偏离路线向驾驶员发出报告。实际上，新一代的汽车平均都加载了500万到1000万条代码，这个数字十分惊人。但问
待学习
开始阅读
12
大动荡
如果汽车公司有能力制定向无人驾驶汽车发展的过渡进程，它们可能会偏爱一条十分缓慢的推进过程：第一个阶段是持续优化驾驶员辅助技术；第二个阶段是在少数高端车型上安装只在特定情境下使用的、自主能力有限的驾驶模块，这些模块大多只应用于高速公路行驶；第三个阶段是这些自主能力有限的模块向下渗透，应用于便宜的车型。德勤咨询公司认为这种渐进的过程所带来的增值也是缓慢递进的，
待学习
开始阅读
13
以人类为主导
在无人驾驶汽车领域，偏爱渐进变革方式的不只有汽车公司。美国运输部和汽车工程师学会（Society of Automotive Engineers，SAE）分别给出了各自对向全自动化驾驶演变的发展路线概要。虽然阶段划分上略微有差异，但是它们有着共同的前提：最好的发展路线要以一系列循序渐进的阶段推进——而不是谷歌式的直接跨越——即汽车搭载的“驾驶员辅助”软件只是
待学习
开始阅读
14
无人驾驶汽车的操作系统
迄今为止，还没有哪个机器操作系统敢宣称自身已经完全掌握了三大核心能力：实时反馈、99.999%的可靠性，以及超越人类水平的感知能力。工业机器人虽然有着实时反馈的精确性，然而却不具备人类水平的感知能力。引导民航客机的操作系统是可靠稳定的，但它们却又缺少应对新问题的能力。自动驾驶的客机之所以是一种安全的运输工具，那是因为相比繁忙的城市十字路口，天空上很少出现复杂
待学习
开始阅读
15
机器人研发的艺术
为了对研发智能化移动机器人的过程有更深入的了解，我们前往机器人研究的圣地——宾夕法尼亚州匹兹堡市的卡内基·梅隆大学（Carnegie Mellon University）。几十年来，卡内基·梅隆大学一直是机器人研究和自动驾驶汽车研究的最前沿阵地。威廉·“瑞德”·惠特克教授（Prof. William“Red”Whittaker）是机器人研究领域的传奇人物，
待学习
开始阅读
16
运动中的人工智能
CHIMP是个超强的移动机器人，可以达到奥林匹克运动员的水平。但可惜的是，这些先进的灾害应对机器人——即使如CHIMP这样精心打造的，也不经意间透露出人工智能研究过程中的拦路虎之一：把一台电脑的棋艺调教到世界大师水平是容易的，但教会一个机器人从一堆瓦砾中走过却要困难得多。机器人学家汉斯·莫拉维克（Hans Moravec）将这种看似简单任务自动化过程中遇到的
待学习
开始阅读
17
驾驶的控制权：混合人工智能
在工程学难题列表中，编写引导无人驾驶汽车的操作系统的难度应该介于CHIMP和自动拖拉机两者之间。无人驾驶汽车的操作系统横跨了两个存在差异的研究领域。其一是控制工程学（Controls Engineering），专门解决机械零部件协调运行的一个工程学分支；其二则是人工智能研究。控制工程学要处理复杂系统（如机器人的机械系统）的运行问题，这些系统要通过输入和输出
待学习
开始阅读
18
底层控制系统：加速、刹车和转向
无人驾驶汽车底层控制的核心工作是将系统稳定在最佳设定值上。反馈控制设备是一种广泛使用却又鲜为人知的判断性装置，通常用于调节引擎的燃油喷射、生产用机械的电压输入，甚至还可以用于调节房间内温度，使其准确地保持在恒温器设定的数值。反馈控制设备应用背后的逻辑支持就在于它的平衡观念：无论是机械设备、电子设备，还是生物体，一个系统需要尽可能维持在稳定均衡状态中。自从2
待学习
开始阅读
19
上层控制系统：路径规划和道路导航
只负责汽车基本运转的底层控制也许可以很快地完成任务，但上层控制系统的工作时间则要长得多，有时可能在整个出行的过程里都需要运行。如果将底层控制系统比喻为“条件反射活动”，那么上层控制系统就类似于“高级心智活动”，即传统上而言的“脑力活动”。上层控制系统的基础是路径规划和导航，而两者都需要通过搜索算法（Search Algorithms）的应用来实现。搜索算法
待学习
开始阅读
20
物体识别的挑战
中层控制软件需要指导无人驾驶汽车，穿行于具有无限可能性的复杂真实情景中。想要体会研发人员所面临的艰巨挑战，只需想象一下编写软件来指导汽车通过一个繁忙的十字路口是何感觉。既然软件应该与一个驾驶员保持相同的标准，那么它就必须遵守车辆管理局制定的一系列标准化交通规则。减速、准备停车、避让已经在十字路口或刚进入十字路口的机动车辆和行人。而且，还需避让排在前面的机动
待学习
开始阅读
21
中层控制系统
我们先来谈谈第一个模块，占据栅格。占据栅格是一种软件工具，针对汽车外部环境进行实时、持续更新的三维数字建模。类似于一个包含了数字记录的后端数据库，占据栅格是一个存储了汽车周围实体对象信息的数字存储库。它既可以与中层控制软件的其他模块相配合，也能作为程序员的视觉参照模型。流入占据栅格的数据，一些是源于已经存储的高清地图的静态数据，其他数据则来源于汽车视觉传感
待学习
开始阅读
22
绝对安全可靠
我们已经讨论过当前的技术瓶颈，操作系统目前仍难以做到完全的可靠性。此外，足够全面的法律标准也需要进一步定义并量化。很多人坚持认为，无人驾驶汽车只有达到100%完美的可靠性才能合法，那意味着没有发生任何碰撞、事故或失误。然而事实是，如果需要完美的可靠性，无人驾驶汽车将永远不会获得合法地位，因为没有任何操作系统能做到始终完美可靠。操作系统出错的概率很大，而且即
待学习
开始阅读
23
比人类驾驶安全两倍
随着存储知识库中驾驶情况的持续成倍增长，无人驾驶汽车将变得越来越能干。然而，为了获得整个社会和法律的认可，无人驾驶汽车仍需要一套透明的可靠性标准，一个定义明确的公共标准——规定了安全的和可接受的平均故障间隔距离。理想情况下，无人驾驶汽车的法规需要由制造企业将与政府合作，共同定义出无人驾驶汽车的平均故障间隔距离应该达到多少才是可接受的。在无人驾驶的新时代，平
待学习
开始阅读
24
黄金时代
为了鼓励汽车运输业的发展，1956年联邦政府通过了《联邦高速公路法案》（Federal Highway Act of 1956），开启了持续数十年的公路疯狂建设，并最终让美国各个城市、郊区以及乡村的格局面貌焕然一新。随着购车用户数量的急速上涨，数百万驾驶员奔向了这个国家新建的各个道路和高速公路。随着数万英里的道路铺设，横跨东西海岸的州际公路系统的完善，美国的
待学习
开始阅读
25
通用汽车的电子化高速公路
美国无线电公司（Radio Corporation of America, RCA）是20世纪50年代电子工业创新的发源地，通用汽车公司遂与之合作研发电子化高速公路。美国无线电公司雇用了当时著名的发明家弗拉基米尔·兹沃雷金（Vladimir Zworykin）——阴极射线管及自动化解决方案的开拓者，由其研发信号灯的管控系统。兹沃雷金很早就意识到高速增大的交通
待学习
开始阅读
26
自动化高速公路的衰亡
自动化高速公路的美梦最终破灭的主要原因之一就是成本。安装必备的电缆和路边控制系统是一项耗资巨大却又见效缓慢的工程，装配一条短小的测试跑道所需的成本还算合理，但是对于美国或欧洲那些横跨各州的浩大公路网系统而言，方案就显得不切实际了。即使在20世纪60年代，政府划拨了大量的公路建设预算，但考虑到埋设线缆、晶体管以及其他电子设备组成的这一套脆弱的基础设施，想要装配
待学习
开始阅读
27
V2X技术
美国联邦交通运输机构关于V2X的倡议，目标在于创建无线交通基础设施网，连接每辆汽车。它们通过路边传输器共享数据，从而减少事故，挽救生命。V2X研究利用的是由联邦运输委员会（FCC）监管的专用短程通信技术网络（DSRC）的部分储备带宽。负责V2X计划的机构是美国交通运输部的一个主管部门——美国高速公路安全协会（NHTSA）。通常情况下，当我觉得研究会议无聊时
待学习
开始阅读
28
智能交通系统的历史
早在20世纪80年代，信息技术重塑了整个工业格局。1986年，为了解决美国日益增长的交通和汽车尾气问题，加州交通局联手加州大学，共同探索信息通信技术在汽车与高速公路的应用，帮助人们提升驾驶效率。这次合作最终促成了一个名为“先进技术与高速公路（Program on Advanced Technology and Highways，PATH）”的全国项目。很快地
待学习
开始阅读
29
关于V2X的反思
联邦交通运输局拥有资源和立法权，能对无人驾驶汽车给予支持，这样每年能挽救成百上千个生命。2013年，美国高速公路安全协会朝全自动化的道路迈出了蹒跚的一步，并对外发布了详细报告。报告中列出了自动驾驶发展的几个理论阶段。这是一个良好的开端，接下来长路漫漫仍需努力。尽管事实表明，在过去的十年，人工智能的发射器在软件和硬件层面都取得重大发展，这让无人驾驶汽车技术日
待学习
开始阅读
30
非智能高速公路的价值
或许是由于近几十年间，联邦政府和私营部门的资金不断投入到智能高速公路系统领域，很多人觉得无人驾驶汽车上路，需要对高速公路基础设施进行大规模的投资。直到2014年时，沃尔沃公司还提议把磁铁嵌入公路，以便无人驾驶汽车可以在雾中辨识道路。至此，改进高速公路基础设施的建议势在必行。就连那些资深的计算机程序员也十分渴望，设想着若是能实现条形码在公路上的应用，或是把射频
待学习
开始阅读
31
修订交通运输政策
十几年前那场轰动一时的“Demo 97”活动后，美国交通运输部与其下属机构高速公路安全协会和联邦公路管理局喜欢以消极被动的态度发展无人驾驶汽车，置身事外看看是否有行业或哪个州愿意承接这个项目。部分联邦官员认同某些保守的做法，例如对信息与通信技术的发展不予评价。然而，无人驾驶汽车的技术发展日新月异，使得当局再也没有借口仅局限在V2X研究上。同时，也有一些令人
待学习
开始阅读
32
机器学习和无人驾驶
斯坦福大学教授塞巴斯蒂安·特伦（Sebastian Thrun）带领那支研发出“史丹利”的冠军团队，对赛前准备有着不同于对手的思考。首先，他意识到是汽车软件，而不是硬件决定比赛胜负。其次，是对中级控制系统软件的研发。考虑到汽车引导软件中“识别”和“响应”两大功能的重要地位，他们摒弃了当时盛行的中规中矩的基于规则的人工智能软件。在项目初期，他们也曾尝试去写一套
待学习
开始阅读
33
西洋跳棋
有人指出2007年是现代全自动汽车的诞生元年。事实上，现代无人驾驶汽车的出现分为不同阶段。早在2004年、2005年举办的前两届比赛中，无人驾驶技术的表现就开始渐入佳境了。到了2007年的第三届比赛，参赛者不仅受益于之前的大赛经验，帮助提升比赛成绩的还有硬件技术的迅猛发展、以机器学习为代表的人工智能软件的重大突破。 Stack Overflow是一个著名的I
待学习
开始阅读
34
无限状态空间
尽管机器人研究专家使用机器学习技术长达几十年，可这些机器人一直在高度结构化的环境当中运作。机器学习在棋类比赛中运作得非常好，这是因为棋盘是个有限的状态空间，所能产生的下棋方法数量是有限的。塞缪尔的计算机下棋程序通过在数据库中的查找功能，使数据一一对应上棋盘的具体位置。每一个棋面布局都特征鲜明，定义清晰，因此容易进行数据存储。下国际象棋比西洋跳棋的难度要高，
待学习
开始阅读
35
现代工具箱
“重组创新（Recombinant Innovation）”指的是用创新的方式，把现行的几项技术组合起来的过程。尽管人们总觉得像无人驾驶这样的新兴技术（尤其是看起来非常复杂的技术）是孤僻的天才发明家用新奇的方式凭空创造的，但实际上它是重组创新的最佳案例。重组创新是摩尔定律间接衍生而来的副产品，这条著名定律的内容是半导体材料的性能增长是呈指数型的，同时成本的
待学习
开始阅读
36
高清数字地图
高清地图的精确度区别于标准数字地图。高清地图既能反映大型地理特征，像是高山湖泊，也能反应诸如树木和人行道的分布等微观地形细部。应用在无人驾驶汽车领域的高清地图，重点呈现的是道路或十字路口的表层静态数据，比如车道线、路口交叉点、施工地段以及道路标志。图8.1 覆盖着传感器数据的十字路口高清地图来源：HERE地图为人类肉眼设计的传统地图是二维图形成像，用静
待学习
开始阅读
37
数码相机
数码相机借鉴了哺乳动物眼睛的一些概念。硅传感器在某种程度上与视网膜相似：两者的视觉数据都被拆分成几个小的视觉单位进行处理。视网膜上有数百万的生理感光细胞：视杆和视锥，吸收光子并把光能转化成神经信号，传输给大脑处理视觉信息。人眼内的视杆细胞和视锥细胞是不规则排列的，视网膜中部排列密集，边缘部分较为稀疏。而在数码相机里的硅传感器，每个像素在一定间距内呈矩形排列。
待学习
开始阅读
38
光检测与测距（激光雷达）
除了数码相机之外，另一类主流的传感器就是激光雷达，全称是“光检测与测距（light detection and ranging）”，亦称“激光雷达（Lidar）”。数码相机的工作原理是把三维视觉空间拆分为二维像素矩阵。激光雷达设备则不同，它向周围散射出强烈的脉冲激光，测算出光束反射回来所用的时间，然后根据激光测距原理计算出周围环境的三维数字模型。和数码相机
待学习
开始阅读
39
无线电检测与测距（雷达）
除了激光雷达和数码相机，无人驾驶汽车还使用普通雷达（Radar）来识别周围环境。数码相机在像素网格里捕捉场景，激光雷达传感器则类似一罐“数码喷漆”，让原本无形的物体披上“数字化外衣”。然而雷达传感器的工作方式就像往池塘里扔下一块小石子，追随水面漾起的圈圈涟漪跳跃的方向。雷达原本应用服务于军事领域，在二战期间，雷达发射塔建在海滩、田地里，用于侦测敌军的飞机、
待学习
开始阅读
40
超声波传感器（声呐）
如果把激光雷达和数码相机比作一个人的眼睛，超声波传感器就是人的耳朵。超声传感器可谓雷达的近亲——像雷达一样，发射波形信号，检测回波——不过超声波传感器发射的是超声波，不同于雷达的电磁波。超声波传感器根据物体反射回来的时间、频率、声波形状来监测位置和速度。超声波传感器一般分为两个部分：发送器和接收感应器。发送器产生振动频率高于20kHz的机械波，高于人耳能听
待学习
开始阅读
41
全球定位系统（GPS）
虽然数字地图和各式雷达传感器在无人驾驶方面扮演着极其重要的角色，可是除了这两者以外，还有一项更为关键的技术——GPS全球定位系统。这个系统负责统筹和整合信息，并在高清数字地图上为汽车提供最终的精确定位。 GPS是一项已经面世长达数十年的技术，最初用于军事领域；发展遵循摩尔定律，后来发展成为稳定可靠的、低成本的消费应用品。几十年前，GPS的接收器像冰箱一样庞大
待学习
开始阅读
42
内置的耳朵（IMU惯性测量单元）
GPS的失误会造成灾难性的后果。卫星感知的缺失这个潜在的致命难题的解决方案是另一种军事技术的产物——惯性测量单元。这种装置有两种重要功能：它能弥补GPS的不准确计算；它还是无人驾驶汽车的“内置耳朵”，能够感应，也就是决定该走哪条路。惯性测量单元是一种多用途多功能的设备，它配有加速感应和定位感应，能记录汽车行驶的轨迹，从而也能看出诸如左右轮胎高度是否一致等问
待学习
开始阅读
43
线控技术（Drive by Wire）
数码相机、激光雷达、普通雷达、超声波传感器和惯性测量单元等一众传感装置为无人驾驶提供稳定的数据流。数据流融合后，汽车的操作系统顺利进行数据处理，奇迹就这么发生了。正如我们在前几章提到的，汽车操作系统使用好几种人工智能技术来快速做出指令。最后一步就是把这些指令转换成实际操作，像是转动方向盘、踩下刹车或油门。在以前，工程师把普通汽车改装成为无人驾驶汽车，是通过
待学习
开始阅读
44
其他设备
另外，汽车现存的某些明显“弱点”，实际上是有意这样设计的。大部分的汽车都有个实体连接器，叫作车载诊断系统（on-board diagnostics, OBD），当车辆检测人员把设备插入OBD插口时，便能诊断汽车出了什么机械问题。OBD插口一般隐藏在驾驶杆附近，汽车厂商将OBD插座设计在驾驶室内，是为了确保这个插座的安全，这样设计，意味着只有拿到车钥匙的人才能
待学习
开始阅读
45
神经网络
神经元细胞传递信号是一个电化学反应的过程。一个神经元细胞包含一个细胞体，负责接收信号，信号从其他神经元发出后要经过许多细小的树突（Dendrites）。当神经元细胞体接收到另一个神经元传过来的信号，信号会沿着一根长长的附属线路，类似蒲公英根茎的形状，它叫轴突（Axon）。神经轴突把一个信号传输给另一个。与其他细胞之间的连接点就叫作突触（Synaptic）。当
待学习
开始阅读
46
感知器
该感知器由六个机架构成，机架内装载着电子设备。每层机架相当于生物视觉感知系统中一个理论层，由上百个节点组成，最终达到了每个机架排列8个神经元。发展到今天，现代深度学习网络已经包含超过150层的人工神经元细胞，相互连接的节点有将近10亿个。这项伟大的创举实现了高速、强大的计算机和复杂的培训算法。从生物学范畴来说，神经元细胞传输能力的强弱是由神经递质的集中程度
待学习
开始阅读
47
第一次人工智能冬天
如果人工智能这一全新领域有越来越多的研究人员遵循罗森布拉特的方法，我们也许能早几十年在自动感知领域取得成功。然而，取得良好的开端后不久，感知器便失去了光环。原因之一是训练神经网络所需要的计算能力和传感数据仍然不足。原因之二是人为问题——政治反对。在罗森布拉特和感知器的故乡伊萨卡（Ithaca），冬季黑暗和漫长。然而，没有一个伊萨卡冬天能比得上罗森布拉特取得
待学习
开始阅读
48
神经网络研究的复兴
符号型人工智能高速发展的同时，神经网络研究仍旧在艰难起步。到如今，“感知器”已经演变为神经网络中某一层神经元的通称。有趣的是，模拟硬件装置的命运与原始的感知器相似，已经被搁置一边。人工智能专家专注于在软件里打造神经网络。 1975年，哈佛博士生保罗·韦伯斯（Paul Werbos）发明了一种新型、改良的感知器。韦伯斯为推进人工神经网络的发展做出了两项重要的贡
待学习
开始阅读
49
神经认知机
在神经网络的发展历史上还有另一段畸形扭曲、颇具讽刺意味的传奇故事。它发生在20世纪90年代短暂而风光一时的人工智能研究复兴之前，80年代的一款神经网络模型实际上解决了不变量表示的老大难问题。在详细讲述该神经元网络的学术文章刊出以后，引起了许多神经网络研究“顽固对头”的关注。 1980年，日本科学家邦彦福岛（Kunihiko Fukushima）提出了一种新型
待学习
开始阅读
50
深度学习的诞生
如同新生儿，机器通过接触大量的信息进行学习，即数据密集型办法。在训练算法中，所需的数据数量通常与问题的难度成正比。相比之下，教会一台机器辨别三角形与正方形，比教一台机器成功辨别男性与女性要简单得多。罗森布拉特的感知器只需要调整512处节点的权重，所以用于培训的图片数量相对较少。大型的神经网络（无论深层与否）都包含上百万的连接，因此需要上百万张训练图片。如果
待学习
开始阅读
51
绘图处理器（GPUs）
我们已经对高速计算机、大数据、数字相机和多层人工神经网络等主题进行讨论。还有一项更为重要的技术即将映入眼帘：高速独立显卡。它之所以重要的原因在于神经网络对于计算能力的要求极高。早先，优质的独立显卡资源掌握在游戏界手里。游戏行业有时会遭遇某些保守的成见——“游戏会使青年人沉溺其中，浪费时光，毫无创造性”，然而事实上游戏行业却是创新的主要来源，尤其在图片处理方
待学习
开始阅读
52
现代深度学习
比赛规则如下：参赛者向大赛管理方监管的服务器提交图片识别软件。根据要求，软件将会处理十万张新图片。由于图片随机排列，呈现的物品分散，软件将需通过编程和算法，对每张图片上五种识别出的物品进行命名。 ImageNet竞赛分为三项：图像分类、分类定位、检测。分类项目旨在测试计算机算法能否将图片正确分类并标上恰当的标记；分类定位项目用于评估对已标记图片以及图片上的物
待学习
开始阅读
53
神经网络内部
有几种不同类型的网络用于图像识别，每个网络都有自己的自测工具，并通过应用独特的改进算法提升训练的精度。深度学习是快速发展的领域，几乎每周都会推出新的结构和算法。然而，一个共同的特点是深度学习网络使用串联式多层人工神经元，从经过软件识别与标上标记的数字图片中捕捉图片特征。先进的深度学习网络拥有超过100层的人工神经网络（对比罗森布拉特的感知器只有单层神经网络，
待学习
开始阅读
54
新型边缘检测
分析深度学习网络的识别行为的一个方法，是把人工神经元逐个分开，用某种特定模式来测试它们的反应。进行这项实验的研究专家发现，在深度学习网络识别视觉信息的过程中，人工神经元细胞在网络中的位置越深（越靠近输出层），识别抽象模式的能力越强。相反地，神经元细胞越靠近表层网络，识别出的物体越简单。 1959年，有一次有趣的生物学实验中，生物学家大卫·休伯尔（David
待学习
开始阅读
55
机器人的自我管理
深度学习软件应用在驾驶上产生了一种妙不可言的边际效应。导航软件一开始效率不高，不过只要达到某个临界点之后，导航软件的性能就会持续加速提升。换言之，无人驾驶系统收集的数据越多，它们的驾驶技术就越高明。总结这种良性循环，我们会发现这与机器学习软件的训练数据多少有关。消耗的数据越多，软件的性能就越好，从而推动系统越发积极采集数据。该良性循环是这样展开的：起初，需
待学习
开始阅读
56
预测交通情况
当无人驾驶汽车进一步地开展其地图业务，它们的位置、速度和选择路径会生成非常实用的副产品：交通数据。今天我们使用路径规划软件来提供有限的导航来避开交通拥挤。几乎每个人手机上都有一款APP是用来指导我们到达特定的目的地，这些APP较为先进的版本会把交通信息也加入到运算当中。无人驾驶汽车将包含复杂的交通预测软件，它使用机器学习软件从实时以及历史交通数据中学习。经
待学习
开始阅读
57
个人隐私
然而无人驾驶汽车将面临较为特别的隐私问题。车子是移动的，一旦被装配上高分辨率的视频摄像头，外加远超人类的感知与识别能力，汽车可能成为“机器人间谍”。滥用这种能力的可能性很高。车子能拍下乘客或路边行人的照片，进而传输给人脸识别系统软件。软件能将收集来的人脸数据传递给政府。危险性降低了，但烦恼却增多了。当各大公司的市场部急需人们的衣着、出行方式和其他习惯的数据，
待学习
开始阅读
58
道德伦理规范
数据隐私与安全性是由无人驾驶汽车产生的、引起重视的道德挑战，另一个道德挑战是汽车对紧急情况的回应。当面对突发意外，无人驾驶汽车使用数据和软件，而不是人类的直觉，来计算出最佳处理方法。为了赋予车辆合宜的反应能力，程序员艰难地通过量化数值的途径来保障生命财产。当通过系统软件开车时，人类司机不再需要在车祸发生瞬间，作出“留存哪方性命”的选择。这时经过程序员的提前
待学习
开始阅读
59
工作岗位
首当其冲的是货车驾驶。这份稳定、高薪的蓝领工作曾大幅抵御了离岸外包和自动化技术的冲击。根据2010年全美普查数据，美国有将近350万名货车司机。数据显示，货车司机是29种最常见的职业之一。如果无人货车得到推广，用不了几年，自动化技术就将在货运行业占据一席之地。图11.2 货车司机成为2014年美国绝大部分州最常见的职业来源：美国国家公共广播（NPR）货
待学习
开始阅读
60
交通事故带来的工作收入
有一句古老的英语谚语说，一个人的收获来自另一个人的损失。这样看起来，无人驾驶汽车能够挽救生命、节省燃料和时间，那么受损失的就是部分商业模式与交通事故相关的企业。这类行业的范围很广，从汽车保险到个人伤害维权的律师，从实体店到零件供应商，从高速公路的巡查人员到预防性驾驶课的老师，从器官捐赠机构到急救室医护人员，从交通法庭到监狱…… 美国人每年因交通事故住院的时间
待学习
开始阅读
61
新型车身
我们预计，无人驾驶汽车的里里外外看起来都会和现在的汽车不一样。方向盘会消失；仪表盘将变成灵活的工作区间；车厢中将配备人们休闲娱乐所需要的设备；车子外部不再需要侧镜或尾灯。正如我们在第二章所讲的，未来汽车行业将划分为两大类：制造实用标准化运输工具的公司和特殊顾客用途车辆的制造商。特殊顾客用途包括一人小型车辆到能在车内休息或工作的大型豪华车辆。大部分的车辆都会
待学习
开始阅读
62
新的市场
商家用返还或打折的手段提升顾客体验的做法并不新鲜，每天人们都能在免费网站上阅读到各种在线广告。我们中的大部分人已经接受了这种“免费”的交易，我们默许商家往电子邮箱和文本信息中投放各种广告，以换取免费使用的邮箱和平价的电话服务。无人驾驶汽车的乘客也会对这些条款讨价还价争取自己的权利。精明的乘客知道该如何用减免车费，或是为自己的车辆换取更便宜的油费作为筹码来交
待学习
开始阅读
63
新型的零售业
精心规划顾客路线的餐馆和企业将会从无人驾驶汽车中受益良多。另一个即将发生改变的行业是零售业。这个行业在上个世纪已经经历好几次转型，导致转型的影响因素首先是规模化生产，接着是大购物中心的出现，再接下来是折扣店，最近的一次是网络商店。无人驾驶汽车将会引发零售行业的最后一次变革。在古代，珍贵的香料经由骆驼从中东运输至欧洲；今天，油罐车运送到世界各地的港口，在那里
待学习
开始阅读
64
犯罪与（成人）娱乐
任何对一项新技术的完整分析都不能回避其阴暗面——犯罪活动。计算机容易被用作盗窃数据和入侵自动银行系统窃取身份等的犯罪工具，无人驾驶汽车同样也吸引了跃跃欲试的罪犯将其应用在高科技犯罪中。有些黑客会把他们的才能用于窃取和损害无人驾驶车辆的数据，包括传感器、数字地图和操作系统的数据；另一类型的攻击是劫持机器人，或是当无人驾驶汽车停在十字路口的时候，走到车前劫持车
待学习
开始阅读
65
未来之路
未来前景如何？机器人技术已发展到了重要的转折点，无人驾驶汽车如期成了安全实用的运输方式。我有时候在想，如何向下一代解释，驾驶汽车曾经是成年与自由的象征。当我向他们讲述高中时期的我和同学们曾经用一个学期的时间来学习驾驶技术，我能想象出他们的脸上写满不屑和难以置信的神情。我期待着有一天，虽然我们都老去，却仍然记得亲自驾驶车辆的感觉。就像文字处理器通用的今天，人
待学习
开始阅读
66
机器人的进化
确实，当我们进行机器人进化实验时，整个过程非常不稳定。进化机器人学说（Evolutionary Robotics）是机器人研究领域的一个分支。该学说应用于好几代机器人的变异和选择，刺激了计算机朝“达尔文理论”的进化特点发展。在实验中，我们让计算机随机地把机器人零部件（机械关节、刚性构件、发动机、电线和神经元）放在一起制造虚拟机。然后对计算机编程，使其快递选择
待学习
开始阅读
67
传感器王后
实验中，机器人的人为进化最终得出满足的结果，然而生物界进化过程却鲜有规律。寒武纪大爆发的成因到今天依然是个未解之谜。有人把这史前出现的多样性形成原因，归为多细胞生物发现成果的一部分。也有人认为，这是因为氧气等资源丰富、地球的生物宜居性提高，或者在物种大灭绝后出现的适应辐射的后果。还有人认为，原因部分来自于某些“使能技术”的“发现”，从而产生了许多之前没有的新
待学习
开始阅读
68
幂次增长之王——算法
人们往往倾向于留意到计算、交互、传感方面的机器人硬件技术的飞速进步，但我们常常遗忘是哪些发现带来了这些进步及其背后的新算法技术的发明。在计算机科学家和电子工程师中流传着一种说法，无论硬件工程师取得了什么样的进步，软件工程师是都能马上“废了”它们（原本程序员的说法用词太过激烈，不适合写在书里）。我们都知道无论计算机的硬件性能变得多快，操作系统软件却总是运行太
待学习
开始阅读
69
算法的进步大量涌现
我们不知道眼睛在大脑的发展过程中起了何种促进作用，但我们知道智力的作用远远超过视觉皮层细胞，从识别捕食者和猎物、寻找配偶，到今天阅读本书时用到的充分交互与自我认识能力。我们知道深度学习算法从最初的为视觉感知服务，到今天成功应用到许多人工智能领域，例如语音识别到语言产生再到艺术创作。我们推测这股发展趋势仍将继续。发展趋势将持续多久？何时结束？这些都是科幻作家
待学习
开始阅读
70
致谢
几年的时间里，我们与众多相关人士进行了很多激动人心的、发人深思的讨论，最终才形成了这本系统性介绍的书籍。我们要特别感谢所有在本书成书过程中伸出援手的人，他们提供的任何形式的帮助都有巨大作用。我们想要感谢在自动驾驶汽车研究领域长期作出突出贡献的两位学者，他们是奇点大学的布拉德·邓普顿（Brad Templeton）和普林斯顿大学的阿兰·肯豪森（Alain K
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

机器司机

在不远的将来，全球汽车博物馆里展览的汽车，都会变成21世纪初之前的那些光鲜靓丽的车型。就像历史的痴迷者来到一个历史遗迹后，会闪身钻入精心保存下来的中世纪小屋回廊里，参观博物馆的人也会钻进这些展览车辆的前排座椅里。这些参观者坐在方向盘后面，拨弄着内置GPS的显示器屏幕，游戏似的用他们的脚踩动着刹车，这一切恐怕会让体验者不禁感叹，21世纪初的人类竟然会用如此不便甚至危险的交通方式。

我们当前的汽车是非智能的。它有四个轮子、一个金属机身和一个气动发动机，这样一套标准化的自动系统“平台”，自100年前被引入后就从没有发生过任何本质性改进。而在这100年间，随着越来越多的智能软件，几乎无处不在的通信网络，以及体型不断缩小、价格逐年下降的强大而准确的硬件传感器兴起，世界上其他产业的根基都在发生着根本性的变革。得益于机器人技术和人工智能软件在近期取得的成就，非智能汽车的时代终将结束。普通平凡的汽车即将发展进化成自动化的移动机器人。

在近一个世纪的时间里，由人类驾驶的汽车已经改变了我们的生活。这种无需马匹拉动的“自动”车厢的出现，已经改变了“行走之城”的城市格局。曾经如蜂巢一般，由各种小而弯曲的小巷、庭院、商铺、公共广场交织而成的城市演变成了“汽车之城”，打造出了由广阔街道和停车场组成的整齐的大网格。汽车不仅给人们带来了自由，同时也带来了新的工作机会和社交机会。汽车也给商业贸易带来了便利，商人可以快速地将产品运输到以前从未到达过的市场。

然而，如此宝贵的个人移动便捷性也让人类付出了极高的代价。在近百年的进程中，交通事故已经夺去了数百万人的生命。当汽车赋予人们开车到远方工作的自由时，也催生了一种新的问题——城市交通拥堵。今天，世界上所有城市的人们每天都要出行、上班通勤，或者通过汽车运送货物，这使得城市上方的空气层恶化成一个黄色烟雾似的“油斗篷”。

粗略估计，目前全球有十亿辆由人类驾驶的汽车在陆地上漫游。对汽车的依赖已经使我们在很多方面付出了高昂代价。但归根结底，对于世界上的大多数人而言，汽车仍是目前个人出行中最快速、最廉价、最舒适的方式。不管怎样，汽车仍将是我们现代生活中不可缺少的一部分。

事实上，解决汽车引发系列问题的最好方式就是让它们变得更智能。当人类驾驶者让智能软件接管方向盘的时候，无人驾驶汽车将为全世界数十亿人提供一种更安全、更简洁，甚至更方便的出行方式。在未来的十年，自动驾驶汽车将出现在全世界的大街小巷，它将再次重新编排我们的居住环境以及工作娱乐环境。

不相信？这也难怪。

近百年来，各行各业的专家都在预测人类的霸主地位将会被智能机器所取代。但到目前为止，这些预测仅仅在一些高度细分化的工业岗位上成真了，或者是仅限于虚拟世界中的活动。例如，机械手臂可以完美无瑕地取代曾经由工厂工人实现的操作；在虚拟世界里，人工智能软件的能力已经超越了人类，它们可以玩棋类游戏，可以迅速地进行股票证券交易，或者在复杂的大运量公共客运系统中找出最优路线。

现代化的软件极大提升了人工智能的能力，先进的机器人还可以执行诸多技巧性的工作，这些都已成为现实。但是如果机器人的身体并非由螺栓插销固定，而是由仿人类的机械躯干组成，使其能在运动过程中与周边环境互动，那么即使是当前最先进的人工智能软件系统也无法顺利地承载这项复杂的管理任务。在后面的章节中，我们会陆续探讨相关的原因，但目前来看，今天那些能够移动的机器人，在身体敏捷性和感知能力上也就相当于蟑螂的水平——或者状态良好的话，可以达到蟾蜍水平。

当机器人学家还在研究移动化智能机器人的道路上步履维艰时，建造一辆踏实可靠的无人驾驶汽车从技术上而言已经触手可及，这同样也是工程学上的一项壮举。因为对于程序员为人工智能写代码操作运动过程来说，汽车相比其他形式的移动化机器人有一个巨大的优势——滚动要比行走或爬行简单得多。

如果人工机器人具备多个肢体部件，那么管理其动作快速运行的软件从体量和复杂性上都要比智能汽车大得多，因为多肢体部件可以演化出数量近乎无限大的不同动作模式和相对位置。相反，一辆汽车的四个轮子、刹车以及方向盘组合出的运动模式几乎全部是可预测的。引导无人驾驶运动的软件所管控的动作组合数量必然相当少，例如多半只是车轮的左右转动，或者监控汽车是在减速还是加速。

驾驶行为可以自动化的第二个原因在于，开车是一个相对刻板重复的反应式活动，无论智力高低都能拿到驾照，因此无人驾驶的智能只需满足以下条件就够了：对清晰可见的路面危险——比如不断靠近的路面坑洼或者缓慢行走的成群结队小学生——做到即时反应，沿着清晰明了的道路或高速行驶，并且遵守相对简单的交通规则。

说到这儿，怀疑论者就会指出这背后一定另有故事。的确，如果只是简单地编辑程序让四个轮子的机器人遵守道路交通规则，那么无人驾驶在几十年前就早已普及了。汽车为什么直到现在才有可能变得智能自动化呢？源于两个原因：

第一是现实因素，也就是它的门槛很高。汽车毕竟是行驶在公共街道上的重达两吨的“铁盒子”。如果引导无人驾驶的软件出现了问题，后果将不堪设想。“人命关天”，这也就解释了为什么今天的第一批自动驾驶车辆会先在人烟稀少的地方使用，因为车辆如果在这种地方出问题、偏离既定的路线，所造成的人员伤亡是最小的。例如，在偏僻的澳大利亚北部矿石公司使用巨大的自动化驾驶卡车来运载矿石；农民使用自动驾驶的拖拉机、联合收割机在广袤而无人的农地里耕作；在配送中心和工厂里，专门的自动化车辆会将货物从房间的一侧运到另一侧；在度假村或机场，名为纳维亚的无人驾驶穿梭车会以既定每小时15英里的速度沿着固定路线往返运送乘客……

制约无人驾驶发展的第二个难点及关键点就是纯粹的技术问题。虽然在99%的时间里，驾驶过程都是思维僵化而且可预测的，但是仍有1%的时间里会产生突发事件。生物有机体会依赖所谓的“本能（Simple）”来应对生活中突发的未知事件。是“本能”，使人类可以在交通的高峰时段自由驾驶，也正是“本能”，蕴含了人类智能中尤为难以复制的大量能力。

机器人学家对这种只在1%的时间内才发生的突发性小概率事件赋予了专门的名称——“极端事件（Corner Cases）”。极端事件并不常见，也难以预测，却可能导致灾难性后果。机器人的人工“本能”在处理极端事件时的效果最终决定了它的可靠性与价值。如果一个机器人的软件无法处理它所遇到的每一个极端事件，那么希望人们不会放任它独自行动，否则最坏的情况就是机器人无法完成交代的任务并造成了严重的破坏。

驾驶也许是最为重复刻板的活动，但同时也充满了数不尽的、潜在的致命性极端事件。管理无人驾驶的软件必须能够本能性对突发情况做出反应，例如跳上汽车引擎盖的鹿，或者向汽车挡风玻璃上喷漆的愤怒乞丐，这些都有可能发生——还要祈祷乘客会为挡风玻璃上的污渍付清洁费——所以，尽管投入了几十年的努力，自动化工程师和机器人专家还是无法编写出一个有效的软件，处理无人驾驶在道路上可能遇到的无数种突发状况。

机器人技术中一条基本的规则就是，环境越是简单、越是容易预测（极端事件越少），构建一个使机器人在这种环境下执行任务的软件就越简单。机器人能在工厂里广泛普及是因为大多数工厂都是一个封闭的世界、一个高度结构化的环境，在那里极端事件是能够预测的，而且会被工业工程师小心地排除。在封闭的环境中，机器人的工作职能会围绕特定任务进行设计。工厂里的机器人知道将会发生什么。指导它们运行的软件会引导机器人进行一系列一成不变的活动，例如冲压金属部件、固定螺栓，或者将箱子从一侧拉到另一侧。

虽然在工厂里可以设计一个整齐划一的封闭式环境，然而在实际环境中，街道和高速公路上是复杂混乱且难以预测的。汽车方向盘后的每个司机不仅要处理新的突发情况，还必须应对其他相关挑战，这些挑战是软件程序难以处理的，由模糊的或者高度情境化的行为规则调控的信息交互问题。人工智能软件尤其会在对安全驾驶有重要影响的两类活动中出现问题，即复杂的非语言信息沟通，和在多种情境中对同一物品进行持续正确识别。

驾驶行为要求司机和行人之间进行复杂的“社交”活动。当人类司机位于方向盘后面时，通常会参与到一场非语言的“社交芭蕾舞剧”中，并用点头、挥手、眼神交流来传达他们的意图。挥手和微笑对于人类而言可能是简单的，但是想要编写一套软件来识别人类的面部表情、身体语言并做出恰当的回应，则异常困难。

无人驾驶汽车，这一移动版机器人不仅在识别复杂的非言语交流上存在困难，当需要应对突发事件时，它们的计算机智能也会捉襟见肘。这些问题均是由知觉缺陷导致的，即它们不具备对所见事物进行感知区分并合理应对的能力。理想情况下，计算机科学家会通过编写一套程序来解决这个问题，为汽车提供一致性、准确的人工意识和情境理解能力。然而直到目前为止，这个问题还没有被解决，这样的软件还没有做出来。自从人工智能领域开辟半个多世纪以来，计算机科学家和机器学家为了实现“知觉”这一神秘技艺的自动化已经尝试了各种方法，但均未能取得突破性进展。

生物有机体的知觉系统包含了一系列广泛的能力。知觉中的一个方面就包含认知识别功能，人或动物因此具有“读取”复杂情境的能力，并知道如何正确地反应。知觉的另一个功能就是加工处理视觉信息。生命体具有高度发达的视觉系统，可以良好地识别一个物体，甚至是从不同的角度、在不同的光线条件以及不熟悉的情境中都可以准确识别同一个物体。

视觉感知需要对视觉信息进行正确识别并进行归类，人类在进行这样的过程时，纯粹依靠本能，而且几乎能够做到完美无误。然而，我们这种感知所见事物的能力似乎拒绝被自动化。几十年来，机器视觉领域的研究者一直在努力研发能够快速而准确地“理解”环境中视觉信息的软件，但均以失败告终。

在机器人发展史的大部分进程里，它们都难以处理视觉信息。工业机器人应对这一缺点的方式就是在全封闭、黑暗无光的工厂环境中纯机械化地辛勤工作。而对于那些工作中涉及某些视觉活动的机器人，它们的工作方式则被设定为绝不去分类或检查它们不熟悉的事物。

阻碍机器视觉软件发展的另一因素就是计算能力的不足。由于处理图像是一项数据密集型活动，所以第一代机器视觉系统只能采取一种结构化路径的方式来实现这一流程，即用一系列“规则”来解析视觉信息。这些早期机器视觉系统的工作原理是想尝试将识别的物体与机器人内部储存的已知物体小型样例库做匹配，但显然这是一个缓慢、不准确也不灵活的过程。

早期机器视觉软件的最大缺陷之一，就是它们在应对新鲜事物或情境时表现不佳。即便是很熟悉的物体，只要在略微不同的场景中出现，任何借助这类软件引导的机器人（或汽车）都无法进行准确识别。鉴于准确识别邻近物体这一能力对于安全驾驶至关重要，机器视觉软件的差劲表现数十年来一直阻碍着无人驾驶汽车的发展。然而，最近在人工智能领域的一项突破进展可能会彻底改变这一切。

在人工智能研究领域原地踏步多年之后，一种被称为“深度学习（Deep Learning）”的新型软件于2012年诞生了，它可以对随机的数千个数码图像信息进行准确分类，并达到人类水平的精准度。虽然对随机物体的图像进行准确分类的能力听起来无足轻重，但这一能力的确是人工知觉（Artificial Perception）的基础。一旦某个物体可以被精准识别，它的信息会被“转化”给其他类型的人工智能软件，而那些软件就可以发挥其传统优势：利用统计分析或某种逻辑、规则推导出最佳反应。

深度学习软件对于无人驾驶如此有价值，就是因为它可以在开阔公路这种非结构化的环境中充分发挥作用。深度学习隶属于“机器学习（Machine Learning）”这一类人工智能软件。这类软件的突破创新并非由人类程序员来设计，机器学习软件并不会去建立一个现实世界的模型，再用正常的逻辑和规则来处理其中的问题，相反机器是通过大量的训练数据后被“喂养”出来的。例如，为了开发无人驾驶所用的深度学习软件，程序员每天会用几千兆字节（Gigabyte，即GB）的原始视觉素材来“喂养”这个软件，而这些视觉素材都是通过车载摄像头在真实道路环境下的行驶中拍摄收集的。

深度学习软件通过观察世界来“学习”，这一点赋予了它另一巨大优势——不依赖规则（not rule-bound）。人类的婴儿学会依照物体的突出可识别性特征来识别物体，同理，深度学习软件在对物体分类时也是依据物体的视觉特征。使用规则依赖的传统途径编制的软件，遇到坐在自行车上的猫的图片时，就会陷入困惑。相反，深度学习软件会关注猫身上可供识别的视觉特征——尖耳朵和尾巴，然后不管这只猫是出现在一个多么奇怪的情境中，软件都会迅速而准确地推测出它只是一只猫。

深度学习软件已经彻底改进了对人工知觉的研究，并极其成功地应用到语言识别领域，以及其他需要软件来处理古怪异常信息的活动中。过去的几年里，为了寻求深度学习的专业技术支持，很多汽车公司都在硅谷设立了分部。谷歌和百度这些软件巨头本身已经具备了管理巨量信息和构建智能软件的能力，再加上深度学习领域的专业优势，足以支撑它们与曾经不可一世的汽车巨头在无人驾驶领域展开角逐。

深度学习对于人工智能领域的影响极其深远，甚至在我们写作本书时，其影响还在逐步拓展，而且未来几年可能会持续扩大。深度学习所引领的技术领域并不只是汽车一隅。我们预计，深度学习将会对移动类机器人的总体发展轨迹产生变革性影响。当机器人获得了通过视觉理解周遭环境的能力时，人工生命形态的发展可能会开始延续5亿多年前有机体生命发展的路径——化石显示大约在寒武纪以前，所有形态的有机体生命都是近乎眼盲的。当5亿多年前寒武纪开启时，那些近乎眼盲的有机体突然神秘地演化出了复杂的新型视觉系统，要知道先前它们的“眼睛”只是些光感性的原始细胞集。一旦它们具备了看的能力，这些简单的有机体随之演化出了复杂的身体形态，以便实现快速的反应和移动。反过来，新的身体机能又会需要发展一个更大号的大脑来监管这些新生肢体的协调。当装备上视觉系统、快速响应的身体以及更大的大脑时，曾经不起眼的细胞集演化出了种类繁杂的复杂生物，它们从最初生命的泥沼中爬出，并努力在陆地上寻求属于自己的一块领地。

关于寒武纪生命大爆发——发生在寒武纪时期的生命大量快速演化，有一个有趣假设，即“光开关理论（Light Switch Theory）”。这个理论是由安德鲁·帕克（Andrew Parker）提出的，该理论认为正是眼睛的进化，引发了生命体之间的进化竞赛，使得那些具备最佳视觉的生物才最有可能生存下来。也许“光开关理论”理论对于机器人也是适用的。

曾经“眼盲”的机器获得了知觉的能力，它们也会从原始的禁锢中爬出，摆脱现今我们为其设计的结构化的、黑暗的工厂环境。健全的机器视觉将使得机器人可以充分利用其新添加的身体部件——轮子、四肢或踏板，而那些部件能为它们提供更高水平的灵敏度。想要控制复杂的机械新“四肢”，它们的机器大脑也会随之扩张。当我们目睹机器人掌握了新的技能并找到可以发挥功效的新应用场景时，我们也终将见证机器人形态和功能的“寒武纪大爆发”。