bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
前言
普通汽车终将退出历史舞台。得益于移动机器人技术的快速发展，汽车即将成为我们可以放心托付自己性命的第一代自主式机器人。在经历了数十年不断失败的尝试后，借助速度更快的电脑、可靠的硬件传感器，以及被称为“深度学习”的新一代人工智能软件，汽车可以获得与人类相似的能力，在无法预测的环境中自主安全驾驶。本书就是为了讲述这场变革。我们之所以对无人驾驶如此关注，原因有两
待学习
开始阅读
2
机器司机
在不远的将来，全球汽车博物馆里展览的汽车，都会变成21世纪初之前的那些光鲜靓丽的车型。就像历史的痴迷者来到一个历史遗迹后，会闪身钻入精心保存下来的中世纪小屋回廊里，参观博物馆的人也会钻进这些展览车辆的前排座椅里。这些参观者坐在方向盘后面，拨弄着内置GPS的显示器屏幕，游戏似的用他们的脚踩动着刹车，这一切恐怕会让体验者不禁感叹，21世纪初的人类竟然会用如此不便
待学习
开始阅读
3
迎接无人驾驶
一群热带鱼的行动过程十分值得观赏。它们组成紧凑而均匀的队形，扭动着明亮鲜艳的身体在水中游弋。这几十条不同的鱼可以一瞬间同时转向掉头，动作一致犹如一个整体。如果有个障碍物突然出现在鱼群的行进路线上，鱼群会分开绕过，然后迅速重新建立起它们先前的队形。鱼群彼此之间从不相撞，也不会触碰到浪涛裹卷而来堵在路上的异物——枝条、石子或珊瑚礁。在理想的将来，我们的街道和高
待学习
开始阅读
4
致命病症的特效药
关于汽车，有一个奇妙的讽刺，虽然汽车自从发明以来已经“谋害了”数百万人的生命，但我们的社会对于它造成的死亡人数仍视而不见，这或许是一种冷漠的默许。每年，全世界都有将近120万人死于车祸，这个死亡率相当于每年释放10个广岛级别的原子弹爆炸。与战争、暴力、毒品一样，汽车对人而言也有着致命危害。谋杀、自杀以及战争每年预计会造成160万人死亡；由毒品导致的死亡人数
待学习
开始阅读
5
阻碍无人驾驶技术发展的7个误区
如果不积极响应无人驾驶技术的发展，我们就会继续付出生命和时间的代价，继续承担污染的危害，继续丧失机遇。然而，并不是每个人都认识到了无人驾驶汽车的价值。在写作本书时，我们发现有些针对无人驾驶的误解还在广泛肆意传播，并且这些信息会被反对者拿来对抗无人驾驶的推广政策。我们将这些误解谣传总结成7个误区。具体如下： 1. 自动化驾驶技术会脱胎于当今的驾驶员辅助技术。
待学习
开始阅读
6
无人驾驶技术发展的时间表
无人驾驶汽车的推广并没有一个简单明确的时间表。实际上，向无人驾驶汽车世界的转变将是逐步推进的。汽车并不会在某个特定的年份一下子都变成无人驾驶。有两个原因：首先，无人驾驶汽车的应用会先发生在某些场所或某些国家；再者，汽车公司目前正在采取的策略分阶段自主化。如果他们成功了，人们可能需要在行驶过程中某段时间来驾驶，这也使得汽车向无人化的转变不可能存在一个明确的时间
待学习
开始阅读
7
便利的个人移动性
无人驾驶汽车对人类生活产生的影响中最不为人全面认识的一点，就是对于交通拥堵产生的影响，以及随之而来的弊端。一种乐观的局面是无人驾驶汽车可以提升城市交通系统的效率，致使私家车数量减少，进而减少拥堵，降低城市中交通出行产生的碳排放量。另一种对环境不利的局面是，在人们享受着个人移动性的便利的时候，平均而言，无人驾驶汽车实际上每年将会刷新出更高的车辆行驶里程，也就导
待学习
开始阅读
8
找停车位不再令人头疼
其实，我们很难明确指出一个城市为何令人着迷。就像是对于艺术由什么构成这个问题的争论一样，一个城市的吸引力来自哪里也不是人们能轻易解释清楚的，但是只要人们身临其境体验过，就能察觉出那个城市的独特韵味。在我们的经验里，那些引得人们去游览、定居并工作的城市多半有着深具活力的城市步行文化。街道上的行人越多，这个城市的热闹氛围也就越有趣，街道上餐厅和商场里的消费交易
待学习
开始阅读
9
更短的通勤时间和更少的花费
类似孟买、墨西哥城以及上海这样的城市，居住人口超过2000万人。到2050年，预计全球城市人口数量增长将会接近1倍，从目前的33亿人增长到64亿人。这些特大城市的纵深将会横跨几英里，街道上也会塞满各种车辆，因为居民每天不得不外出上班，并且还拼了命地想避免拥堵，最后反而更加拥堵。随着城市人口的扩张，市政府需要对空间利用做出更明智的规划。在无人驾驶汽车逐渐变得
待学习
开始阅读
10
社交和孤独感
虽然无人驾驶的便利性让人无法抗拒，但有时生活中的低效行为反而会有着积极的影响，例如传统的交通工具能促进社交互动的发生；廉价高效的个人移动性也可能会产生一些副作用，“孤独”就是其中之一。根据美国人口统计局的调查，每四个美国人中就有一个独自居住，而且自称“感到孤独”的人群数量每年也在持续增长。为了解释孤独感上升的原因，人们提出了多种可能的理论，有的说是家庭结构
待学习
开始阅读
11
汽车和代码
请等一下，现在的汽车不是已经自动化了吗？如今即使一辆廉价的轿车上也会装载复杂的传感设备，而那些设备在十年前只有喷气式战斗机才能安装。今天，一辆普通的汽车用于管理刹车、定速巡航以及动力传输的微处理器也多达上百个。有的软件模块还能在行人突然出现时，或者车辆偏离路线向驾驶员发出报告。实际上，新一代的汽车平均都加载了500万到1000万条代码，这个数字十分惊人。但问
待学习
开始阅读
12
大动荡
如果汽车公司有能力制定向无人驾驶汽车发展的过渡进程，它们可能会偏爱一条十分缓慢的推进过程：第一个阶段是持续优化驾驶员辅助技术；第二个阶段是在少数高端车型上安装只在特定情境下使用的、自主能力有限的驾驶模块，这些模块大多只应用于高速公路行驶；第三个阶段是这些自主能力有限的模块向下渗透，应用于便宜的车型。德勤咨询公司认为这种渐进的过程所带来的增值也是缓慢递进的，
待学习
开始阅读
13
以人类为主导
在无人驾驶汽车领域，偏爱渐进变革方式的不只有汽车公司。美国运输部和汽车工程师学会（Society of Automotive Engineers，SAE）分别给出了各自对向全自动化驾驶演变的发展路线概要。虽然阶段划分上略微有差异，但是它们有着共同的前提：最好的发展路线要以一系列循序渐进的阶段推进——而不是谷歌式的直接跨越——即汽车搭载的“驾驶员辅助”软件只是
待学习
开始阅读
14
无人驾驶汽车的操作系统
迄今为止，还没有哪个机器操作系统敢宣称自身已经完全掌握了三大核心能力：实时反馈、99.999%的可靠性，以及超越人类水平的感知能力。工业机器人虽然有着实时反馈的精确性，然而却不具备人类水平的感知能力。引导民航客机的操作系统是可靠稳定的，但它们却又缺少应对新问题的能力。自动驾驶的客机之所以是一种安全的运输工具，那是因为相比繁忙的城市十字路口，天空上很少出现复杂
待学习
开始阅读
15
机器人研发的艺术
为了对研发智能化移动机器人的过程有更深入的了解，我们前往机器人研究的圣地——宾夕法尼亚州匹兹堡市的卡内基·梅隆大学（Carnegie Mellon University）。几十年来，卡内基·梅隆大学一直是机器人研究和自动驾驶汽车研究的最前沿阵地。威廉·“瑞德”·惠特克教授（Prof. William“Red”Whittaker）是机器人研究领域的传奇人物，
待学习
开始阅读
16
运动中的人工智能
CHIMP是个超强的移动机器人，可以达到奥林匹克运动员的水平。但可惜的是，这些先进的灾害应对机器人——即使如CHIMP这样精心打造的，也不经意间透露出人工智能研究过程中的拦路虎之一：把一台电脑的棋艺调教到世界大师水平是容易的，但教会一个机器人从一堆瓦砾中走过却要困难得多。机器人学家汉斯·莫拉维克（Hans Moravec）将这种看似简单任务自动化过程中遇到的
待学习
开始阅读
17
驾驶的控制权：混合人工智能
在工程学难题列表中，编写引导无人驾驶汽车的操作系统的难度应该介于CHIMP和自动拖拉机两者之间。无人驾驶汽车的操作系统横跨了两个存在差异的研究领域。其一是控制工程学（Controls Engineering），专门解决机械零部件协调运行的一个工程学分支；其二则是人工智能研究。控制工程学要处理复杂系统（如机器人的机械系统）的运行问题，这些系统要通过输入和输出
待学习
开始阅读
18
底层控制系统：加速、刹车和转向
无人驾驶汽车底层控制的核心工作是将系统稳定在最佳设定值上。反馈控制设备是一种广泛使用却又鲜为人知的判断性装置，通常用于调节引擎的燃油喷射、生产用机械的电压输入，甚至还可以用于调节房间内温度，使其准确地保持在恒温器设定的数值。反馈控制设备应用背后的逻辑支持就在于它的平衡观念：无论是机械设备、电子设备，还是生物体，一个系统需要尽可能维持在稳定均衡状态中。自从2
待学习
开始阅读
19
上层控制系统：路径规划和道路导航
只负责汽车基本运转的底层控制也许可以很快地完成任务，但上层控制系统的工作时间则要长得多，有时可能在整个出行的过程里都需要运行。如果将底层控制系统比喻为“条件反射活动”，那么上层控制系统就类似于“高级心智活动”，即传统上而言的“脑力活动”。上层控制系统的基础是路径规划和导航，而两者都需要通过搜索算法（Search Algorithms）的应用来实现。搜索算法
待学习
开始阅读
20
物体识别的挑战
中层控制软件需要指导无人驾驶汽车，穿行于具有无限可能性的复杂真实情景中。想要体会研发人员所面临的艰巨挑战，只需想象一下编写软件来指导汽车通过一个繁忙的十字路口是何感觉。既然软件应该与一个驾驶员保持相同的标准，那么它就必须遵守车辆管理局制定的一系列标准化交通规则。减速、准备停车、避让已经在十字路口或刚进入十字路口的机动车辆和行人。而且，还需避让排在前面的机动
待学习
开始阅读
21
中层控制系统
我们先来谈谈第一个模块，占据栅格。占据栅格是一种软件工具，针对汽车外部环境进行实时、持续更新的三维数字建模。类似于一个包含了数字记录的后端数据库，占据栅格是一个存储了汽车周围实体对象信息的数字存储库。它既可以与中层控制软件的其他模块相配合，也能作为程序员的视觉参照模型。流入占据栅格的数据，一些是源于已经存储的高清地图的静态数据，其他数据则来源于汽车视觉传感
待学习
开始阅读
22
绝对安全可靠
我们已经讨论过当前的技术瓶颈，操作系统目前仍难以做到完全的可靠性。此外，足够全面的法律标准也需要进一步定义并量化。很多人坚持认为，无人驾驶汽车只有达到100%完美的可靠性才能合法，那意味着没有发生任何碰撞、事故或失误。然而事实是，如果需要完美的可靠性，无人驾驶汽车将永远不会获得合法地位，因为没有任何操作系统能做到始终完美可靠。操作系统出错的概率很大，而且即
待学习
开始阅读
23
比人类驾驶安全两倍
随着存储知识库中驾驶情况的持续成倍增长，无人驾驶汽车将变得越来越能干。然而，为了获得整个社会和法律的认可，无人驾驶汽车仍需要一套透明的可靠性标准，一个定义明确的公共标准——规定了安全的和可接受的平均故障间隔距离。理想情况下，无人驾驶汽车的法规需要由制造企业将与政府合作，共同定义出无人驾驶汽车的平均故障间隔距离应该达到多少才是可接受的。在无人驾驶的新时代，平
待学习
开始阅读
24
黄金时代
为了鼓励汽车运输业的发展，1956年联邦政府通过了《联邦高速公路法案》（Federal Highway Act of 1956），开启了持续数十年的公路疯狂建设，并最终让美国各个城市、郊区以及乡村的格局面貌焕然一新。随着购车用户数量的急速上涨，数百万驾驶员奔向了这个国家新建的各个道路和高速公路。随着数万英里的道路铺设，横跨东西海岸的州际公路系统的完善，美国的
待学习
开始阅读
25
通用汽车的电子化高速公路
美国无线电公司（Radio Corporation of America, RCA）是20世纪50年代电子工业创新的发源地，通用汽车公司遂与之合作研发电子化高速公路。美国无线电公司雇用了当时著名的发明家弗拉基米尔·兹沃雷金（Vladimir Zworykin）——阴极射线管及自动化解决方案的开拓者，由其研发信号灯的管控系统。兹沃雷金很早就意识到高速增大的交通
待学习
开始阅读
26
自动化高速公路的衰亡
自动化高速公路的美梦最终破灭的主要原因之一就是成本。安装必备的电缆和路边控制系统是一项耗资巨大却又见效缓慢的工程，装配一条短小的测试跑道所需的成本还算合理，但是对于美国或欧洲那些横跨各州的浩大公路网系统而言，方案就显得不切实际了。即使在20世纪60年代，政府划拨了大量的公路建设预算，但考虑到埋设线缆、晶体管以及其他电子设备组成的这一套脆弱的基础设施，想要装配
待学习
开始阅读
27
V2X技术
美国联邦交通运输机构关于V2X的倡议，目标在于创建无线交通基础设施网，连接每辆汽车。它们通过路边传输器共享数据，从而减少事故，挽救生命。V2X研究利用的是由联邦运输委员会（FCC）监管的专用短程通信技术网络（DSRC）的部分储备带宽。负责V2X计划的机构是美国交通运输部的一个主管部门——美国高速公路安全协会（NHTSA）。通常情况下，当我觉得研究会议无聊时
待学习
开始阅读
28
智能交通系统的历史
早在20世纪80年代，信息技术重塑了整个工业格局。1986年，为了解决美国日益增长的交通和汽车尾气问题，加州交通局联手加州大学，共同探索信息通信技术在汽车与高速公路的应用，帮助人们提升驾驶效率。这次合作最终促成了一个名为“先进技术与高速公路（Program on Advanced Technology and Highways，PATH）”的全国项目。很快地
待学习
开始阅读
29
关于V2X的反思
联邦交通运输局拥有资源和立法权，能对无人驾驶汽车给予支持，这样每年能挽救成百上千个生命。2013年，美国高速公路安全协会朝全自动化的道路迈出了蹒跚的一步，并对外发布了详细报告。报告中列出了自动驾驶发展的几个理论阶段。这是一个良好的开端，接下来长路漫漫仍需努力。尽管事实表明，在过去的十年，人工智能的发射器在软件和硬件层面都取得重大发展，这让无人驾驶汽车技术日
待学习
开始阅读
30
非智能高速公路的价值
或许是由于近几十年间，联邦政府和私营部门的资金不断投入到智能高速公路系统领域，很多人觉得无人驾驶汽车上路，需要对高速公路基础设施进行大规模的投资。直到2014年时，沃尔沃公司还提议把磁铁嵌入公路，以便无人驾驶汽车可以在雾中辨识道路。至此，改进高速公路基础设施的建议势在必行。就连那些资深的计算机程序员也十分渴望，设想着若是能实现条形码在公路上的应用，或是把射频
待学习
开始阅读
31
修订交通运输政策
十几年前那场轰动一时的“Demo 97”活动后，美国交通运输部与其下属机构高速公路安全协会和联邦公路管理局喜欢以消极被动的态度发展无人驾驶汽车，置身事外看看是否有行业或哪个州愿意承接这个项目。部分联邦官员认同某些保守的做法，例如对信息与通信技术的发展不予评价。然而，无人驾驶汽车的技术发展日新月异，使得当局再也没有借口仅局限在V2X研究上。同时，也有一些令人
待学习
开始阅读
32
机器学习和无人驾驶
斯坦福大学教授塞巴斯蒂安·特伦（Sebastian Thrun）带领那支研发出“史丹利”的冠军团队，对赛前准备有着不同于对手的思考。首先，他意识到是汽车软件，而不是硬件决定比赛胜负。其次，是对中级控制系统软件的研发。考虑到汽车引导软件中“识别”和“响应”两大功能的重要地位，他们摒弃了当时盛行的中规中矩的基于规则的人工智能软件。在项目初期，他们也曾尝试去写一套
待学习
开始阅读
33
西洋跳棋
有人指出2007年是现代全自动汽车的诞生元年。事实上，现代无人驾驶汽车的出现分为不同阶段。早在2004年、2005年举办的前两届比赛中，无人驾驶技术的表现就开始渐入佳境了。到了2007年的第三届比赛，参赛者不仅受益于之前的大赛经验，帮助提升比赛成绩的还有硬件技术的迅猛发展、以机器学习为代表的人工智能软件的重大突破。 Stack Overflow是一个著名的I
待学习
开始阅读
34
无限状态空间
尽管机器人研究专家使用机器学习技术长达几十年，可这些机器人一直在高度结构化的环境当中运作。机器学习在棋类比赛中运作得非常好，这是因为棋盘是个有限的状态空间，所能产生的下棋方法数量是有限的。塞缪尔的计算机下棋程序通过在数据库中的查找功能，使数据一一对应上棋盘的具体位置。每一个棋面布局都特征鲜明，定义清晰，因此容易进行数据存储。下国际象棋比西洋跳棋的难度要高，
待学习
开始阅读
35
现代工具箱
“重组创新（Recombinant Innovation）”指的是用创新的方式，把现行的几项技术组合起来的过程。尽管人们总觉得像无人驾驶这样的新兴技术（尤其是看起来非常复杂的技术）是孤僻的天才发明家用新奇的方式凭空创造的，但实际上它是重组创新的最佳案例。重组创新是摩尔定律间接衍生而来的副产品，这条著名定律的内容是半导体材料的性能增长是呈指数型的，同时成本的
待学习
开始阅读
36
高清数字地图
高清地图的精确度区别于标准数字地图。高清地图既能反映大型地理特征，像是高山湖泊，也能反应诸如树木和人行道的分布等微观地形细部。应用在无人驾驶汽车领域的高清地图，重点呈现的是道路或十字路口的表层静态数据，比如车道线、路口交叉点、施工地段以及道路标志。图8.1 覆盖着传感器数据的十字路口高清地图来源：HERE地图为人类肉眼设计的传统地图是二维图形成像，用静
待学习
开始阅读
37
数码相机
数码相机借鉴了哺乳动物眼睛的一些概念。硅传感器在某种程度上与视网膜相似：两者的视觉数据都被拆分成几个小的视觉单位进行处理。视网膜上有数百万的生理感光细胞：视杆和视锥，吸收光子并把光能转化成神经信号，传输给大脑处理视觉信息。人眼内的视杆细胞和视锥细胞是不规则排列的，视网膜中部排列密集，边缘部分较为稀疏。而在数码相机里的硅传感器，每个像素在一定间距内呈矩形排列。
待学习
开始阅读
38
光检测与测距（激光雷达）
除了数码相机之外，另一类主流的传感器就是激光雷达，全称是“光检测与测距（light detection and ranging）”，亦称“激光雷达（Lidar）”。数码相机的工作原理是把三维视觉空间拆分为二维像素矩阵。激光雷达设备则不同，它向周围散射出强烈的脉冲激光，测算出光束反射回来所用的时间，然后根据激光测距原理计算出周围环境的三维数字模型。和数码相机
待学习
开始阅读
39
无线电检测与测距（雷达）
除了激光雷达和数码相机，无人驾驶汽车还使用普通雷达（Radar）来识别周围环境。数码相机在像素网格里捕捉场景，激光雷达传感器则类似一罐“数码喷漆”，让原本无形的物体披上“数字化外衣”。然而雷达传感器的工作方式就像往池塘里扔下一块小石子，追随水面漾起的圈圈涟漪跳跃的方向。雷达原本应用服务于军事领域，在二战期间，雷达发射塔建在海滩、田地里，用于侦测敌军的飞机、
待学习
开始阅读
40
超声波传感器（声呐）
如果把激光雷达和数码相机比作一个人的眼睛，超声波传感器就是人的耳朵。超声传感器可谓雷达的近亲——像雷达一样，发射波形信号，检测回波——不过超声波传感器发射的是超声波，不同于雷达的电磁波。超声波传感器根据物体反射回来的时间、频率、声波形状来监测位置和速度。超声波传感器一般分为两个部分：发送器和接收感应器。发送器产生振动频率高于20kHz的机械波，高于人耳能听
待学习
开始阅读
41
全球定位系统（GPS）
虽然数字地图和各式雷达传感器在无人驾驶方面扮演着极其重要的角色，可是除了这两者以外，还有一项更为关键的技术——GPS全球定位系统。这个系统负责统筹和整合信息，并在高清数字地图上为汽车提供最终的精确定位。 GPS是一项已经面世长达数十年的技术，最初用于军事领域；发展遵循摩尔定律，后来发展成为稳定可靠的、低成本的消费应用品。几十年前，GPS的接收器像冰箱一样庞大
待学习
开始阅读
42
内置的耳朵（IMU惯性测量单元）
GPS的失误会造成灾难性的后果。卫星感知的缺失这个潜在的致命难题的解决方案是另一种军事技术的产物——惯性测量单元。这种装置有两种重要功能：它能弥补GPS的不准确计算；它还是无人驾驶汽车的“内置耳朵”，能够感应，也就是决定该走哪条路。惯性测量单元是一种多用途多功能的设备，它配有加速感应和定位感应，能记录汽车行驶的轨迹，从而也能看出诸如左右轮胎高度是否一致等问
待学习
开始阅读
43
线控技术（Drive by Wire）
数码相机、激光雷达、普通雷达、超声波传感器和惯性测量单元等一众传感装置为无人驾驶提供稳定的数据流。数据流融合后，汽车的操作系统顺利进行数据处理，奇迹就这么发生了。正如我们在前几章提到的，汽车操作系统使用好几种人工智能技术来快速做出指令。最后一步就是把这些指令转换成实际操作，像是转动方向盘、踩下刹车或油门。在以前，工程师把普通汽车改装成为无人驾驶汽车，是通过
待学习
开始阅读
44
其他设备
另外，汽车现存的某些明显“弱点”，实际上是有意这样设计的。大部分的汽车都有个实体连接器，叫作车载诊断系统（on-board diagnostics, OBD），当车辆检测人员把设备插入OBD插口时，便能诊断汽车出了什么机械问题。OBD插口一般隐藏在驾驶杆附近，汽车厂商将OBD插座设计在驾驶室内，是为了确保这个插座的安全，这样设计，意味着只有拿到车钥匙的人才能
待学习
开始阅读
45
神经网络
神经元细胞传递信号是一个电化学反应的过程。一个神经元细胞包含一个细胞体，负责接收信号，信号从其他神经元发出后要经过许多细小的树突（Dendrites）。当神经元细胞体接收到另一个神经元传过来的信号，信号会沿着一根长长的附属线路，类似蒲公英根茎的形状，它叫轴突（Axon）。神经轴突把一个信号传输给另一个。与其他细胞之间的连接点就叫作突触（Synaptic）。当
待学习
开始阅读
46
感知器
该感知器由六个机架构成，机架内装载着电子设备。每层机架相当于生物视觉感知系统中一个理论层，由上百个节点组成，最终达到了每个机架排列8个神经元。发展到今天，现代深度学习网络已经包含超过150层的人工神经元细胞，相互连接的节点有将近10亿个。这项伟大的创举实现了高速、强大的计算机和复杂的培训算法。从生物学范畴来说，神经元细胞传输能力的强弱是由神经递质的集中程度
待学习
开始阅读
47
第一次人工智能冬天
如果人工智能这一全新领域有越来越多的研究人员遵循罗森布拉特的方法，我们也许能早几十年在自动感知领域取得成功。然而，取得良好的开端后不久，感知器便失去了光环。原因之一是训练神经网络所需要的计算能力和传感数据仍然不足。原因之二是人为问题——政治反对。在罗森布拉特和感知器的故乡伊萨卡（Ithaca），冬季黑暗和漫长。然而，没有一个伊萨卡冬天能比得上罗森布拉特取得
待学习
开始阅读
48
神经网络研究的复兴
符号型人工智能高速发展的同时，神经网络研究仍旧在艰难起步。到如今，“感知器”已经演变为神经网络中某一层神经元的通称。有趣的是，模拟硬件装置的命运与原始的感知器相似，已经被搁置一边。人工智能专家专注于在软件里打造神经网络。 1975年，哈佛博士生保罗·韦伯斯（Paul Werbos）发明了一种新型、改良的感知器。韦伯斯为推进人工神经网络的发展做出了两项重要的贡
待学习
开始阅读
49
神经认知机
在神经网络的发展历史上还有另一段畸形扭曲、颇具讽刺意味的传奇故事。它发生在20世纪90年代短暂而风光一时的人工智能研究复兴之前，80年代的一款神经网络模型实际上解决了不变量表示的老大难问题。在详细讲述该神经元网络的学术文章刊出以后，引起了许多神经网络研究“顽固对头”的关注。 1980年，日本科学家邦彦福岛（Kunihiko Fukushima）提出了一种新型
待学习
开始阅读
50
深度学习的诞生
如同新生儿，机器通过接触大量的信息进行学习，即数据密集型办法。在训练算法中，所需的数据数量通常与问题的难度成正比。相比之下，教会一台机器辨别三角形与正方形，比教一台机器成功辨别男性与女性要简单得多。罗森布拉特的感知器只需要调整512处节点的权重，所以用于培训的图片数量相对较少。大型的神经网络（无论深层与否）都包含上百万的连接，因此需要上百万张训练图片。如果
待学习
开始阅读
51
绘图处理器（GPUs）
我们已经对高速计算机、大数据、数字相机和多层人工神经网络等主题进行讨论。还有一项更为重要的技术即将映入眼帘：高速独立显卡。它之所以重要的原因在于神经网络对于计算能力的要求极高。早先，优质的独立显卡资源掌握在游戏界手里。游戏行业有时会遭遇某些保守的成见——“游戏会使青年人沉溺其中，浪费时光，毫无创造性”，然而事实上游戏行业却是创新的主要来源，尤其在图片处理方
待学习
开始阅读
52
现代深度学习
比赛规则如下：参赛者向大赛管理方监管的服务器提交图片识别软件。根据要求，软件将会处理十万张新图片。由于图片随机排列，呈现的物品分散，软件将需通过编程和算法，对每张图片上五种识别出的物品进行命名。 ImageNet竞赛分为三项：图像分类、分类定位、检测。分类项目旨在测试计算机算法能否将图片正确分类并标上恰当的标记；分类定位项目用于评估对已标记图片以及图片上的物
待学习
开始阅读
53
神经网络内部
有几种不同类型的网络用于图像识别，每个网络都有自己的自测工具，并通过应用独特的改进算法提升训练的精度。深度学习是快速发展的领域，几乎每周都会推出新的结构和算法。然而，一个共同的特点是深度学习网络使用串联式多层人工神经元，从经过软件识别与标上标记的数字图片中捕捉图片特征。先进的深度学习网络拥有超过100层的人工神经网络（对比罗森布拉特的感知器只有单层神经网络，
待学习
开始阅读
54
新型边缘检测
分析深度学习网络的识别行为的一个方法，是把人工神经元逐个分开，用某种特定模式来测试它们的反应。进行这项实验的研究专家发现，在深度学习网络识别视觉信息的过程中，人工神经元细胞在网络中的位置越深（越靠近输出层），识别抽象模式的能力越强。相反地，神经元细胞越靠近表层网络，识别出的物体越简单。 1959年，有一次有趣的生物学实验中，生物学家大卫·休伯尔（David
待学习
开始阅读
55
机器人的自我管理
深度学习软件应用在驾驶上产生了一种妙不可言的边际效应。导航软件一开始效率不高，不过只要达到某个临界点之后，导航软件的性能就会持续加速提升。换言之，无人驾驶系统收集的数据越多，它们的驾驶技术就越高明。总结这种良性循环，我们会发现这与机器学习软件的训练数据多少有关。消耗的数据越多，软件的性能就越好，从而推动系统越发积极采集数据。该良性循环是这样展开的：起初，需
待学习
开始阅读
56
预测交通情况
当无人驾驶汽车进一步地开展其地图业务，它们的位置、速度和选择路径会生成非常实用的副产品：交通数据。今天我们使用路径规划软件来提供有限的导航来避开交通拥挤。几乎每个人手机上都有一款APP是用来指导我们到达特定的目的地，这些APP较为先进的版本会把交通信息也加入到运算当中。无人驾驶汽车将包含复杂的交通预测软件，它使用机器学习软件从实时以及历史交通数据中学习。经
待学习
开始阅读
57
个人隐私
然而无人驾驶汽车将面临较为特别的隐私问题。车子是移动的，一旦被装配上高分辨率的视频摄像头，外加远超人类的感知与识别能力，汽车可能成为“机器人间谍”。滥用这种能力的可能性很高。车子能拍下乘客或路边行人的照片，进而传输给人脸识别系统软件。软件能将收集来的人脸数据传递给政府。危险性降低了，但烦恼却增多了。当各大公司的市场部急需人们的衣着、出行方式和其他习惯的数据，
待学习
开始阅读
58
道德伦理规范
数据隐私与安全性是由无人驾驶汽车产生的、引起重视的道德挑战，另一个道德挑战是汽车对紧急情况的回应。当面对突发意外，无人驾驶汽车使用数据和软件，而不是人类的直觉，来计算出最佳处理方法。为了赋予车辆合宜的反应能力，程序员艰难地通过量化数值的途径来保障生命财产。当通过系统软件开车时，人类司机不再需要在车祸发生瞬间，作出“留存哪方性命”的选择。这时经过程序员的提前
待学习
开始阅读
59
工作岗位
首当其冲的是货车驾驶。这份稳定、高薪的蓝领工作曾大幅抵御了离岸外包和自动化技术的冲击。根据2010年全美普查数据，美国有将近350万名货车司机。数据显示，货车司机是29种最常见的职业之一。如果无人货车得到推广，用不了几年，自动化技术就将在货运行业占据一席之地。图11.2 货车司机成为2014年美国绝大部分州最常见的职业来源：美国国家公共广播（NPR）货
待学习
开始阅读
60
交通事故带来的工作收入
有一句古老的英语谚语说，一个人的收获来自另一个人的损失。这样看起来，无人驾驶汽车能够挽救生命、节省燃料和时间，那么受损失的就是部分商业模式与交通事故相关的企业。这类行业的范围很广，从汽车保险到个人伤害维权的律师，从实体店到零件供应商，从高速公路的巡查人员到预防性驾驶课的老师，从器官捐赠机构到急救室医护人员，从交通法庭到监狱…… 美国人每年因交通事故住院的时间
待学习
开始阅读
61
新型车身
我们预计，无人驾驶汽车的里里外外看起来都会和现在的汽车不一样。方向盘会消失；仪表盘将变成灵活的工作区间；车厢中将配备人们休闲娱乐所需要的设备；车子外部不再需要侧镜或尾灯。正如我们在第二章所讲的，未来汽车行业将划分为两大类：制造实用标准化运输工具的公司和特殊顾客用途车辆的制造商。特殊顾客用途包括一人小型车辆到能在车内休息或工作的大型豪华车辆。大部分的车辆都会
待学习
开始阅读
62
新的市场
商家用返还或打折的手段提升顾客体验的做法并不新鲜，每天人们都能在免费网站上阅读到各种在线广告。我们中的大部分人已经接受了这种“免费”的交易，我们默许商家往电子邮箱和文本信息中投放各种广告，以换取免费使用的邮箱和平价的电话服务。无人驾驶汽车的乘客也会对这些条款讨价还价争取自己的权利。精明的乘客知道该如何用减免车费，或是为自己的车辆换取更便宜的油费作为筹码来交
待学习
开始阅读
63
新型的零售业
精心规划顾客路线的餐馆和企业将会从无人驾驶汽车中受益良多。另一个即将发生改变的行业是零售业。这个行业在上个世纪已经经历好几次转型，导致转型的影响因素首先是规模化生产，接着是大购物中心的出现，再接下来是折扣店，最近的一次是网络商店。无人驾驶汽车将会引发零售行业的最后一次变革。在古代，珍贵的香料经由骆驼从中东运输至欧洲；今天，油罐车运送到世界各地的港口，在那里
待学习
开始阅读
64
犯罪与（成人）娱乐
任何对一项新技术的完整分析都不能回避其阴暗面——犯罪活动。计算机容易被用作盗窃数据和入侵自动银行系统窃取身份等的犯罪工具，无人驾驶汽车同样也吸引了跃跃欲试的罪犯将其应用在高科技犯罪中。有些黑客会把他们的才能用于窃取和损害无人驾驶车辆的数据，包括传感器、数字地图和操作系统的数据；另一类型的攻击是劫持机器人，或是当无人驾驶汽车停在十字路口的时候，走到车前劫持车
待学习
开始阅读
65
未来之路
未来前景如何？机器人技术已发展到了重要的转折点，无人驾驶汽车如期成了安全实用的运输方式。我有时候在想，如何向下一代解释，驾驶汽车曾经是成年与自由的象征。当我向他们讲述高中时期的我和同学们曾经用一个学期的时间来学习驾驶技术，我能想象出他们的脸上写满不屑和难以置信的神情。我期待着有一天，虽然我们都老去，却仍然记得亲自驾驶车辆的感觉。就像文字处理器通用的今天，人
待学习
开始阅读
66
机器人的进化
确实，当我们进行机器人进化实验时，整个过程非常不稳定。进化机器人学说（Evolutionary Robotics）是机器人研究领域的一个分支。该学说应用于好几代机器人的变异和选择，刺激了计算机朝“达尔文理论”的进化特点发展。在实验中，我们让计算机随机地把机器人零部件（机械关节、刚性构件、发动机、电线和神经元）放在一起制造虚拟机。然后对计算机编程，使其快递选择
待学习
开始阅读
67
传感器王后
实验中，机器人的人为进化最终得出满足的结果，然而生物界进化过程却鲜有规律。寒武纪大爆发的成因到今天依然是个未解之谜。有人把这史前出现的多样性形成原因，归为多细胞生物发现成果的一部分。也有人认为，这是因为氧气等资源丰富、地球的生物宜居性提高，或者在物种大灭绝后出现的适应辐射的后果。还有人认为，原因部分来自于某些“使能技术”的“发现”，从而产生了许多之前没有的新
待学习
开始阅读
68
幂次增长之王——算法
人们往往倾向于留意到计算、交互、传感方面的机器人硬件技术的飞速进步，但我们常常遗忘是哪些发现带来了这些进步及其背后的新算法技术的发明。在计算机科学家和电子工程师中流传着一种说法，无论硬件工程师取得了什么样的进步，软件工程师是都能马上“废了”它们（原本程序员的说法用词太过激烈，不适合写在书里）。我们都知道无论计算机的硬件性能变得多快，操作系统软件却总是运行太
待学习
开始阅读
69
算法的进步大量涌现
我们不知道眼睛在大脑的发展过程中起了何种促进作用，但我们知道智力的作用远远超过视觉皮层细胞，从识别捕食者和猎物、寻找配偶，到今天阅读本书时用到的充分交互与自我认识能力。我们知道深度学习算法从最初的为视觉感知服务，到今天成功应用到许多人工智能领域，例如语音识别到语言产生再到艺术创作。我们推测这股发展趋势仍将继续。发展趋势将持续多久？何时结束？这些都是科幻作家
待学习
开始阅读
70
致谢
几年的时间里，我们与众多相关人士进行了很多激动人心的、发人深思的讨论，最终才形成了这本系统性介绍的书籍。我们要特别感谢所有在本书成书过程中伸出援手的人，他们提供的任何形式的帮助都有巨大作用。我们想要感谢在自动驾驶汽车研究领域长期作出突出贡献的两位学者，他们是奇点大学的布拉德·邓普顿（Brad Templeton）和普林斯顿大学的阿兰·肯豪森（Alain K
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

现代深度学习

比赛规则如下：参赛者向大赛管理方监管的服务器提交图片识别软件。根据要求，软件将会处理十万张新图片。由于图片随机排列，呈现的物品分散，软件将需通过编程和算法，对每张图片上五种识别出的物品进行命名。

ImageNet竞赛分为三项：图像分类、分类定位、检测。分类项目旨在测试计算机算法能否将图片正确分类并标上恰当的标记；分类定位项目用于评估对已标记图片以及图片上的物体位置的复制能力。最后的检测项目借鉴了其他项目的元素，但评价标准更为严格，图片数量众多，每张图片上呈现好几样微小的物体。随着时间的发展，比赛会新增了一些项目，如视频流的识别，保证比赛跟上技术的发展。

2010年比赛的获胜者是来自日本电气股份有限公司（NEC）和伊利诺伊大学香槟分校。在10万张测试图片中，获胜的神经网络的出错率是28%。两支亚军团队的错误率分别是33.6%和44.6%。为了更好地分析这个比赛结果，我们来对比一位未经过特别训练的普通人，他对图片进行分类的能力相当突出，错误率只有5%。

2011年第二届ImageNet竞赛成绩显示，尽管参赛团队几乎都没有使用神经网络，但这一年中机器视觉算法还是取得了较大进步。来自XRCE技术公司的团队错误率只有25%，比上一届冠军降低了2.4%的出错率，两支亚军队伍的错误率分别是31%和36%。

当第三届ImageNet竞赛在2012年9月30日深夜落下帷幕时，机器视觉领域发生了永恒的改变。这届比赛既没有狂热的媒体，也没有华而不实的颁奖礼。但是如果监管比赛的机架式服务器有反应的话，它们将会彼此拥抱，热烈庆祝。

东京大学团队研发的SuperVision神经网络，正确率高达85%，创下了世界软件识别比赛中骄人的成绩。错误率降低15%~25%听起来并不太多，可是对于计算机-视觉研究界而言，他们过去苦苦努力为了提高不到1%的正确率，这成绩就像是看到一个人人生第一次达到专业田径选手的水平，四分钟内跑完一英里。

SuperVision的发明者是亚历克斯·克里泽夫斯基（Alex Krizhevsky）、伊利亚·斯图斯盖尔（Ilya Sutskever）两名同学和他们的老师戈弗雷·辛顿（Geoffey Hinton）。Super Vision属于卷积神经网络。卷积神经网络的许多特征是建立在三十多年前福岛博士发明的神经认知器的技术基础上的。其余的改良部分是来自于由纽约大学扬·勒丘恩、斯坦福大学的吴恩达（Andrew Ng）和蒙特利尔大学的约书·本吉奥组成的研究小工的工作成果。SuperVision是一个大型的神经网络，由工人神经元组成矩阵，矩阵组成机架，机架再组成一个30层神经网络。东京团队做了一个大胆的举动，他们开放码源，让任何人都能使用和修改。这个举动在计算机视觉界内轰动一时。

深度学习人工神经网络已成为图片识别软件新的黄金准则。在SuperVision取得2012届图片识别比赛的辉煌胜利之前，几乎没有人使用卷积神经网络。但在2012年后，不使用卷积神经网络的研究团队甚至不敢再参加竞赛了。

SuperVision获胜后的下一年，冠军的错误率降低至11.2%，亚军紧跟其后，数据分别是12%和13%，所有人都使用的是指定的深度学习卷积神经网络。2014年，谷歌团队创下了6.66%的错误率新低。来自牛津大学的团队使用了更庞大的卷积神经网络，但错误率是7.1%。2015年，微软北京研究实验室团队（由首席研究员孙剑带领）使用了152层深度神经网络，赢得了三个比赛项目的冠军。值得一提的是，微软团队这一年的错误率仅有3.57%，历史上首次低于人类的错误率5%。

在取得这些胜利之后，机器视觉其他的研究方法仿佛都要被淘汰。算法不再局限于物体识别，已经开始从计算机视觉领域扩展至所有人工智能领域。人工智能发生了永恒的改变，无人驾驶汽车发展的最后一道障碍——软件的人工感知能力——终于被扫除了。

这场巨大的胜利后不久，各方开始尝试合作。Nvidia 推出了深度学习卡，是克里泽夫斯基的SuperVision网络在低功耗硬件上的衍生产品。Nvidia的商业应用程序目标何在？毫无疑问，是无人驾驶汽车。该系统被名副其实地命名为DRIVE PX，它能同步处理超过12个视频频道的实时内容。一年后，速度更快、造价更低、质量更优的计算机卡推出，自动深度学习的技术研发竞赛拉开了大幕。