Local EPUB Text
驾驶的控制权:混合人工智能
在工程学难题列表中,编写引导无人驾驶汽车的操作系统的难度应该介于CHIMP和自动拖拉机两者之间。无人驾驶汽车的操作系统横跨了两个存在差异的研究领域。其一是控制工程学(Controls Engineering),专门解决机械零部件协调运行的一个工程学分支;其二则是人工智能研究。
控制工程学要处理复杂系统(如机器人的机械系统)的运行问题,这些系统要通过输入和输出信息来与周围环境进行互动。在给复杂的系统输入指令时,机器人学家会区分出底层控制和上层控制。以无人驾驶汽车为例,底层控制管理汽车内部系统的运行方式,如刹车、加速和转向;上层控制则管理汽车的长期策略计划,如导航和路线规划问题。
当控制工程专注于应用软件管理复杂的系统时,人工智能中相关领域的研究者则努力研发具备智能行为的软件,智能行为这一看似宽泛模糊的定义恰恰反映了这一领域的惊人深度和多样性。人工智能研究的理论基础来源于多个不同的领域,从心理学到语言学,再到统计学都有所贡献。虽然研发具备所谓普通智力水平的软件仍然是这个领域的长期目标,但这不妨碍许多人工智能研究者定向研究某一类问题的领域,例如让工业过程更加高效,或者让汽车能够自动驾驶得更安全。
对人工智能技术的深度解析远非本书所能及。为了简化问题,我们将人工智能技术中丰富多元的内容大致分为两派:自上而下的和自下而上的,或称为符号型人工智能(symbolic AI)和数据驱动型人工智能(data-driven AI),后者就是渐渐被人熟知的“机器学习”。符号型人工智能会将复杂的情境或任务分解成若干标准的指令或规则条目,然后程序员将这些规则写进软件代码,使计算机能够依据推理和查找功能执行这套逻辑规则。相反,数据驱动型人工智能(或者说机器学习)会应用各种算法对大量数据进行处理,然后利用统计学技术分类、排序,最终再解析这些数据。两种人工智能各有优势,但重要的是根据特定的任务应用最适合的人工智能。
所有人工智能程序都在尝试做的一件事就是将复杂未知的“现实世界”转变成有限数量的逻辑“组块”,以便软件进行后续分析。每个组块,或者说独立的情境,可以被称为一种“状态(State)”。一种状态既可以是指棋盘上棋子的特定组合配置,也可以是一瞬间环境中物体固定下来的特定组合配置,所有可能情境的集合被称为“状态空间(State Space)”。
符号型人工智能技术最适合在小型的状态空间里应用,即所有可能的结果可以事先预期到,并且能按照既定的规则解决。例如,相比繁忙的城市街道,工厂装配线的状态空间数量要少得多。因此,引导工厂内机器人执行有限数量的可能性动作和反应的软件,这种基于规则的符号型人工智能是一种有效的技术路线。
几十年来,符号型人工智能长期占据市场的主导地位。直到20世纪末,随着计算力的提升,传感器将可用数据数量从微小提升到海量,机器学习也从冷门学科进入到人们的视野里,赢得了广泛认同。这种技术路线的巨大优势,就是它不需要由人类程序员预计到一个场景中的所有可能结果,而传统的符号型人工智能技术却离不开这些。当程序员有了强大计算力的设备和大量训练数据,他就可以编写一个机器学习软件,让机器根据手头的素材“学会”自行应对处理,某些情况下,软件还可以学会应对不熟悉的新情境。汽车的操作系统应该囊括不同类型的人工智能软件,以实现各种控制功能的管理。
谷歌公司的“大眼睛的”自动化驾驶的出现与现代智人(Homo sapiens)的诞生具有相同价值,谷歌的无人驾驶汽车并不完全是谷歌天才研发人员在安保严密的实验室里突然搞出来的。实际上,谷歌现在的无人驾驶汽车是近一个世纪以来人工智能和机器人研究的智慧结晶,它所承载的机器人DNA也是从多个早已停止的研究项目中汲取的,有些项目提供了基本概念,有些贡献了突破性技术。
在人们通常的观念里,有一个不全面的观点,即在很久以前,多个人类物种先后灭绝的过程中,现代智人这一支系因其先天优势而得以保存下来。而现代DNA分析证实这种观点是有问题的。人们曾经认为尼安德特人(Neanderthals)已被其优秀的“表亲种族”所灭绝,但事实是他们的基因仍潜伏在我们身上——近期DNA分析表明欧洲人和亚洲人身上都多多少少携带着一些尼安德特人的基因,这说明人类的演化过程并不像我们曾经以为的那样循序渐进、阶段分明。
引导当前自动化驾驶汽车的软件,其发展渊源也同样存在争议,复杂难辨。谷歌汽车底层控制中用于监控刹车、转向和速度控制的软件,延续了1912年设计的军用机器人原型“战争狗(Dog of War)”的技术路线,可以说是其后辈的后辈;谷歌汽车上层控制中计划最佳路线的软件,使用的搜索算法也有几十年历史了。谷歌汽车通过对比现在驾驶情境与过往经验来实现学习的能力,有一部分源于机器学习技术,而这一技术的最初提出可追溯到20世纪50年代。