Local EPUB Text
无限状态空间
尽管机器人研究专家使用机器学习技术长达几十年,可这些机器人一直在高度结构化的环境当中运作。机器学习在棋类比赛中运作得非常好,这是因为棋盘是个有限的状态空间,所能产生的下棋方法数量是有限的。塞缪尔的计算机下棋程序通过在数据库中的查找功能,使数据一一对应上棋盘的具体位置。每一个棋面布局都特征鲜明,定义清晰,因此容易进行数据存储。
下国际象棋比西洋跳棋的难度要高,因为每个棋局都有更多的未知可能性,这就是人工智能科学员所说的“高分支系数(higher branching factor)”。更复杂的情形还要数城市街道或是繁忙的高速公路,它们呈现的状态空间可能产生数不清的“下法”或“棋局”。在人工智能的研究中,能够为机器人提供无穷无尽新情形的环境被称为“无限状态空间(Infinite State Space)”。
无人驾驶汽车必须能够处理无限状态空间,因为它会不间断地遇到各种新情况。每一种情况都是全新的,不可能新建一个检索表来存储这些信息。不仅不可能把每一种新经验都归结为有限的可存储单位,而且即使能够生成,大量的存储数据还需要无比庞大的检索表才能迅速输出数据,这哪怕是现代最先进的计算机也无法做到。
多年来,无限状态空间一直是机器人专家把机器学习应用到非结构性的、充满变数的未知环境中去的障碍。直到21世纪初,机器学习才成功实现到无限空间状态的应用——现在已经出现新的算法,计算能力提升以及数量充足的训练数据发展成形。在2005年DARPA挑战赛中,斯坦福大学的工程师第一次尝试把机器学习技术应用在驾驶上。
特伦团队解决无限状态空间的方法其实很简单:把车外千变万化的客观世界简化成两种情况:可驾驶和不可驾驶。他们训练机器学习系统把车载雷达和摄像机收集到的原始实时视觉数据分成两类。为了教机器学习软件识别可驾驶的地面,每个周末团队都会回到沙漠中,收集更多能反映沙漠地貌的视觉数据。当系统出错,他们就会及时调整,然后训练继续。
为了用采集来的数据给中层控制软件的概率网格图搭建视觉系统,特伦团队把数据流配上颜色代码。把机器学习软件认为可以驾驶的前方路面配上一种颜色,不能驾驶通过的路段数据配上另一种颜色。视频显示,当“史丹利”前进时,屏幕上会出现让人眼花缭乱的色彩漩涡,机器学习软件就这样把沙漠的无限状态空间简化成两种类型的。
“史丹利”在2005年挑战赛最终获胜,证明了计算机的视觉应用系统能通过机器学习在复杂多变的现实世界环境中应用。在机器学习软件的发展过程中,关键的推动因素之一是培训数据增多,数量充足。在无人驾驶的应用中,培训数据来源于车载硬件设备,曾经作为稀缺资源的培训数据,随着车载硬件设备在过去几年中的极大提升,也将变得不再稀缺。