Local EPUB Text
机器人的自我管理
深度学习软件应用在驾驶上产生了一种妙不可言的边际效应。导航软件一开始效率不高,不过只要达到某个临界点之后,导航软件的性能就会持续加速提升。换言之,无人驾驶系统收集的数据越多,它们的驾驶技术就越高明。总结这种良性循环,我们会发现这与机器学习软件的训练数据多少有关。消耗的数据越多,软件的性能就越好,从而推动系统越发积极采集数据。
该良性循环是这样展开的:起初,需要有人类司机来训练汽车学习软件。积累到了一定程度,到达一定临界点后,深度学习软件开始自主导航行驶,同时收集新的训练数据,形成稳定的数据流。新数据用于训练深度学习软件,以提高物体识别的准确率,进一步改进性能。当导航软件的能力提升后,就可以派遣更多的车辆在街道上行驶。当无人驾驶汽车以车队的形式集体工作时,其增长速度会开始以幂次方速度进行增长。车队装配有相机和深度学习软件,将会记录每棵树、每堵墙、每个垃圾桶、每道风景的特色。一天下来,车辆把数据上传到中央数据库,这样别的车辆也能利用这些数据。有了这上千甚至上百万辆无人驾驶汽车贡献自己采集的数据至丰富又鲜活的数据池,深度学习软件的性能才能飞速增长。
车队学习还会以另一种方式加速无人驾驶汽车性能的提高。若是几辆汽车记录了相同的视觉环境,重叠部分将会被交叉检查。由于错误检测软件需要检查多辆汽车,实现数据交叉检查,以确保数据的准确性。假如有1000辆汽车都报告看见一棵树倒在路旁,并且目击时间一致,观察角度各异,那么确实有一棵树倒在路旁的概率就很高。
深度学习软件的能力最终是由软件自己来提高的,这让人联想到一个有趣的场景,那就是移动机器人有能力提升车载地图的准确率。这个地图构建过程被称为“即时定位与地图构建(simultaneous localization and mapping, SLAM)”。发明这个方法的同学最初命名为“即时地图构建与定位”,字母缩写为SMAL(幸运的是他的导师建议重新调换单词次序,于是一个与著名篮球杂志《SLAM》相同的,响亮的字母缩写SLAM诞生了)。
SLAM本质上是把Bootstrap——一个被广泛应用的Web前端框架——采用在地图上的过程。在这个过程中,移动机器人能很快构建起新的认知环境,以其中一个点作为初始视野点,并由此扩散开来。该过程以机器人选择起点作为开端,接着,它开启视觉传感器记录下该位置所能看到的一切物体,所捕捉到的原始数据被录入空白的原始地图。接来下,机器人逐步推进,并重复扫描,在第二个视野点描绘出周围场景的第二幅地图。先前位置上观察到的大部分物体在当前的视野中也能看到。根据两幅地图的重叠部分,机器人能进行校对,整理成一幅更大型、更精确的地图。对这幅新融合而成的地图进行三角测算处理,根据所看到的物体推断出机器人所在地点以及确定下一步探索的未知地图边界。
由于机器人不断进行即时定位与地图构建过程,它马上就能完整而精确地构建出该区域的局部地图。我们曾看见研究中的机器人使用SLAM方法快速对建筑物周围环境进行学习:机器人以一张空白的地图开始,经过几个小时的游荡,成功生产出一张大型地图。
图10.1 使用即时定位与地图构建(SLAM)技术得出的3D地图
来源:Jakob Engel, Jorg Stuckler和Daniel Cremers合著的论文《立体相机的大规模直接SLAM技术》(Large-Scale Direct SLAM with Stereo Cameras),2015年国际智能机器人和系统大会,1935~1942页。
Andreas Geiger,Philip Lenz和Raquel Urtasun合著的论文《自动驾驶,我们准备好了吗?KITTI视觉基准测试套件》(Are We Ready for Autonomous Driving? The KITTI Vision Benchmark Suite),2012年国际计算机视觉与模式识别会议,3354~3361页
SLAM技术赋予机器人自主提升地图准确性的能力。由于移动机器人使用SLAM技术来收集传感信息,机器人储存的地图质量不断攀升。良性循环开始了。当机器人存储的地图精确度与详尽程度提升到了一个新高度,机器人就成了一个更好的导航者,从而能更好地出发,去收集更多的数据来更新地图。
如今,移动机器人把SLAM技术应用在各个领域,从军事领域到家用扫地机器人。与车队学习相类似,也出现了团队型SLAM。在这个过程中,几名机器人通力合作,把视觉数据进行汇合。SLAM另一个分支技术是3D SLAM,这项技术可以使自动潜水艇绘制出海底地图,使空中无人机描绘出探测过的洞穴的内部情况。
如果有无人驾驶车队使用Booststrap框架来提升高清地图和深度学习的准确性,它们将会采用类似团体型SLAM和3D SLAM的工作过程,反复拍摄每个街景,仔细查看每个路面上的裂痕、颠簸之处和道路标志。当无人驾驶车队获取的图片信息形成平稳的即时数据流并输入软件,就能形成一个不断成长和更新的数据模型,内容将覆盖路上行人的举止行为和该地区路面街道的详细情况。当车队把它们各自驾驶的经验都汇集成机器人认知的合集时,综合起来的经历将等同于一个人类司机几千年积累的驾驶经验。