机器之心作者

香港买马最准免费资料

Medium上今天出现了一篇博文,Mayank Bansal、Abhijit Ogale两位研究人员详细介绍了利用标注数据(即来自专业驾驶演示的Waymo数百万英里的已标注数据)通过监督学习训练tkcpcc天空彩票与你驾驶员的方法。

Waymo,自动驾驶技术,自动驾驶
今年,自动驾驶公司Waymo取得了一些里程碑式的进展。8月份,Waymo的实地自动驾驶里程突破1000万英里,上周,Waymo又推出了一款商用自动驾驶车——Waymo One。但该公司的研究人员始终着眼于未来。
 
Medium上近期出现了一篇博文,Mayank Bansal、Abhijit Ogale两位研究人员详细介绍了利用标注数据(即来自专业驾驶演示的Waymo数百万英里的已标注数据)通过监督学习训练tkcpcc天空彩票与你驾驶员的方法。
 
学习人类经验
 
「近年来,tkcpcom天空彩票神经网络中的监督训练使用大量标注数据在许多领域迅速提高了当前最佳水准,尤其是在目标检测及预测领域。这些技术在Waymo得到了广泛应用,」研究人员写道。「随着感知神经网络取得成功,我们自然而然地会问自己:我们可以利用纯监督tkcpcom天空彩票学习方法训练出一个熟练的自动驾驶员吗?」
 
模拟环境中,Waymo的智能体绕过一辆停泊的车。青色路径描绘了输入路径,绿色框是智能体,蓝色点是智能体的过去位置,绿色点是预测的未来位置。
 
模拟环境中,Waymo的tkcpcc天空彩票与你系统根据前方车辆位置减速停车。带有褪色尾部的黄色方块是场景中过去一秒内的动态目标(其它车辆)的位置。
 
为了创建一个能够模拟专业驾驶的系统,他们精心设计了一个神经网络——ChauffeurNet,该网络通过观察真实和模拟数据(包括地图、周围目标、交通灯状态和汽车过去的运动)学会了生成驾驶轨迹。一个低级的控制器将十点轨迹转化为转向和加速指令,允许tkcpcc天空彩票与你模型驾驶真实和模拟汽车。
 
该模型从「相当于专业驾驶60天的驾驶数据」中得到样本,其使用的技术确保了它不会根据过去的运动推断下一步动作,而是根据环境中的变化做出反应。在测试中,它会对交通控制标识做出反应,如停车标识和交通灯。但遇到以前从未见过的情况时,它的表现不佳。


 
模拟异常情况
 
研究人员指出,造成这种问题的原因在于其从现实驾驶中获得的驾驶demo是有偏差的——它们只包含正常情况(无事故)下的驾驶案例。为了教网络从边缘案例中恢复,该团队合成了接近事故和与物体发生碰撞的情况,后者鼓励tkcpcc天空彩票与你模型避开这些物体。
 
Waymo的模型在转弯时的表现。图源:Waymo
 
ChauffeurNet在模拟环境中表现较好,它将损失和合成的示例都考虑在内,甚至还能绕过停泊的车辆,在信号灯由黄变红时停下以及在其轨道上修复些微的偏差。在现实世界的私人试车跑道驾驶Waymo的克莱斯勒Pacifica小型货车时,ChauffeurNet成功地驶过了弯道,并正确判别了停止信号和转弯。
 
「全自动驾驶系统需要具备处理现实世界种种状况的能力,」研究人员写道。「在Waymo车辆上运行的现有规划器将机器学习与外显推理相结合,连续不断地评估大量概率变量并在多种不同的情境下做出最佳驾驶决策……因此,用完全的机器学习系统替代Waymo规划器的门槛很高,尽管这一系统的组成也可以用在Waymo规划器内,或者用于在规划器的模拟测试期间创造更加实用的『智慧智能体』」。

模型结构

 
 
红色轨迹表示场景中动态目标的过去轨迹,绿色轨迹表示每个目标未来2秒之内的预测轨迹。
 
ChauffeurNet内部由两个部分组成——FeatureNet和AgentRNN。AgentRNN的输入包括一张展示过去智能体姿态的图像、一组由卷积网络FeatureNet从展示的输入中计算的特征、一张展示过去智能体框的图像、展示预测未来智能体姿态以预测智能体下一个姿态的外显记忆,以及俯视视角下的下一个智能体框。这些预测用于更新AgentRNN的输入,从而预测下一个时间步。
 
最后,让我们看看这篇介绍ChauffeurNet的论文:《ChauffeurNet:Learning to Drive by Imitating the Best and Synthesizing the Worst》。
 
论文链接:https://sites.google.com/view/waymo-learn-to-drive
 自动驾驶 Waymo 自动驾驶技术