布谷鸟产研-从特斯拉台湾嘉义事故说双目

* 来源: * 作者: admin * 发表时间: 2020-06-12 10:16:00 * 浏览: 554

单目和三目如果无法识别目标就认为目标不存在。车辆会认为前方无障碍物,会不减速直接撞上去。现实世界每时每刻都在产生着新的不规则目标。特斯拉多次事故都是如此,双目或激光雷达是当前唯一解决方法,本文由布谷鸟科技-产研首席分析师周彦武老师编写。

在2020年6月1日,台湾嘉义县的特斯拉Model 3事故最为典型,一辆大卡车侧翻在地,一辆开启自动驾驶(肯定是在自动驾驶状态,因为如果是人工状态,侧翻的巨大卡车非常醒目,人工状态肯定会制动)的Model 3没有丝毫减速,径直撞上侧翻的大卡车。OPS算力高只是缩短能识别目标的识别时间,如果无法识别,还是毫无价值,一样发生事故。

以特斯拉为代表的单目和三目系统,对深度学习高度依赖,深度学习视觉感知中目标分类与探测(detection)是一体的,无法分割。也就是说,如果无法将目标分类(classifer,也可以通俗地说是识别recognition)就无法探测。换句话说,如果无法识别目标就认为目标不存在。车辆会认为前方无障碍物,会不减速直接撞上去。训练数据集无法完全覆盖真实世界的全部目标,能覆盖10%都已经是很神奇的了,更何况真实世界每时每刻都在产生着新的不规则目标。特斯拉多次事故都是如此,比如在中国两次在高速公路上追尾扫地车(第一次致人死亡),在美国多次追尾消防车。还有无法识别车辆侧面(大部分数据集都只采集车辆尾部图像没有车辆侧面图像)以及无法识别比较小的目标。毫米波雷达容易误判,特别是静止目标,如金属井盖,金属天桥,金属护栏,因此毫米波雷达会自动过滤到静止目标。此时需要双目或激光雷达,这两类传感器都无需分类即可探测。

双目可以准确识别出中央隔离带,无论怎么用深度学习,怎么用单目虚拟双目,单目和三目在这种大面积空洞无纹理特征的车侧和车顶图像前完全就是瞎子,所有像素都几乎无差别,就什么也看不到。特斯拉也有撞上中央隔离带致人死亡的事故。

以上图像,单目和三目也基本是瞎子,视而不见。图片来自丰田工业大学、电装、SOKEN的双目研发成绩汇报。

豪华车领域奔驰、雷克萨斯、捷豹路虎都是双目的拥趸,Tier1领域,全球前4达Tier1的博世、大陆汽车、电装、麦格纳都是双目的拥趸。前三者都有量产双目产品。自动驾驶领域,福特、大众、丰田、奔驰、宝马都是双目拥趸。

麦格纳的自动驾驶原型车,采用双目的克莱斯勒大切诺基

福特与大众联合投资超过30亿美元的Argo自动驾驶原型车,采用500万像素双目

上图为Waymo深度学习科学家drago anguelov 2019年2月在MIT在讲述无人车感知系统时,坦承机器学习的不足,激光雷达和毫米波雷达是感知领域必不可少的。

对单目和三目来说,深度学习是最好的算法,传统经典算法在单目和三目上表现很差。深度学习最大不足是没有确定性。实际深度学习就是靠蛮力计算(当然也有1X1卷积、池化等操作降低参数量和维度)代替了精妙的科学。深度学习没有数学算法那般有智慧,它知其然,不知其所以然,它只是概率预测,它无法具备确定性。所以在目前的深度学习方法中,参数的调节方法依然是一门“艺术”,而非“科学”。深度学习方法深刻地转变了人类几乎所有学科的研究方法。以前学者们所采用的观察现象,提炼规律,数学建模,模拟解析,实验检验,修正模型的研究套路被彻底颠覆,被数据科学的方法所取代:收集数据,训练网络,实验检验,加强训练。这也使得算力需求越来越高。机械定理证明验证了命题的真伪,但是无法明确地提出新的概念和方法,实质上背离了数学的真正目的。这是一种“相关性”而非“因果性”的科学。历史上,人类积累科学知识,在初期总是得到“经验公式”,但是最终还是寻求更为深刻本质的理解。例如从炼丹术到化学、量子力学的发展历程。

如对距离的判断,单目和三目是依靠像素大小,由于高度因素,行人3和行人2的像素大小是非常接近的,单目会因为两者与自车的距离是相同的,但实际上行人2和行人3与车辆距离距离差别很大,单目是纯2D的推算距离,无法对应高低起伏的3D场景,无法得出准确的距离。

双目的缺点在于其算法技术门槛高,双目需要至少7-8年的技术积累,奔驰、丰田、博世、大陆汽车的专利也限制了一些国际大厂进入,双目以前还缺乏专用的ASIC,近年来才有瑞萨V3H,安霸CV22这样的ASIC。深度学习的免费资源很多,从事深度学习的人至少是双目的几千倍,双目人才奇缺,并且一切都要从头做起,几乎没有免费资源。

双目的立体匹配是最具技术挑战的地方,最常见的SGM精度不高,颗粒度很明显,很难实用。奔驰和丰田在这个领域花费了大量时间来研发,奔驰早在1999年就投入双目的研发,2013年才在S级上应用,丰田大约也是1999年开始。

针对立体匹配,丰田开发了一种称之为MPV的算法,类似神经网络

效果相当好

这种方法对算力需求高,但鲁棒性特别强,即使下雪的夜晚都没问题

不少人担心激光雷达价格降低后会取代双目,这是不大可能的。和机械扫描型激光雷达相比,双目体积小,易过车规,易安装。最重要是刷新频率远高于机械扫描激光雷达,对于机械扫描型激光雷达,其角分辨率与刷新频率成反比,激光雷达刷新频率一般是5-10Hz,而双目是30Hz,双目的响应速度更快,可以增加安全性,特别是高速场合。Flash型激光雷达刷新频率可轻易达KHz,但是其性能与双目差距很大,距离近,分辨率低,应用算法成熟度低,8-10年内还不会威胁到双目的地位。