关于马斯克说话误导性的高质量分析TOP2引言:微博用户猩红线歌者认为马斯克关于FSD使用光子信息重建图像质量比人好很有误导性。误导性分为2个层面:1.认为特斯拉使用的不是原始光子信息,是经过CMOS预处理后的RAW DATA。2.假设真的在用原始光子信息,纯视觉方案在一些特殊场景下依然是处理不了的,而马斯克的表达显得特斯拉有能力处理这些。猩红线歌者论述处理不了的依据,有两条是基于物理定律正确前提下的不可行(原文没有非常细化解释,但是论证不可行是到了这个尺度的),其余的更多是工程上很困难。
以下为猩红线歌者的原文:关于马斯克的推,我想到了一个比较好的比喻:
这就相当于有人在告诉你直接去活牛身上啃下来的牛肉更能保留营养,相比于加工做熟后的牛肉营养价值更高。
首先这个结论是对的,牛肉经过加工做熟后会流失营养,当然没直接啃下来的有营养,不过他没告诉你的是:
一、吃生牛肉首先你得有一个比较好的牙口,能把生牛肉直接啃下来,嚼细碎,才能咽下去(RAW DATA冗余信息多,有效特征隐蔽,一般的CNN小模型直接使用效果会很差,只能用参数量较大的Transformer网络才行)。
二、吃生牛肉你还得有一个比较好的消化系统(因为RAW DATA的数据量和传输速率需求远大于RGB,所以会对车载算力和显存带宽的要求大幅提升)
三、生牛肉由于带血有很重的血腥气,并且未经过烹饪,可能带有细菌,也不符合人类口味(RAW DATA很多时候人眼无法直接观看,标注、筛选、增广都要配套专门体系,传统图像标注工具无法直接使用)
虽然特斯拉实际使用的并不是原始光子信息,而是经过CMOS做了极简预处理(线性降噪和拜耳解码等等)后的RAW DATA,但是我上述的比喻依然适用。
我论述到这里,有人可能会说,那是你太菜了,特斯拉上面的问题都能搞定。好,我们就忽略以上所有,我只想问这些人一个问题:
即使直接使用原始光子信息,是否可以解决所有炫光、弱光等等纯视觉路线的问题?答案是不能。
为什么?因为纯视觉还有大量更底层的光学和硬件级问题无法解决。包括但不限于:
一、物理极限极弱光。在接近完全黑暗、环境中无有效光子入射时,CMOS也无法输出任何有效的RAW DATA数据,只能靠硬件感光规格优化解决。
二、对向直射超高亮远光、正午直视太阳,光子电荷直接填满CMOS像素电容达到物理饱和,哪怕RAW DATA也会出现满值过曝,算法无法彻底解决。
三、镜头上出现杂光、鬼影、镜头眩光时,RAW DATA依然会保留这些信息,它们无法被消除从而影响算法表现。
四、夜间环境导致的过量噪点即使经过预处理依然有可能干扰特征识别,影响算法表现。
五、雨雾、沙尘、大雾等恶劣环境会带来透光率衰减,影响有效光子乃至于RAW DATA的输入,识别衰减无法被完全消除,影响算法表现。
所以有一说一,直接使用RAW DATA(跳过ISP)甚至光子原始信息,从理论上和特斯拉的实践上来讲确实可以解决部分视觉问题,但并不能解决自动驾驶中所有的感知局限性问题。
马斯克只会告诉你特斯拉搞定了哪些问题,不会告诉你新技术引入了哪些问题以及搞不定哪些问题。只片面地强调新技术的优势,就是一种变相的画饼和误导。
理想汽车理想汽车理想i6理想i8理想MEGA理想L6理想L7理想L8理想L9
