快捷导航
科技信息

到底什么是端到端,蔚来任少卿给我们做了一场普通易懂的遍及

出品丨虎嗅汽车组作者丨李铭扬头图泉源丨蔚来发布会(蔚来智能驾驶副总裁任少卿)7月27号,蔚来举行了一场技能发布会,有芯片亮相,也有整车操纵体系发布,有Nio Phone的正式上市,也有智能驾驶天下模型NWM的展示。

出品丨虎嗅汽车组

作者丨李铭扬

头图泉源丨蔚来发布会(蔚来智能驾驶副总裁任少卿)

7月27号,蔚来举行了一场技能发布会,有芯片亮相,也有整车操纵体系发布,有Nio Phone的正式上市,也有智能驾驶天下模型NWM的展示。发布会后的第二天,虎嗅汽车来到蔚来位于上海漕河泾的办公室,和蔚来智能驾驶副总裁任少卿聊了两个小时。

除了近来热门的端到端技能以外,任少卿从主动驾驶的本质出发,分享了许多源头上的思考。以下为虎嗅汽车与任少卿的对话:

端到端可以类比为“一体式压铸机”

虎嗅汽车:客岁NIO IN发布会就展示了端到端技能,而本年发布了NWM天下模型,那这个模型具体是怎么搭建的?意义安在?

任少卿:我以为表明这些题目之前,大概要先说一下,为什么会有端到端这件事。因为我是做智能驾驶行业的,就发现行业里全部人都在说端到端。但假如你换一个别的行业就会发现,没有人说这个事。好比说呆板人行业,就没有人讲这个事对吧,因为呆板人肯定是端到端,端到端的本质就是我用一个模型去办理一个题目嘛。

那为什么主动驾驶有端到端和非端到端的题目呢?因为智能驾驶本身比AI开发得早,许多年前的模型还没有现在这么成熟,一个模型办理不了这么复杂的题目。举个例子:就和流水线造车一样,已往造一个车尾部的铸造件,因为没有那么大的一体压铸机,那就把它拆成一个个零件。先做一个零件A,然后再做零件B,末了再把A和B拼起来。智能驾驶也一样,已往假如没有办法把这个复杂的题目一次性办理,那我们就把它酿成了流水线,酿成了一个一个工序。但就像压铸机一样,你就要界说,A和B怎样拼接起来?非端到端就是这个原理。

那为什么现在又要做端到端呢?其实跟压铸机也很像,现在有本领做成一体式的了。已往分成两个件,其实会产生一些题目,好比说中心有接口,其实从铸造的角度来说,你接口的强度就没有一体压铸的那么强,还会有额外的损耗。那从模型的角度是什么呢?你假如有接口,这个接口就要界说得相对更清楚。一体式压铸,不是只把零部件压上就竣事了,还要界说接口有几个焊点。模型大概意思也是如许,我要界说两个部门之间有多少个“焊点”,这个过程中现实就会造成信息的丧失,压铸的话就是造成强度的丧失,模型上也会造成信息的丧失。

虎嗅汽车:信息丧失具体是什么?又会造成什么影响?

任少卿:什么叫信息的丧失呢,举个例子,一个最简单的开车场景下,智能驾驶的工作逻辑是怎么样的呢?火线碰到一辆车。起首要有一个感知的模块,这个感知的模块要界说前面这辆车,那怎么形貌它的位置、速率?最简单的方式各人都能明确,就是画个框,然后有隔断、长宽高、速率。第二步再写一个规划的模块,好比说当火线车辆隔断我只有10米时,假如速率比我低,那我就要减速制动了,大概是这个逻辑。

但现实研发时,肯定比上述形貌要复杂得多,当视线富足清楚也就是你能看清火线的时候,这件变乱大概题目不大。但假如遇上下雨天气,现实上你也看不清楚前面的车到底隔断有多远,大概是5米,也大概是10米,此时肯定要界说模型给出个结果,那它怎么给呢?大概给个均匀值大概给个中位数,大概是7米。假如现实隔断是5米,但此时大概就离前车很近,很不安全。而假如现实隔断是10米,那就造成跟车隔断很长,影响体验。这里面,许多都是不确定性的信息。

位置的一阶量隔断,位置的二阶量速率,位置的三阶量加快率,这些不确定因素还会叠加起来,高阶量因素从简单统计上来说,没有办法形貌,以是就产生了信息流失。而非端到端的中心必要有人工的处置惩罚。就跟前面举例的铸造件一样,中心两个件大概要靠个呆板人或靠个人把它焊起来,这个过程中就产生了额外的工序和人工消耗。放在制造业来说,倒还好,大概工人培训一段时间后,比力轻易把产能提升上去。但是主动驾驶算法必要的算法工程师,本身很难规模化。

以是会有这么两个题目,就黑白端到端,第一有信息丧失,第二个要加人工处置惩罚的逻辑在里面,团体的开发服从就会低沉。假如是AEB的题目,处置惩罚一些标准case还好。但假如是真实场景,就会有无穷无尽这种case,人工根本处置惩罚不过来。

主动驾驶许多年前没有本领去做一个模型,以是做了这个流程的拆分,因为做了流程的拆分,以是引入刚才第一个信息丧失的题目。第二个难点,就是办理职员去做针对case的开发,很难规模化,分工辩论就是题目。而到了近来这几年,模型的本领也变强了,那各人就想说,当时因为模型本领不敷,以是有了这些汗青的包袱,现在可以扔了。

好比现在许多其他科技范畴的项目,上来就是一个端到端,因为能用一个模型去办理一个变乱,没有什么比这个更fancy了。端到端和非端到端,本质的差别和逻辑,就是如许。

天下模型的本质:在四维时空里高效安全活动

虎嗅汽车:我们体验了最新版本的智能驾驶,升级之后跟车隔断会调得非常长,会影响用户现实体验。蔚来基于一个怎样的考虑出发来如许操持,是由研发同事界说,照旧产品同事界说的?

任少卿:每个版本都有微小的厘革,但每个人的感觉其实差别会很大。好比说我们感觉大概就没什么特殊大的厘革,那有些用户就比力敏感一些。现实上现在也是数据驱动的去做迭代,数据驱动之后会有一些微改,根本逻辑就是传达这个数据。但我们也在不绝地在加新的数据,每一个版本出来大概都会有些场景举行微调。

已往的智能驾驶,都是固定的逻辑,其实比力轻易。前车是什么速率隔断,我就保持多少速率和隔断。无论什么场景,都是很机械的反应。

现在的做法其实是 motion plan,数据驱动,丢进去各种各样的场景,让它去学习对于隔断尚有速率的掌控。我们会从中挑开得比力好的专业数据,把数据放进去让模型继续去学。但某种环境下,差别的场景大概表现的结果差距就多了。大概附近车多一点,就跟得近一点,附近车少一点,就能跟远一点。以是这个过程中,数据还会连续往里加,连续调优。

虎嗅汽车:NIO IN展示这个天下模型,大概是基于前三秒去想象将来两分钟发生的变乱,你怎么可以或许确定他思考出来或想象出来的东西是公道的?

任少卿:关于猜测,传统的方法其实有许多种,第一种就是短时间猜测,好比我输出一个接下来几秒钟的大概轨迹。就像我们的模型里面,末了输出一个规划轨迹,其他车也输出一个猜测轨迹。这个模型要办理的,就是在当前时间点,本身的车在接下来3秒钟大概7秒钟怎么开。其他的车接下来3秒钟大概7秒钟怎么开。但它是一个独立时候,在某种程度上,就只有这个独立时候的信息。但现在我们盼望可以或许推演的更长,而且盼望推演的这个过程是有交互的。

好比说其他车,我猜测它有大概cut in(切入变道),假如它cut in的话我就变道,假如它不cut in,我就稳固道,就会有如许一些交互的逻辑。现实上,现在有两种做法去做这些交互和猜测。第一种做法是我们客岁做的,跟下棋一样,你可以明确成谁人AlphaGo。它的逻辑就是,假如我的白子落这,(对面)黑子落这,那我下一步白子再落哪,它黑子再落哪。我下一步落白子有200种大概性,它黑子也有200种大概性。假如都看将来三步棋,就有200* 200* 200种大概,这是第一种方式。

另外一种,就是期望模型本身去学习弈棋本领。刚才说的第一种点,你本身想200种大概性,别人再想200种大概性,这相乘起来是4万,但其实这4万种大概性里面,有绝大多数是根本不大概存在的。以是4万种大概性就要把它压掉,把99%的大概都干掉。这现实上是一个紧缩的过程,有一个树分枝的过程,然后有一个砍树枝的过程,接着有个再分枝然后再砍树枝的过程,这两件变乱让模型一起做了。那我们说模型做这个想象和砍树枝的过程,就是要模型得想得对,想得公道,把那些不公道的干掉。

尚有一点我们想分享的就是:我们在城区里面开车通常都会碰到很故意思的变乱,各人都知道有绿波带这个东西。一连碰到两个红灯之后,当你看到火线第三个红灯的时候,起步就不会开那么快了。因为开快了,一脚油门上去,然后你还得一脚刹车下来,本身给本身找罪受。现在还没有任何一个主动驾驶的算法可以做到这种长时间猜测(未必是猜测红灯,也大概是火线出现的未知拥堵),这里必要一个连续几分钟的逻辑。那怎么让模型干,这就必要拟人性。

图片泉源:蔚来发布会,任少卿

虎嗅汽车:天下模型展示的更多是我们观察它的一个过程,但是怎么去用人工干预去逊???

任少卿:回到天下模型这个训练过程,先说我们盼望他干嘛?第一个他能想象,第二个他能推演。关于推演,新手一开始学开车的时候,从一个辅路进来,那离前面的路口大概有100米,但是要左转,必要横跨四个车道。老司机的反应就是直接开已往得了,但新手肯定会思考许多:背面的车速快不快,这么已往行不可?能不能变道?这就是推演的过程。

那模型也必要这么做,只是现在模型用比力显性的方式,给各人展现了这个过程。前面说的端到端,非端到端,这都是范围于主动驾驶这一件变乱上。但我想说:天下模型不范围于主动驾驶,我们现实上就想让一个模型,它无论是开车也好,照旧一个呆板狗在工厂里溜达也好,照旧一个呆板人在家里干活也好。现实上就是盼望有一个模型,具备通用本领,去学会怎么在真实的四维时空里面去高效、安全地活动。

主动驾驶的终极追求:实质性淘汰交通变乱

虎嗅汽车:李斌接受采访的时候,讲了Robotaxi这个贸易模式不是那么make sense。在他看来,主动驾驶更大的意义应该是两点:让驾驶更安全、更加惬意。你怎么看主动驾驶的终极形态和贸易化落地?

任少卿:对,我们很早就认定了主动驾驶真正的两个代价:第一个是解放精神,第二是淘汰变乱。就像你说的,第一个是让人开得更轻松,第二个是开得更安全。

这两点,都必要有新的代价来支持,开得更轻松的代价,就是说我城区开得更好,当然这个对于宣传口来说,其实也比力难传播。以是解放精神这个事和开得更轻松这事,大概就是接下来的L3智能驾驶更能表现出来。

开得更安全这个角度,就是淘汰变乱。之前各人都是各种发小作文发视频,说白了发了那么多视频,那真实案例到底怎么样?demo肯定都能做,都能找出来好的视频。但我以为关于安全,我们本身的追求肯定是实质性淘汰交通变乱。什么叫实质性淘汰变乱?好比说,我们几十万车主,客岁变乱率低沉了70%,全量的话,本年要降到好比说80%到90%。这个数据是要有solid的,能被证明的数据。

虎嗅汽车:你们有对变乱的范例做一些分析和分类吗?

任少卿:从客岁就开始,我们已经具体地去做变乱的分析,这不是一件轻易的事。起首,第一个变乱是:你想知道变乱细节其实不轻易,我们有气囊报警提示,但是气囊报警只占全部变乱的0.3%。第二个是:我们去做IMU的检测,座舱不是有谁人主动传感器,车假如产生撞击,那我去看看它是不是变乱。但传感器监测,也只能获取15%的变乱数据,尚有85%的变乱你不知道。IMU检测传感器必要有一个阈值,不能说人在车上踩一脚产生震惊,我们就拿出来看一看。以是我们把最新的OCC感知加进去,这个能把变乱监测提升到95%以上。

起首得先知道变乱的发生,第二步要知道变乱的范例,我们现实能对全部全量的变乱去分析范例。第三步当分析完变乱范例后,必要判定它的损伤有多大,这里又包罗单方变乱丧失和三方变乱丧失。

有了这些系列分析后,我们才知道还必要做哪些功能,怎么能实质性地淘汰变乱?现实上,最新版本的智能安全辅助功能上线后,我们从保险端数据来看,变乱已经往下走了。当然现在时间还比力短,我们会累计富足多的数据后,再跟各人说这个具体数字。这就是我们想做的事,必须看到群体的变乱报险数在往下走。关于驾驶安全这个事,我们本身的认知就是:各人要拿出现实数据,你到底淘汰了多少变乱。

智驾范畴的玩家会渐渐收敛

虎嗅汽车:蔚来这家公司,芯片、操纵体系、主动驾驶等等许多变乱都自研。在你看来,主动驾驶时代,OEM和Tier 1 (一级供应商)之间的关系会被重构吗?到底是每家OEM全都自研,照旧多数去依赖Tier 1,照旧这两种方式兼而有之?

任少卿:短期内大概会是末了一种,对于主动驾驶的研发,有的case必要1, 000小时、1万小时的测试。作为一级供应商,肯定不如车企更轻易搞到这么多辆车,我们可以让量产车去反馈题目。而智驾的供应商险些没有拿到最新数据,纵然最大的几个公司也一样,这里就会有它的瓶颈在。而智驾的研发越今后越不可逆转的趋势就是数据化,数据越多,越能产生新的体验。

其实对于主动安全的开发也一样,100万公里的测试很正常,一公里三五块钱的本钱也很正常,这都算比力低的,在国外更要高许多。全部这些数据,还要上传到云端硬盘生存,又是一笔很大的本钱。以是许多传统的主动安全供应商,是没有更新逻辑的,就是因为战略本钱太高。末了就只做标准场景,多余的场景别做,做了没法验证,没法迭代。其实这个过程中,实质性的变乱照旧没有淘汰。

我还想分享一个点就是:中国车企今后想做全球化,技能含量越来越高,数据要求越多,其实本钱也会越来越高,不见得会有这么多玩家在智能驾驶这个范畴了。我以为智驾这个范畴肯定是要相对更规模化,然后要收敛,只是说末了收敛到什么程度。末了比拼的是:各人在新的基于模型、基于数据的这种范式下,谁能跑得更快、做得更好、本钱更低,末了渐渐整合。

虎嗅汽车:对于能源战略,蔚来开放换电同盟给其他车企。蔚来的智驾方案,以后也会考虑雷同的战略开放给其他玩家吗?

任少卿:我以为会有这个过程,假如有主机厂对我们的新方案感爱好,我们其实是有多套方案的。4orin芯片,单orin芯片的,纯视觉做城区等等方案。单orin纯视觉做城区的方案,应该现在市面也没有,我们会是第一个。那相对来说,性价比就比力高,背面我们还会有神玑NX9031。

我为什么乐意做这个事?回到前面说的,主动驾驶肯定会向大数据驱动发展,有更多的车,有更好的数据闭环,那你就有更好的竞争优势。基于蔚来体系,我们的数据闭环绝对是全球顶级,那就可以去赋能更多车型。

收藏 邀请
上一篇:从Mag7财报,我看到英伟达的业绩大概被透支了下一篇:富士康回归中国背后的真假
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP