快捷导航
科技信息

车端的地平线,瞄着云端的英伟达

导语Introduction你有GPU,我有DSA。作者丨王小西责编丨李思佳编辑丨朱锦斌说到AI芯片范畴,迩来的一件大事是,10月13日地平线和大众旗下软件公司CARIAD官宣相助。两边建立合资企业,CARIAD控股60%,投资约24亿欧元

导语

Introduction

你有GPU,我有DSA。

作者丨王小西

责编丨李思佳

编辑丨朱锦斌

说到AI芯片范畴,迩来的一件大事是,10月13日地平线和大众旗下软件公司CARIAD官宣相助。两边建立合资企业,CARIAD控股60%,投资约24亿欧元,预计会在2023年上半年完成。

这算是地平线迄今为止最重磅的一个相助。而一个插曲是,半年前地平线才公布第三代产物征程5芯片首个定点相助,花落比亚迪,上车时间2023年。不外,故意思的是,比亚迪同时也将投产搭载英伟达DRIVE Orin盘算平台的车型。

而公社C次元迩来一篇文章《英伟达不要的,地平线都要》,对地平线和英伟达在汽车范畴AI芯片应用的竞争环境也做了先容,以是,这篇我们就科普科普,到底这两家企业竞争些什么,以及车企的选择背后是怎样的思量?

都是AI芯片,有啥不一样?

论及两边,他们的产物都是用于主动驾驶范畴的AI芯片。但是区别还是很大的。

AI芯片的应用场景,紧张分为云端和终端,尚有边沿端。现在,云端应用的更多,相对成熟。别的,云端应用又可分为练习和推理两种,此中练习的市场规模占比力高。

云端应用的霸主,就是英伟达。而云端(服务器、数字中央)和终端(手机、智能汽车等移动端)应用场景中,AI芯片的运算方式有着本质性的差异。

比如,云端处置处罚大批量一次性到达的累积数据(扩大批处置处罚量,batch size),可以“等”数据“够了”再开始处置处罚。但车端芯片则须要处置处罚流数据,随着行驶(时间)连续到来的数据;须要实时完成盘算,尽大概得低落延长。

对于交互性,终端要求更高。云端任务本身是限定在假造天下,无需思量与现实天下的交互。终端则身处现实天下,每一个任务都须要思量交互性。

别的,功耗和本钱在车端AI芯片的考量中也占据更重的分量。可见,对于汽车终端来讲,AI芯片除了须包管盘算能效,尚有低功耗、低延长、低本钱的要求。

现在,AI芯片紧张有三种,分别是通用型的GPU,可定制的FPGA,以及专用的ASIC。英伟达的Orin芯片,是基于通用GPU。而地平线的征程5芯片,既是ASIC芯片,也是DSA(Domain Specific Architecture 特定范畴架构)芯片。值得留意的是,Orin芯片的核心GPU架构还是云端架构。

不外,对车企来说,芯片的兼容性越强越好,由于车企可以一步到位,而且无需再重新做验证,用一个芯片就能实现未来高阶智能驾驶的硬件预埋,为未来更高阶的智能驾驶做好准备。这也是很多品牌乐意选择英伟达Orin芯片的缘故起因。

而地平线接纳面向特定场景的软硬团结方法论来筹划芯片,也就是DSA芯片的做法,极大提升了芯片的有效算力。但是,我们的疑问是,征程5芯片的极限到达后,更高级别的主动驾驶需求就要换用征程6,那么,这个换装的综合本钱,谁来买单蒙受呢?

除了算力,尚有FPS

除了通用和定制的区别,现在业内存在“唯算力论”,好像芯片算力越高以为越好。实在,这有失偏颇。现实上,还是要看FPS(每秒传输帧数)才行。

FPS平凡来讲就是指动画或视频的每秒画面数。FPS是丈量用于生存、体现动态视频的信息数量。简朴来说,FPS数值越大,性能越好。对于主动驾驶全部应用的盘算平台来说,FPS被以为是权衡先辈算法运行服从的评价标准之一。

比如,在芯片算力上,单片英伟达Orin和征程5的算力分别为254TOPS(每秒万亿次盘算)和128TOPS,功率为45W和30W,功耗比分别为4.6TOPS/W和4.2TOPS/W。征程5只有英伟达Orin的一半。

但是,征程5的FPS(每秒传输帧数)却为1283。比Orin的1001FPS(基于同安培架构的英伟达RTX3090举行调解后测算得出)高出不少。地平线征程5画面传送视频的流通度显着要好于英伟达Orin。怪不得地平线BPU算法负责人罗恒要说,“能效上来看,我们(征程5相比Orin)有6倍多的提升。”

实在,不但是地平线以FPS来算帐。2017年发布自研的FSD芯片时,特斯拉首创人马斯克便以此前应用的英伟达Drive PX2作比,从算力来看FSD是Drive PX2的3倍,但FPS是Drive PX2的21倍。

别的,低延长性能也是权衡AI芯片性能的关键指标。由于,延长标题直接关乎驾驶证安全。比如,在告急制动场景下,100毫秒意味着近1.7~3.3米的刹车隔断。

而按照地平线的说法,征程5的8M单现在视感知布局化输出延长小于60毫秒,比英伟达ORIN的延长性能更好。而Orin芯片的低延长数据未知。

以是,从FPS和低延长、低成原来说,地平线在汽车范畴的发展机遇还是很大的,现在有凌驾20家车企的70多款车型应用了征程系列芯片,这也是地平线通过定制蹊径的“奇兵”劳绩的结果。

架构,决胜

而在第五波盘算海潮之下,决定芯片的核心,固然是架构。由于,架构是芯片企业最底层的核心技能,迭代本钱巨大,也是最值钱的技能。

作为提出DSA架构的泰山北斗,John Hennessy与David Patterson在得到2017年图灵奖时的获奖演说中指出:“未来十年,将是盘算机体系布局的黄金年代”。这是一个很好的注脚。

而地平线的征程系列芯片,从其架构来说,履历了名为高斯、伯努利和贝叶斯的三代BPU(Brain Processing Unit, 地平线自主筹划研发的高效的人工智能处置处罚器架构)架构。

从低到高,高斯架构紧张处置处罚感知,就是图像辨认,辨认摄像头,雷达,传感器等的图像,接纳40nm工艺。而伯努利架构参加了深度学习,20nm工艺。贝叶斯架构则是参加贝叶斯网络,团结深度学习来进步AI的正确率,16nm工艺。

再来看英伟达。创建于1993年的英伟达锋利之处在于,1999年发明GPU(图形处置处罚器),2006年发布CUDA通用并行盘算架构,实现了软硬解耦。开辟者不必再利用高难度的GPU专用开辟语言,而能利用通用性的编程语言调用GPU算力。

通过软硬解耦,将图形处置处罚的专用芯片GPU变为实用于大规模并行盘算的通用型芯片,英伟达站上AI期间的C位。对于地平线以及其他芯片企业来说,也是高山仰止、冒死追赶的对象。

而英伟达的Orin是基于Ampere(安培)架构,这也是推动英伟达数据中央业务增长近9成的主力产物架构。换句话说,面向高级别主动驾驶场景的Orin,用的还是魔改的通用架构。这就像,本年大热的高通8155芯片,是从消耗电子芯片魔改而来。

通用架构的利益是“上手轻易”,拿来就能用,而且工具丰富。不外,缺点是,很多硬件性能前期是浪费的,临时用不上的。

那么,为什么站在云端的英伟达仍旧在用通用架构?看看汽车业务占比就明确。

5月26日,英伟达发布2023财年Q1财报(制止2022年3月),本季营收82.9亿美元,同比增长46%。此中,由超大规模盘算、云端和AI业务推动的数据中央业务占比45.23%;显卡支持的游戏业务占比43.67%。汽车业务呢?微不敷道,占比2.1%。

地平线的营收环境,没有公开的披露。不外,2020年《晚点LatePost》曾报道,地平线2020年营收为2~2.3亿元,此中70%来自向车厂提供芯片等产物的收入,客户包罗长安、一汽和理想汽车等。

从营收来看,地平线和英伟达的差距还不是一个数量级的,还根本无法威胁到英伟达的职位,是海洋界鲸鱼和海豚的关系。以是,英伟达没什么动力去做面向车企的ASIC芯片。这也给了地平线和其他芯片企业巨大的机遇。

固然,地平线还处于发展初期也就是要不绝砸钱的阶段。根据企查查的数据,假如不盘算未披露的融资金额,地平线累计融资超34亿美元(约合人民币243.3亿元)。迩来一笔,是奇瑞汽车的。

地平线现在的核心业务只有端侧的汽车范畴。市场方面,地平线征程系列芯片现在累计出货凌驾150万片。而通过针对主动驾驶场景算法和需求专门筹划的专用芯片,实现在服从上的更高效,只是地平线追赶英伟达的第一步。

就像前面说的,比亚迪并不是唯逐一个同时摆设英伟达和地平线的车企。理想在2021理想ONE以及后续的理想L8 Pro上搭载了征程5,而在理想L8 MAX和L9上则利用的是英伟达Orin。

以是,地平线更难的是构建出好用的软件体系,以及能支持连续演进迭代的用户生态,而这正是英伟达CUDA体系的王牌所在。地平线的天工开物尚有很长的路要走。不外,无论怎样,地平线给中国汽车企业带来了一个DSA芯片的可选项,都是件“极好的”事。

收藏 邀请
上一篇:苹果Q4净利增长不到1% 高端iPhone机型供应仍将受限下一篇:利亚德:西欧贩卖小间距产物来欧洲工厂
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP