目前自动驾驶技能在环球范围内已经进入快速发展期。随着搭载L1/L2级别ADAS功能的汽车进入大规模量产,L1/L2级别ADAS功能的市场渗透率将快速提升。而L3/L4级别自动驾驶系统仍处于小规模原型测试阶段。当今的自动驾驶行业,中国市场绝对是主力。今年中国L2的搭载量估量打破80万,中国品牌霸占绝大部分份额。
ADAS功能市场渗透率的快速提升来自几个方面的驱动力:

1. ADAS干系的软硬件技能越来越成熟和稳定,本钱也越来越低。比如:毫米波雷达跟五年前比较低落了超过50%。

2. 一些基本的ADAS功能(比如:自动紧急刹车AEB)被纳入到了各国的汽车评测体系(比如:C-NCAP)中,这在客不雅观上极大的推动了这些ADAS功能的遍及。
3. 中低端车竞争加剧,ADAS功能可以有效地提升品牌的科技感和驾车体验,造成主流合伙品牌和自主品牌的重点车型乃至超过了一些国际上的高端品牌。
未来中国市场ADAS功能的渗透率还将持续快速提高,中低端汽车所配置的ADAS功能将逐步增多。根据艾瑞咨询研究报告显示,估量2025年ADAS功能在乘用车市场可以达到65%旁边的渗透率。L3级别的高速自动领航HWP功能和L4级别的AVP自动停车功能,目前车型渗透率较低,未来提升空间较大。
图3-1 ADAS功能市场渗透率预测
1.1 ADAS/AD功能汇总目前行业内的ADAS系统实现了很多赞助驾驶的功能,总体上这些功能按照用场可以分为这么几类:主动安全功能、舒适性赞助驾驶功能、停车赞助功能和监督/无监督自动驾驶功能等。
常日,L0-L2级自动驾驶,习惯用ADAS表征;L2+级自动驾驶,用ADAS/AD表征,以示过渡;L3-L4级自动驾驶,用AD表征。
1.2 ADAS/AD系统架构智能驾驶系统实质上便是要办理三个问题:1)我在哪?2)我去哪?3)我该如何去?基于这样一个别系模型,范例的智能驾驶系统或者自动驾驶系统常日由三部分组成:
1. 环境感知:感知系统依赖各种传感器(包括:摄像头、毫米波雷达、超声波雷达、激光雷达、高精舆图/IMU/GPS等)来获取汽车所处环境信息和周边车辆、行人、交通信号灯和路标等信息,为汽车的综合决策供应数据支撑,办理“我在哪”的核心问题。
2. 决策方案:通过环境感知的结果进行数据领悟,结合高精舆图数据确定得当的事情模型,决定相应的轨迹方案方案,以达到替代人类作出驾驶决策的目的,将智能汽车以拟人化的办法融入全体交通流当中,办理“我去哪”的核心问题。
3. 掌握实行:也便是对一个详细的最小决策方案结果的实际实行,从而达到方案的目的。详细在车上,常日表示为通过各种掌握理论和算法来掌握车辆的驱动、制动和转向系统,从而实现车辆的横向及纵向掌握,使汽车精准地按照决策方案实现有效的避让、减速、车距保持、转向等动作,办理“我该如何去”的核心问题。
图3-2 范例自动驾驶系统的系统模型
2.ADAS/AD感知系统
自动驾驶的感知系统实在包括:环境感知、车辆自身状态感知以及车辆定位等几大模块。传感器是车辆感知系统网络环境信息、车辆自身状态信息和位置信息等的主要手段。自动驾驶车辆所配备的传感器可以分为三类:
车辆自身状态感知传感器(简称:自感知传感器):自感知利用本体感应传感器来丈量车辆确当前状态,包括:车辆的速率、加速度、横摆和转向角等。本体感应西西里常日利用预先安装的丈量单元来获取信息,比如:里程表、惯性丈量单元(IMU)、陀螺仪(Gyroscopes)和来自掌握器局域网(CAN)总线的信息。定位传感器(Localization):定位传感器利用GPS等外部传感器(Exteroceptive Sensor)或惯性丈量单元读数的航位推算进行定位,可以确定车辆的环球和本地位置。车辆高精度定位常日会基于多个传感器信息的组合来进行,比如:GPS、IMU、里程表和摄像头等。对多个传感器的数据领悟可以最大限度减少单个传感器的局限性和缺陷,提高定位的精度和可靠性。环境感知传感器(Surrounding-sensing):环境感知传感器紧张有摄像头、超声波雷达、毫米波雷达和激光雷达等四种。环境感知系统依赖这些环境感知传感器来采集车辆所处环境信息数据,并对其进行一些列的打算和处理,从而对周围环境进行精确建模,其输出结果是一个环境模型。所谓环境模型是指车辆外部物理天下的数字表示,它包括道路、要避开的物体(比如:其它车辆、易受侵害的道路利用者等)以及可驾驶的“自由空间(Freespace)“的表示。
不同传感器特点互异
不同的传感器由于其事情事理不同,因此具有不同的特性。主机厂为了担保ADAS感知系统的冗余和鲁棒性,常日会采纳多种传感器领悟的配置方案。下表总结了ADAS系统中常见的各种传感器的特点:
2.1 ADAS系统传感器布局方案
主流的ADAS系统从L0级别发展到目前的L2+级别,技能方案已经发生了巨大的变革,从早起的分布式智能传感器方案演化到现在基于ADAS域掌握器的ADAS域集中式方案。相应的传感器布局也有了很大的变革。
下面是常见的一些ADAS传感器布局中的术语简称:
FCM:Front Camera Module,前视摄像头总成,有单目(Mono)、双目(Stereo)、双焦(Bi-Focals)和三焦(Tri-Focals)4种形态。FCR:Front Central Radar,前雷达模块,有MRR (中距,Mid-Range Radar) 和 LRR (长距,Long-Range Radar) 2种形态。一样平常1R1V方案(后续会详细阐明该方案)中常选择MRR作为前雷达模块,5R1V方案中,常选择LRR作为前雷达。SRRs:Side-Rear Radars,侧后雷达模块(左、右,一样平常左master右slave),有SRR (短距Short-Range Radar) 和MRR (中距Mid-Range Radar) 2种形态;SRR常为24G毫米波,MRR常为77-79G毫米波。这里SRR缩写就有两个含义,可能是指侧后雷达模块,也可能是指短间隔毫米波雷达,因此加s区分侧后雷达模块(SRRs)。USS:Ultra Sonic Sensor,超声波雷达传感器。早期的L0-L2级别的ADAS系统是由几个相互独立的子系统组成的,每个子系统实现相应独立的ADAS功能,因此也称为分布式的ADAS系统方案。
图3-3 早期的L0-L2级别的ADAS系统实现方案
前向ADAS系统:一样平常由单FCR,或者单FCM组成;当前主流配置是FCR+FCM组成的1R1V方案,能够支持到TJA/ICA的L2 ADAS(单车道驾驶赞助)。后续伴随视觉检测能力的提高,在L0-L2级ADAS/AD定位的车型上,有向单FCM发展趋势,由于车道线等横向掌握所需感知信息,只有视觉能供应;省却雷达能降落系统本钱。侧后ADAS系统。一样平常由侧后方两个SRRs组成,实现大部分侧后向ADAS功能。自动停车系统。即停车掌握器+12颗超声波传感器(USS)组成的APA(自动停车赞助)系统;实现功能紧张是APA和FAPA等。全景环视系统。即由全景环视掌握器(实际现在该掌握器目前已很少见,该零部件实体已经被接管合并到其他掌握器节点上了;紧张由车机、停车掌握器或者域掌握器所取代)+ 四个鱼眼摄像头组成。实现AVM功能(Around View Monitoring,环视监控)。个中,前两个别系常称之为行车ADAS系统(Driving ADAS System),有时候这种行车ADAS方案也常被称作3R1V方案,3 Radar 1 Vision方案;后两个常称之为停车ADAS系统(Parking ADAS System)。
到L2+级别的ADAS系统,集成度更高、性能更强大的ADAS域掌握器整合了原来分散的ADAS子系统,原来分散系统所独占的传感器数据可以被多个ADAS功能所复用。
L2+级别的ADAS系统紧张有两大类:1)多雷达域集中式方案,紧张是5雷达方案,常见的有5R1V、5R2V、5R5V等方案;2)多视觉的域集中式方案,是指基于多雷达方案的连续演进,形成多视觉感知+雷达冗余感知的系统,比如5R12V方案。
下图是L2+级别ADAS/AD系统最大化的传感器架构方案——5R-12V-12USS方案。这个传感器布局架构的上限便是“武断不上激光雷达”。只要上了激光雷达(一样平常是前向激光雷达),就到了L3级AD系统的传感器架构;
图3-4 L2+级别ADAS系统的终极传感器布局架构
前视主摄像头(Main Camera, x1):主摄像头在L0-L2阶段对应FCM总成,即单目前视方案;在L2+域控方案中,作为dummy Camera,采取LVDS与域掌握器连接。常见的HFOV(水平视场角,Horizontal Field Of View)紧张有30° - 50° - 60° - 100° - 120°等核心设计值,一样平常较为圆整化。实际工程实现值,会根据详细光学镜头的不同,有48°/52°(设计值50°)、28°(设计值30°)等规格。摄像头色彩矩阵(Patten)常日为RCCB或RCCC,有向RYYCy发展的趋势。RYYCy没有Clear,色彩信息未丢失,可以担保色彩还原性能。检测间隔150-170米。前视窄角摄像头(Narrow Camera, x1):30°旁边的前视摄像头,用来不雅观察红绿灯/车辆/行人等关键目标。一样平常与前视主摄像头会采取相同的图像传感器(比如同为1.3MP,或同为2MP,乃至同为8MP的Image sensor),缩小FOV后,像素密度变大,检测间隔相对Main Camera更远;Patten常为RCCB或RCCC。检测间隔250米。前视广角摄像头(Wide Camera, x1):HFOV约140°,类似特斯拉的三焦视摄像头中的广角摄像头。在上了8MP摄像头后,Main Camera的FOV都能达到120°了,Wide Camera可能就不须要了。侧前(旁边两颗)摄像头(Corner Camera, x2):HFOV约70°-80°,后续会升级到约100°;类似特斯拉的B柱摄像头,向侧前方看,紧张关注近间隔车辆cut-in和自车变道需求。Patten常为RCCB或RCCC。侧后(旁边两颗)摄像头(Wing Camera,x2):HFOV约80°-90°,后续可能会统一到100°。Patten常为RCCB或RCCC;关注侧边和侧后方目标,知足变道需求。后视摄像头(Rear Camera):同前向Main Camera,用于后方目标检测。以上这些摄像头,也常称为Driving Cameras(行车摄像头,多用于行车功能)。
前向鱼眼摄像头(Front Fisheye Camera):鱼眼环视摄像头之一,用于全景环视功能的Display(给人看的,显示功能,HMI),以及领悟停车功能的视觉Detection(给“车”看的,视觉感知,目标检测);常用色彩矩阵为RGGB,由于有色彩还原需求。若利用8MP摄像头,并利用像素合并技能降落到2MP利用,则可以选择RYYCy。左侧鱼眼摄像头(Left Fisheye Camera):同上。右侧鱼眼摄像头(Right Fisheye Camera):同上。后向鱼眼摄像头(Rear Fisheye Camera):同上。以上这四颗鱼眼摄像头,也常称为Parking Cameras(停车摄像头,多用于停车功能);当然L2+阶段各个传感器不断领悟,目前Driving Camera和Parking Camera的界线已经逐渐模糊了。停车功能也常用前视摄像头做影象停车(MPA,Memory Park Assist);行车功能也常用侧边鱼眼摄像头检测车道线做safety stop。
除以上视觉传感器,还有很多主动型传感器:
前向毫米波雷达(Front Central Radar):一样平常为LRR(Long-Range Radar),卖力前方目标检测,具备良好的测距测速性能,也不随意马虎被遮挡;侧前角雷达(Side-Front Radar, SFR x2)和侧后角雷达(Side-Rear Radar, SRR x2): 车辆四角,一样平常由SRR(Short-Range Radar)或MRR(Middle-Range Radar)充当。可以供应双模检测模式,Long Range Mode和Short Range Mode;长间隔模式FOV小,检测间隔远;短间隔模式FOV大,检测间隔近。在域掌握器方案中,雷达不分Master和Slave。在分布式方案中,一样平常左侧雷达为Master,右侧雷达为Slave。超声波传感器(Ultra Sonic Sensor, USS):12颗,侧边4个长间隔,前后8个短距的。除了上诉环境感知传感器之外,L2+及以上ADAS/AD系统还须要GNSS定位、IMU(一样平常旗子暗记来源于安全气囊掌握器或者ESP系统)、高精舆图平分歧感知数据源。
3.ADAS/AD域控芯片及方案
(一) L0-L2级别的ADAS方案
正如前所述,早期大多数L0-L2级别的ADAS系统都是基于分布式掌握器架构,全体ADAS系统由4-5个ADAS子系统组成,每个子系统常日是个一体机整体方案(可以被看作是一个smart sensor),子系统独占所配置的传感器,常日相互之间是独立的。
以智能前视摄像头模块(Intelligent Front Camera Module,FCM)为例,全体子系统ECU主板上包含2颗芯片:一颗是安全核(Safety Core);另一个颗是性能核(Performance Core)。安全核一样平常由英飞凌TC297/397之类的MCU充当,承载掌握任务,因此须要较高的功能安全等级需求;性能核常日是具有更高性能算力的多核异构MPU,会承载大量的打算任务。
下面是一个对L0-L2级别方案的总结:
L0级别方案:实现各种ADAS报警功能,比如:FCW、LDW、BSW、LCA等。分布式架构,常日由FCM、FCR、SRRs、AVS、APA等几大硬件模块组成。L1级别方案:完成各种ADAS单纵向核单横向掌握功能,比如:ACC、AEB、LKA等。也是分布式架构,硬件模块组成与L0级别方案大致相同。L2级别方案:完成ADAS纵向+横向组合掌握功能。比如:基于FCM+FCR领悟系统,领悟前向视觉感知和前雷达目标感知信息,实现TJA/ICA等功能;或者基于AVS+APA的领悟系统,实现自动停车功能。(二)L2+以上级别的ADAS方案
分布式架构的ADAS系统存在两个致命缺陷:1)各个子系统相互独立,无法做多传感器之间的深度领悟。2)各子系统独占所配置的传感器,因此无法实现跨多个不同子系统传感器的繁芜功能。
当整车EE架构演进到域集中式EEA之后,ADAS域掌握器中配置了集成度更高、算力性能更高的打算处理器平台,进而可以支撑更繁芜的传感器数据领悟算法,以实现更高品级别的ADAS功能,比如:HWP、AVP等。
集中式ADAS域掌握器方案从最早的四芯片方案,过渡到三芯片方案,再到当前业界主流的两芯片方案,如下图3-5所示:
图3-5 ADAS域掌握器方案演进历史
下图3-6是一个范例的车载ADAS域功能构造示意图,无论硬件方案如何变革,各方案所需实现的功能构造都是类似的。
图3-6 范例的车载ADAS域功能构造示意图
3.1 Mobileye EyeQ系列芯片方案Mobileye成立于1999年,因此色列供应基于视觉算法剖析和数据处理来供应ADAS/AD办理方案的环球领先者。其EyeQ系列芯片产品截止2021年底已经总计出货靠近一亿片。只管在L3/L4领域被英伟达和高通压制,但是在主流的L2级别ADAS市场,仍旧是霸主,其市场霸占率高达75%。2021年出货量高达2810万片。
Mobileye一贯采取“传感器+芯片+算法”绑定的软硬件一体化的ADAS办理方案模式。这种“黑盒”商业模式的优点是开拓周期短,客户可以快速出产品,比较受转型较晚或者软件/算法能力较弱的传统主机厂或者Tier 1厂商欢迎。但是缺陷是导致客户开拓灵巧度低落,不能知足客户差异化定制产品的需求。越来越多的主机厂希望采取更开放的平台,把“芯片和算法剥离开,采取可编程的芯片,从而通过OTA来实现持续的算法迭代升级”。这也是软件定义汽车的思路。
下面是其EyeQ4/5/6三代产品的基本情形:
(一)EyeQ4芯片平台
EyeQ4新品配置了4个MIPS CPU核、6个矢量微码处理器(VMP)以及两个可编程宏阵列(PMA)。每个CPU核拥有4个硬件线程。总计2.5TOPS的算力,可以实现以每秒36帧的处理速率处理8路摄像头的视频信息。总体性能比较EyeQ3提升8倍之多,此外,EyeQ4还引入“路网采集管理(REM)”系统,它利用纵包数据的方法将路标、车道线等进行压缩,终极聚合成路书,从而为自动驾驶汽车供应更精确的定位。
下图是EyeQ4新品的功能模块图。
图3-7 EyeQ4芯片功能模块图
(二)EyeQ5芯片平台
EyeQ5紧张有4个模块:CPU核、打算机视觉处理器(CVP)、深度学习加速器(DLA)和多线程加速器(Multithreaded Accelerator,MA)。个中,CPU和CVP是大头。
EyeQ5选择了Imagination的MIPS I6500作为CPU内核,每个MIPS I6500内核都拥有2个硬件线程。统共配置8个CPU内核,可供应高达52000 DMIPS算力。
EyeQ5统共配置18个CVP内核。CVP是Mobileye针对很多传统打算机视觉算法设计的新一代视觉处理器。Mobileye从公司成立时起就以自己的CV算法而有名,也由于用专用的ASIC来运行这些CV算法而达到极低的功耗而有名。
EyeQ5采取了7nm的制程工艺,总计可供应高达24TOPS的算力,并且只有10W旁边的TDP功耗,因此有着极为出色的能效比。EyeQ5最多支持20个外部传感器,包括:摄像头、雷达或者激光雷达等。出色的打算性能使得我们在EyeQ5上进行深度的传感器领悟,以实现更繁芜的L2+/L3级别ADAS功能。
下图是EyeQ5的芯片功能模块图:
图3-8 EyeQ5 Block Diagram
(三)EyeQ6芯片平台
EyeQ6H与Mobileye之前的芯片最大的不同便是加入了两个小算力规模的GPU,一个是ARM Mali GPU,算力为64GFLOPS,估量用于ADAS的AR图像叠加输出。另一个是Imagination的BXS 1024 MC-2,算力为1000GFLOPS,估量用于OpenCL加速引擎。
CPU仍旧是EyeQ5的MIPS I6500-F架构,不同之处在每个CPU内核的线程数从2个增加到4个,统共是8核32线程。
EyeQ6H可以用比EyeQ5多25%的功耗,供应比3倍于EyeQ5的算力性能。
图3-9 EyeQ6 ADAS域控处理器
Mobileye芯片平台最大优点是产品本钱低,开拓周期很短,开拓用度极低,绝大部分功能都经由验证,没有风险。而缺陷是系统非常封闭,难以搞特色功能,迭代困难,出了问题,较难改进或提升。对付传统车厂而言,Mobileye基本是唯一选择,对付总想分歧凡响的新兴造车厂家来说就有点无法适应。然而新兴造车企业毕竟还是极少数。Mobileye霸主地位至少五年内固若金汤。
3.2 TI Jacinto 7芯片平台2020年初的CES大会上,TI发布了其最新的Jacinto 7架构的系列车载芯片。上一代的Jacinto 6架构紧张聚焦在车载Infotainment(信息娱乐)的功能,例如更炫的UI(用户界面)、更多的显示屏等。随着新一代Jacinto 7架构芯片的发布,可以看出TI已经基本放弃智能座舱和IVI市场,而重点转向ADAS域控和汽车网关域方向。
Jacinto 7系列芯片包含两颗车规级芯片:(1)用于高等赞助驾驶(ADAS)系统的TDA4VM芯片;(2)用于网关系统的DRA829V处理器。这两款处理器都包含了用于加速数据密集型打算任务的专用加速器(如打算机视觉和深度学习等),而且它们也都集成了支持ISO26262功能安全的MCU核,使得我们可以用一颗芯片来同时承载ASIL-D高等别功能安全的掌握任务和传感器数据处理这样的打算密集型任务。
3.2.1 TDA4VM ADAS芯片基于Jacinto™ 7架构的TDA4VM处理器专为L2+或以上级别的集中式ADAS域掌握器平台而设计的,它集成了各种加速器、深度学习处理器和片上内存,具有强大的数据剖析和处理能力,是一个全功能、可编程的高集成度ADAS域控处理器平台。
这种多级处理能力使得TDA4VM能够胜任ADAS域的各种中央处理单元角色。比如:TDA4VM处理器支持接入8MP(800万像素)高分辨率的摄像头,更强大的前视摄像头可以帮助车辆看得更远,因此可以开拓出更强的赞助驾驶增强功能。用户也可以用TDV4VM处理器同时操作4到6个300万像素的摄像头,并还可以将毫米波雷达、超声波雷达和激光雷达等其它多种传感器数据处理在一个芯片平台上进行深度领悟(后领悟)。还可以将TDA4VM处理器用作自动停车系统中的中央处理器,实现360度的环视感知能力,从而可以开拓出用户体验更好的360度全屏停车系统。
以下框图的左边是当前范例的ADAS 系统框图,紧张数据处理部分是由GPU或NPU完成,在这颗运用场置器外,汇合成MCU、外部ISP、以太网交流机和PCIe交流机等。右边是利用TDA4VM后的ADAS系统框图。TDA4把原来外部须要的上述模块集成到芯片中,个中包含通用途理部分的CPU、实时MCU、功能安全MCU、C7x DSP、MMA深度学习加速器、VPAC DMPAC视觉加速器、内部的ISP和以太网交流机,以及PCIe交流机等等。显然利用TDA4VM可以大大简化ADAS系统的硬件繁芜度。
图3-10 TDA4x域控处理器简化ADAS系统架构
下图是TDA4VM处理器的Block Diagram。其芯片中关键特性如下:
具有两个64位 Arm® Cortex®-A72微处理器子系统,事情频率高达1.8GHz,22K DMIPS;每个Cortex®-A72核集成了32KB L1 D-Cache和48KB L1 I-Cache。每个双核Cortex-A72 Cluster共享一个1MB大小的L2 Cache。有六个Arm® Cortex®-R5F MCU,事情频率高达1.0GHz,12 K DMIPS;每个核存储器为64K L2 RAM隔离安全岛中的MCU子系统有两个Arm® Cortex®-R5F MCU通用打算部分有四个Arm® Cortex®-R5F MCU两个C66x浮点DSP,事情频率高达1.35 GHz, 40 GFLOPS, 160 GOPS;C7x浮点,矢量DSP,高达1.0 GHz, 80 GFLOPS, 256 GOPS;深度学习矩阵乘法加速器(MMA),1.0GHz高达8 TOPS (INT8);视觉处理加速器(VPAC)和图像旗子暗记处理器(ISP)和多个视角赞助加速器;深度和运动处理加速器(DMPAC);图3-11 TI TDA4x处理器功能模块图
“C7x”是TI的下一代DSP,它将TI 行业领先的DSP 和EVE 内核整合到单个性能更高的内核中并增加了浮点矢量打算功能,从而实现了对旧代码的向后兼容性,同时简化了软件编程。新型“MMA”深度学习加速器可在业界最低功率包络内实现高达8TOPS 的性能。专用的ADAS/AV 硬件加速器可供应视觉预处理以及间隔和运动处理。
TDA4VM处理器还能很好地知足全体系统的功耗哀求,当胜任这些ADAS域控所需的高性能打算,TDA4VM处理器仅需5到20W的功耗,因此无需主动冷却。比如:Momenta曾在2020年CES有一个演示,在现场有客户触摸TDA4 的芯片外壳,创造芯片外壳上没有做任何的散热,可见功耗是非常低的。
TDA4VM处理器內的功能安全设计包括两部分:1)隔离的功能安全岛中集成了两个支持双核锁步模式的Cortex-R5F核,可以实现ASIL-D级别的功能安全;2)别的主处理器部分可以达到ASIL-B功能安全。
隔离的功能安全岛中集成了两个支持双核锁步模式的Cortex-R5F核,可以实现ASIL-D级别的功能安全;功能安全岛中的两个ARM Cortex-R5F核带有浮点协处理器,支持双核锁步运行模式。512字节的Scratchpad RAM内存高达1MB、带有ECC支持的片上SRAM安全岛內专用的电压与时钟域(独立于主处理器)安全岛內专用的内存和接口设计(独立于主处理器)主处理器的别的部分可以达到ASIL-B功能安全:片上内存和互联都带有ECC保护内置自检机制(Built-in Self-Test,BIST)3.2.2 DRA829V网关芯片传统汽车过去一贯在利用低速网络(比如:CAN/LIN等)进行通信,因此如果要对整车所有电控单元进行软件升级将会是非常缓慢的(如下图的左边部分)。当当代汽车演进到域集中式EEA之后,比如常见的三域EE架构(ADAS域、座舱域、整车掌握域),域与域之间的通信就须要非常高速的通信总线(如下图右边),因此就须要中心网关跨域通信的网络协议转换和包转发功能。DRA829V处理器便是用于这个场景。
图3-12 DRA829V作为汽车域和域之间的通信网关
DRA829V 处理器是业界第一款集成了片上 PCIe 交流机的处理器,同时,它还集成了支持 8 端口千兆支持 TSN 的以太网交流机,进而能够实现更快的高性能打算和整车通信。
下图的左边是TI理解的全体车身运算平台的框架,在这个框架运用场置器外须要接上外部的PCIe交流机、以太网交流机,也须要外部的信息安全模块(eHSM),外部的MCU。而下图的右边用DRA829V处理器把上述外部须要集成的IP模块全部集成进来,因此大大降落了硬件繁芜度,提高了可靠性。TI汽车网关处理器最核心的一点是高性能处理器,同时须要功耗非常低。
图3-13 TI DRV8x系列网关芯片简化网关系统架构
DRA829V SoC 通过供应打算资源、在车辆打算平台中高效移动数据以及在全体车辆网络中进行通信,办理了新型车辆打算架构带来的难题,可以看到DRA829V 紧张是处理数据交流和安全的问题。
与NXP S32G2/S32G3比较,虽然这两款芯片都是针对汽车中心网关场景,但是设计特点是不同。
图3-14 NXP S32G中心网关处理器
NXP的S32G是作为一个成熟的网络处理器设计的,最大的特色是通过网络卸载引擎来加速3层的协议转换和包转发。它完备是作为汽车域集中式EE架构中的中心网关场景量身设计的,可以有效处理各掌握器的OTA升级、数据网关的交互,安全信息的传输等任务。
而DRA829V 更多是车内高速旗子暗记的集联和转发,这些能力使DRA829V更适宜充当域内的高速旗子暗记的集联和转发节点(把稳:这不同于NXP S32G的中心网关角色,可以认为是域主控处理器所须要的网关功能)。当然,DRA829V也可以作为中心网关的角色,但是由于缺少类似于NXP S32G网关中包转发引擎,因此这并不是DRA829V的主打功能。
3.3 NVIDIA Xavier/Orin的方案英伟达是环球最大的智能打算平台公司。公司早期专注于PC图形打算,后来利用其适宜大规模并行打算的GPU架构,逐步将业务重点拓展到云真个AI加速、HPC高性能打算、AR/VR等领域。除了精良的硬件平台架构和性能之外,NVIDIA在软件和生态上也具有巨大的上风。基于NVIDIA GPU架构的CUDA软件开拓平台,是业界事实标准的异构打算框架。NVIDIA在CUDA打算框架的根本上,开拓出了DNN加速库、编译器、开拓调试工具以及TensorRT推理引擎等。
NVIDIA 2015年正式发布其面向移动端/机器人/自动驾驶等领域的智能处理器Tegra X1,它内置集成了当时NVIDIA最前辈的Maxwell架构的GPU核。这颗SoC处理器的发布也在环球开启了嵌入式领域的AI打算时期。
借助于它在云端积累的CUDA+TensorRT生态上风,NVIDIA在自动驾驶领域供应“芯片+完备自动驾驶软件栈”端到端办理方案,包括:Drive AV软件平台、Drive IX软件平台、Drive Sim等完全的软件生态。
3.3.1 Xavier自动驾驶打算平台NVIDIA在2018年CES上推出了Xavier平台,作为Driver PX2 的进化版本。NVIDIA称Xavier 是“天下上最强大的SoC(片上系统)”,Xavier可处理来自车辆雷达、摄像头、激光雷达和超声波等传感器的自主驾驶感知数据,能效比市场上同类产品更高,体积更小。“NVIDIA® Jetson AGX Xavier™ 为边缘设备的打算密度、能效和 AI 推理能力树立了新的标杆。”
2020年4月上市的小鹏汽车 P7,成为首款搭载 NVIDIA DRIVE AGX Xavier 自动驾驶平台的量产车型,小鹏 P7 配备了13 个摄像头、5 个毫米波雷达、12 个超声波雷达,集成开放式的 NVIDIA DRIVE OS 操作系统。
Xavier SoC基于台积电12nm FinFET工艺,集成90亿颗晶体管,芯片面积350平方毫米,CPU采取NVIDIA自研8核ARM64架构(代号Carmel), 集成了Volta架构的GPU(512个CUDA核心),支持FP32/FP16/INT8,20W功耗下单精度浮点性能1.3TFLOPS,Tensor核心性能20TOPs,解锁到30W后可达30TOPs。
Xavier是一颗高度异构的SoC处理器,集成多达八种不同的处理器核心或者硬件加速单元。使得它能同时、且实时地处理数十种算法,以用于传感器处理、测距、定位和绘图、视觉和感知以及路径方案等任务负载。
八核CPU:八核 “Carmel” CPU 基于ARMv8 ISA深度学习加速器(DLA):5 TOPS (FP16) | 10 TOPS (INT8)Volta GPU:512 CUDA cores | 20 TOPS (INT8) | 1.3 TFLOPS (FP32)视觉处理器:1.6 TOPS立体声和光流引擎(SOFE):6 TOPS图像旗子暗记处理器(ISP):1.5 Giga Pixels/s视频编码器:1.2 GPix/s视频解码器:1.8 GPix/sXavier的主处理器可以达到ASIL-B级别的功能安全等级需求。
下面是Xavier SoC的Block Diagram:
图3-15 NVIDIA Xavier处理器功能模块图
除了强大的打算资源外,Xavier SoC拥有丰富的IO接口资源:
Xavier有两个版本的片上系统(System On Module),分别是Jetson AGX Xavier 8GB和Jetson AGX Xavier:
Jetson AGX Xavier 8GB:是一款价格实惠的低功耗版的Jetson AGX Xavier,在软硬件上与现有的 Jetson AGX Xavier 完备兼容。其全体模块最高花费 20W 功率,同时供应高达 20 TOPS 的 AI 性能。Jetson AGX Xavier:作为天下上第一个专为自主机器人设计的智能打算平台,Jetson AGX Xavier可以供应很高的打算性能,同时保持较低的功耗。Jetson AGX Xavier平台可以预设10W、15W和30W三种运行模式,Jetson AGX Xavier Industrial(工业版)则供应两种可选的功耗模式:20W和40W。下面是各不同版本的Jetson AGX Xavier片上系统的性能参数比拟:
基于Xavier的ADAS DCU方案
Ecotron(ecotron.ai/)是美国一家专注于ADAS DCU(ADCU)的制造商。它于2019年9月发布了EAXVA03型ADAS域掌握器,这是一款采取NVIDIA Xavier SoC和Infineon TC297 MCU打造、面向L3/L4级别自动驾驶领域的高性能中心打算平台。按照设计方案考虑,Xavier智能处理器用于环境感知、图像领悟、路径方案等,TC297 MCU用于知足ISO26262功能安全需求(ASIL-C/D级别)的掌握运用处景(也即作为Safety Core),比如安全监控、冗余掌握、网关通讯及整车掌握。
目前最新的型号已经发展到EAXVA04和EAXVA05。EAXVA04是EAXVA03的升级版,还是一颗Xavier+一颗TC297的方案,而EAXVA05则采取了两颗Xavier+TC297的方案,因而可以供应更大的算力。下面是EAXVA04 ADAS域掌握器的构造图:
图3-16 EAXVA04的方案构造图
下面是EAXVA05 ADAS域掌握器双Xavier+TC297 MCU的方案构造图:
图3-17 EAXVA05 ADAS域掌握器构造图
3.3.2 Orin自动驾驶打算平台2019年12月英伟达发布了新一代面向自动驾驶和机器人领域Orin芯片和打算平台。具有ARM Hercules CPU内核和英伟达下一代GPU架构。Orin SoC包含170亿晶体管,晶体管的数量险些是Xavier SoC的两倍,具有12个ARM Hercules内核,将集成Nvidia下一代Ampere架构的GPU,供应200 TOPS@INT8性能,靠近Xavier SoC的7倍,Orin SOC将在2021年供应样片,2022年正式面向车厂量产。
2020年5月GTC上,英伟达先容了即将发布的新一代自动驾驶Drive AGX Orin平台,它可以搭载两个Orin SoC和两块NVIDIA Ampere GPU,可以实现从入门级ADAS办理方案到L5级自动驾驶出租车(Robotaxi)系统的全方位性能提升,平台最高可供应2000TOPS算力。未来L4/L5级别的自动驾驶系统将须要更繁芜、更强大的自动驾驶软件框架和算法,借助强劲的打算性能,Orin打算平台将有助于并发运行多个自动驾驶运用和深度神经网络模型算法。
作为一颗专为自动驾驶而设计的车载智能打算平台,Orin可以达到ISO 26262 ASIL-D 等级的功能安全标准。
借助于前辈的7nm制程工艺,Orin拥有非常出色的功耗水平。在拥有200TOPS的巨大算力时,TDP仅为50W。
下图是Orin SoC的Block Diagram:
图3-18 NVIDIA Orin处理器功能模块图
下表是Jetson AGX Orin的片上系统的性能参数:
3.4 高通Snapdragon Ride自动驾驶平台
2020年12月30日,长城汽车召开智能驾驶计策升级发布会,正式发布全新的咖啡智驾“331计策”。会上,长城还与高通达成计策互助关系,决定在量产车上搭载高通Snapdragon Ride自动驾驶平台。长城汽车操持在2022年推出环球首个基于高通Snapdragon Ride平台的L4级量产车。搭载IBEO的4D全半导体真固态激光雷达,也便是Flash激光雷达,最远有效间隔可达300米。
高通Snapdragon Ride自动驾驶平台在硬件方面由两块芯片构成:1)SA8540主处理器(作为ADAS域运用主处理器,知足系统级安全需求);2)SA9000B加速器,供应自动驾驶系统所需的算力。全部达到ASIL-D,可支持L1~L5级别的自动驾驶。单板的AI算力是360TOPS(INT8),整体功耗65瓦,打算能效比约为5.5TOPS/W,通过PCIe交流机可以增加到4套打算平台,四加速器的AI算力总计达1440TOPS。
ADAS运用场置器:Kryo CPU、Adreno GPU、神经处理器、嵌入式视觉处理器自动驾驶专用加速器(ASIC):神经网络处理器阵列L1/L2级ADAS:面向具备AEB、TSR和LKA等驾驶赞助功能的汽车。硬件支持:1个ADAS运用场置器,可供应30 TOPS的算力L2+级ADAS:面向具备HWA(高速赞助)、自动停车APA以及TJA(低速赞助)功能的汽车。所需硬件支持:2个或多个ADAS运用场置器,期望所需算力哀求60~125 TOPS的算力L4/L5级自动驾驶:面向在城市交通环境中的自动驾驶乘用车、机器人出租车和机器人物流车;所需硬件支持:2个ADAS运用场置器 + 2个自动驾驶加速器(ASIC),可供应700TOPS算力,功耗为130W到目前为止,高通还未公开其SA8540P和SA9000B两款芯片的信息,高通单独为L3/L4自动驾驶开拓全新芯片的可能性极小,以是我们可以根据高通的其它干系芯片产品来大致推测一下。高通在2021年上半年正式商业化一款AI 100边缘打算套件,采取骁龙865做运用场置器,AI 100做加速器,在M.2 edge接口下,算力为70TOPS,在PCIe接口16核心下,算力可达400TOPS。
根据长城的宣扬图片,8540和9000都是7纳米,AI 100和骁龙865也是7纳米,PCIe也在长城的宣扬图片上可以看到。当然为了车规,必须捐躯一点性能,通过降频来降落功耗,达到车规,因此性能降到了360TOPS。骁龙865是高通7纳米芯片中最顶级的,870的频率更高,最高达3.2GHz,功耗势必更高,因此8540最有可能是骁龙865的车规版芯片,当然X55的Modem可以去掉。高通只有一款加速器,SA9000B很可能便是AI 100的车规版。
图3-19 高通Cloud A100 AI加速处理器
高通AI 100的核心走的是DSP路线,单芯片最多有16个AI核心。每个AI核的SRAM是9MB,16个便是144MB,特斯拉FSD是64MB,基本上AI 100是特斯拉的两倍。高通套件用的是12GB的LPDDR5,特斯拉FSD只能对应LPDDR4。
高通当然不会只供应硬件,而是会供应全套软硬件办理方案,包括软件SDK、工具和仿真等。
图3-20 高通Snapdragon Ride自动驾驶软件栈架构
高通自动驾驶平台的互助伙伴,重点是其视觉感知和驾驶策略软件栈Arriver。实际Arriver便是Veoneer的软件品牌,停车方面紧张是法雷奥,Park4u是法雷奥停车系统的名称。DMS方面紧张互助伙伴是Seeing Machines,即凯迪拉克DMS供应商。
总体来看,高通的策略是自己供应端到真个完全软硬件办理方案,并同时积极布局高下游相应的生态互助伙伴。
4 ADAS/AD芯片的关键指标作为全体汽车的大脑,自动驾驶域掌握器常日要连接多个摄像头、毫米波雷达、激光雷达以及IMU等传感器设备,并对来自这些传感器的大量数据进行处理和打算。尤其是摄像头和激光雷达所产生的数据量非常大,因此须要配置一个核心运算性能越来越强劲的自动驾驶主处理器。
下面我们总结一下自动驾驶主处理器所应具有的关键指标:
(一)CPU核心
在汽车电子领域,常日以DMIPS(Dhrystone MIPS)来丈量CPU核心的整数打算能力。
Dhrystone标准的测试方法很大略,便是单位韶光内跑了多少次Dhrystone程序,其指标单位为DMIPS/MHz。MIPS是Million Instructions Per Second的缩写,每秒处理的百万级的机器措辞指令数。DMIPS中的D是Dhrystone的缩写,它表示了在Dhrystone标准的测试方法下的MIPS。
除了Dhrystone Benchmark之外,CoreMark是另一套在嵌入式领域常见的CPU核心性能的测试基准。CoreMark是由嵌入衰落处理器基准评测协会EEMBC的Shay Gla-On于2009年提出的一项基准测试程序,其紧张目标是测试处理器核心性能,这个标准被认为比迂腐的Dhrystone标准更有实际代价。
(二)Memory带宽
自动驾驶芯片平台由于要接入大量的传感器数据,因此内存的压力非常大。全体系统每每呈现出Memory-Bound系统的特点,因此内存带宽常日决定了系统性能的理论上限。
比如常见的256-bit LPDDR4@4266,其带宽为:(256 4266)/ (8 1000)= 136.5GB/s。256-bit LPDDR5@6400的带宽为:(256 6400) / (8 1000) = 204.8 GB/s。
(三)AI算力
自动驾驶系统由于要处理各种各样的传感器数据,因此对算力需求很大。个中当属对来自摄像头的视觉图像数据的处理最为花费算力。
自动驾驶级别每升高一个级,其所需算力至少增加数倍。比如:L2级别须要10+ TOPS的算力,L3须要100 TOPS旁边的算力,L4级别可能须要500 TOPS旁边的算力,L5级别乃至须要1000+ TOPS以上的算力。
除了理论硬件算力之外,实际的算力利用率也至关主要。不同AI加速器的架构设计常日会导致不同的硬件算力实际利用率,因而相同的神经网络模型在两款具有相同硬件理论算力的AI加速器上跑出不同的实测性能。
(四)能效比
能效比是算力与TDP功耗之比,也即每瓦功耗所能贡献的理论算力值,这是衡量AI加速器设计好坏的一个非常主要指标。比如:NIVIDA Orin芯片的算力为200TOPS,TDP是50W,其能效比约为4TOPS/W。
(五)车规与功能安全
与消费电子产品比较,汽车芯片在安全性和可靠性上有这个最高的哀求。
汽车芯片长年事情在“-40℃到125℃”高低温以及剧烈震撼的恶劣环境下,为了担保汽车电子产品达到对事情温度、可靠性与产品寿命的高标准质量哀求,国际汽车电子协会(Automotive Electronics Council,AEC)建立了干系的质量认证标准,个中AEC-Q100是针对付车载集成电路压力测试的认证标准。AEC-Q100标准经由多年景长,已经成为汽车电子产品在可靠性和产品寿命等方面的工业事实标准。
除了知足车规级哀求之外,自动驾驶芯片也须要知足由ISO 26262标准定义的“功能安全(Function Safety,简称Fusa)”的认证哀求。功能安全对芯片上的设计哀求是要尽可能找出并纠正芯片的失落效(分为:系统失落效和随机失落效)。系统失落效实质上是产品设计上的毛病,因此紧张依赖设计和实现的流程规范来担保,而随机失落效则更多依赖于芯片设计上的分外失落效探测机制来担保。
ISO 26262对安全等级做了划分,常见的是ASIL-B和ASIL-D级别。ASIL-B哀求芯片能覆盖90%的单点失落效场景,而ASIL-D则哀求能达到99%。芯片面积越大,晶体管越多,相应的失落效率越高。
(六)视觉接口与处理能力
摄像头接入目前常日采取MIPI-CSI2接口标准。MIPI CSI(Camera Serial Interface)是由MIPI同盟下 Camera 事情组指定的接口标准。CSI-2 是 MIPI CSI 第二版,紧张由运用层、协议层、物理层组成,最大支持4通道数据传输、单线传输速率高达1Gb/s。同时接入的摄像头路数是自动驾驶芯片的一个主要指标。比如:NVIDIA的Xavier/Orin都许可同时接入16路摄像头。
ISP作为视觉成像处理的核心芯片,也是非常主要的。自动驾驶芯片常日内置集成的ISP模块。通过MIPI-CSI-2接口所连接的摄像头Sensor,先把Raw图像数据送给ISP进行处理,ISP处理过后的RGB/YUV图像数据再送给其它模块,比如:CODEC或CV加速器等。为了得到更好的图像效果,自动驾驶汽车上对ISP的哀求非常高。
此外,跟视觉处理干系的主要特性还包括:图像绘制加速GPU,显示输出接口以及视频编解码等。
(七)丰富的IO接口资源
自动驾驶的主控处理器须要丰富的接口来连接各种各样的传感器设备。目前业界常见的自动驾驶传感器紧张有:摄像头、激光雷达、毫米波雷达、超声波雷达、组合导航、IMU以及V2X模块等。
对摄像头的接口类型紧张有:MIPI CSI-2、LVDS、FPD Link等。激光雷达一样平常是通过普通的Ethernet接口来连接。毫米波雷达都是通过CAN总线来传输数据超声波雷达基本都是通过LIN总线组合导航与惯导IMU常见接口是RS232V2X模块一样平常也是采取Ethernet接口来传输数据除了上述传感器所需IO接口外,常见的其它高速接口与低速接口也都是须要的,比如:PCIe、USB、I2C、SPI、RS232等等。








