地平线征程J6系列芯片深度分析_征程_地平线

文章目录 [+]

图片来源：地平线

征程6系列不是人们之前预测的3款芯片，而是6款，足以覆盖智能驾驶的各个场景和价位。
发布会上重点先容了征程6B、6E、6M和6P，笔者认为B该当是Base，L是Light，E是Efficiency，M是Medium，H是High，P是Performance或Premium。
地平线没有公开征程6L和6H的参数，预估6H的AI算力是256-300 TOPS，CPU算力是250-300K DMIPS。
6L的AI算力是30-40TOPS，CPU算力是40-50K DMIPS。

地平线征程J6系列芯片深度分析_征程_地平线地平线征程J6系列芯片深度分析_征程_地平线通讯

征程6系列与5系列比较，升级最明显的是CPU算力。
征程5的CPU是8核心Cortex-A55，算力大致是25-30K DMIPS，这次除了最低的征程6B，别的CPU算力都大幅度提高。

（图片来自网络侵删）

征程6系列的另一个升级是BPU架构，所谓BPU便是地平线对AI加速器的另一种称呼，B代表Brain，可以称为类脑处理器，第一代BPU，地平线致敬数学家伯努利，伯努利分布是最大略的离散型概率分布模型。
第二代BPU，地平线致敬英国数学家贝叶斯，他推导出贝叶斯定理，贝叶斯定理是一个由结果倒推缘故原由的概率算法，当年默默无闻，在人工智能的本日大放异彩。

征程6的第三代BPU架构则致敬博弈论创始人纳什，称之为纳什架构。
约翰·纳什，生于1928年6月13日，著名经济学家、博弈论创始人、《俏丽心灵》男主角原型，并且还是前麻省理工学院助教，后任普林斯顿大学数学系教授，紧张研究博弈论、微分几何学和偏微分方程。
由于他与其余两位数学家（经济学家，约翰·C·海萨尼和莱因哈德·泽尔腾）在非互助博弈的均衡剖析理论方面做出了首创性的贡献，对博弈论和经济学产生了重大影响，而得到1994年诺贝尔经济学奖。

博弈论紧张针对智能车与智能车，智能车与非智能车之间决策交互产生的影响，目前大部分智能驾驶都是基于单车的，未考虑其他车辆对智能车决策的影响，这使得智能车有时候看起来不十分灵巧，比如对向车主动让道让智能车先走，但智能车无法理解对向车的意图，还是傻傻地等对向车先走。
也便是智能驾驶的策略，大多都有强化学习的影子，强化学习（Reinforcement Learning，RL）旨在通过与环境（可以是虚拟的也可以是真实的）的交互来使智能体（我们的「模型」）学习。
RL 一开始是根据 Markov 过程提出的，我们让智能体处于不愿定的固定环境中，并试图通过褒奖/惩罚机制来学习到一个最优策略。
在单智能体的情形下，这种方法被证明是收敛的。
但是，如果是将多个智能体放置在同一环境中（多智能体强化学习，MARL），情形就繁芜多了。

假设我们正在试着用智能车来改进城市的交通情形，这时每辆车的决策都会影响其他车的决策与表现，比如智能车与智能车之间很可能会发生冲突，由于可能对付两辆智能车而言，沿着某条路线行驶都是最方便的（得到最多的褒奖）。
博弈论有个RL算法，它利用深度神经网络进行函数逼近，迭代打算子游戏的收益矩阵（Gt）。
这个子游戏便是上文提到的 stage games。
在每个韶光 t 处（每个 stage game），都会打算出符合 NE 的回应（σ），并得到最优策略（π），然后添加新的策略来扩展 Gt 为 Gt + 1，连续重复上述过程。
这是最高明的智能驾驶决策算法。

征程6全系列的AI加速都是纳什架构。
征程6B主打极致性价比，CPU可能是6核心的Cortex-A55，制造工艺可能是14或28纳米，征程6B的国际意向客户是博世和电装，海内意向客户是四维图新、福瑞泰克和Minieye。
紧张对手可能是Mobileye的EyeQ5M/H和EyeQ6L。

图片来源：地平线

征程6系列主打产品是E/M。

图片来源：地平线发布会现场

征程6系列将于2024年内开启首个前装量产车型交付，并估量于2025年实现超10款车型量产交付。
面向中阶智驾市场，地平线推出普惠城区性价比方案最优解——征程6M，以及极致体验高速NOA最优解——征程6E，并供应符合AEC-Q104车规标准的SiP模组和Matrix 6域控参考设计，以超高集成度实现更低的功耗和更优的系统本钱。
发布会上，地平线官宣与多家Tier1、软硬件互助伙伴达成征程6E/M的互助，并公布到2024年第二季度将有超过50家生态伙伴推出基于征程6E/M的准量产级产品。

图片来源：地平线

大家最关注的还是征程6系列的旗舰征程6P。

图片来源：地平线发布会现场

征程6P的AI算力是560TOPS，地平线谨慎地做了标注，560TOPS是在1/2稀疏网络下的等效算力，地平线未提及精度，该当还是INT8位。
这个算力实际远超4片Orin合并的算力，再强调一次，以目前车载领域用的最顶级车载以太网交流机带宽不超过1.25GB/s，范例的PCIe 4.0交流机，带宽不超过32GB/s，即便是价格远超Orin 的PCIe 6.0交流机，带宽也不超过120GB/s。
想要像做事器行业那样是用4个H100就让算力增加4倍，带宽至少要做到900GB/s，而这根本做不到，用最顶级的车载以太网交流机连接4个Orin，算力顶多是1.2倍单个Orin算力，也便是300TOPS。
这也是英伟达要花十几亿美元开拓NVLINK的缘故原由，也是NVLINK被美国牵制严禁出口的缘故原由。

图片来源：地平线发布会现场

CPU是18核心的ARM Cortex-A78AE，算力是410K DMIPS，英伟达Orin-X是12核心，内核也是ARM Cortex-A78AE，算力是227K DMIPS，由于Orin的GPU发热量比较大，以是其CPU的频率较低，而地平线的GPU算力只有200GFLOPS，发热量很低，以是CPU频率可以高点，算力险些是英伟达的两倍，华为的昇腾610的CPU则是16核心，算力是200K DMIPS。

图片来源：地平线发布会现场

征程6P里面添加了一个微型GPU，算力很低，只有200GFLOPS，紧张是为了将智能驾驶领域的图像输出到仪表或中控屏上。

图片来源：地平线发布会现场

为了降落本钱，更好管理供应链，也为了减少软件繁芜度，征程6P内部添加了一个达到ASIL-D级的MCU岛，算力是10K DMIPS，目前大家都是利用单独的安全MCU来掌握车辆底盘，常日是英飞凌的TC397，TC397价格比较高，且价格颠簸大，供应状况不稳定，最高算力是4K DMIPS，范例算力是2.7K DMIPS。
地平线没有公布详细信息，该当是和高通SA8650/SA8255/SA8775那样的4核心ARM Cortex-R52内核，运行频率估计是800-1000MHz。

存储带宽方面，升级到了LPDDR5，带宽达205GB/s，与英伟达Orin相同。
前视感知支持1800万像素，图像带宽5.3Gpixel/s。

图片来源：地平线发布会现场

内部采取TB/s级高性能总线，访存延时低至130纳秒。

图片来源：地平线发布会现场

为应对新一代大模型Transformer较多的矢量运算，特殊添加了VPU，即矢量浮点运算加速单元。

图片来源：地平线发布会现场

地平线征程P6的晶体管数量高达370亿，英伟达Orin只有170亿，Xavier只有90亿。

与征程6系列一同发布的还有全场景智能驾驶办理方案SuperDrive，它聚焦拟人化体验打破，打造好用的智驾系统2.0。
凭借动态、静态、OCC（Occupancy占用网络）三网合一的端到端感知架构，数据驱动的交互式博弈算法，SuperDrive在任何道路环境下都能兼顾场景通过率、通畅效率和行为拟人，在拥堵汇流、路口交互-动态Driveline、礼让骑行人、拥堵换道、城市环岛通畅等城区繁芜场景下，均能够为用户带来优雅不怂、从容笃定的智能驾驶体验。

SuperDrive繁芜场景体验打破

图片来源：地平线

动态、静态、Occupancy三网合一的感知端到端架构是精准还原客不雅观物理天下的有效手段。
在此架构下遮挡准召率提升70%，动态代码行数降落90%，网络负载降落50%，有效办理当前行业感知架构时延高、规则多、负载重的问题。
数据驱动的交互博弈可带来更拟人的最优解，使得SuperDrive像老司机一样灵巧处理繁芜交通流，在拥堵场景下变道成功率提升50%，路口通过率提升67%。

随着美国对中国高科技领域的敌意持续升级，英伟达Thor大概率不会许可出口到中国，芯片领域的国产替代大潮即将到来。

免责解释：本文不雅观点和数据仅供参考，和实际情形可能存在偏差。
本文不构成投资建议，文中所有不雅观点、数据仅代表笔者态度，不具有任何辅导、投资和决策见地。