首页 » 互联网 » 边缘AI芯片是个什么玩意?_芯片_边沿

边缘AI芯片是个什么玩意?_芯片_边沿

神尊大人 2024-08-27 00:37:40 0

扫一扫用手机浏览

文章目录 [+]

市场上很多AI芯片,令人眼花缭乱。

根据其运用范围,大体上可以分为几类

边缘AI芯片是个什么玩意?_芯片_边沿 边缘AI芯片是个什么玩意?_芯片_边沿 互联网

边缘AI芯片是个什么玩意?_芯片_边沿 边缘AI芯片是个什么玩意?_芯片_边沿 互联网
(图片来自网络侵删)

终端AI芯片:终端AI芯片哀求功耗低,算力需求也相对较低,紧张是AI推理的运用。
终端AI芯片以各种带AI模块的MCU来呈现,专注于某一类运用,例如,智能音箱里面的AI芯片,可以用于语音识别。
智能门锁的AI芯片,可以人脸识别等等

云端AI芯片:云端AI芯片则是数据中央,用于云端AI加速,不但可以推理也可以做演习。
例如NVIDLA的GPGPU卡,谷歌的TPU等等。
云端AI芯片性能比较强,面积也非常大,例如A100听说在7nm下有826mm2,性能也比较刁悍!

除此之外,还有边缘AI芯片。

那么边缘AI芯片是做什么来用的。

提到边缘打算,有一个非常有名的“章鱼论”。

章鱼这种生物比较奇怪,章鱼有8条腿,但是章鱼的某些决策不是都要放到大脑中来打算,而是在腿中就进行打算。

这个章鱼腿比较于章鱼大脑(云端),便是边缘端!

这个比喻非常有趣,以至于常常被边缘打算的场景来引用。

例如,自动驾驶或者ADAS (智能驾驶赞助系统),须要在本地就把全体决策及设计完成。

有很多在须要大数据量打算但是实时性比较高,不须要绕一圈到云中央来打算的场景

例如智能驾驶,智能工厂,与安防结合交通管理等等。

相对付终端AI芯片很多消费级的场景,边缘AI芯片更多的是工业领域的运用。

边缘AI基本年夜将运用局限在某个范围内,可以是一辆汽车,一列火车,一个工厂,一个商店。

在这个范围内,有一些实时的AI决策及处理需求须要被知足。

相应的我们会把AI赋能称之为,自动驾驶,智能制造,聪慧零售等等。

其核心目的紧张强调在数据来源侧来办理问题。

这便是边缘AI芯片存在的需求。

2:边缘AI芯片特色

那么边缘AI芯片都有什么特色?
1:算力强:边缘AI的算力要比终端要算力更强,常日都是独立办理问题。
但是性能要比小区的人脸识别或者智能音箱这种语音识别的基于某种运用的端侧AI芯片的处理能力要强1-2个数量级。
2:外设丰富:边缘AI基本上强调信息的可得到性,例如多路摄像头的输入的需求,对付类似MIPI的接口的数量会有很大的需求,例如可以同时支持多路摄像头等视频音频的输入。
3:可编程性:边缘AI芯片常日用面向工业用户,须要AI赋能用户,换言之:AI要和用户运用处景相结合,常日根据不同工业用户不同的场景须要进行编程,用于适配不同的模型和场景。
也不局限于某种运用。
一个良好的可编程的架构是办理问题的关键。
边缘AI芯片不是直接给工业客户用,而是要根据工业客户的需求进行客户需求AI赋能,这个是边缘AI芯片核心特色。

3:边缘AI芯片架构

那么边缘AI芯片的架构是什么样子的?
举个例子,边缘AI打算平台,JESTON 该当算是一个。
其最新一代发布的是JESTON AGX Orin 。
JETSON作为英伟达边缘的AI打算平台,其名气没有英伟达的GPGPU大。
但是,JESTON同时继续了Ampere的架构的GPGPU和 ARM Cortex-A78,在边缘侧AI芯片中,既可以做推理也可以做演习。
作为一个边缘AI产品,其有200Tops的处理性能(INT8)。
我们以JESTON AGX Orin为例,探索下其芯片内部架构是若何的。
这个芯片的打算部分紧张是三大件:CPU,GPU,DSA(NVDLA+PVA)
CPU:
JESTON其内部有3组4核的A78,频率可以到2Ghz。
也便是说,这个芯片内部有12核的A78的处理器,不同于手机的处理器,3个cluster的A78是对称的,不是手机处理器的大小核设计,其紧张是面向打算做事,而不是手机运用中不同负载的低功耗。
在一些标量的运算中,多核A78的打算能力也是非常刁悍。
GPU:
GPU是英伟达最新的安培架构,拥有2048个CUDA核,以及64个Tensor内核。
这些都可以可编程的。
安培架构是最新一代的GPGPU架构,前面几代分别是:Kepler,Maxwell,Pascal, Volta等。
最新一代的安培架构升级了tensor core。
用了安培GPU往后,与其他边缘AI芯片不同的是,可以支持推理和演习。
最主要的是,这个AI芯片可以用cuda来编程了,而可编程性则是边缘AI芯片的核心需求了。
DSA:
作为AI加速单元,JESTON本身也有其余还有2个NVDLA 的硬核,以及VISION加速器 PVA;
NVDLA紧张用于推理。
内核核心还是一个大的矩阵卷积运算。
个中NVDLA已经开源,有兴趣的小伙伴可以在GITHUB高下载并运行这些源码。
详见:nvdla· GitHub
这个可以可看到工业界的实际在用的成果开源,也对业界有很大的促进浸染。
PVA用了VPU的架构,利用VLIW的架构,VLIW是超长指令字构造,其并行度比较好,VIEW架构设计简化了硬件构造,其二,VLIW的大位宽实行并不会以捐躯性能和频率为代价。
但是同时将问题交给了软件来运行。
IO资源:
除了打算资源,IO资源也比较丰富,毕竟边缘AI侧,就须要的丰富的输入,支持6个摄像头以及16组通道的MIPI接口。
如果边缘AI芯片选一个主要的接口,那肯定是MIPI了,毕竟,边缘AI芯片,除了算力之外,还短缺不了的便是MIPI接口。
MIPI便是边缘AI芯片的眼睛,(用于连接摄像头)。
毕竟和人不同,须要很多双眼睛,毕竟边缘AI芯片须要“眼不雅观六路,耳听八方”。
只有大脑,没有耳朵和眼睛,边缘AI芯片是不能事情的。
同样还有USB接口,也可以支持一些USB摄像头。
同样可以支持PCIe。
RC和EP都支持,也便是说,可以同时作为加速卡插在别的主机上,也可以作为主设备插别的加速卡。
同时在网络方面,支持4路10G口,可以实现高速互联,如果有须要可以实现高速网络传输,或者几个JESTON AGX的互联。
下图便是 JESTON AGX Orin 的详细参数,拿走不谢!
根据这些参数,芯片面积小不了,我以为这颗芯片可能是7nm的制程。
才能在面积和功耗上比较平衡一下。
其范例功耗大约在15W,30W,45W几个不同的量级上。

4:边缘AI芯片浸染

那么这么刁悍性能的AI芯片能做什么?
举个例子,现在疫情下,很多场所都有人流的限定(本场所限流100人!
)。
小到一个商店,大到一个街区。
应时获取人流便是一个范例的任务。
通过人像识别,获取一个区域内的人流的密度,实时决定对区域内人流进行管控。
如果是终真个AI的MCU,很难有很大的算力,也不同时接管多路视频的输入。
那边缘端AI芯片就有了用武之地。
作为一个方案商,不但要有一个非常强劲的AI引擎,其次要有很多的视频输入源。
末了要通过一个非常刁悍的AI框架(SDK)将这些硬件运行起来。
也便是说边缘AI须要根据用户对付AI的需求二次开拓。
刚才提到,边缘AI个中一个主要的特色便是,根据工业场景进行AI+场景的再开拓。
很多AI芯片纸面性能很强,但是如何将这些算力转换成用户感知的提升,这个里面就有很多内功可做。
因此工业用户须要的是一个开放AI平台,而不是一个只有算力的芯片,更主要的是要根据用户需求进行AI业务开拓。
有句古话“干活不由东,累去世也无功”。
只有硬件,没有软件,或者软件不好用,就好比武功只有一身招式,没有内功心法一样。
AI芯片算力虽强,没有软件(SDK)也发挥不出来。
软硬兼修是永久不过时的选择。
如何将AI算力转换成用户生产力。
在这个方面,Jeston AGX Orin供应了jetpack 5.0,支持了cuda11和最新版本的cuDNN和tensorRT。
通过这些软件事情,特殊是CUDA,这些利于用户开拓的工具将JESTON平台上刁悍的算力和丰富IO结合起来。
终极完成边缘打算授予AI芯片的“义务任务”。
终极用户得到的是:用户定义的AI芯片。
或者说是需求定义的AI芯片。
这才是边缘AI芯片的实质!

与30万半导体精英一起,订阅您的私家芯闻秘书!
欢迎订阅摩尔精英旗下更多公众年夜众号:摩尔精英、半导体行业不雅观察、摩尔App\"大众 data-from=\公众0\"大众>

免责声明:本文由作者原创。
文章内容系作者个人不雅观点,半导体行业不雅观察转载仅为了传达一种不同的不雅观点,不代表半导体行业不雅观察对该不雅观点赞许或支持,如果有任何异议,欢迎联系半导体行业不雅观察。

本日是《半导体行业不雅观察》为您分享的第2914内容,欢迎关注。

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

标签:

相关文章