在2018年10月16日,FPGA大厂赛灵思(Xilinx)在北京的“Xilinx开拓者大会 ”(XDF)上,发布了环球首款自适应打算加速平台(ACAP)芯片系列Versal,并发布了AI Core系列和Prime系列。去年,这两个系列产品也已经成功推向了市场。
本日(3月11日),赛灵思举行线上发布会,正式推出了Versal ACAP产品组合的第三大产品系列—— Versal™Premium。

赛灵思认为,随着来自多元化运用和事情负载(比如智能设备、视频流、物联网、企业等)的数据爆炸性增长,这也使得核心网正面临巨大的压力。数据显示,2019年区域流量容量提升了100倍,带宽年复合增长率达到了51%。

随着数据的爆炸性增长,对付全体网络根本举动步伐提出了更高的哀求,这也加速驱动了网络转型。而在这个转型过程当中,我们可以看到三个趋势:
1、下一代核心网络加速扩展。根据ABI Research数据显示,2020年-2024年5G核心网年复合增长率估量为313%。
2、安全已成为网络运营商最高优先级的问题。ISH Markit的研究显示,对付网络运营商来说,过去性能、扩展性、本钱一贯是运营商紧张关注的问题,而现在,安全性已经成为了网络运营商最为关注的问题。
3、随着数据的增长,对付打算能力与带宽的需求越来越高。我们可以看到,现在网络的带宽的增长非常的迅速,但是,随着摩尔定律的放缓乃至是趋于消亡,芯片的打算能力越来越跟不上了。根据赛灵思的估算,2018年之时,做事器端口速率的增长已经超过了摩尔定律对付做事器CPU性能所带来的增长,并且差距正在进一步扩大。
在此背景之下,为了加速运营商的网络转型,赛灵思推出了Versal Premium ACAP系列产品,其具备了高度集成且功耗优化的网络硬核,是业界带宽最高、打算密度最高的自适应平台。专为在散热条件和空间受限的环境下运行最高带宽网络,以及须要可扩展、灵巧应变运用加速的云供应商而设计。
Versal Premium ACAP系列详解
我们都知道,2018年赛灵思推出的Versal系列是业界首款自适应打算加速平台( ACAP ),是一个功能远超常规芯片架构的革命性全新异构打算器件种别。而据赛灵思先容,其去年就已经向客户交付的Versal AI Core系列和Versal Prime系列,已经得到了几百家客户的采取,反响很好,目前正在加速生产。
而这次赛灵思推出的全新Versal Premium则是Versal Prime系列的升级款版,是针对网络根本举动步伐推出的旗舰级产品。其采取台积电( TSMC ) 7nm 工艺制程打造而成,融软件可编程能力与动态可配置硬件加速、预制连接和安全功能为一体,为加快产品上市进程供应了强大引擎。
作为 Versal ACAP 的最新产品系列, Versal Premium 系列可供应比当前FPGA高达三倍的吞吐量,且拥有高度集成的软件/硬件平台,内置了以太网接口、Interlaken和加密引擎,以打造快速、安全的网络。该系列还供应了当前支配主流 FPGA 两倍的打算密度,同时还面向持续扩展的多元化且不断演进的云事情负载及网络事情负载,供应了灵巧应变的能力。
△Versal Prime系列
详细来说,与之前的Versal Prime系列比较,Versal Premium系列在其原有的灵巧多变的平台(集成了Arm运用场置器内核和实时处理器内核、自适应硬件、DSP引擎、高速片上可编程网络等等)上,打破性的集成了功耗优化的网络硬核(ASIC),包括:400G高速加密引擎、600G Interlaken硬核、600G以太网硬核、112G PAM4收发器、带有DMA的PCIe Gen5&CCIX。
△Versal Premium系列
据赛灵思先容,Versal Premium系列所供应的网络IP集成,供应了等效22个16nm FPGA的逻辑密度,极大缩减了开拓者在设计根本架构与连接上的投入,可以使得开拓者将更多的精力专注于差异化。同时,这也使得Versal Premium系列能够超越摩尔定律的局限,实现新一代的带宽与处理能力,并且能够显著降落成本支出与运营本钱。
前面提到,Versal Premium系列所集成的一系列功耗优化的网络硬核,供应了等效22个16nm FPGA的逻辑密度,这也意味着Versal Premium系列可以开释更多的逻辑用于个性化定制。
根据赛灵思公布的资料显示,其Virtex UltraScale+ VU9P内部的20万个LUT被用于了掌握器、存储器、PCIe接口等根本举动步伐(包括4个存储器、4个掌握器和一个PCIe+DMA),而比较之下,Versal Premium系列直接将这些作成了网络硬核,使得其根本举动步伐对付内部的LUT的花费为0。可以帮助客户降落异构成本,更好的专注于差异化。
其余,在易用性方面,赛灵思面向各种类型的开拓职员供应了丰富的软硬件集成平台,可以让他们利用自己熟习的框架和工具来进行开拓。对付数据科学家来说,可以通过TensorFlow、Caffe、PyTorch等同用框架来利用Versal Premium系列;软件开拓者也可通过赛灵思去年推出的Vitis统一开拓平台来利用Versal Premium系列;而硬件开拓者则可以通过VIVADO平台来利用Versal Premium系列。
赛灵思表示,下一代根本举动步伐须要更大的带宽密度,且方案受限于现有的形状尺寸、功耗和材料,其余,数据中央的占地面积也是有限的。这就哀求,下一代的根本举动步伐须要功耗优化的高吞吐量与打算量。
Versal Premium系列所集成的112G PAM4收发器、400G高速加密引擎、600G Interlaken硬核、600G以太网硬核、带有DMA的PCIe Gen5&CCIX等硬核IP,不仅能够供应功能优化的高带宽密度,供应自适应硬件的灵巧应变性,还可适宜AI和ML,可以帮助客户系统适应不断变革的算法和安全威胁。
随着 5G 网络投入运营,网络流量大幅增长,导致现有空间和功耗范围内功耗优化吞吐量与打算密度的需求不断提高。为支持业界应对这一寻衅,Versal Premium 系列供应了高达 9Tb/s 的可扩展、自适应串行带宽。详细方法是将 112G PAM4 收发器与集成的网络功能模块用于核心网、城域网和数据中央互联( DCI )根本举动步伐,将每端口带宽密度提高两倍,并降落时延高达 50%。
其余,在当前400G网络的发展与支配上,58Gb/s的PAM4收发器就足以应对,而Versal Premium系列所集成的112Gb/s PAM4收发器则可在向下兼容的根本上,同时可面向未来的单通道100G光通信和800G网络根本举动步伐的发展需求。并且可兼容更具寻衅性的铜缆线和基板。
Versal Premium系列的通道化以太网硬核能够以最小占板空间供应高达5Tb/s的可扩展以太网吞吐量,可适用于下一代核心网400G和800G根本举动步伐,支持多速率、多标准;支持1.8Tb/s现有的Interlaken协议下的芯片间的互联通信;支持1.6TB/s加密线路速率吞吐量(拥有硬化的400G加密引擎),并支持 AES-GCM-256/128、MACsec 和 IPsec 。
Versal Premium系列是环球逻辑密度最高的7nm可编程逻辑平台,支持硬件差异化、标准演进以及AI/ML。为开拓者供应了很大的差异化设计且与未来兼容:如带内网络遥测、vRAN,且适应各种标准与协议;拥有网络非常检测AI:支持入侵检测、恶意软件识别,应对新兴威胁的自适应AI算法,赛灵思随机森林算法IP;配置与网络性能AI:自动检测与性能瓶颈纠正,自动配置,最大限度延长正常运行韶光。
根据赛灵思供应的数据显示,Versal Premium系列拥有业界领先的多太比特吞吐量,比较赛灵思Virtex UltraScale+(VU13P)提升了5倍以上。
在能效方面,Versal Premium系列可以低于100瓦的功耗供应单芯片800G DCI(数据中央互联)吞吐量,与前代的Virtex UltraScale+比较,功耗降落了60%。在数据中央的运用当中,Versal Premium与前代的FPGA比较,可以供应2倍的带宽密度,这也意味着,在带宽相同的情形下,Versal Premium的机柜空间占用只有前代FPGA的一半。
与此同时,Versal Premium系列还支持以嵌入式办法将预制连接与硬核集成到现有云根本举动步伐中。从基因组学、数据剖析和视频转码,到针对语音和图像识别的 AI 推断,Versal Premium 供应了高度集成的云就绪平台,为多元化的事情负载供应打破性能。
详细到AI性能方面,Versal Premium系列在NeatNet50(224×224)图像分类模型下的性能是英伟达Tesla V100的1.6倍,是英伟达Tesla T4的2.3倍;在Yolov2(608×608)工具检测模型下,性能分别是英伟达V100和T4的4.6倍和7.7倍;在非常检测AI方面(随机森林算法),性能是英特尔Xeon的65倍。
其余,存储器也是打算加速的一个主要瓶颈。Versal Premium系列不仅拥有1Gb的紧密耦合的存储器,可以改进性能,降落功耗和延时,同时内部还集成了LUTRAM、块RAM、UltraRAM,以及高速片上网络、硬化的内存掌握器,可以供应高达123TB/s的片上存储器带宽,分别是英伟达Tesla V100和T4 GPU的9倍和25倍。而将超过123TB/s 的片上存储器带宽与可定制存储器层级相结合,能够减少数据移动从而肃清相应的关键瓶颈。
赛灵思表示,Versal Premium ACAP解锁了GPU无法企及的性能。
产品与供货
赛灵思Versal Premium系列供应了7款产品,系统逻辑单元从最小160万个到最高740万个;自适应引擎LUT数量从最低72万个到最高340万个。
据先容,Versal Premium 系列将于 2021 年上半年开始为早期用户供应样品。目前已供应文档,客户可立即利用 Versal Prime 评估套件开始原型设计。Versal Prime 器件与 Versal Premium 器件拥有浩瀚相同的架构模块,支持引脚迁移至 Versal Premium。
编辑:芯智讯-浪客剑










