由于在GTC 2020大会演讲中,NVIDIA CEO黄仁勋评论辩论的领域基本便是大数据、HPC打算、AI人工智能等方面的内容,而Tesla A100加速卡针对的行业也是这部分。以是可以确定的是,之后要发布的RTX 3080系列显卡和Tesla A100的联系不大,毕竟针对游戏部分,很多东西都会改变。不过从Tesla A100中,我们也可以看到安培GPU核心的特点,并且对即将来到的RTX游戏显卡有更深的理解。
Teala A100:新时期的NVIDIA核弹Tesla A100采取的是是台积电7N工艺,这是单独定制的7nm工艺,核心面积达到了826平方毫米,这也是7nm时期我们见到的是最大的核心面积,这颗核心拥有542亿晶体管,也是目前晶体管数量最多的GPU核心。此外,A100核心拥有108组SM单元,SXM4架构,6912个CUDA核心,这几个数字都是NVIDIA GPU架构中相同设计最多的,以是毫无疑问,它的性能也便是最强的。
要知道上一代的V100核心只有80组SM单元,5120个CUDA核心;至于游戏卡的顶峰RTX 2080Ti,更是只有4352个CUDA核心,这样比较的话,就知道基于安培核心的Tesla A100有多强了,这里还没有谈到安培相对图灵在架构上的进步。
同时作为加速打算卡,AI方面是每一代NVIDIA都要重点考虑的部分,比较Volta架构的640个Tensor Core,A100核心的Tensor Core减少到了432个,但是性能大幅增强,支持全新的TF32运算,浮点性能156TFLOPS,同时INT8浮点性能624TOPS,FP16性能312TFLOPS。
不过也正是如此,以是A100的功耗激增到了400W,这是核心规模太大导致的。这种情形带来的后果自然是频率只能往下调度。以是A100的频率比上一代的V100还降落了不少,只有1.41GHz。不过我们再次声明,RTX游戏卡不会这么设计,频率肯定会更高,且有较大的浮动空间。
显存是这次安培核心的一大进步。A100配备HBM2显存,频率从1.75Gbps提升到了2.4Gbps,位宽5120bit,容量增加到了40GB,显存带宽达到惊人的1.6TB/s。不过从这个容量而言,彷佛和位宽不是那么匹配,这只能解释安培核心该当有更完全的版本,说不定未来老黄会在游戏领域推出128组SM单元的超级显卡呢?
此外,安培核心还支持一种名为Multi-instance GPU多实例GPU:简称MIG,这是一项创新技能,可以将一个GPU划分为七个独立的GPU,针对不同的目标供应不同的运算,最大化提高打算效率。当然这个技能该当不会运用在游戏卡中。同时这次NVIDIA还带来了NVLink 3.0,支持做事器领域的多卡互联,带宽也从之前的300GB/s提升到了600GB/s,相信这个技能也会用在桌面游戏卡上。
无任务预测:RTX 3080Ti会砍几刀?目前NVIDIA对付安培GPU的架构变革没有过多的解释,所有参数的比较都是直接拿上一代的加速卡V100来比拟,以是我们现在不知道在GPU详细架构上,安培有哪些进步,不过既然基于安培GPU的A100加速卡都已经发布了,我们也可以从A100的参数上预测RTX游戏卡有哪些变革。
从上一代RTX 2080Ti来看,拥有4352颗CUDA核心,也便是68组SM单元,那么RTX 3080Ti肯定也会遵照这个规律,SM会大砍一刀。A100有108组SM单元,那么RTX 3080Ti该当比RTX 2080Ti的CUDA核心数量更多,我们估计RTX 3080Ti的SM单元可能会被砍到80个以下,估计是72个或者80个,这样的话RTX 3080Ti的CUDA核心数量就会达到4608或者5120个,极大可能是后者,这样才能和RTX 2080Ti拉开性能差距。
如果之后AMD太牛X的话,不用除NVIDIA会连续推出RTX 3080 Titan这样的超级核弹,如果有Titan这款产品的话,就有可能采取96组SM单元,CUDA核心数量达到6144个,这样性能会非常靠近完全的安培大核心。但是再往上的可能性就比较低了,毕竟108组SM单元的规模,功耗就已经达到了400W。上一代RTX 2080Ti的最大功耗是325W,这一代RTX 3080系列最高功耗不应该超过350W。
显存部分是百分之百要砍的,40GB容量的HMB2显存实在太夸年夜,也就做事器平台才用得上。如果老黄良心点,那么连续采取5120bit或者4096bit的HMB2,容量砍到16GB旁边,是可以接管的一个方案,这样显存带宽会非常高,超过1TB/s没问题,当然也要看详细的显存频率。如果不那么厚道,连续采取GDDR6也是合理的方案,采取512bit(或者480bit)的带宽,容量在12GB旁边,也会比上一代强不少。当然最坏的结果也便是和现在RTX 2080Ti一样,连续利用352bit的GDDR6,这样当然大略,只不过性能提升较少。
此外比较靠谱的是,由于显示设备的变革,在接口方面今年的显卡都要有一些改变,DP1.4是AMD和NVIDIA早就配备了,但是HDMI接口有可能从2.0升级到2.1,这样以适宜4K 120Hz的规格。
写在末了当然,目前我们预测的都仅仅是规格参数的变革,而安培GPU一定在核心架构和功能上比较上一代图灵有很大的改进。这些变革估计要等RTX显卡发布时,老黄才会公布了。一款显卡的性能不但要看纸面参数,还要看架构上面的进化才行。
不过既然A100是目前NVIDIA有史以来最大的一颗核弹,乃至安培个人超算价格都超过了140万元,以是我们有情由期待RTX 3080系列也会带给我们惊喜。而且加速卡已经发布,游戏卡还会远吗?以是我们还是耐心等待吧!
对付性能我们不用担心,可能目前最担心的便是价格了……毕竟这么大一颗核弹,要花多少钱啊!