这是什么观点?
让我们重温一下目前 NVIDIA 的旗舰游戏 GPU GA102,GA102 的 CUDA Core 数量是 10752 个,基于该 GPU 的 RTX 3090 采取减少版的 GA102-300 版,拥有 10496 个 CUDA Core,加速模式时的频率为 1695MHz,此时的单精度浮点性能是 35.6 TFLOPS,可以预期,AD102 单凭浮点性能就可以做到 GA102 的两倍以上。

须要把稳的是,纯挚凭底层浮点性能是无法真正理解芯片的实际表现,例如 NVIDIA 安培架构的 CUDA Core 算法是依照浮点单元来打算的,浮点单元数量是整数单元的两倍,而在之前的图灵架构里,浮点单元数量和整数单元数量是对等的,这意味着如果游戏的整数指令较多的话,安培的每 CUDA Core 性能摊分实在是要低一些的。

这次 Greymon55 除了爆料频率外,还透露了 AD102 的内存型号依然是 GDDR6X,这就有点奇怪了,不过考虑到目前的 GPU 越来越方向于集成更大的高速缓存来改进内存带宽的做法,GDDR6X 实在也是一个合理的选择。
让我们拭目以待吧。










