(图 via ComputerBase.de)
TechPowerUp指出:GH100 打算芯片拥有 800 亿个弘大的晶体管数量,较 GA100 增加近 50% 。
Hopper GPU 的流处理器设计

有趣的是,在 4nm EUV 工艺的加持下,GH100 的芯片面积却只有 814 m㎡,小于基于 7nm DUV(台积电 N7 工艺)节点制造的 GA100(826 m㎡)。
Ampere GPU 的流处理器设计
由图可知,英伟达 GH100 的组件层次构造与上一代类似,紧张数学运算部分被支配到了 144 组流处理器(SM)上。
GH100 拥有 18432 个 FP32(单精度)/ 9216 个 FP64 (双精度)CUDA 核心,辅以 576 个第四代 Tensor 核心,此外硅片上个中一组 GPC 具有光栅图形单元。
鉴于 GH100 具有 6144-bit 的 HBM3 显存位宽,英伟达或为其标配 80GB VRAM,估量带宽可超 3 TB/s(且有 ECC 加持)。
主机接口也迎来了重大升级,且 SXM 形状的 PCB 板上配备了最新一代 NVLink 界面(具有 900 GB/s 的带宽)。
AIC 插卡版本则是采取了 PCIe 5.0 x16(128 GB/s)接口,且两者都引入了资源池(resource-pooling)功能。
末了,英伟达正在用更高的功耗来压榨更多的性能 —— 可知 H100 的范例功率值为 700W,而 A100 仅为 400W 。
不过 H100 并非满血 SKU,纵然高密度的 SXM 形状版本,也只启用了 144 组 SM 单元中的 132 个 。
PCIe 插卡版本更是仅启用了 114 个 SM 单元,且两者的最高时钟速率都是 1.80 GHz 。