1. 这是一张硅衬底,面积 12650 平方毫米,即是 16 个掩膜版尺寸(单个 775mm2)。镜头拉近,硅片上挖小孔,两行交错排列做绝缘,穿铜柱。再拉开镜头,高下排相隔甚远,两排铜柱共用一片导线层。风骚走位后,一对持续接到这些触点,整片衬底都要做成同样构造。
2. 这东西中文名叫高带宽内存,尺寸跟一小节手指差不多。背面也是 1200 个触点,高下触点焊在一起,无脑复制。还有 6 颗闪存,这一大片就相称于是内存和硬盘的组合,视为存储区。额外放了 6 个限位点,浸染一会再说。上面供电,独立分配。确实 HBM 内存功耗不小,这一大片就要四五百瓦。

3. 正面看完,翻到背面,先铺一层金属屏蔽,然后挖孔绝缘,把正面的铜柱引出来。好多屏蔽线,并行数据的抗滋扰能力实在太差,只能靠屏蔽手段来续命。第一排数据线上去一半就折返了,目的是要和各排线路的总长度保持相等。类似构造统共有 15 层,大内存全并行,数据都在这 15 层里穿梭。
4. 来到侧面,硅衬底在这个位置被连根割断,折过来后被限位点顶住,数据层则保持连续。这是内部样子,微不雅观森林,斜一下看,密密麻麻全是触点。这是第一片,现在到第二片,更繁芜,这些金色触点的排列密度比内存区的要高得多了。
5. 第二片显然是逻辑区,每块 GPU 带着两颗私有内存,不参与共享。中间的 CPU 则直联了四颗神经处理器,毫无疑问,这绝对是用来处理大措辞模型的。来看第三片,120 万个触点,多少有点胆怯了。正面剖开看一下,大面积的金色触点数百万不止。寄存器背面的 120 万个并行触点,先要平摊到这四块寄存芯片上,然后再通过触点连接到中控。以是单这四块寄存器,就要有不下 240 万的触点。
6. 末了是中控,中控芯片可太主要了,海量数据都得由它安排,假如造不出来,前面的两大片就都废了。1/0 接口是对外的,没什么好讲。三张芯片尺寸都差不多,现在开始关键步骤,拼接。中控为底座,一张内存一张逻辑,面对面成一对,微锡焊接,同样的组合统共 10 对。
7. 液冷铜芯非常主要,一对芯片的功耗超过了 1 千瓦,假如不能快速散热,这套架构便是个熔炉,开机 3 秒自毁,铜芯交叉排列,确保各个管道不相互斗殴。弹性保护层浸染顾名思义,把空间塞满。
8. 再下来便是供电了,十几千瓦的功耗要在这么小的空间内均匀分配,不知道这些模块到底够不足,总之示意动画,意思意思就行。这些插口也是略显软弱,供电模块自身功耗不小,中控也一样,给它们配个异形散热器,组合完成。
9. 接着便是封装,钢套包起来,留出液冷口,大功告成。
10. 末了一起欣赏这玩意儿的整体外不雅观。一键三连,原创不易。










