按照我们常日的理解,3D堆栈内存的优点之一便是更高的集成度,内存容量该当更大才对,AMD选择的HBM内存为什么最大容量只有4GB呢?对付这个问题,Fudzilla网站做了一番阐明。
首先,AMD、NVIDIA实在都在研究3D堆栈内存了,NVIDIA在去年的GTC大会上宣告了Maxwell架构的继任者——Pascal帕斯卡架构,它不仅会利用比PCI-E更快的NVLink通道,还会利用3D Memory,这也是3D堆栈内存,带宽和容量都达到了目前水平的2-4倍。
不过NVIDIA的3D Memory内存要等到2016年,须要新的FinFET制程工艺合营。AMD利用HBM内存的Fiji GPU不出意外该当还是28nm工艺,而且在3D堆栈技能上AMD选择了不同的方案,如下图所示:

核心堆栈方案中有垂直堆栈的,这种是真正意义上的3D堆栈,还有一种是通过中介层(interposer)实现的2.5D堆栈,称之为2.5D-IC silicon interposer(2.5D硅基中介层),xPU(CPU或者GPU)跟内存芯片不是垂直排列的,而是双方共同位于一个中介层上,通过中介层实现旗子暗记联通。
AMD选择2.5D堆栈可能是出于降落风险的目的,毕竟目前TSV(硅通过技能)技能的3D堆栈还不太成熟。
再来看HBM内存方面,AMD的HBM互助伙伴是SK Hynix,目前也只有SK Hynix已经量产出货HBM内存,容量1Gb,速率1Gbps,等效位宽1024bit,每个内存芯片带宽128GB/s,4颗HBM芯片总带宽就达到了512GB/s,有证据显示Fiji显卡上的HBM频率为1.25GHz,因此总带宽达到了640GB/s,目前GTX 980显卡带宽为224GB/s,GTX Titan Black带宽336GB/s,R9 290X的带宽为320GB/s。
SK Hynix的HBM内存利用的5mKGSD封装,4Hi堆栈,VDD/VDDQ电压1.2V,比目前GDDR5显存的1.5V电压要低不少,能耗会更低。
再来说AMD的2.5D堆栈方案,Fudzilla援引他们的来源称现有的技能下,中介层上最多只能堆叠4个内存芯片,以是AMD的Fiji显卡显存容量最多只有4GB。如果要想实现8GB HBM显存,那就得堆叠8颗芯片,但这样又会使得芯片很大,以是这一代显卡上不会涌现8GB HBM内存。
当然,如果真要8GB显存也可以通过别的办法实现——芯片内堆叠4GB HBM显存,然后在PCB上连续利用4GB显存,这就有点像以前的CPU把L2、L3缓存放在芯片之外那样了。(话说,NVIDIA的GTX 970显卡的末了500MB显存实在就可以认为是缓存,其带宽比PCI-E更高,但28GB/s的带宽又低于正常的显存带宽)
PS:Fudzilla说了这么多,大略来说便是——Fiji显卡如果真的利用HBM内存,容量也不会超过4GB,除了实用性及本钱的问题之外,AMD选择的2.5D堆栈也是限定性成分之一。
此外,SK Hynix现在量产的HBM内存还是第一代,每个DRAM Die的容量是2Gb,速率1Gbps,4Hi堆栈的容量是1GB,而第二代HBM内存每个DRAM Die容量是8Gb,速率也提升到了2Gbps,带宽256GB/s,4Hi堆栈容量可达4GB,8Hi堆栈则可以达到8GB容量,以是AMD的Fiji显卡的4GB HBM紧张还是目前的技能制约。
至于NVIDIA的3D Memory,从之前GTC大会上公布的情形来看,NVIDIA选择的该当是3D垂直堆栈,更前辈一些,但他们的GPU要等到2016年的FinFET制程工艺,韶光要晚一年乃至两年。