这个新的部门将由半导体资深人士 Dina McKinney 领导。McKinney 曾担当卖力 AMD CPU 设计和 Marvell 根本举动步伐处理器的副总裁,他将卖力监督为云打算、5G 电信、游戏、汽车等领域构建定制芯片的团队。
那么,英伟达为什么要了局定制芯片(ASIC 芯片),英伟达了局后能够在 ASIC 市场中称王称霸吗?

01 为什么英伟达选择 ASIC?

英伟达选择 ASIC 的缘故原由,实在从其新部门面向客户中可以窥见一二。新部门面向的紧张是云打算公司,这和英伟达目前在紧张的北美 CSP(云打算供应商)企业重叠,包括 Google Cloud、AWS、Microsoft Azure 和 Meta 等企业。
这些企业都已经开始进行自家芯片的开拓,例如 Google 的 TPU 和微软的 AI 加速器 Maia 及专为 Azure 设计的 CPU "Cobalt"。
因此英伟达进军 ASIC 的缘故原由有二:第一,盘踞新的市场。第二,保护自己免受替代。
先来看盘踞新的市场。数据中央定制芯片的蛋糕并不小,据研究公司 650 Group 估计,数据中央定制芯片市场今年将增长至 100 亿美元,到 2025 年将翻一番。
Needham 剖析师 Charles Shi 表示,2023 年更广泛的定制芯片市场代价约为 300 亿美元,约占环球芯片年发卖额的 5%。
数据中央的定制芯片的市场中有两大巨子:博通和 Marvell。在高端 ASIC 市场,博通以 35%的市占率,稳坐龙头宝座,Marvel 以 12%的市占率居次。博通和 Marvell 实在都认为随着数据中央处理器变的多样,会让定制芯片的模式重新焕发生机。
缘故原由在于,AI 时期中,ASIC 芯片也能撑起一片天。
这就谈回了一个老问题:ASIC、GPU,谁是最得当的 AI 芯片?实在这两类芯片有各自的特点,但在知足算力需求上是相互竞争的。大略来说,GPU 有先发上风,技能发展韶光长,利用本钱较低,但是功耗高。ASIC 面向特定用户需求设计的定制芯片,在吞吐量、功耗、算力水平等方面都有上风。
在 20 世纪 90 年代时,很多大型企业都渴望设计和供应针对特定运用的定制 ASIC 设备,同时供应更好的性能。Sony、Toshiba 和 IBM 最初设计的用于 Sony Playstation 3 的 Cell Processor 便是一个例子。不过,由于 ASIC 的本钱高,随着为特定产品设计 ASIC 变得越来越难以合理规模,ASIC 的岁月彷佛过去。
ASIC 和 GPU 的不合就在这:本钱。
由于从性能来看,针对特定场景或运用所设计的 ASIC 芯片,会比英伟达所卖的通用 GPU 更有上风。以前一贯利用 GPU,也带火了英伟达等厂商的古迹和股价,但后来大家创造,随着机器学习、边缘打算发展,算法更加成熟和稳定,自己完备有足够的打算需求去分摊 ASIC 的本钱。
尤其 ChatGPT 爆火往后,英伟达 GPU 产品掉队,很多企业都是靠着做事器 CPU+ASIC 的形式,来知足用户对付 AI 演习和推理的算力需求。
这就展示出 ASIC 在 AI 时期的浸染。Marvell 的打算与定制集团技能副总裁 Mark Kuemerle 不雅观察到:" 关于这些数据中央客户的有趣事实是,如果他们的系统中涌现轻微的瓶颈点,问题会被放大 1000 倍乃至更多(由于它们支配在超大规模中)。" 这样的瓶颈点可能导致 NIC 卡住。现成的机器学习设备可能无法匹配事情负载或知足灵巧性或可编程性的需求。
Kuemerle 说:" 这些超大规模数据中央真的必须将统统精确调度到他们的事情负载。那么,他们投资培植定制芯片绝对是值得的。"
ASIC 早已成为 GPU 面临的强大竞争者。
虽说各大厂商购买英伟达 GPU,费钱如流水,既然都是流水,为什么不定制更适宜自家运用处景的芯片呢?要定制就要费钱,英伟达同样想把大厂定制芯片的钱,纳入自己的钱包。
再来看 " 免受替代 " 是怎么回事。目前,谷歌、亚马逊、特斯拉和 Meta 都推出了 ASIC 芯片。
谷歌 2015 年发布首款 ASIC 芯片 TPU v1,去年已经迭代到了 v5。根据官方供应的数据,每个 TPU v5p pod 在三维环形拓扑构造中,通过最高带宽的芯片间互联(ICI),以 4,800 Gbps/chip 的速率将 8,960 个芯片组合在一起,与 TPU v4 比较,TPU v5p 的 FLOPS 和高带宽内存(HBM)分别提高了 2 倍和 3 倍。
谷歌利用 TPU v5p 垒起一道抵御英伟达 GPU 的高墙。
对付谷歌来说,要钱有钱,要技能有技能,要运用处景有运用处景,可以说是各大科技巨子中在自研 AI 芯片这条路上走得最远的,其他厂商目前还在源源不断地给英伟达账户打钱,但谷歌却早已做好了两手准备。
微软则也是打响了 " 逃离英伟达 " 的旗子暗记枪。最新的,微软正在开拓一款新的网卡,可以提高其 Maia AI 做事器芯片的性能,并有可能减少该公司对芯片设计商 Nvidia 的依赖。
有知情人士表示,微软首席实行官萨蒂亚 · 纳德拉 ( Satya Nadella ) 已任命网络设备开拓商瞻博网络 ( Juniper Networks ) 联合创始人普拉迪普 · 辛杜 ( Pradeep Sindhu ) 来领导网卡事情。
看来出于本钱和自主率考虑,大厂还是更乐意利用自家的 ASIC。买英伟达的 GPU 不但价格高昂,并且受制于人。不过,利用自家芯片多一些,那就用英伟达 GPU 少一些。
02 英伟达能称霸吗?
谷歌推出自家 ASIC 的背后,与博通有很大关系。去年说到最红火的企业是英伟达,而背后还有一个卖铲人也在闷声发财——博通。目前博通的市值已经达到了 5741.98 亿美元,已经超过了台积电的市值。
实在从收入来看,博通是环球第二大人工智能芯片公司,仅次于英伟达。博通加速器的发卖额每每高达数十亿美元。
谷歌与博通互助,卖力谷歌 TPU 的物理设计,实质上是基于谷歌的设计图纸开拓芯片。此外,博通还卖力监督台积电的芯片代工业务。自谷歌和博通开始互助以来,谷歌每两年旁边发布新一代 TPU。知情人士称,谷歌和博通把每一代 TPU 的性价比提高了至少 50%。
博通与各大巨子公司互助定制芯片。不但参与了谷歌每一代 TPU 处理器的设计,还与 Meta、苹果等公司达成互助,共同设计生产芯片。
研究机构 SemiAnalysis 创始人表示,博通定制芯片业务规模达 100 亿美元,美满电子规模达 20 亿美元,英伟达的参与确实是一个威胁。
英伟达能否称霸 ASIC 市场关键也是看两点能力:设计制定条约价能力。
先来看设计能力。作为定制芯片,芯片设计的好坏肯定直接会影响到 CSP 大厂数据中央的运行能力,以及本钱高低。对付大厂来说,只要能够供应强大的性能,纵然芯片的价格偏高,也会乐意买单。
我们先来看看一台 AI 做事器究竟须要哪些芯片?如果拆开一台 AI 做事器内部,以 HGX H100 8-GPU 为例,8 块 H100 GPU 在全新的 FP8 精度下 AI 性能比上一代高 6 倍,可供应 900GB/s 的带宽,该做事器内部包含 NVLink、PCIe 和 QPI 等主板总线。GPU 之间的互联通过 NVSwitch 芯片来实现,CPU 与 GPU 之间的互联则通过 PCIe 5.0 总线实现。
英伟达自家的高速传输 NV Link、开拓者软件 CUDA 和 Omniverse 等软件套件,这些带了极大上风。
但是 PCle Switch 也很主要,而这个领域是博通的天下。环球 PCle Switch 三大供应商,博通、微芯、祥硕科技三家,共霸占环球约 58% 的份额。博通作为 PCI Express 交流领域的领导者,出货量超过 10 亿个。
前文我们提到博通参与了很多公司的定制芯片,为什么各大公司都看中博通呢?不仅仅是芯片设计的能力,博通有自己的 " 护城河 " 芯片间的通信。
博通是 SerDes(串行器 / 解串器)的通信技能无可争议的垄断巨子。SerDes 接口通过在传输之前将低速并行数据转换为高速串行数据,然后在吸收端转换回并行数据,目的在于许可数据从一个 TPU 高速移动到另一个 TPU,提升旗子暗记传输效率。在环球 50GB/S 的 SerDes 市场中,博通霸占了 76% 的市场份额。
这么来看,英伟达、博通在芯片设计方面,都有自己的 " 护城河 "。
从芯片议价能力来说,英伟达在晶圆的采购量上要比博通、迈威尔大得多。在这样的状况下,议价能力也相对较高。沿用此逻辑来看,纵然 CSP 厂拥有强大的 IC 设计团队,也不见得可取得最佳价格。
如果 CSP 能与台积电签订具价格竞争力的长约,有机会在价格上得到上风,冲破英伟达的垄断局势。
03 结语
总的来说,由于仍有许多存在于云端大厂外的措辞模型,因此通用型 GPU 仍有生存空间。
目前英伟达是否会成立 ASIC 部门还未确认。一名 IC 设计代工管理层透露,英伟达一贯都有在看 ASIC 市场,曾经找上门希望能外包部分 ASIC 方案。换句话说,当时的英伟达纵然正生产通用型芯片,仍一壁通过外包的办法,吃下 ASIC 市场。
如今,ASIC 的市场需求日益壮大,作为 AI 霸主英伟达自然不会视而不见,加上还拥有如高速传输 NV Link、开拓者软件 CUDA 等技能上风。目前 ASIC 竞争对手如博通(Broadcom)、Marvell 亦多有布局,博通实行长更在传出加入 Meta 董事会,英伟达的新策略是否冲击市场,值得持续关注。·







