文 | 硅基研究室,作者 | 白嘉嘉
2024年注定是AI芯片厂商们捉对厮杀的一年。
过去一年韶光里,AI赛道烈火烹油,以英伟达为代表的GPU厂商手握算力心脏,背靠AI企业扩大云打算规模和演习大模型的需求,吃下了AI时期的第一笔红利,赚得盆满钵满。

随着韶光来到2024,AI从云端蔓延向终端,「AI+产品」观点下的许多新物种逐渐走到消费级的临界点。为了捕捉这些增长点,雄踞于各个细分领域的AI芯片龙头纷纭开启了跨界互助,一手推出新品,一手探求新的互助伙伴。
即便是确定性相对较强的云端算力市场,也透着一股「山雨欲来风满楼」的气息。谷歌、微软、亚马逊先后宣告推出或操持推出自研AI芯片,AMD的新产品MI300X在性能上紧咬英伟达H100,英特尔CEO基辛格透露:“全体行业都被推动来减少CUDA(英伟达推出的运算平台)的市场。”
2024,AI芯片市场的格局将迎来什么变革?而这泼天富贵,又将花落谁家?
云端之战:英伟达如何对抗围剿?
从云端需求和企业动作来看,2024年研发下一代大模型仍将是各大科技公司竞争的核心,个中多模态模型占比逐渐提高的趋势带动了更大的算力需求。
C端AI运用数量的增加也为云市场的增长注入了稳定性。过去,模型的预演习是GPU花费最大的环节,大约80%,但随着越来越多的消费者开始调用模型进行推理,未来推理和演习的算力占比将颠倒。晚点LatePost宣布,多位大模型从业者估算,如果千亿参数或更大的人工智能模型被广泛利用,大模型的演习本钱和推理本钱会达到2:8,乃至1:9。
对AI创业者以及科技巨子来说,这个忧喜参半。
2023年,所有涌向AI的掘金者都对上游芯片供应商有一种繁芜的感情。研发AI产品离不开AI芯片这颗算力心脏,但高昂的价格和短缺的产能同时也令他们无时无刻不被焦虑包围。
除了恐怖拿到芯片的同行领先自己在市场上铺开业务,更担心卖方市场的格局仍将持续下去,无法摆脱向上游「纳税」的命运。
但令人意外的是,这些赚得盆满钵满的卖水人同样不安。GPU龙头英伟达创始人黄仁勋在去年十一月的一场演讲中表示:“我们不须要假装公司一贯处于危险之中。我们(确实)一贯处于危险之中。”
黄仁勋在AI的狂风眼站了一年,这句话大概是他的真实感想熏染。
压力首先来自于同行竞争。
作为市场上唯一有希望在GPU领域寻衅英伟达的企业,AMD每次发布新芯片,英伟达都会被拿出来做比拟,你乃至可以在去年12月的多轮交手中看到火花迸射。
AMD12月6日推出MI300x时,流传宣传表现优于英伟达的AH100。英伟达随后发布了自己的基准测试作为回应,表明AH100在精确的设置下仍旧更好。AMD再次对此做出回应,发布了新的基准测试,再次显示MI300X在精确的设置下表现出色。
此外,英特尔虽然在GPU领域鲜有建树,但仍未放弃这块甜美的蛋糕。英特尔声称,将在2024年上市的Gaudi 3,性能超过了英伟达的AI芯片H100。
除了同行,英伟达的客户们也并不忠实,谷歌、亚马逊、特斯拉、阿里、百度、微软……险些所有的大客户都宣告将自研AI芯片。
这些客户还对英伟达的生态护城河发起了猛攻。“全体行业都被推动来减少CUDA的市场”,英特尔CEO基辛格最近公开表示,MLIR、谷歌和OpenAI等都在转向一个“以Python措辞为根本的编程层”,以使AI演习更加开放。
自研芯片和生态培植并非易事,为何反倒成为了行业共识?英伟达的「镰刀」实在太锋利了。
《财新》的一篇宣布中显示,哪怕花英伟达同样的本钱,只要做出十分之一的效果,这些科技厂商便已经有利可图。更详细的案例是,按照谷歌的报价,利用其最新的AI芯片TPUv5e在演习、推理参数少于2000亿的大模型时,本钱低于用A100或H100。
英伟达抢客户的行为也让云厂商难以接管。去年3月GPU最稀缺的时候,英伟达推出云打算做事DXGCloud。大略来说便是把卖给云厂商的GPU再租回来,进一步优化后再出租给须要GPU算力的客户。一来一去,云厂商承担了数据中央的培植本钱,但客户却去了英伟达。
对英伟达来说,最大的变量可能还是在中国。近日外媒的一篇宣布显示,由于对华出口芯片的性能被一压再压,中国玩家正在对其失落去兴趣,这意味着它可能失落去靠近五分之一的营收。
当然,作为硅谷最具战斗精神和固执的企业之一,坐以待毙从来不是英伟达的风格。过去的一年里,凭借占市场份额靠近95%的最大GPU卖方身份,英伟达的护城河实在被拓宽了。
英伟达的核心竞争力紧张由三个板块构成——供应链上风、软硬件生态、投资。
软硬件生态方面,估量2024年出货的AI芯片H200及生态配件,仍是市场上最适宜大模型成长的「土壤」。而投资方面,2023年英伟达完成了20多笔投资,投资版图涵盖AI干系的各个行业,即便未必能从中稳定获利,过程中积累起的KnowHow,也将逐渐成为其它初创企业选择英伟达的情由。
真正决定2024年市场格局的,是英伟达的供应链上风。
AI芯片家当链冗长、繁芜,每个细分领域都有各自的领头企业,只有将它们集成到一起,才能生产出性能最好的芯片。
英伟达收买它们的手段是承诺不可取消的订单。目前,英伟达有111.5亿美元的采购承诺、产能责任和库存责任,其余还额外签订了代价38.1亿美元的预支费供应协议。这些被承诺的订单中包含台积电近六成产能和SK海力士、三星、美光HBM的大部分供应。
台积电封装对芯片性能的影响无须多言,HBM同样关键。HBM是高带宽内存芯片,而GPU只有内存足够大、数据传输速率足够快,才能担保运行效率。
单从这方面看,没有其他供应商可以与之相媲美,因此他们也将无法参与正在发生的狂热AI浪潮,即便是谷歌等科技巨子。
综上所述,2024年的云端战事确定性较强,虽然英伟达遭遇围剿,但无论是自研芯片还是生态培植都须要韶光来逐步发酵,至少在供应链紧张的问题办理之前,英伟达的统治地位不会被动摇。
场景之战:AI PC、AI Car、AI Phone成最热板块
淘金先富卖铲人,背后的AI芯片厂商已经捋臂将拳。分行业来看,AI PC、AI Phone、AI Car是个中关注度最高的三个板块。
AI Phone:亟待AI拉动新增量
过去几年韶光里,手机处于增长乏力的状态,即便厂商在硬件上「卷」到了极致,仍难以粉饰创新缺失落的残酷原形。除了华为mate 60横空出世给市场带来了一些新鲜血液,就连苹果的发布会都难以讲出说服消费换机的新故事。
AI是它唯一能拉动增长的发力点。「AI上机」的传说从ChatGPT向C端开放起就飘荡在市场的上空,被评论辩论了一整年。但在大模型向小型化发展之前,硬件与模型规模之间的抵牾险些不可调和。
事实上在手机端,至今也很难在担保模型性能的情形下,避免手机发热、内存占用量过大等体验对消费者购买欲产生的影响。
年初,手机芯片双雄之一高通演示了在安卓上运行Stable Diffusion的效果,并在近期宣告将推理韶光缩短到1秒以内,但另一雄的联发科工程师表示,本地运行13B体量的小模型就意味着须要占用约13GB的内存,再加上安卓本身的4G,在不下载任何其他App的情形下,就已经超过了大多数手机16GB的内存容量。
即便如此,市场仍为AI Phone领域的增长投下了附和票。它们的情由是,手机是人们日常利用频率最高的电子产品,基于入口上风,虽然本地支配还存在一定的困难,但云端运行AI带来的增量仍不容忽略。剖析机构Canalys预测,2024年环球智好手机出货量将在2024年规复增长,增幅约为4%。
AI PC:硬件、框架之争
比较之下,AI PC的进展则顺利得多。情由也很大略,与手机比较,PC的体积更大,芯片性能的上升空间更广。IDC预测,2024年将成为AI PC快速发展的第一年,2024年整体PC市场AI PC占比将达到55%,而2027年将达到85%。
目前PC真个AI芯片厂商已经开释出了浓郁的炸药味,彼此间的混战一触即发。
NPU与GPU之争是混战的第一个赛点。
GPU无需多言,关键是NPU为什么能站上擂台。与算力中央背靠成千上万台集成了CPU、GPU等各种芯片的做事器不同,PC的算力紧张集中在一块「总芯片」当中,这块芯片由CPU、GPU、NPU等「分芯片」构成,各芯片分工不同。个中NPU便是专门被设计出来处理AI干系运算任务的。
因此,抵牾产生了。虽然GPU的定义是图形处理器,但同时它浮点、并走运算的特性也匆匆使它成为了运行AI运算的最佳载体之一,这一点在云端已经被证明。一旦AI PC实现,大量AI运算任务势必带动GPU的销量。本次CES展开幕之前,英伟达连发三款消费级GPU,显然是向市场开释旗子暗记。
X86构架和ARM构架之争,是混战的第二个赛点。
X86和ARM是芯片的两种构架。X86构架是英特尔的代名词,在PC芯片端,直接与英特尔展开竞争的是采取ARM构架的手机芯片龙头高通和联发科。
X86和ARM的差异可以大略概括成前者性能、功耗双高,后者双低。过去,ARM一样平常被用于手机,但近年内,随着ARM芯片的性能不断提高,低功耗的上风正在引起业内玩家的把稳。微软、苹果、Meta等厂商都在支持基于ARM的PC。据界面新闻宣布,英伟达和AMD正在考虑2024年为移动PC供应基于ARM的办理方案。
高通对付AI PC垂涎已久,去年10月面对Windows 11发布的骁龙X Elite芯片与同级X86比较,性能可达竞品的两倍,而达到相同峰值性能时,功耗仅为竞品的三分之一。
AI Car:两大阵营跑马圈地
虽然AI PC的沙场已经硝烟四起,但若是与AI Car比较,乃至能被称作一团和蔼。背后的缘故原由也很好理解,PC和手机是为存量市场里找增量,而车载AI则是实打实的蓝海。
「AI上车」同样有两个赛点,分别是智能座舱和自动驾驶。
在智能座舱领域,高通率先采取SoC逻辑设计车载MCU芯片的举措为它带来了先发上风,因此扮演着守城者的角色。眼下,它正面临着英伟达、联发科、英特尔等企业的多重围攻。
去年6月,联发科宣告将与英伟达互助,为下一代软件定义汽车供应全套车载人工智能座舱供应办理方案,覆盖从豪华到主流的所有汽车细分市场。
双强互助的模式是,联发科将开拓集成英伟达GPU的汽车SoC。而英伟达则是目前高端车型紧张采取的自动驾驶系统供应商,客户资源广泛。本次CES展中,英伟达公布了DRIVE系列汽车业务的最新进展,空想、长城、极氪、小米等企业均已采取DRIVE Orin平台为其智能自动驾驶系统供应支持。
英特尔亦在CES宣告了进军汽车行业的主要计策,推出专为下一代汽车设计的AI增强软件定义车辆系统芯片(SoCs)。其旗下的自动驾驶办理方案公司Mobileye一贯处于天下领先的地位。
在自动驾驶领域,则呈现两强争霸的格局。英伟达与地平线分别经办高端和低端车型,按覆盖车型价格区间的广度排名,地平线第一,英伟达第二。
与英伟达CUDA类似,地平线也有自己的生态护城河。同时,作为本土供应商,地平线在交付效率上更具上风。
格局之战:2024,谁是最关键的变量?
各家芯片厂商在AI PC、AI Phone、AI Car卷出天涯,在这个堪比「春秋战国」的新竞争时期,即便英伟达依旧遥遥领先,一些关键问题也随之而来:2024年,谁能杀出重围?谁又是英伟达之外最关键的变量?
毫无疑问,这将是一场格局之战。我们可以从蛛丝马迹中对2024年谁将杀出重围做出一些预判。
虽然三大热门场景都有变革,但增量的绝对值不尽相同。综合硬件性能、用户需求、市场规模等成分,「硅基研究室」判断,AI Car会是增量最大的领域,AI Phone次之,AI PC最末。
车端可能是2024年最扑朔迷离的AI芯片沙场。
市场上玩家布局的路线紧张可以归纳成两条。一条从自动驾驶出发,向智能座舱拓展,譬如英伟达和Mobileye(通过英特尔实现)。另一条文是从智能座舱出发,向自动驾驶拓展,譬如高通。
在智能座舱领域,眼下市场上各家新能源车企的竞争,与其说是芯片性能之争,不如说是对用车场景的理解之争。而在自动驾驶领域,由于和安全息息相关,必须要担保硬件运行的稳定性,并且须要经由市场验证,领先玩家具备更高的壁垒。
从这个角度出发,英伟达、Mobileye将率先受益,地平线等二线厂商有望凭借低本钱、高成熟度的产品成为车企的替代方案。
但是,如果将视角切换到交付的稳定度和市场铺开面上,则是地平线、华为等国产玩家具备更强的潜力。
一方面,在地缘政治背景下,AI芯片的对华出口能否持续、稳定,须要画一个问号。性能和生态固然是一道门槛,但正在办理当中。
另一方面,虽然目前地平线紧张在低端车型中铺开,但企业在自动驾驶领域的发展高度依赖数据积累,未来以更快的速率对前辈厂商完成反超也并非没有可能。
在手机领域,AI芯片厂商享受红利的前置条件是大模型本地支配。
众所周知,大模型上机有两种模式,一种是云端接入,另一种是终端支配。前者靠将用户的诉求反馈至云端,运算后在将结果发回手机。后者全流程均依赖本地硬件完成。
从能实现的功能上来看,两者类似,唯一对消费者购机意愿影响较大的成分是“是否乐意将本地数据(包括照片、文件、对话记录)上传至云端”。从这一点出发,本地支配确实存在需求,手机AI芯片的增长值得期待。
那么高通和联发科谁能将霸占领先地位呢?
从市场站位来看,高通和联发科分别霸占高端和中低端手机市场,向上打破的难度远大于向下兼容,并且目前推出AI手机的厂商均将价格定位在高端。
高真个市场站位给高通带来了更丰硕的毛利率,比拟财报来看,高通第三季度的毛利率约为55.1%,联发科毛利率水平为47.4%,这意味着高通有更多的「余钱」来推动研发。滚雪球效应下,恐怕联发科想要追赶高通仍有一段路要走。
值得一提的是,苹果和华为的AI芯片操持也会对市场格局产生影响,但程度较轻。
近年来,苹果手机芯片的性能提升幅度与高通、联发科等竞争对手比较均不占上风。不久前登场的两大安卓芯片——高通8 Gen3以及联发科天玑9300,在CPU多核性能、CPU多核能效比、GPU峰值性能、GPU能效比等核心技能指标上均已领先同期间的苹果A17 Pro。
华为方面,受到地缘政治成分影响,目前在芯片性能方面还难以和国际一流芯片厂商掰手腕。
在PC端,虽然近日AI PC的声量不小,但间隔它真正撬动C端市场的销量,还须要一些时日。
从C端场景出发,可以大致将AI运用区分为办公和娱乐两大类。
办公场景中,虽然微软、金山办公、Midjourney、Adobe等软件已经将AI功能融入个中,但它们的推理任务紧张还是由云端包袱,并且已经形成了按次付费的商业模式,不须要本地硬件具备太高的性能。
在娱乐场景中,在AI热兴起之前,为了支撑游戏流畅运行,本身就对GPU为代表的图形处理能力有较高的哀求。按照眼下能被「塞」进PC的模型规模,过去用于渲染游戏画面的GPU,完备有充足的算力支撑AI衍生运用运行。
仍以英伟达为例,虽然在本次CES揭幕之前发布了三款新的消费级GPU,但三款GPU的性能均未超越2022年发布的RTX 4090。
综上所述,2024年,在云打算等传统领域,英伟达得益于供应链上风等护城河,最值钱的卖水人地位短期内不会发生改变。
而在AI PC、AI Phone、AI Car三大场景中,分别在技能和渠道方面霸占上风的英伟达和地平线将率先吃到AI Car的红利,而高通有望在亟需新故事拉动增长的AI Phone品类杀出重围,至于AI PC,在新场景和新事情范式涌现,并带动更强的硬件需求之前,干系企业的市场份额及销量还有待不雅观察。
2024年是AI芯片厂商迎来泼天富贵的一年,但同时,也能感想熏染到水面之下酝酿着激烈的变革。企业和投资者当然可以投身这片蓝海,但最好时候保持当心。
参考资料:
大模型公司「卷」芯片,英伟达危?|元宇宙日爆 2024年,人工智能芯片展望 | 半导体行业不雅观察 英特尔推最新AI处理器,寻衅英伟达:演习主导地位不会持久|澎湃新闻 英伟达H200溘然发布:容量翻倍,带宽狂飙| 半导体行业不雅观察 英伟达芯片,最新路线图 | 半导体行业不雅观察 作为自动驾驶芯片领域的独角兽,地平线不再抗拒低端滤镜| 零态LT 当苹果芯片跌落神坛| 智东西 一夜暴增5600亿!美国英伟达发布最强消费级显卡,AI 性能增长超170%|直击CES 2024|林志佳