首页 » 互联网 » 云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技

云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技

雨夜梧桐 2024-11-15 14:16:01 0

扫一扫用手机浏览

文章目录 [+]

作者 | ZeR0编辑 | 漠影

上周,环球最大云打算巨子亚马逊云科技自主研发的Graviton4处理器全面上市,最初为全新实例Amazon EC2 R8g供应支持。

云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技 云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技 互联网

这件事还挺让人感慨,有种Arm做事器CPU千帆过尽、苦尽甘来的既视感。

云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技 云巨擘大年夜暴走自研CPU落地200万张!新一轮芯片洗牌开始了_亚马逊_科技 互联网
(图片来自网络侵删)

做事器CPU领域曾经上演风水轮流转,早期由一众精简指令集前辈一统天下,后来被繁芜指令集架构x86逆袭蚕食。
等精简指令集中的子弟Arm想闯数据中央赛道时,x86早已全面霸场。

实在Arm早在2008年就对这个新兴市场跃跃欲试,结果一晃十年过去,几经试水,愣是没激起零散的水花。

第一张进入数据中央市场的门票,还是云打算家当老大哥亚马逊云科技送来的。

当时亚马逊云科技发了个“三连击”:

1、2015年1月,出其不虞地收购以色列芯片设计企业Annapurna Labs,引发迹当密切关注;

2、2017年,推出首款自研网络芯片Amazon Nitro,把环球第一款商用的DPU芯片送上历史舞台;

3、2018年,发布首款Amazon Graviton处理器,让Arm做事器CPU在数据中央历史中有了清晰的坐标。

随后亚马逊云科技紧锣密鼓开展了教科书般的多线定制芯片攻关,其他中美大厂也相继跟上自研处理器的风潮。
漫长的做事器CPU拉锯战,终于从x86单方面碾压,变成Arm阵营声势渐涨。

Graviton亦逐渐坐稳环球最广泛利用的Arm做事器CPU,亚马逊云科技更是被视作带领Arm生态在数据中央开疆辟土的“全村落的希望”。
伯恩斯坦去年的一份报告显示,亚马逊云科技霸占了环球超过一半的Arm做事器CPU市场。

▲亚马逊云科技五年发布五款Graviton处理器(图源:智东西)

本日,大厂自研芯片习认为常,但成功者寥寥可数。
亚马逊云科技用五年写出的这本自研做事器CPU参考教材,值得被反复咀嚼。

一、六年去世磕CPU自研创新,给Arm做事器芯片开路

一代开山路,二代奠江湖。

这是亚马逊云科技自研做事器芯片发财的真实写照:2018年11月发布的Graviton处理器,发出了云打算大厂自研CPU的第一声枪响;一年后,继任者Graviton2出场,标志着Arm做事器CPU正式进入数据中央市场竞争中,与x86掰手腕。

Graviton2集成了300亿颗晶体管,核心数量足足是上一代的4倍,并翻倍提升了L1/L2缓存,总线带宽达到2TB/s,比较上一代实现了7倍的性能提升。
与基于x86的同类实例比较,基于Graviton2的实例性能提高了40%,每个实例本钱降落了20%。

在低功耗上的出色表现,使亚马逊云科技大举将通用事情负载转移到Graviton2上,以节省电力和本钱。
此后,Graviton系列的采取率飙升,覆盖的事情负载从起初的Cache和Web扩展到数据剖析、机器学习、高性能打算等。

Graviton在市场的初步告捷,堪称改变Arm命运的节点。

这背后,亚马逊云科技在底层创新上颇费心思:首次不再利用同步多线程技能,而是实现物理核心单线程资源独享,让每个vCPU独占1个物理核心,使vCPU之间更加隔离,不会因争抢资源而导致性能抖动。

从第一代到第二代,Graviton通过增加核数取得了可不雅观的性能提升,但到第三代,亚马逊云科技须要纳入更多的设计创新。

增加核数、提升主频,是提升性能的两个常见手段。
2021年发布的第三代Graviton3没有采取这些思路,核心数不变,主频仅略微提升。
由于提高频率对付大规模数据中央来说会比较冒险,可能会带来大量的能耗,而且须要搭配升级的电源及散热配置,终极导致客户的利用本钱上升。

Graviton3做了几项有别于前代的创新:

1、采取Chiplet设计,将7块硅die封装在一起;

2、采取指令级并行方法,提高了单个核心周期可实行的指令数量,使核心能完成更多任务;

3、针对内存带宽和延时敏感型事情负载,增加了40%的内存空间,并采取DDR5将内存通道带宽提升50%。

结果,比较上一代,Graviton3能将运用负载的性能无差别提升25%,功耗比较x86实例降落多达60%。
通过内置机器学习硬件加速单元,这颗处理器还实现了3倍的机器学习性能提升,并被AI研究职员和企业用于云中的MLOps。

2022年推出的Graviton3E,专门针对浮点和向量指令运算进行了优化,向量打算性能达到Graviton3的2倍,尤实在用于人工智能/机器学习、高性能打算等运用处景。

最新一代Graviton4用上了更好的Neoverse-V2核心,并将核心数增加到96核,每个核心的L2缓存提升1倍至2MB,内存带宽提升75%。

每一代Graviton都会较上一代有两位数的性能提升,并且单位算力功耗不断低落。
而节能减排对付数据中央的可持续发展极其主要,Twitter、Databricks、F1方程式赛车、Snap等有名云客户都利用了基于Graviton的做事,并对其降本增效的上风赞誉有加。

据外媒宣布,到2022年年中,Graviton约占亚马逊云科技CPU实例的20%,个中大部分是Graviton2,亚马逊云科技新增虚机实例中约50%都是Graviton系列。

一些云客户公开背书称,他们通过租用Graviton做事节省了10%~40%的打算本钱。

作为Graviton早期用户的大宇无限,用Graviton2将大数据作业的本钱降落了20%;大量利用Graviton2实例的涂鸦也升级到新一代实例,将IoT平台加解密性能提高50%。

根据市场调研机构IDC的数据,2023年第一季度Arm做事器出货量市占率约为10%。
此时Arm在做事器市场的生态问题已经初步得到办理。

截至目前,亚马逊云科技在环球六大洲33个地区和100多个可用区累计支配了超过200万张Graviton处理器。
这些处理器驱动了超过150种打算实例,被环球超过5万的企业和开拓者所利用。

二、唯一实现大规模利用Arm架构的云大厂

在做事云客户的过程中,亚马逊云科技团队创造如果希望针对所有可能的事情负载彻底变革打算的性价比,须要彻底重新思考实例,深入底层技能,包括定制芯片。

为什么是基于Arm架构设计芯片?

对付亚马逊云科技来说,这既是形势所迫,又是前瞻布局。

首先,Arm的容许证相对易得,而且设计自由度高,便于亚马逊云科技设计出更符合云业务需求的处理器。

其次,省电长期是数据中央的老大难。
考虑到规模效应,每个芯片节省的几瓦特都很主要。
而Arm已经被移动处理器市场考验过高能效、高算力密度、低本钱等上风。

其余前文我们提到过,Graviton在提升频率上很谨慎,通过更高的指令级并行来补足性能,使其在性价比上更有竞争力。
在高CPU利用率下,Graviton中每个vCPU独占一个物理核心,不存在争用问题,能保持依然快的速率,其价格上风则会变得明显。

据亚马逊云科技表露,比较采取Graviton3的第七代R7g实例,基于新一代Graviton4处理器的Amazon EC2 R8g实例性能提高了30%,实例大小更大,vCPU和内存增加多出3倍,能为数据库、内存缓存和实时大数据剖析等内存密集型事情负载供应更好的性价比。

与R7g实例比较,R8g实例可将Web运用程序最高提速30%,数据库最高提速40%、大型Java运用程序最高提速45%。

其性能和性价比上风已经得到一些实测验证。

根据Phoronix发布的一些基准测试结果,在相同vCPU数量时,新Graviton4核心大致与英特尔Sapphire Rapids性能相称,同时能媲美AMD第四代EPYC,在运行高性能打算、加密、代码编译、光芒追踪、数据库、3D建模等事情负载时,代际进步整体非常出色。

▲经测试,基于Graviton4的R8g实例性价比超过基于英特尔至强、AMD EPYC的亚马逊云科技云实例(图源:Phoronix.com)

作为R8g实例首发客户之一,Honeycomb分享称Graviton4的吞吐量改进非常明显,比较四年前刚开始利用Graviton,每vCPU吞吐量提高了一倍多。
他们准备在R8g实例系列正式发布后立即把全体事情负载迁移到Graviton4上。

爆款游戏《堡垒之夜》的制作公司Epic Games评价说,基于最新Graviton4的EC2 R8g实例是基于他们测试过的最快的EC2实例,在其“最具竞争力和对延迟敏的事情负载中表现出色”,可以充分提高游戏做事器的性能。

对SAP HANA Cloud利用R8g实例的初步测试结果显示,与基于Graviton3的实例比较,R8g实例的剖析性能可提升高达25%,事务性事情负载性能可提升高达40%。

▲R8g实例不同规格比拟

迄今为止,只有亚马逊云科技真正实现了大规模利用Arm架构。

为什么是亚马逊云科技?正如亚马逊云科技大中华区办理方案架构总经理代闻在今年中国峰会上所言:“只有在云打算的环境下,才有机会做这样的从运用到CPU的全栈创新。

自研芯片不是纸上创新,须要工程履历的积累,不仅要追求高性能,而且要足够的稳定可靠和高度安全。

用相同Arm微架构不代表就能做出一样性能的CPU,设计出芯片也不代表就能取得量产和商业上的成功。
光是几百个CPU核心互连带来的线性度和通信延时问题,就能难倒不少芯片团队,更别提设计Arm做事器芯片还冲要破生态难关。

亚马逊云科技的研发思路是从对云客户事情负载的深刻理解,逆向穿透到芯片设计。
这种以客户为中央的方法能让亚马逊云科技短期内进行调度,以快速适应市场动态。

以Graviton4为例,亚马逊云科技首次面向实际运用设计CPU架构,该处理器的设计工程中从传统的MicroBenchmark基准测试评价体系转向以实际事情负载进行评价的方法。
比如,优化Cassandra数据库、Groovy运用、nginx做事器,所须要的前端和后端CPU参数是不一样的。

弘大的客户规模为亚马逊云科技高筑壁垒。
其遍布环球的广泛数据中央集群,能承载Graviton系列处理器的落地。
环球最大云打算业务所形成的规模效应,又能为亚马逊云科技有效摊薄本钱。

持续创新的云做事,使亚马逊云科技能够理解到利用最多的运用及其资源花费模式,以此来挑选对用户来说收益最高的技能点,进行针对性优化,快速改进软件和硬件堆栈乃至是CPU设计,研发出相匹配的vCPU和硬件核心。

同时,亚马逊的各条托管做事的产品线都利用统一的根本举动步伐,因此Graviton创新可以及时运用到所有的托管做事里。
用户通过改换打算选项,就能轻松享受到Graviton带来的性价比提升。

用户只需关心哪款实例更能知足需求,亚马逊云科技卖力将软件的迁移和学习本钱打下来。
通过将更多的管理做事和Graviton做深度集成,从x86无缝迁移到Arm变得大略快捷。

三、自研芯片如何影响云打算?

本日,自研芯片已经成科技大厂的标准动作,不管是降本增效、构建竞争上风,还是提高可控性、降落第三方芯片企业依赖,都是随意马虎说服下贱客户和投资者的好故事。

但在九年前,当亚马逊云科技率先踏出自研芯片之路时,这还是个超前的探索。

回溯云打算发展史,亚马逊云科技在2006年发布首款EC2(弹性云打算)实例定义被视作一个历史时候。
随后越来越多的企业逐渐接管云打算观点,并开始将自家运用迁移到云端。

现在亚马逊云科技可以在云上顺利运行几万个节点的高性能打算集群来演习大模型,能在云上处理高并发的实时流媒体运用,这些在当时都是很难想象的。
要知道亚马逊云科技的第一款EC2实例,主频只有1.7GHz,网络带宽250Mbps,内存不到2GB,磁盘是只有160GB的机器盘。

在云打算业务刚起步的几年,亚马逊云科技要办理很多棘手问题,特殊令团队焦虑的是:如果利用定制版Xen作为虚拟化管理程序,无论如何耗费大量韶光来优化代码,虚拟层始终会占用主机资源,并且x86 CPU并不善于处理网络流量。

直到2013年,一家以色列芯片企业Annapurna Labs走进亚马逊云科技的视线。
经由互助,亚马逊云科技首次将网络处理写到硬件。
惊喜的落地表现,让亚马逊云科技盯上了这家出色的互助伙伴:2015年1月,亚马逊云科技宣告收购Annapurna Labs,自此踏上自研芯片的旅程。

回过分来看,这绝对是亚马逊云科技历史上一笔精明的投资。

就在这一交易的两年后,亚马逊云科技对外宣告Nitro虚拟化平台,将安全、管理、监控全部卸载到硬件上,将主机算力近乎100%地供应给客户。

从此,云打算走上了业务与根本举动步伐完备物理隔离的路子,底层的虚拟化技能创新和上层的做事器种类发展可以并行展开。

这催生了EC2实例的关键拐点:从2006年到2017年,亚马逊云科技用11年从1种EC2实例做到70种;而从2017年到2023年,EC2实例骤然爆发式增长,6年从70种发展到750种,能为各种负载供应得当的打算实例。

站在Nitro成功的基石上,亚马逊云科技发展出网络芯片、做事器CPU、AI演习和推理芯片三条产品线:Nitro网络芯片已经发展到第五代,持续优化网络性能、存储性能和安全加固;Graviton已经发布四代五款;AI推理芯片Inferentia和AI演习芯片Trainium,通过供应更具性价比的推理和演习实例,让用户有了GPU之外的AI加速选择。

这使得亚马逊云科技能够保持内部全栈创新的灵巧性:从定制的板卡及做事器开始,到深入底层定制芯片,再到横向扩展自研芯片版图,亚马逊云科技逐渐将从芯片、硬件到软件整合协同,在为业务带来更好本钱效益和可靠性的同时,构成独属于自己的核心竞争力。

自研芯片与亚马逊云科技自研的存储做事器和高速网络系统联动,使得更多芯片能够高效互连,从而真正明显缩短打算的韶光。
站在这些创新根本上,亚马逊云科技能够支持云打算中运行最具寻衅性的任务之一——人工智能与机器学习。

在近期举行的亚马逊云科技纽约峰会上,亚马逊云科技宣告96%的AI/ML独角兽已将其业务跑在亚马逊云科技上,2024福布斯AI 50榜单中90%的企业选用亚马逊云科技。
从2023年至今,亚马逊云科技已经正式发布了326项天生式AI功能,同期机器学习和天生式AI做事的正式可用数量超过了其他供应商的两倍。

广泛的用例与深厚的技能积累总是唇齿相依。
这些数量惊人的AI用例,使得亚马逊有足够的实践案例来为客户供应能取得最佳收益的选择,而广泛的客户反馈又能成为其芯片设计最好的动能。
芯片技能的持续迭代,将托举起越来越高性价比的云做事,推动天生式AI普惠。

结语:没有哪款芯片,是云打算的唯一解

市场上有大量的芯片选择,云根本举动步伐供应商能在如何将所有这些整合在一起方面发挥代价,从而更好实现从根本举动步伐到云做事的各种创新。

与独立芯片企业不同的是,亚马逊云科技自研芯片的目的不在于参与市场竞争,而在于为其客户供应一个“万能商店”,既供应自研芯片,又供应英特尔CPU、英伟达GPU等市情主流选择,由客户来根据这些芯片实例的配置文件,自行选择最能知足事情负载需求的产品组合。

Graviton的六年演进,走通了Arm做事器CPU落地的故事。
Arm为亚马逊云科技供应了灵巧定制CPU的根本,亚马逊云科技则推动了做事器芯片市场格局的变阵,成为Arm在数据中央市场展现本钱和性价比上风的最好代言。

只要Graviton还有降本增效的空间,亚马逊云科技就可以连续贬价让利,把规模与技能的红利回馈给云客户。

相关文章