首页 » 科学 » 超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构

超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构

南宫静远 2024-12-25 06:23:31 0

扫一扫用手机浏览

文章目录 [+]

AMD新一代处理器的核心:Zen 5架构解析

本次锐龙9000桌面处理器以及锐龙AI 300系移动处理器均利用Zen 5架构,而这两款处理器都会在本月上市,详细韶光是锐龙AI 300的条记本会在7月28日,而锐龙9000处理器则是7月31日。

Zen 5架构的改进方向大体可归纳为:每周期可实行更多指令;更宽的调度和实行单元;数据缓存带宽翻倍;更强的AI加速性能。

超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构 超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构 科学

先来看前真个改进,Zen 5直接升级成双管道预取和解码,搭配高平分支预测技能,可有效减少延迟、提高准确性和吞吐量,指令缓存的延迟和带宽也得到改进,这些方法有效提高了数据流和数据处理速率,且不会捐躯准确性。

超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构 超能教室(333):AMD锐龙9000和锐龙AI 300处理器CPU、GPU、NPU全解析_处置器_架构 科学
(图片来自网络侵删)

整数实行单元加宽了指令分派和实行通道,分配和引退从以往Zen架构的每时钟周期6条指令增加到8条,以往的旧Zen架构整数实行单元包括4个ALU和3个AGU,而Zen 5则增加到6个ALU和4个AGU,它们均配备一体化调度器,这样Zen 5就拥有更大的实行窗口,在更繁芜的打算事情负载下会有更好表现。
此外核心缓冲区从320条款增加到448条款,以更好地处理更广的调度和实行​​所产生的更多的未命中。

浮点实行单元得到重大更新,AMD自上代Zen 4开始支持AVX-512指令集,但那是利用256位SIMD用两个时钟周期来实行AVX-512指令的,而Zen 5则可供应完全的512位数据位宽,搭配6管线与2周期延迟的FADD,可处理更多浮点指令,在CPU实行一些AI模型时,能够显著提高反应速率与效能,面对未来各种AI运用。

缓存方面,一级数据缓存容量从32KB增加到48KB,宽度也从8路增加到12路,每周期4次读取2次写入,这让一级缓存与浮点单元的最大带宽直接比上代翻倍,改进了数据预取的效率。

根据AMD给出的数据,Zen 5架构的性能提升紧张由数据带宽、实行/退休、解码/指令缓存以及获取/分支预测这四大部分改进相互促进而成的,而Zen 5的IPC较Zen 4均匀提升了16%之多,而利用VNNI的机器学习单核性能则比Zen 4提升了32%,利用AVX-512的AES-XTS加密负载单核性能则提升了35%。

除了在7月会上市的两款消费级处理器外,采取Zen 5内核的第五代EPYC也将会在今年下半年上市,目前的Zen 5 CCD以及锐龙AI 300将会采取台积电4nm工艺生产,而未来更紧凑、更节能的Zen 5c则会采取台积电3nm工艺。
从图片可以看出EPYC Turin最多16个Zen 5 CCD,按每个CCD有8个核心打算的话最多128核,而采取Zen 5c CCD的版本则最多192核。

在Zen 5之后,Zen 6也在路上了

锐龙AI 300的核显:RDNA 3.5架构

今年AMD有没有RDNA 4这点我还不知道,但这RDNA 3.5是AMD专门为Strix Point移动处理器所打造的,针对每瓦能效、内存每bit效能以及更长的电池续航韶光进行架构优化,它将被用在Radeon 800M系列核显上。

RDNA 3.5较原来的RDNA 3比较有两倍的纹理采样率和插值与比较速率,前者意味着GPU拥有前代的两倍性能,在游戏过程中纹理和图形的细节和清晰度得到增强,理论上有助于改进细节纹理,在高分辨率时更有冗余,而后者则可以更好地呈现高质量图形细节。

还引进了更前辈的内存管理技能,提高了内存每bit的操作效能,降落了对LPDDR5内存访问频率,意味着读写更快,总体上也更节能,延长条记本的电池续航力。

根据官方的数据,在同样是15W性能开释下,Radeon 800M的3DMark Timespy得分比上代提升了32%,而Night Raid跑分则提升了19%。
以上便是关于RDNA 3.5的内容,说真的AMD并没有透露太多的细节信息。

新NPU算力高达50 TOPS:XDNA 2架构

Intel在宣扬Lunar Lake时说它有CPU、GPU、NPU三个AI内核,实际上AMD自锐龙7040系列处理器开始便是这种构造,而现在Strix Point则配备了全新的XDNA 2架构NPU,可供应高达50 TOPS的AI算力,比锐龙7040的10 TOPS和锐龙8040系的16 TOPS提升非常大。

上图是XNDA架构NPU和传统的多核处理器的比拟,说真的XDNA的这构造实在更像GPU这种平衡处理器,XDNA设计将灵巧的打算与自适应内存层次构造结合起来,内部拥有大量互联的AI引擎,有着弹性的运算单元与内存调度制度。

每个AI引擎通过可编程互联节点进行分区掌握,可进行灵巧分区利用,包括空间分区和韶光分区,空间分区就如上图的例子那样,两列AI引擎卖力实时视频、两列卖力实时音频、四列卖力内容创作运用。
韶光分区则适宜大模型,可以整体先后实行不同的任务,比如先全力处理大措辞模型,然后全部转向视频编辑。

XDNA 2拥有32个AI引擎,每列拥有4个AI引擎,MAC数量较上代翻倍,缓存容量增加1.6倍,支持Block FP16块状浮点格式,支持非线性增强。
NPU可根据任务的轻重程度以列为单位开启AI引擎,在轻任务下可以关闭部分核心,从而节约功耗,能效比初代提高了一倍。
性能方面,XDNA 2可供应50 TOPS的AI算力,是上代的5倍。

XDNA 2架构行业创始支持Block FP16浮点格式,对付AI运算来说数据类型至关主要,Int 8有较高的打算效能但精确度相对较低,而FP16则有较高的精确度但效能较低,而Block FP16则可实现Int 8的性能和FP16的精度。

AMD比拟了Strix Point和苹果M4 ANE、Intel Lunar Lake和高通骁龙Elite X处理器运行FP16数据的峰值算力,性能要赶过很多,Lunar Lake的48 TOPS是基于Int 8数据的,跑FP16大概减半。

Block FP16数据类型精准度实在仅比FP32低那么一点点,而且对付开拓商来说,可以相称随意马虎的把模型转化为FP16、FP32和BF16等数据类型。

在大措辞模型Llama v2 7B的FP16量化模型的性能测试中,最新的锐龙AI 300处理器NPU的相应速率是酷睿Ultra 7 155H的5倍。

AMD也操持推出Ryzen AI Software以支持各种模型并对其优化,并采取ONNX Runtime实行,让未来搭载锐龙AI处理器的条记本电脑具备更多的AI运用功能。

锐龙9000桌面处理器

实在锐龙9000系列桌面处理器的规格早在Computex 2024上就公布了,基本和当年的锐龙7000是完备一样的,包括:

锐龙9 9950X,16核32线程,最高频率5.7GHz,64MB L3缓存,170W TDP;

锐龙9 9900X,12核24线程,最高频率5.6GHz,64MB L3缓存,120W TDP;

锐龙7 9700X,8核16线程,最高频率5.5GHz,32MB L3缓存,65W TDP;

锐龙5 9600X,6核12线程,最高频率5.4GHz,32MB L3缓存,65W TDP;

两颗锐龙9是双CCD,而锐龙7和锐龙5则是单CCD,而且锐龙9 9950X、锐龙9 9900X的最高频率和锐龙9 7950X、锐龙9 7900X也是一样的,而锐龙7 9700X和锐龙5 9600X则比锐龙7000的两款同型号的高100MHz,而这些处理器的上市韶光敲定在7月31日。

由于Intel的新一代桌面处理器估计要10月才上市,这次AMD给锐龙9 9900X找的对手是现在Intel现在的旗舰酷睿i9-14900K,而锐龙7 9700X的对手则是酷睿i7-14700K,锐龙5 9600X是酷睿i5-14600K,详细的性能比拟大家看图就好了,至于顶级的锐龙9 9950X,就等着对手的下一代处理器来寻衅。

AMD没给出锐龙7 9700X与锐龙7 7800X3D的性能比拟,而是放出了锐龙7 5800X3D的比拟,根据官方数据,65W的锐龙7 9700X在游戏性能上领先于105W的锐龙7 5800X3D,均匀要快12%,而且功耗更低,实际上锐龙9000X3D该当也不远了,到时候再和锐龙7 7800X3D比拟吧。

除了最顶级的锐龙9 9950X外,这代每个型号的TDP都要比上代有所降落,性能方面则有11%到22%不同幅度的增长,此外得益于新架构和新工艺,处理器的热阻降落了15%,同TDP下温度要比上代低7℃,对散热器的哀求明显降落。

内存支持也有所改进,默认的JEDEC内存可支持DDR5-5600,但新的AGESEA可让内存频率直达DDR5-8000,同时支持内存实时超频,可在系统内对内存时序经行变动,可随时利用Ryzen Master软件进行内存超频,也可随时切回默认状态。

CPU超频可直接交给PBO,可实现6%~15%的性能提升

此外AMD在原有的Curve Opitimizer功能根本上推出Curve Shaper功能,可进一步许可玩家最大化调度降压曲线,可供应最多15组频率与温度的组合,玩家可以在稳定区降落电压并在必要时增加电压,这许可玩家把锐龙9000处理器的潜力挖掘到极致,这设置适用于所有核心,不能单独对某个核心进行调节。

主板方面,且和之前透露的差别不大,X870E是双芯片,与X670E比较便是多了USB4的支持。
X870变成了单芯片,现在GPU和M.2都逼迫支持PCIe 5.0,同时也支持USB4,可看作是多了USB4的B650E。
B850实在便是B650的平替,但M.2支持PCIe 5.0,而显卡的PCIe 5.0则是可选的。
B840大家把它理解成A620就行了,不支持CPU超频但支持内存超频,只支持USB 10Gbps,显卡和M.2口都是PCIe 4.0的,其他扩展则是PCIe 3.0。

锐龙AI 300处理器

实在上面所说的RDNA 3.5以及XDNA 2都是锐龙AI 300移动处理器的独享内容,锐龙9000桌面处理器并不会配备这些,它的IO-Die还是锐龙7000上面那个,以是核显也是RDNA 2架构的。

实在到这里Strix Point也没多少东西可说了,首批供应了锐龙AI 9 HX 370和锐龙AI 9 365两款产品。
其采取了稠浊架构设计,CPU部分包括了Zen 5和Zen 5c架构的内核,与Intel异构不同,Zen 5、Zen 5c还是完备相同的架构,IPC和ISA是完备相同的,不同之处在于核心频率以及搭配的L3缓存容量。

锐龙AI 9 HX 370拥有4个Zen 5和8个Zen 5c,共24线程,配备24MB L3缓存,根本频率2.0GHz,最大加速频率5.1GHz,配备16组CU的Radeon 890M核显。

锐龙AI 9 HX 365拥有4个Zen 5和6个Zen 5c,共20线程,配备24MB L3缓存,根本频率2.0GHz,最大加速频率5.0GHz,配备12组CU的Radeon 880M核显。

两者均配备50 TOPS的XDNA2架构NPU,TPD从15~54W可调。

AMD拿锐龙AI 9 HX 370比拟了Intel酷睿Ultra 9 185H以及高通的骁龙X Elite处理器,不论生产力还是创作力方面的性能都是办法先对手的。

游戏性能更是AMD处理器的拿手好戏,而且高通X Elite处理器在游戏上涌现了不少兼容性问题,根本不能运行,ARM架构在Windows系统下还是存在较严重的兼容性问题,而AMD新一代RDNA 3.5架构Radeon 890M核显则可在高画质下流畅运行不少3A游戏。

总结

AMD新一代Zen 5架构的锐龙AI 300条记本会在7月28日上市,而锐龙9000处理器则是7月31日,虽然上面的PPT比拟的都是Intel当前这代的产品,但大家该当都清楚它们真正的对手是Intel下一代的Arrow Lake和Luner Lake,当然了Luner Lake实在并不是一个赛道上的东西,但难免被大家拿来比拟。

由于这次Lion Cove架构P核和Skymont架构E核改动很大,再加上大家都利用台积电4nm工艺,到时的性能比拟肯定很精彩,只不过AMD这次确实有韶光上风,由于搭载Luner Lake处理器的条记今年夜概率要等到9月才上市,而Arrow Lake桌面版本则要等到10月,移动版更是要明年初。
AMD这次早至少两个月不说,而且还让他们搭上了暑期发卖旺季这班车,打对手一个先手,至于到时会不会被反推还很难说,反正可以确定的是AMD还有X3D这个夹帐藏着。

相关文章

IT治理,构建数字化时代的基石与智慧

随着信息技术的飞速发展,IT治理已成为企业、政府机构乃至整个社会的重要议题。IT治理不仅关乎企业的信息安全,更涉及组织战略、流程优...

科学 2024-12-26 阅读0 评论0

IT猎头网络,连接人才与企业的桥梁

随着互联网技术的飞速发展,我国IT行业迎来了黄金时代。在这个时代背景下,IT猎头网络应运而生,成为连接人才与企业的桥梁。本文将从I...

科学 2024-12-26 阅读0 评论0

IT猴子潮牌,潮流与科技的完美融合

在当今这个科技与时尚交织的时代,一款融合了创新科技与独特潮流的服装品牌——IT猴子,正以其独特的魅力,俘获了一大批年轻人的心。本文...

科学 2024-12-26 阅读0 评论0