7月28日,锐龙AI 300条记本上市。
这款机型之以是受到关注是由于搭载了AMD全新的AI处理器“锐龙AI 300系列”(4nm工艺制程)。
这个系列的处理器,采取了AMD全新的Zen 5架构。AMD曾在今年6月初的中国台北国际电脑展上发布了锐龙AI 300系列和锐龙9000系列两款桌面AI处理器,并对Zen 5架构做了简要先容。
在7月28日搭载了锐龙AI 300系列桌面处理器的笔电上市之前,AMD在美国举办的Zen 5 Tech Day技能活动上,表露了这款处理器的详细技能信息。
Zen 5架构的定制款被称为Zen 5c,特色是更“紧凑”的内核,比标准全功能的Zen 5架构内核小约25%。这两种内核类型,在同一芯片上,具有不同数量的缓存。这是AMD首次做出这样的设计。
AMD在2017年推出Zen架构,取代了之前的Bulldozer(推土机)架构:Zen架构的IPC(均匀每周期指令)性能比Bulldozer架构提升了52%,远超预期的40%性能提升值。
在Zen架构推出七年以来,AMD将之迭代了5次。AMD流传宣传,新推出的Zen 5架构,比前代Zen 4架构的IPC性能提升了16%,“实现了性能的本色性飞跃”。
AMD做了什么努力?
大略来说,AMD做了多项架构改进,包括增加每时钟周期指令数、拓展指令分派与实行带宽、翻倍缓存数据带宽和AI加速等等。比如,通过扩展管道和矢量大小,AMD以此增强Zen 5架构的吞吐能力,这有助于同时处理更多数据并提高核心的并行处理能力。
CPU出身至今,在设计层面已形成一套成熟的体系。大致上,CPU设计分为前端和后端两个环节,物理模块构造大致包括指令预取与解码、整数实行、浮点实行、载入存储和缓存平分歧的单元。
Zen 5架构提升了前真个部分模块的规格,比如从1提升到1.5:AMD设计了双预取、双解码流水线和提升一倍的指令带宽等(前端)。
个中,前端带宽指令翻番,有助于提高处理器处理繁芜打算和数据密集型任务的效率。这个新设计,也表示在L1和L2缓存之间,以及增加了L1缓存到浮点(FP)单元的数据传输速率。
Zen 5架构的浮点与矢量实行单元部分,在Zen 4架构引入AVX-512指令集的根本上,从仅支持256位数据宽度,强化为支持完全的512位;L1缓存容量也从32KB增大到48KB,同时从8路增强为12路。
面对如今彭湃澎湃的AI算力和运用需求,Zen 5架构大幅提升了数学加速单元的性能:单核实行数学学习提速最高至32%,AES-XTS指令提速最多至35%。
正由于有了这些技能努力,故而Zen 5架构的IPC性能可提升16%,在有些场景中,乃至能提升35%。
AMD称Zen 5架构整体性能比前代提升幅度“巨大”,是否夸年夜?
华尔街见闻查阅了Zen架构之前四次迭代的性能提升幅度后创造,这个说话多少有些夸年夜。Zen+、Zen 2、Zen 3和Zen 4各自比前代的性能提升幅度分别是3%、15%、19%和13%。这次是16%,不如Zen 3的性能升幅。
但这并没有影响Zen 5架构的技能创新和由此带来的AI性能表现。这是一款符合AI需求的桌面处理器,而采取Zen 3架构的处理器并未具备这些新的技能上风。
7月28日上市的搭载锐龙AI 300系列处理器的条记本电脑,有Zen 5和Zen 5c两种规格。
这两款处理器采取了完备相同的CPU架构,不同之处是什么?Zen 5c属于定制款,相对来说,由于采取“紧凑型”设计,因此相对Zen 5架构,Zen 5c架构的缓存更小,频率也更低,但能效更高,更符合移动场景需求。
作为一款AI PC处理器,锐龙AI 300系列也采取异构设计,即CPU+GPU+NPU。个中,CPU架构升级到了Zen 5,GPU则采取了RDNA 3.5架构,NPU用了XDNA 2架构。个中,RDNA 3.5架构紧张提升了能效比、内存性能和电池续航。
NPU部分,XDNA 2架构将AI引擎单元从20个增加到32个(分四行八列)),每个单元内的MAC数量翻倍;叠加板载内存容量增加的1.6倍、支持Block FP16块状浮点格式、非线性增强支持和8条并发空间流(比前代架构实现翻倍),故而锐龙AI 300系列的NPU算力,高达50 TOPS。
这个指标,在环球范围内,超越了头部同类竞品:Intel Lunar Lake(48 TOPS)、高通骁龙X Elite(45 TOPS)、苹果M4(38 TOPS)。
本文来自华尔街见闻,欢迎下载APP查看更多