弁言
在RTX4090发布之际,我们在首发视频中为大家着重先容了索泰GeForceRTX4090AMPEXTREMEAIRO,作为索泰的高端系列,凭借着至高无上的强劲性能以及独领风骚的外不雅观设计,至今让人印象深刻。现在RTX40系显卡的后续型号也陆续发售,而个中备受瞩目确当属次旗舰RTX4080显卡。
索泰作为NVIDIA之中的一线AIC品牌,推出了多款高端系列的RTX4080显卡,这次我们上手的是索泰AMP家族的新成员——索泰GeForceRTX408016GBAMPEXTREMEAIRO月白,这款显卡一改以往的风格,一身白衣,简约的风格搭配流线型的设计,完美营造出一种舒适而优雅的视觉美感。

下文“索泰GeForceRTX408016GBAMPEXTREMEAIRO月白”简称为“索泰RTX4080AMPEXTREMEAIRO月白”
规格比拟
在开始之前,先理解一下本次的主角RTX4080,其采取的是AD103-300核心,TSMC4N工艺制造,芯片面积为379平方毫米,晶体管密度达到了459亿,晶体管数量比较较于上一代产品提升明显,近乎翻倍,而这一代的核心还进一步提升了频率,因此能带来更好的性能表现。
其他参数方面,RTX4080标配9728个CUDA,128个第三代RTCores,512个第四代TensorCores,并且用上了16GB的GDDR6X显存,大显存合营性能上的提升更可以为游戏以及创作者带来更好的利用体验。
而目前RTX4080显卡配备的AD103-300核心并不是完全的AD103核心,完全的AD103核心该当包括7个GPC(图形处理集群)、40个TPC(纹理处理集群)、80个SM(流式多处理器)以及一个带有8个32Bit显存掌握器的256Bit显存带宽。因此笔者预测,RTX4080或许不是AD103核心下的终极产物,后续该当还会推出完全AD103核心的RTX4080Ti。
再看看下方的RTX4080的核心构造图,和完全版本的AD103核心比拟起来就很随意马虎看出差别,RTX4080核心代号为AD103-300,其拥有4个完全规格的GPC(图形处理集群,每个内建6个TPC),与3个非完全的GPC(两个内建5个TPC,一个内建4个TPC),共组成38个TPC,SM单元则剩下76个,显存位宽还是完全的256Bit。
但是RTX4080上的AD103-300核心在编解码器上砍了一刀,不得不说老黄的刀法精准,编解码器数量直接砍半,与RTX4090同等规格,仅保留了两个NVENC编码器和一个NVDEC解码器,因此完全版的AD103核心该当会有更快的视频编解码速率,不过之前测试过RTX4090,编解码速率比较上一代有着近乎翻倍的提升,想必RTX4080也有不错的表现。
外不雅观赏析
这张索泰RTX4080AMPEXTREMEAIRO月白最值得说道的便是它的外不雅观,造型设计参考了空气动力学,因此它的外壳不像其他显卡方方正正,而是多了许多流线型的柔美。
整张显卡以白色为主打色,风扇上的金色与包边的银色为辅,在视觉效果上既时尚又不过分高调,给人一种唯美的小清新感。是笔者见过的所有RTX4080显卡中独树一帜,可以说是最具特色的一款。
正面最显眼的便是3把110mm仿生盾鳞2.0风扇,你可别鄙视这3把风扇,它们都利用了空气动力学事理,增加了风扇厚度,加深风扇外罩,有利于风骚集中,大幅提升散热效率。并且中间的风扇采取反向旋转,能够有效减少乱流。
每把风扇的扇叶也有小设计,仔细看可以看到每一片扇叶上都有鳞状仿生条纹,扇叶的曲率也有改进,这些小改动可以提高风扇的进风量、风压与风骚,让冷空气吹透全体散热鳍片,帮助显卡快速降温。
既然说到散热风扇,众说周知,RTX4080的散热器都很“踏实“,这对PCB是一个不小的包袱,以是索泰RTX4080AMPEXTREMEAIRO月白采取高强度合金材料一体铸形而成的金属背板。
同时背板和散热器采取多点分布式安装设计,且增加了合金加固骨骼构造部件,增加显卡构造强度的同时,保护显卡PCB。
在金属背板的一侧还有镂空窗口设计,合营散热器上第三组风扇的风骚能够直接穿透散热鳍片以及镂空的PCB,显著降落显卡温度。
翻到显卡的顶部,这里可以看到被索泰称为“虹桥幻影”的超长灯带,采取半透明彩虹色涂层,设计灵感来源于北欧神话中的彩虹桥。
一旦上机点亮时这根超长的RGB灯带能够透射出惹眼的光芒,旖旎斑斓,呈现出独特的美感,显卡颜值更进一步。
当然索泰RTX4080AMPEXTREMEAIRO月白的RGB怎么可能只有这么一点,在显卡顶部、正面、侧面和背部共设有5个ARGB灯光区域,现在索泰也能称得上玩灯高手了。
不止显眼的地方有RGB,索泰在这款显卡上藏了不少灯珠,像金属背板之下也有隐秘的灯带,从机箱侧面看去便是绵延不绝的水流在显卡之上舞动。
玩家还可通过索泰的FireStorm掌握软件自行设定不同的灯效模式和颜色,或一键同步5个区域的灯效。
显卡底部的设计与顶部类似,一长排的散热鳍片铺排而过,能够最大限度的带走内部热量。
电源接口是PCIe5.0规范的16Pin供电接口,内部的金属端子进行了镀金设计,能够减缓氧化,降落发热量。
在电源接口阁下还有个小按钮,这便是索泰RTX4080AMPEXTREMEAIRO月白的BIOS切换按键,点击即可在双BIOS中来回切换。其余在索泰的FireStorm掌握中央也可以直接切换,更加方便快捷。
显卡金手指是常规的PCIe4.0x16接口,上机前一定要提前打开主板的ResizableBAR功能,这样才能跑满带宽,完备发挥显卡性能。
视频输出接口配备的是三个DP1.4a和一个HDMI2.1a,可以同时支持4屏输出,8K@60Hz也不成问题。
从这个角度也能看到显卡的厚度,索泰RTX4080AMPEXTREMEAIRO月白尺寸为35.5X16.6X7.2cm,也便是3.5槽厚,对小机箱会是一个寻衅。
2显卡拆解
显卡拆解
外在的颜值已经足够惊艳,内在的配置到底如何就要拆开来看看才知道了,索泰RTX4080AMPEXTREMEAIRO月白的拆解还是比较大略的,卸下背板螺丝即可分离PCB了。
虽然索泰RTX4080AMPEXTREMEAIRO月白的散热系统相称的大,但其显卡的PCB基板采取的却是紧凑的短板型设计,并且全体功能电路区域的设计非常清晰明了,电子元件布局也非常工致,可见索泰在显卡设计的上的博识的工艺。
PCB的背面比较正面简洁不少,大部分掌握芯片都放在此处。
要说这背面最显眼确当属核心后的电容,利用了两个POSCAP(导电聚合物钽电容),电气性能更强一些。
索泰RTX4080AMPEXTREMEAIRO月白上利用的是AD103-301-A1核心,TSMC4N工艺制造,内含9728个CUDA核心,Boost频率出厂就可达到2565MHz,性能表现更是直接碾压前代卡皇RTX3090Ti。
核心的四周是8颗GDDR6X显存,由美光与NVIDIA联合研制,型号为2PU47D8BZF,单颗显存容量2GB,8颗组成16GB,显存位宽为256Bit,速率达到了22.4Gbps。
AD103核心妥妥的旗舰级核心,想要带动它,供电系统也要高规格。索泰RTX4080AMPEXTREMEAIRO月白采取S.E.P2.0供电系统,超强的24+3相高规格供电乃至超越了不少RTX4090显卡。
核心供电与显存供电均采取了独立的DrMos芯片,并且配置同等,封装型号为NCP302150,来自安森美科技,持续输出电流为50A。
核心供电和显存供电均配有PWM供电掌握芯片,安排在PCB背面,型号分别是:uP9512R、uP9529Q以及uS5650Q。个中uP9512R与uP9529Q共同管理核心供电,可以做风雅化的供电管理,而uS5650Q则是紧张卖力显存供电部分。
在PCB上还能创造两颗不起眼的小芯片,这是索泰RTX4080AMPEXTREMEAIRO月白的BIOS掌握芯片,型号为IS25WP016,分别掌握加速与寂静两种不同的BIOS。
供电接口是全新的12VHPWR接口,单口供电能力达到了600W,索泰RTX4080AMPEXTREMEAIRO月白最高功耗仅450W,完备能够知足需求。
金属端子整体采取镀金工艺,对减缓氧化,降落电源线和接口的打仗阻抗颇有成效,同时还能减少发热量。
作为索泰旗下的高端系列,索泰RTX4080AMPEXTREMEAIRO月白的散热规格可以用豪华来形容,IceStorm3.0散热系统相称的有分量,由散热风扇、鳍片散热器以及金属背板三个部分组成,为显卡供应精良的散热效能。
拆开后可以看到超大面积的镀镍纯铜底,这款显卡的显存通过高导热系数的导热垫直触铜底,散热表现出奇的精良。
同时显存、电感、Mos管处还有高系数的导热垫添补硬件与均热板间的空隙,有助于高效导热。GPU核心也是抹上了厚厚的一层硅脂,毕竟压制的可是次旗舰定位的AD103核心。
除此之外,金属背板的显存和GPU核心位置依然贴了导热垫,可以从背板处导热,妥妥的旗舰级配置散热。
由于这款显卡的外不雅观设计与一样平常显卡不同,以是散热器的造型也更具特色,散热器为两段式设计,右侧可以看到加厚加高的镀镍散热鳍片模组,大大提升鳍片散热面积和导热能力,轻松搪塞严苛的散热寻衅。
散热鳍片之下是9热管豪华阵列,并且全部换装升级为冰脉2.0版本,新版本采取精密的无损内嵌焊接工艺,将9根热管均匀分置贯穿全体模组。
内部设计也经由优化,增加了热管壁厚度和内壁脉络状导液沟槽,用上了更高导系数的导热介质,加大冷凝液与热管内壁打仗面积的同时,进一步加快冷凝液导热循环。
迭代升级的IceStorm3.0散热系统进一步优化了显卡散热效能,在主动散热方面用的是3把11cm大尺寸仿生盾鳞2.0风扇,采取双滚珠轴承设计,能够有效减少风扇迁徙改变时的噪音,增加风扇寿命。
放大看细节,扇叶上带有鳞状仿生条纹,并且扇叶的曲率经由分外优化,厚度也进行了相应的增加,这样做的目的是增加风量,使内部散热效率更高。
并且这三把散热风扇均支持AI启停功能,高效散热的同时也不会带来巨大的噪音。可以说索泰在散热方面做足了作业。
3测试平台先容&理论/游戏性能
测试平台先容
看完拆解,下面先容一下这次的测试平台,为了测试这张索泰RTX4080AMPEXTREMEAIRO月白,我们搬出了评测室的最强硬件。
CPU用的是Inteli9-13900K,主板为ROGMAXIMUSZ790HERO,内存插满,直接上金士顿的64GBDDR5-6000。这样的配置想必就算是RTX4090来了,也能很好的应对。
顶级的硬件平台自然要有顶级的显示器加持,这里我们用上了天花板级别的显示器——爱攻&保时捷联名设计的AGONPD32M,4K@144Hz高刷,还有miniLED背光加持,从里到外都散发着一种高等感,只有这样的显示器才能配得上索泰RTX4080AMPEXTREMEAIRO月白这张显卡。
末了是上机前的例行检讨,在GPU-Z中我们可以看到索泰RTX4080AMPEXTREMEAIRO月白的基准频率为2205MHz,而Boost频率相称高,直接跃升到2565MHz,比公版的RTX4080要赶过60MHz,可见这款显卡在性能上有不小的提升。
其余在GPU-Z中我们还可以看到索泰RTX4080AMPEXTREMEAIRO月白的温度限定跟功耗墙,这款显卡的TGP终极落在320W,与公版同等,最高许可打破至450W;88℃的温度墙显然是为了超频所预留的冗余空间。
理论性能测试
理论性能能够让我们先对这款显卡的性能有一个大致的理解,因此这里采取3DMark对索泰RTX4080AMPEXTREMEAIRO月白进行一个基本测试,同时加入了上代卡皇RTX3090Ti,从而能够更直不雅观的理解到这代显卡的性能提升。
在3DMark中,索泰RTX4080AMPEXTREMEAIRO月白的表现那是真的没得说,以DX11为代表的FireStrike系列测试里,这款显卡的性能能够超越前代RTX3080Ti38%以上,而在以DX12为代表的TimeSpy测试中,索泰RTX4080AMPEXTREMEAIRO月白更是离谱,领先幅度已经拉开到40%以上,可见这代显卡彪悍的性能开释。
更让笔者惊喜的还是光追部分的测试,光追是老黄在RTX20系显卡上引入的新观点,能够提升游戏的质感,不过对显卡的性能哀求颇高。上代卡皇RTX3090Ti在PortRoyal光追测试项目中得分为1W4旁边,而带索泰RTX4080AMPEXTREMEAIRO月白凭借新架构的上风,在该项目中已经打破1W8分大关,性能领先30%。
要说提升更大的还要属算力部分,在AIDA64GPGPU理论性能测试中,索泰RTX4080AMPEXTREMEAIRO月白的表现算得上是压倒性的胜利,整体性能领先RTX3080Ti40%以上,无论是在单精度还是双精度浮点运算上,这款显卡都有强劲的表现,相较于30系显卡来说,这次的索泰RTX4080AMPEXTREMEAIRO月白便是一次全方位的升级。
游戏性能测试
旗舰级RTX4090的游戏性能大家都有目共睹,那索泰RTX4080AMPEXTREMEAIRO月白作为次旗舰,游戏表现自然也无需担心。这里我们选择了多款游戏在各种分辨率下进行实测。
首先是1080P分辨率下,这张索泰RTX4080AMPEXTREMEAIRO月白用在这里切实其实是大材小用,不少游戏拿上一代的RTX3080Ti已经足够流畅嬉戏了,用上这款显卡后,游戏帧数堪称逆天,不少游戏已经超过250+FPS,乃至《古墓丽影:暗影》这种优化很好的游戏可以直冲300FPS以上。
2K分辨率下,索泰RTX4080AMPEXTREMEAIRO月白开始脱手了,在我们测试的近10款游戏中,基本都能够达到144FPS以上,不少游戏还有200FPS的惊人表现,并且比较前代RTX3080Ti也是展现了高端显卡的真正实力,性能领先足足有35%。
4K分辨率下,RTX3080Ti部分游戏逐渐败下阵来,但索泰RTX4080AMPEXTREMEAIRO月白依旧强势,进一步扩大了二者的性能差距,这次整体性能领先已经打破了40%。像《赛博朋克2077》这种险些没有优化的游戏,索泰RTX4080AMPEXTREMEAIRO月白在超级光追画质下凭借DLSS2依旧可以有靠近90FPS的游戏体验,而前代显卡乃至60FPS都不到,差距还是很明显的。
8K分辨率下的游戏表现我们也测试了,部分游戏的表现还是超出我们的预期,像《地平线5》跟《古墓丽影:暗影》这种游戏优化的标杆,索泰RTX4080AMPEXTREMEAIRO月白能够跑到70FPS和100+FPS,不过这张显卡是支持DLSS3这种黑科技的,后续如果这些游戏加上对DLSS3的支持,游戏表现该当还会有一定程度的提升。
总的来说,索泰RTX4080AMPEXTREMEAIRO月白在2K、4K分辨率下比较前代RTX3080Ti有着明显的性能上风,不少以前只可以勉强60FPS运行的游戏,在这代显卡上已经能够流畅运行了,搭配DLSS2后,更是能够上到100FPS,如果是DLSS3加持,4K@144Hz高刷玩3A将会是未来的标配,至于8K游戏还须要游戏厂商的优化支持才可能实现了。
4DLSS 3性能测试
DLSS 3性能测试
上面游戏性能测试里一贯提到的DLSS3是本次RTX40系显卡的主要升级点之一,用过20系及以上显卡的用户该当不算陌生,这是一个能够在不影响画面质量的情形下提升游戏性能的黑科技,现在DLSS进行迭代,在新显卡上更新至3.0版本,新增帧天生和NVIDIAReflex技能,据老黄说它实现游戏性能的翻倍提升。
3DMarkDLSS3性能测试
还是老样子,我们先测试一下DLSS3的理论性能,这里用到的是3DMark最新的DLSS3Benchmark,索泰RTX4080AMPEXTREMEAIRO月白在4K分辨率下,开关DLSS3前后性能差距足足有3倍之多,你以为这就结束了?在8K分辨率下,DLSS3胆怯的硬实力能够将原来1.56FPS的测试画面优化至70FPS旁边,不得不说老黄这次真的没有吹牛,DLSS3确实有点东西。
《光明影象:无限》游戏实测
DLSS3在理论测试中的表现属实惊为天人,那它在游戏中的表现又如何呢?这里我们选择了《光明影象:无限》这款游戏进行比拟实测。
从实测结果可以看到,在不开启DLSS的情形下,索泰RTX4080AMPEXTREMEAIRO月白显卡在4K分辨率下已经可以流畅运行《光明影象:无限》这款游戏;开启DLSS2后,游戏帧数就达到了137,1%帧数也达到了115FPS,这样的游戏表现对30系显卡来说已经是无可比拟的水平;而开启DLSS3之后,游戏帧数更是达到了160FPS,再合营我们测试中利用的AGONPD32M,4K@144Hz的高刷体验真的是在享受游戏。
这里也给大家看看游戏中DLSS3的实际表现,分辨率为4K,画质极高,DLSS模式为性能,可以看到纵然是开启DLSS3后,游戏画面肉眼看去险些没有画质丢失,而游戏帧数却一贯稳定在高位,可以说DLSS3让游戏体验达到了新的境界。
2K分辨率DLSS性能测试
单一款游戏可能不能解释代表性,因此我们也测试了更多游戏,索泰RTX4080AMPEXTREMEAIRO月白在2K画质下,开启DLSS2已经超越前代RTX3080Ti不少了,一旦开启DLSS3,它将进化成性能猛兽,大幅领先前者,实测不少游戏在DLSS3已经能够知足240Hz的高刷游戏需求了。
4K分辨率DLSS性能测试
索泰RTX4080AMPEXTREMEAIRO月白在4K画质下的表现也相称亮眼,在开启DLSS3后,游戏帧数比较DLSS2赶过20-30帧,而比较RTX3080Ti来说,那便是性能的翻倍!
像《赛博朋客2077》开启DLSS3后,前后游戏差距足足有30帧,轻微降落一些殊效,4K@144Hz在夜之城驰骋将是一躺全新的体验。
8K分辨率DLSS3性能测试
8K分辨率的测试我们也做了,测完后不得不说,16GB的显存卡得刚刚好,在8K游戏下,这张显卡已经到极限了,可见16GB显存应对8K游戏还是有些不敷,不过索泰RTX4080AMPEXTREMEAIRO月白在部分游戏中依旧能够稳定60FPS运行,像是《瘟疫传说:安魂曲》这类新游戏,开启DLSS3后还是不错的,其他游戏则须要等游戏厂商优化,届时配上8K的显示器乃至是电视,全新的游戏体验一定能够惊艳众人。
UnrealEngine5EnemiesDEMO
末了我们也测试了UnrealEngine5引擎制作的EnemiesDEMO,UE5作为全新的游戏开拓引擎,对显卡的压力自是不小。不过索泰RTX4080AMPEXTREMEAIRO月白可是旗舰级的显卡,它的表现自然是不用担心的。
在开启DLSS3后,索泰RTX4080AMPEXTREMEAIRO月白能够在4K分辨率下达到77AVG/661%FPS/55ms的水平,比较关闭DLSS3后可怜的22FPS,性能提升足足有3倍之多。其余从视频中可以看出,纵然开启DLSS3后,画质险些没有差异,由于DLSS是利用AI进行渲染,在部分细节上,DLSS模式下的画质乃至比原生画质还要清晰。
5创作生产力测试
创作生产力测试
测完游戏就该看看索泰RTX4080AMPEXTREMEAIRO月白的生产力如何了,毕竟高端显卡在生产力方面也颇有建树,这次我们测试了包括PCMark10与PugetBench在内的多个项目。能够比较全面的反应这款显卡在综合体验和视频内容生产力方面的实力。
首先是PCMark10Extended测试,索泰RTX4080AMPEXTREMEAIRO月白的上风紧张在数位内容创作与游戏两个子项目上,通过上面的游戏实测,这一点已经得到了有力的证明。而在PugetBench的Adobe软件测试中,由于Adobe软件本身对显卡哀求不高,因此差距不明显,不过索泰RTX4080AMPEXTREMEAIRO月白还是有分外上风的,16GB的超大显存能够让它处理更繁芜的项目,而RTX3080Ti常常会有捉襟见肘的情形涌现。
其余由于索泰RTX4080AMPEXTREMEAIRO月白支持最新的AV1编解码功能,在NVIDIA供应的AV1分外版本的达芬奇软件中,这款显卡的实际表现还是要强于上代RTX3080Ti,并且已经有了一定的差距,后续软件不断的优化和显卡驱动完善后,这部分的性能差距将会越拉越明显,因此笔者也推举视频后期事情者可以考虑换代索泰RTX4080AMPEXTREMEAIRO月白。
专业生产力测试
我们知道有的用户利用高端显卡用于建模、渲染、工业设计等领域,为此我们也测试了这方面比较具有代表性的软件。
测完给我的觉得便是RTX40系显卡完备便是冲着专业生产力领域来的,单是在Blender渲染软件中,索泰RTX4080AMPEXTREMEAIRO月白比较前代RTX3080Ti就有50%以上的提升,面对RTX3090Ti也丝毫不虚,性能依旧45%的领先幅度。而另一款OctaneBench中表现也是如此,完完备全吊打30系显卡。
在SPECviewperf2020集成的8款工业软件测试中,索泰RTX4080AMPEXTREMEAIRO月白的表现依旧喜人,整体性能领先RTX3080Ti有40%旁边,这也意味着渲染同一素材时,利用索泰RTX4080AMPEXTREMEAIRO月白可以缩短近三分之一以上的韶光。
双NVENC编码器专项测试
可能有用户看到RTX4080在创作生产力上的提升不及专业生产力明显,以为没有换显卡的必要,实在倒也未必。由于索泰RTX4080AMPEXTREMEAIRO月白升级了双NVENC编码器,并且支持时下热门的AV1编码,而AV1作为下一代主流的视频编码技能有着自己独特的上风,其具有更快的编码速率和更高质量的流媒体传输性能,像达芬奇、万兴喵影、剪映等常用的剪辑软件已经支持AV1编码,B站等主流的视频网站也加入了AV1解码,未来AV1将会成为一个新趋势。
为此我们专门利用NVIDIA供应的8K片源与工程文件来考验索泰RTX4080AMPEXTREMEAIRO月白上这个双编码器的真实性能。实测下来可以创造索泰RTX4080AMPEXTREMEAIRO月白的编解码能力乃至不输RTX4090,在同样的素材下,这款显卡利用AV1编码明显要比H.265编码快。纵然在H.265这一同一起跑线下,有双编码器的索泰RTX4080AMPEXTREMEAIRO月白还是比前代强62%以上。
AV1编码不仅编码韶光短,在占用空间上也颇有上风,从下图可以看到无论是4K还是8K分辨率,采取AV1编码均匀能够降落25%的占用空间。这不比导出速率还喷鼻香吗,毕竟现在的空间都是寸土寸金的存在。
有不少用户担心,那编码速率快又占用小,那会不会降画质。这里我们截取了几个画面进行比拟,从肉眼来看,实在画质险些完备一样,这样也意味着AV1可以用更小的空间占用量实现与H.265同等规格的画质表现。
6功耗&超频&评测总结
功耗与发热
在拆解中我们理解到索泰RTX4080AMPEXTREMEAIRO月白采取了创新的气流优化设计,并且散热系统也经由全面迭代优化,因此笔者对它的功耗与发热表现寄予厚望。
室温20℃的条件下,我们利用Furmark单烤15分钟后,显卡占用率直接提升至99%,不过索泰RTX4080AMPEXTREMEAIRO月白的GPU频率凭借强大的散热系统稳定在2500MHz高下,GPU核心温度仅为63℃,即便是GDDR6X这种发热大户,此时的温度也仅有50℃而已。
再看看它的功耗表现,320W!
如此激进的性能开释下,功耗比较前代卡皇RTX3090Ti还要低60W,并且此时风扇转速极低,险些感想熏染不到风扇噪音,同时这款显卡还供应寂静BIOS,开启后能够进一步降落风扇噪音。
为了更直不雅观的展示索泰RTX4080AMPEXTREMEAIRO月白的功耗表现,我们利用HWINFO64软件与FrameView软件双重记录多款显卡的功耗表现情形,从图中可以看到这款显卡整体功耗掌握相称出色,在所有测试场景内都不到400W,险些所有项目的功耗都比RTX3080Ti还要低,但性能却远远超越前代卡皇RTX3090Ti。
总的来说,老黄的AdaLovelace架构和TSMC的4N工艺确实有点东西,索泰RTX4080AMPEXTREMEAIRO月白无论是理论测试还是生产力创作,乃至是游戏场景都妥妥的吊打前代显卡,让这代显卡的每瓦性能实打实的提升到了一个新高度,这是30系显卡无论如何努力都无法企及的高度。
超频潜力测试
超频已经是高端显卡的基本操作了,索泰RTX4080AMPEXTREMEAIRO月白这么高规格的散热加之旗舰级的性能自然不能放过这个绝佳的超频机会,这里我们将利用索泰的FireStorm掌握中央对显卡进行超频,这款软件不仅能够用于超频,还能轻松掌握显卡BIOS、灯效调节、查看显卡状态等。
在解锁显卡的功耗限定与温度墙后,我们将GPU核心和GDDR6X显存同时超频,在FireStorm中将这款显卡的BOOST频率提升到2800MHz,显存也直接超频1000MHz,此时显卡依旧稳定运行。
紧接着利用3DMark中的TimeSpy进行性能测试,可以看到此时显卡的有效频率已经打破3000MHz,坚持在3015MHz的高频,显卡总得分,比较默频的分足足提升2000分之多,性能提升还是非常可不雅观的。
评测总结
评测进行到这里也进入了尾声,让我给RTX40系显卡一个评价便是诚意满满,全新的AdaLovelace架构带来的改造是前所未有的,老黄还给这代显卡加入了黑科技一样平常的DLSS3,这让本就刁悍的索泰RTX4080AMPEXTREMEAIRO月白在游戏表现中所向披靡,险些是上代显卡无法企及的高度。
本次的主角索泰RTX4080AMPEXTREMEAIRO月白在散热方面更是激进,得益于TSMC4N定制工艺,再合营升级后的IceStorm3.0散热系统,功耗与温度表现可以用逆天来形容,前代30系显卡动辄70℃的表现在这张显卡面前毫无招架之力。同时也由于这款显卡强大的散热系统,让超频潜力得以开释,核心与显存双超完备不成问题,这才是AD103核心的真正实力。
索泰RTX4080AMPEXTREMEAIRO月白除了在性能上大显技艺,颜值也是它的卖点之一,它与其他显卡完备不同,大部分显卡都是有棱有角的硬汉风,索泰另辟路子,给这款显卡安排了一个清新、优雅的外不雅观。通体白色更显惊艳,尤为出众,合营闪耀的RGB灯效,让显卡的颜值来到了新的高度,尤其适宜白色主题装机。
综合来说,索泰RTX4080AMPEXTREMEAIRO月白是一款非常得当有高哀求游戏玩家所拥有的4K游戏显卡,同时它也有着不错的生产力属性,如果你对电脑的游戏性能有极致追求,同时希望拥有一款颜值独一无二的的显卡,那么索泰RTX4080AMPEXTREMEAIRO显卡该当是你不错的选择。目前索泰RTX4080AMPEXTREMEAIRO月白已经正式发售,售价为11699元,感兴趣的玩家不要错过。
7技能讲解:Ada Lovelace架构解析
Ada Lovelace架构讲解
Turing、Ampere上两代架构核心均以人物来命名,前者是打算机科学之父——艾伦·麦席森·图灵;后者则是“电学中的牛顿”——安德烈·玛丽·安培,电流的国际单位安培便是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果真,这是 人称“数字女王”的阿达·洛芙莱斯,编写了历史上首款电脑程序,是被天下公认的第一位打算机程序员,果真是一代比一代还要更牛。PS:她的父亲是《唐璜》的作者,墨客拜伦喔。
从Turing架构开始,NVIDIA首次在显卡中加入了加速光芒追踪的RTCore单元,以及面向AI推理的TensorCore单元,这革命性的创新使实时光芒追踪成为可能。而Ampere架构则是全面的架构改进,在加入新一代的二代RTCore和三代TensorCore根本上,还有着更前辈的SM单元设计,这样显卡事情效率那是翻倍的提升。而来到AdaLovelace架构,同时因此效率提升为大条件,自然是引入了最新的第三代RTCores与第四代TensorCores单元,同时加入浩瀚新颖的黑科技,从实行效率来说AdaLovelace架构是上代Ampere架构的2倍以上,乃至光芒追踪能力更是达到了胆怯的4倍性能。
全新的SM流式多处理器
AdaLovelace架构中最大的亮点之一:全新的SM流式多处理器,每个SM包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores(张量核心)、4个TextureUnits(纹理单元)、256KBRegisterFile(寄存器堆),以及128KBL1数据缓存/共享内存子系统,于是这一个全新的SM单元有着超过上一代2倍之的性能表现。
过去的Turing架构INT32打算单元与FP32数量是同等的,而两者相加才组成了64个CUDA核心。但是Ampere架构开始,左侧的打算单元实现了FP32+INT32的打算单元并发实行,也便是说CUDA核心数量翻倍到了128个。
再来看看AdaLovelace架构的SM,FP32/INT32的打算单元组合,同样实现了每个SM内含128个CUDA的设计,看似提升不大,但是当你理解到GeForceRTX4080拥有76个SM,9728个CUDA核心,那你也就该当明白达82.6TFLOPS的着色器能力是如何实现的了,比上一代的RTX3090Ti显卡的40TFLOPS,还真是提升了两倍有多。
其余缓存方面AdaLovelace架构也进行了大规格的提升,首先每个SM单元中单独配上了128KB的缓存,这样RTX4080显卡中就实现了97MBL1/共享内存。其次核心的二级缓存进行进行了重新的设计,并且完全AD103核心与RTX4080都是64MB二级缓存,比较RTX3080Ti可以说是质的飞跃。
技能讲解:第三代 RT Cores 与 第四代 Tensor Cores
以为刚才的CUDA数量与超大L2缓存就已经很猛了,实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。
第三代RTCores
RTCores用于光芒追踪加速,第三代RTCores的有效光芒追踪打算能力达到191TFLOPS,是上一代产品2.8倍。
在Ampere架构中,第二代RTCores支持边界交叉测试(BoxIntersectiontesting)和三角形交叉测试(TriangleIntersectiontesting),用于加速BVH遍历和实行射线三角交叉测试打算,虽然光芒追踪处理能力已经比初代的Turing架构核心更高效,但是随着环境和物体的几何繁芜性持续增加,传统的处理办法很难再以更高效率、精确反应出的现实天下中的光芒,尤其是光的运动准确性。
以是在第三代RTCores增加了两个主要硬件单元:OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,紧张是用于alpha通道的加速,可以将alpha测试几何体的光芒追踪速率提高2倍。
在传统光栅渲染中,开拓职员利用一些Alpha通道的素材来实现更高效的画面渲染,例如Alpha通道的叶子或火焰等繁芜形状的物体。但在光芒追踪时期,这传统的做法会为光芒追踪带为不少无效的打算,例如运动性的光芒多次通过一块叶子,光芒每击中一次叶子,都会调用一次着色器来确定如何处理相交,这时就会做成严重的实行本钱与韶光等待本钱。
而OpacityMicromapEngine用于直接解析具有非不透明度光芒交集的不透明度状态
三角形。根据Alpha通道的不透明,透明与未知等三个不同的块状态进行处理:透明则直接忽略连续找下一个,不透明块则记录并告之命中,而未知的则交给着色器来确定如何处理,这样GPU很大部分都不须要进行着色器的调试处理,能够实现更为高效的性能。
DisplacedMicro-MeshesEngine
如果说OpacityMicromapEngine加速的是面处理,那么DisplacedMicro-MeshesEngine便是几何曲面细节的加速器。如上图所示,在AdaLovelace架构中,通过1个基底三角形+位移舆图,就可以创建出一个高度详细的几何网格,所须要资源占用比二代RTCores更低,效率也更高。
通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们须要须要1.7万个微网格、160万个微三角形,在AdaLovelace架构中BVH创建速率可加快7.6倍,存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的浸染,其将一个几何物体根据不同细节分成密度不一的微网络处理,赤色密度超高,细节处理越为繁芜。相应的低密度微网络区域则可以开释更多的资源与存储空间,这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程,减少构建韶光和存储本钱。
同时AdaLovelace架构SM中新增了着色器实行重排序(ShaderExecutionReordering,SER),这是由于光芒追踪不再只有强光或者阴影渲染处理,未来将会更多的是在光芒的运动性,这样光芒就会变得越来越繁芜,想要第三代RTCores与第四代TensorCores有着更高的实行效率,那就得为他们来安排一位管家。而着色器实行重排序(SER)便是为了能够即时重新安排着色器负载来提高实行效率,为光芒追踪供应2倍的加速,也能更好地利用GPU资源。不过目前仍未有实例,想实现这个功能,还得游戏与开拓工具的支持才行。
第四代TensorCores
TensorCores是专门为实行张量/矩阵运算而设计的专用实行单元,这些运算是深度学习中利用的核心打算功能。第四代TensorCores新增FP8引擎,具有高达1.32petaflops的张量处理性能,超过上一代的5倍。
8技能讲解:DLSS 3
技能讲解:DLSS 3
或者说第四代TensorCores太硬核你不会知道是啥?提升意义在哪?但是TensorCores最经典的运用DLSS你肯定会知道,这一次AdaLovelace架构支持NVIDIA最新的DLSS3技能。
https://images.nvidia.cn/cn/youtube-replicates/r-hu006p23I.mp4
之前我们也聊过DLSS技能,其设计之初是为了填补光芒追踪技能后的性能丢失,详细的表现为开启光芒追踪技能后游戏帧数大幅度的低落,乃至很难担保游戏流畅的运行。于是DLSS利用低分辨率内容作为输入并利用AI技能输出高分辨率帧,从而提升光芒追踪的性能。
在DLSS3中包含了三项技能:DLSS帧天生、DLSS超分辨率(也称为DLSS2)和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的根本上,新增了DLSS帧天生技能;而后两技能中,DLSS超分辨率只须要GeForceRTX显卡都能利用上,NVIDIAReflex则是GeForce900系列往后的显卡都用利用上。
想实现DLSS帧天生可不大略,这须要合营上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧天生技能事理是:利用AI技能天生更多帧,以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流加速器剖析连续帧和运动数据,进而创建其他高质量帧,同时不会影响图像质量和相应速率。
从Ampere架构开始,NVIDIA显卡就已经支持了光流加速器,而AdaLovelace架构的光流加速器升级到了第二代,其供应了高达300TeraOPS(TOPS),比安培架构的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。为了实现DLSS帧天生,OFA扮演了主要的角色,其合营上新的运行矢量剖析算法在DLSS3技能框架内实现精确和高性能的帧天生能力。
其余,由于DLSS帧天生是在GPU上作为后处理实行的,那么纵然在游戏受到CPU性能限定的时候,我们同样能够从中得到更好的游戏性能提升。尤其是那种物理打算密集型的游戏或大型场景游戏,DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可打算的性能来渲染游戏。
末了由于DLSS3是建立在DLSS2根本之上的,游戏开拓者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能,以是DLSS3已在游戏生态得到广泛运用,目前已有超过35款游戏和运用即将支持该技能。
阅读小亮点:NVIDIAReflex
NVIDIAReflex也是DLSS3个中的一环,它可以使GPU和CPU同步,确保最佳相应速率和低系统延迟。
想要实现端对真个最低延迟,你须要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技能。
当GeForceRTX40系列显卡和NVIDIAReflex搭配上后,直接达到1440p分辨率360FPS的体验,这其实是性能有点强劲了。
在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布,包括采取mini-LED技能的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接来到了360Hz。
但唯一一个问题就在于,部分显示器厂商认为此类产品受众人群较少,会降落此类显示器的产能,乃至产品就已经被内部PASS掉,以是1440p360Hz是很美好,但现实也是相称的骨感。
9技能讲解:双NVIDIA编码器(NVENC)
技能讲解:双NVIDIA编码器(NVENC)
GeForceRTX40系列显卡还有一个全新的升级,那便是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265,还支持开放式视频编码格式AV1。
而由于AV1是一种免版税的视频编码格式,上游软件厂商与下贱戏的配套端都在大力推广此编码格式,我们也会看到越来越多的硬件与软件支持AV1格式,包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为盛行的Voukoder插件均支持,且均可通过编码预设利用双编码器,这样我们等待视频导出的韶光缩短将近一半。
不单是视频制作软件,AV1格式也将会是主播、游戏直播UP主们的新宠儿,在担保画面最高质量的情形下,AV1编码器可将效率提高40%,同时显卡的占用也更低。包括OBSStudio逐一代软件中也会增加AV1格式的支持。其余我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容,这样我们做游戏录制也会变得更为轻松。
包括我们之后测试时利用的游戏内录视频都是支持AV1格式,同时双编码器NVENC在资源占用和适配上做得越来越好。