这次GeForce RTX 3070 Ti的发布让全体30系的“Ti家族”已经补全,当然不用除后续NVIDIA会推出GeForce RTX 3090 Ti的可能性,毕竟GA102核心到目前为止仍没有性能全开。
不过远的不说,自GTX 10系开始,“Ti家族”还没有如此整整洁齐过,虽然目前单轮显卡数量上,RTX 20系仍旧要比RTX 30系多,但RTX 20系显卡家族的成员并没有同时登场,在super系列推出后,先前发布不带后缀的型号就已经相继停产。

GeForce RTX 3070 Ti

而RTX 30系显卡截止目前还未宣告哪款显卡将停产,如果说NVIDIA是以为去年发布的RTX 30系显卡定价过低,想推出Ti系列来提高售价,但从已发布的GeForce RTX 3080 Ti来看,虽然价格上去了,但性能同样约即是GeForce RTX 3090,换算过来实在价格并没有变革。
GeForce RTX 3070 Ti
在之前的台北电脑展上,GeForce RTX 3070 Ti的价格已经曝光,为4499元起。在看过了GeForce RTX 3080 Ti的性能提升后,相信大家已经迫不及待了,本日我们就来看看这款GeForce RTX 3070 Ti的性能提升如何。
01GA104核心的第二张显卡
在核心架构上,GeForce RTX 3070 Ti是采取GA104核心的第二张卡,官方白皮书上比拟的工具为GeForce RTX 2070 SUPER,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3070 Ti每个时钟实行2次着色器运算,而Turing为1次,RTX 3070 Ti的着色器性能达到22 TFLOPS单精度性能,而Turing为9 TFLOPS。
新老两代显卡算力比拟
NVIDIAAmpere架构翻倍了光芒与三角形的相交吞吐量,RT Core达到42 RTTFLOPS,而Turing为24 RT TFLOPS。而且第二代光芒追踪最主要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光芒追踪打算加速。
第三代Tensor Core可自动识别并肃清不太主要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达174 TensorTFLOPS,而Turing为72 TensorTFLOPS。
GeForce RTX 3070 Ti采取了GA104核心,与GeForce RTX 3070相同,不过NVIDIA官方并没有给出GA104核心架构图,我们仍以GA102来做讲解。
完全的GA102核心
完全的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3070 Ti的CUDA数量是6144个,共有48个SM单元,也便是3个GPC 24个TPC,而刚刚发布的GeForce RTX 3080 Ti共有40个TPC 80个SM单元,这也是两款芯片的差距所在。
公版显卡参数表
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3070与GeForce RTX 3070 Ti的差距不大,相差的两个SM单元,和刚刚发布的GeForce RTX 3080 Ti情形基本相同,也便是1组TPC,256个CUDA。只不过GeForce RTX 3080 Ti更靠近GeForce RTX 3090,而根据参数来看GeForce RTX 3070 Ti与GeForce RTX 3080还有一定差距。
GDDR6X
其余GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6改换为GDDR6X,两者的差异紧张在于频率和带宽上,同频下实现更高的显存带宽可以降落本钱和功耗,其余在相同韶光内GDDR6X可以比GDDR6传输多2倍的数据。这对付须要大量数据负载的事情尤为主要,如光芒追踪的游戏、AI学习和8K视频渲染。
02NVIDIA Ampere架构GA104解析
GeForce RTX 3070 Ti采取了GA104核心,拥有174亿(17400 million)个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForce RTX 3070的GDDR6有所差异。
本次NVIDIAAmpere的SM在Turing根本上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而常日我们打算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,以是这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3070 Ti共有6144个CUDA,实在它有3072个INT32单元,但由于内部的FP32数量翻了一倍,以是终极实现了6144的CUDA数量。
而这样粗暴的提升CUDA数量对付游戏实在有着非常大的帮助,常日在游戏中浮点运算比较整数打算要常用的多,图形、算法以及各种打算操作中着色器事情负载常日须要稠浊利用FP32算数指令,而FP32的加速也有助于光芒追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技能——RTX IO。目前很多游戏动辄几十G乃至百G的安装空间,对付存储空间的包袱暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,须要先由CPU从硬盘中读取压缩过的数据,经由解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速率相较机器硬盘能够快20倍,但受制于传统I/O限定,NVMe高达7GB/秒的高速读写对付CPU是极大的包袱。
传统的数据交流
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时实在GPU是处于闲置状态的。RTX IO的浸染便是超越CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经由压缩的数据,并且完成无损GPU解压,降落CPU占用,变向提升了性能。
RTX IO可以极大解放CPU包袱
当然这项技能作为系统底层的运行办法改变,还须要借助微软发布的DirectStorage来实现,对付目前容量的游戏来说,RTX IO的改进效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技能将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则须要更多的线缆支持。
03GeForce RTX 3070 Ti外不雅观
首先还是来看一下外不雅观,在外包装上比较之前的公版没有变革,不过显卡本身GeForce RTX 3070 Ti更像是GeForce RTX 3080的mini版,与GeForce RTX 3070相距甚远。
GeForce RTX 3070 Ti配件盒展示
外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线息争释书的配件盒,由于这次公版仍采取单12pin的供电插槽,以是须要转换成双8pin的接口才能利用。
GeForce RTX 3070 Ti
GeForce RTX 3070
显卡正面我们比拟一下GeForce RTX 3070,可以看到GeForce RTX 3070仍旧采取了单面双风扇的设计,而GeForce RTX 3070 Ti则是采取了轴流式设计,两侧均有风扇。除此之外,显卡的整体外边框设计基本相似。
GeForce RTX 3070 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti的背面实在更像GeForce RTX 3080,包括金属边框以及表面的磨砂质感,只是从体积上略小一号。
GeForce RTX 3070 Ti 内角的金属光泽
与GeForce RTX 3080 Ti在边框部位的改动相同,GeForce RTX 3070 Ti的内角从哑光改为了镜面,这种略带跳跃的视觉效果比较之前的设计更好看。
GeForce RTX 3070 Ti 单12pin供电接口
在GeForce RTX 3070 Ti显卡的侧面,可以看到单12pin的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采取了高度紧凑的PCB板,长度也小于一样平常尺寸,以是实在供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方解释,GeForce RTX 3070 Ti的单卡功耗为290W,推举750W及以上电源。
其余在边框的配色上GeForce RTX 3070 Ti的颜色险些为纯银色,而GeForce RTX 3080和GeForce RTX 3080 Ti则为玫瑰金。
GeForce RTX 3070 Ti视频接口
GeForce RTX 3070 Ti的挡板部位整体设计与GeForce RTX 3070相同。接口方面的配置依旧为DP 1.4a3+HDMI 2.11的4接口设计,其余由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
043DMARK 理论性能测试
首先先容一下测试平台,为了担保这次评测能够发挥GeForce RTX 3080 Ti显卡的最佳性能,主板和CPU采取了目前桌面旗舰级配置,详细如下。
在测试成绩上,基准测试采取3DMARK,游戏性能测试利用游戏自带Benchmark,同时为了减小偏差,每项测试成绩均测试3遍取均匀值。
GPU-Z参数
首先看一下GPU-Z的参数,GeForce RTX 3070 Ti采取GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有6144个CUDA,1770MHz频率。采取8GB GDDR6X显存,位宽为256bit,显存带宽达到了608.3 GB/s,光栅单元和纹理单元为96和192。
下面前辈行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值比拟,以便能更好的反应GeForce RTX 3070 Ti的性能水平。
可以看到GeForce RTX 3070 Ti的性能显然更靠近GeForce RTX 3070,整体提升10%旁边;比拟GeForce RTX 3080的差距为17%旁边;比较上一代的GeForce RTX 2070 SUPER提升45%旁边。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 3070 Ti的分数提升稍弱,比较GeForce RTX 3070提升7%旁边。而比拟GeForce RTX 3080的分数差距为23%旁边;比拟上一代GeForce RTX 2070 SUPER的分数要赶过42%旁边。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForce RTX 3070 Ti的表现更贴近GeForce RTX 3070,分数提升为6%旁边;比拟GeForce RTX 3080的分数差距为31%旁边;比拟上一代GeForce RTX 2070 SUPER的分数提升则非常大,约为50%。
这是比较空想的等差数列
其余我们比拟了一组比较故意思的数据,综合来看目前GeForce RTX 30系显卡性能,形成等差数列的游戏卡型号分别为RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,以是个人来看GeForce RTX 3070与GeForce RTX 3070 Ti的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForce RTX 3070的打算。
05游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边疆》、《光明影象:无限》的benchmark跑分软件。
其余在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在游戏实测中可以看到GeForce RTX 3070 Ti和GeForce RTX 3070的帧数差距并不明显,均匀下来为2%旁边。而比拟GeForce RTX 3080的分数差距整体在12%旁边。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,以是我们的数据取跑分均值,其余这款游戏险些每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,GeForce RTX 3070 Ti与GeForce RTX 3070的差距约为3%,而比较GeForce RTX 3080的帧数差距为13%旁边,虽然差距没有那么大,但可以创造其实在1080P分辨率下,CPU已经限定了显卡的发挥,而在4K分辨率下GeForce RTX 3080能领先GeForce RTX 3070 Ti约22%的帧数。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,1080P分辨率下两款显卡的成绩居然相同,在2K和4K分辨率下比较能反应真实水平,比较GeForce RTX 3070提升约为7%。
《无主之地3》游戏测试
《无主之地3》是一款采取了卡通渲染风格的游戏,它对付性能哀求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,个中GeForce RTX 3070 Ti比较GeForce RTX 3070提升为6%;比较GeForce RTX 3080的分数差距为26%。
《光明影象:无限》游戏测试
《光明影象:无限》是由飞燕群岛事情室开拓的《光明影象》新系列,目前还没有游戏供应试玩,不过benchmark的跑分软件官方已经供应,玩家可以在steam上自行下载。其余我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。整体的分数分布情形与《无主之地3》非常相似。
《边疆》游戏测试
在其余一款国产游戏《边疆》的跑分软件中,情形基本与《光明影象:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
06功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采取GPU-Z检测温度,功耗仅打算显卡自身。
功耗测试(点击查看大图)
GeForce RTX 3070 Ti经由我们的实测在满载状态下单卡功耗为280-290W旁边,建议搭配750W及以上电源。
温度测试
温度方面,本次的GeForce RTX 3070 Ti经由15分钟旁边的拷机,温度稳定为78℃旁边,比较GeForce RTX 3080 Ti更高,但显存温度较低为86℃旁边,在上一次GeForce RTX 3080 Ti的温度测试中,显存温度一度达到98℃旁边。
07部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果详细在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也利用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高等的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣扬片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显低落。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,个中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,其余仔细看的话远处建筑物的玻璃同样有光芒的反射,整体画质改进非常明显。
《魔兽天下9.0》RTX ON(点击查看大图)
《魔兽天下9.0》RTX OFF(点击查看大图)
《魔兽天下9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,这次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《掌握》RTX ON(点击查看大图)
《掌握》RTX OFF(点击查看大图)
《掌握》这款游戏所采取的引擎物理效果非常出色,同光阴追开关的比拟也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗比拟也更加明显。
《赛博朋克2077》DLSS模式比拟
DLSS的比拟测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面险些没有任何变革,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式比拟
画质解释
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的比拟。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难创造原生画质和DLSS快速模式的差异很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变革。但帧数提升却非常明显。
08软硬兼施 铸就Ampere
好的硬件没有软件的加持,相称于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。这次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上理解到几毫秒极速相应,但那只是作为终极真个显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的打破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技能。
以往如果想丈量系统延迟须要高速相机以及定制的LED鼠标电路。而利用带有NVIDIA Reflex技能的显示器将内置精确的延迟剖析工具,可在CPU和GPU中优化渲染管道,极大减少延迟韶光,将系统延迟整体降落至30ms以下。不过就像图中所示,为此你须要一个支持反射延迟剖析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再须要任何的背景支配,只须要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你凌乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的事情事理是利用AI算法通过DGX超级打算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%旁边,而基于GPU的NVENC解码可以极大地减轻CPU包袱。
NVIDIA Studio
对付内容创作者来说,提到软件可能大部分只会想到内容创作的干系软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经由更新与优化,对付最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技能,GPU加速殊效可实现更快的实时视频编辑并加速渲染输出,并让原来只能进行软件编码输出的视频轻松得到硬件的支持。其余在AI打算方面的上风,包括自动标记片段、殊效追踪和人脸识别等功能,都有显著的速率提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能供应强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
09出生繁芜 性能提升7%
作为GeForce RTX 30系“Ti家族”的第三位成员,GeForce RTX 3070 Ti和其他几款还有些许不同。在本代显卡中,目前所有Ti系列产品相较原型号基本都有很大提升,如GeForce RTX 3060 Ti和GeForce RTX 3080 Ti,而这次发布的GeForce RTX 3070 Ti整体性能则更贴近原型号。但这一情形精通刀法的黄教主不可能不清楚,通过RTX 20 SUPER系的提升我们就能略见一二。
GeForce RTX 3070 Ti
通过价格来看,GeForce RTX 3070的首发价格为3899元,GeForce RTX 3080的首发价格为5499元,两者的中间值为4699元,而GeForce RTX 3070 Ti为4499元,看似说得过去。
其余A卡方面,RX 6700 XT与GeForce RTX 3070打的有来有回,不过整体来说还是NVIDIA更胜一筹,而GeForce RTX 3070 Ti的涌现,进一步拉开与RX 6700 XT的差距。同时与RX 6800的差距更小,换句话来说GeForce RTX 3070 Ti在性能上横在了RX 6700 XT与RX 6800之间。
GeForce RTX 3070 Ti
以是通过目前的显卡市场来看,N卡的价格中间值与A卡的性能中间值,造就了GeForce RTX 3070 Ti的出身。不过它的涌如今自家产品中的地位还是比较尴尬,不知道大家如何看待?
GeForce RTX 3070 Ti
其余GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6改换为GDDR6X,两者的差异紧张在于频率和带宽上,同频下实现更高的显存带宽可以降落本钱和功耗。从理论上来讲GDDR6X的能效提升很多。同样是8颗显存,GDDR6X能效比比较GDDR6的每比特能耗要低15%。
这是比较空想的等差数列
综合来看,GeForce RTX 3070 Ti的推出更像是GeForce RTX 3070的改进版,通过目前GeForce RTX 30系显卡的整体性能来看,形成等差数列的游戏卡型号分别为RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,以是个人来看GeForce RTX 3070与GeForce RTX 3070 Ti的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForce RTX 3070的打算。
末了,这款显卡的首发价格为4499元。老规矩,在显卡首发的时候会是最优惠的价格,如果你网速妙手气好,不妨试着抢一下6月10日的显卡首发。
(7699327)










