随着GeForceRTXTi的发布,相信大家都对这一次的“Ti”系列充满期待,毕竟GeForceRTXTi的性能提升“肉眼可见”,甚至非公版的GeForceRTXTi在跑分已经出现了越级提升的情况。今天给大家带来的评测则是本次台北电脑展发布的最后一个型号——GeForceRTXTi。
此次GeForceRTXTi的发布让整个30系的“Ti家族”已经补全,当然不排除后续NVIDIA会推出GeForceRTXTi的可能性,毕竟GA核心到目前为止仍没有性能全开。
不过远的不说,自GTX10系开始,“Ti家族”还没有如此整整齐齐过,虽然目前单轮显卡数量上,RTX20系仍然要比RTX30系多,但RTX20系显卡家族的成员并没有同时登场,在super系列推出后,先前发布不带后缀的型号就已经相继停产。
而RTX30系显卡截止目前还未宣布哪款显卡将停产,如果说NVIDIA是觉得去年发布的RTX30系显卡定价过低,想推出Ti系列来提高售价,但从已发布的GeForceRTXTi来看,虽然价格上去了,但性能同样约等于GeForceRTX,换算过来其实价格并没有变化。
GeForceRTXTi
在之前的台北电脑展上,GeForceRTXTi的价格已经曝光,为元起。在看过了GeForceRTXTi的性能提升后,相信大家已经迫不及待了,今天我们就来看看这款GeForceRTXTi的性能提升如何。
GA核心的第二张显卡在核心架构上,GeForceRTXTi是采用GA核心的第二张卡,官方白皮书上对比的对象为GeForceRTXSUPER,相较于上一代的NVIDIATuring架构,NVIDIAAmpere架构下的GeForceRTXTi每个时钟执行2次着色器运算,而Turing为1次,RTXTi的着色器性能达到22TFLOPS单精度性能,而Turing为9TFLOPS。
新老两代显卡算力对比
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RTCore达到42RTTFLOPS,而Turing为24RTTFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代TensorCore可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达TensorTFLOPS,而Turing为72TensorTFLOPS。
GeForceRTXTi采用了GA核心,与GeForceRTX相同,不过NVIDIA官方并没有给出GA核心架构图,我们仍以GA来做讲解。
完整的GA核心
完整的GAGPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForceRTXTi的CUDA数量是个,共有48个SM单元,也就是3个GPC24个TPC,而刚刚发布的GeForceRTXTi共有40个TPC80个SM单元,这也是两款芯片的差距所在。
公版显卡参数表
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForceRTX与GeForceRTXTi的差距不大,相差的两个SM单元,和刚刚发布的GeForceRTXTi情况基本相同,也就是1组TPC,个CUDA。只不过GeForceRTXTi更接近GeForceRTX,而根据参数来看GeForceRTXTi与GeForceRTX还有一定差距。
GDDR6X
另外GeForceRTXTi的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。
NVIDIAAmpere架构GA解析GeForceRTXTi采用了GA核心,拥有亿(00million)个晶体管,平方毫米的面积,基于三星的8nmNVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForceRTX的GDDR6有所区别。
本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的从1:1变为2:1。
GeForceRTXTi共有个CUDA,其实它有个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForceRTX30系显卡一同发布的还有一项新技术——RTXIO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMeSSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTXIO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTXIO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTXIO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI2.1接口,可以支持单线8K的视频输出,而上一代HDMI2.0仅支持4K98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
GeForceRTXTi外观首先还是来看一下外观,在外包装上相比之前的公版没有变化,不过显卡本身GeForceRTXTi更像是GeForceRTX的mini版,与GeForceRTX相距甚远。
GeForceRTXTi配件盒展示
外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线和说明书的配件盒,因为此次公版仍采用单12pin的供电插槽,所以需要转换成双8pin的接口才能使用。
GeForceRTXTi
GeForceRTX
显卡正面我们对比一下GeForceRTX,可以看到GeForceRTX仍然采用了单面双风扇的设计,而GeForceRTXTi则是采用了轴流式设计,两侧均有风扇。除此之外,显卡的整体外边框设计基本相似。
GeForceRTXTi
GeForceRTX
GeForceRTXTi的背面其实更像GeForceRTX,包括金属边框以及表面的磨砂质感,只是从体积上略小一号。
GeForceRTXTi内角的金属光泽
与GeForceRTXTi在边框部位的改动相同,GeForceRTXTi的内角从哑光改为了镜面,这种略带跳跃的视觉效果相比之前的设计更好看。
GeForceRTXTi单12pin供电接口
在GeForceRTXTi显卡的侧面,可以看到单12pin的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采用了高度紧凑的PCB板,长度也小于一般尺寸,所以其实供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方说明,GeForceRTXTi的单卡功耗为W,推荐W及以上电源。
另外在边框的配色上GeForceRTXTi的颜色几乎为纯银色,而GeForceRTX和GeForceRTXTi则为玫瑰金。
GeForceRTXTi视频接口
GeForceRTXTi的挡板部位整体设计与GeForceRTX相同。接口方面的配置依旧为DP1.4a*3+HDMI2.1*1的4接口设计,另外由于新的HDMI2.1协议,最高已可支持单线8K的视频输出。
3DMARK理论性能测试首先介绍一下测试平台,为了保证此次评测能够发挥GeForceRTXTi显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,GeForceRTXTi采用GA核心,三星8nm工艺,芯片面积平方毫米,拥有个CUDA,MHz频率。采用8GBGDDR6X显存,位宽为bit,显存带宽达到了.3GB/s,光栅单元和纹理单元为96和。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3DMARKFS套装测试
在针对显卡DX11性能的3DMARKFS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应GeForceRTXTi的性能水平。
可以看到GeForceRTXTi的性能显然更接近GeForceRTX,整体提升10%左右;对比GeForceRTX的差距为17%左右;相比上一代的GeForceRTXSUPER提升45%左右。
3DMARKTS套装测试
而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,GeForceRTXTi的分数提升稍弱,相比GeForceRTX提升7%左右。而对比GeForceRTX的分数差距为23%左右;对比上一代GeForceRTXSUPER的分数要高出42%左右。
3DMARK光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForceRTXTi的表现更贴近GeForceRTX,分数提升为6%左右;对比GeForceRTX的分数差距为31%左右;对比上一代GeForceRTXSUPER的分数提升则非常大,约为50%。
这是比较理想的等差数列
另外我们对比了一组比较有意思的数据,综合来看目前GeForceRTX30系显卡性能,形成等差数列的游戏卡型号分别为RTX、RTXTi、RTXTi以及RTX,所以个人来看GeForceRTX与GeForceRTXTi的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForceRTX的打算。
游戏性能测试在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在游戏实测中可以看到GeForceRTXTi和GeForceRTX的帧数差距并不明显,平均下来为2%左右。而对比GeForceRTX的分数差距整体在12%左右。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,GeForceRTXTi与GeForceRTX的差距约为3%,而相比GeForceRTX的帧数差距为13%左右,虽然差距没有那么大,但可以发现其实在P分辨率下,CPU已经限制了显卡的发挥,而在4K分辨率下GeForceRTX能领先GeForceRTXTi约22%的帧数。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,P分辨率下两款显卡的成绩居然相同,在2K和4K分辨率下比较能反应真实水平,相比GeForceRTX提升约为7%。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,其中GeForceRTXTi相比GeForceRTX提升为6%;相比GeForceRTX的分数差距为26%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX最高/DLSS质量”模式下进行。整体的分数分布情况与《无主之地3》非常相似。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
功耗及温度测试功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试
GeForceRTXTi经过我们的实测在满载状态下单卡功耗为-W左右,建议搭配W及以上电源。
温度测试
温度方面,本次的GeForceRTXTi经过15分钟左右的拷机,温度稳定为78℃左右,相比GeForceRTXTi更高,但显存温度较低为86℃左右,在上一次GeForceRTXTi的温度测试中,显存温度一度达到98℃左右。
部分游戏光追及DLSS效果展示上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克》RTXON
《赛博朋克》RTXOFF
在《赛博朋克》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTXON
RTXOFF
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTXON
《堡垒之夜》RTXOFF
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTXON
《魔兽世界9.0》RTXOFF
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTXON
《控制》RTXOFF
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克》这款游戏,2K/RTXON/DLSS关闭原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
身世复杂性能提升7%作为GeForceRTX30系“Ti家族”的第三位成员,GeForceRTXTi和其他几款还有些许不同。在本代显卡中,目前所有Ti系列产品相较原型号基本都有很大提升,如GeForceRTXTi和GeForceRTXTi,而此次发布的GeForceRTXTi整体性能则更贴近原型号。但这一情况精通刀法的黄教主不可能不清楚,通过RTX20SUPER系的提升我们就能略见一二。
GeForceRTXTi
通过价格来看,GeForceRTX的首发价格为元,GeForceRTX的首发价格为元,两者的中间值为元,而GeForceRTXTi为元,看似说得过去。
另外A卡方面,RXXT与GeForceRTX打的有来有回,不过整体来说还是NVIDIA更胜一筹,而GeForceRTXTi的出现,进一步拉开与RXXT的差距。同时与RX的差距更小,换句话来说GeForceRTXTi在性能上横在了RXXT与RX之间。
GeForceRTXTi
所以通过目前的显卡市场来看,N卡的价格中间值与A卡的性能中间值,造就了GeForceRTXTi的诞生。不过它的出现在自家产品中的地位还是比较尴尬,不知道大家如何看待?
GeForceRTXTi
另外GeForceRTXTi的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗。从理论上来讲GDDR6X的能效提升很多。同样是8颗显存,GDDR6X能效比相比GDDR6的每比特能耗要低15%。
这是比较理想的等差数列
综合来看,GeForceRTXTi的推出更像是GeForceRTX的改进版,通过目前GeForceRTX30系显卡的整体性能来看,形成等差数列的游戏卡型号分别为RTX、RTXTi、RTXTi以及RTX,所以个人来看GeForceRTX与GeForceRTXTi的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForceRTX的打算。
最后,这款显卡的首发价格为元。老规矩,在显卡首发的时候会是最优惠的价格,如果你网速好手气好,不妨试着抢一下显卡的首发。
预览时标签不可点收录于合集#个上一篇下一篇