中科白癜风看皮肤病更专业 https://jbk.39.net/yiyuanfengcai/tsyl_bjzkbdfyy/nxka212/受到芯片短缺以及矿潮影响,近一年的DIY市场尤其混乱,其中又以显卡最为畸形,原本元首发的GeForceRTX已经被炒到了左右,价格翻了3倍。而不久前NVIDIA在官方博客中再次宣布,后续推出的RTX30系显卡,除了RTX外将全部从芯片层面限制挖矿,包括之前已经推出的RTX/Ti//,以及后续将要推出的显卡,今天大家期待已久的GeForceRTXTi终于来了。根据NVIDIA此前的官方博客说明,这批显卡已经限制了以太坊的算力,不过对比特币等其他币种没有任何限制。另外GeForceRTXTi这一批的非公版显卡,在外包装上不会有任何标注,“LiteHashRate”或者“LHR”的说明只针对已经发售的显卡,后续为了方便区分才会在包装上进行标注。GeForceRTXTiGeForceRTXTi细节特写关于此次发布的GeForceRTXTi显卡,想必大家主要关心的有这几点,首先是价格和性能,其次是供货量,能不能买到。由于此次的显卡全部限制了哈希率,也就是以太坊挖矿,所以会减少矿工的涌入。在6月1日台北电脑展发布会上,已经公布了售价为元,但国内目前买不到,所以只能期待一波非公版的显卡了,不同厂商会根据公版定价酌情加价,但首发价格一定是比较低的,大家不妨去抢一波。01GA核心的第三张卡下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForceRTXTi,相较于上一代的NVIDIATuring架构,NVIDIAAmpere架构下的GeForceRTXTi每个时钟执行2次着色器运算,而Turing为1次,RTXTi的着色器性能达到34TFLOPS单精度性能,而Turing为14TFLOPS。第一代NVIDIARTX架构Turing下的RTXTi第二代NVIDIARTX架构Ampere下的RTXTiNVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RTCore达到67RTTFLOPS,而Turing为43RTTFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。第三代TensorCore可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达TensorTFLOPS,而Turing为TensorTFLOPS。GeForceRTXTi仍然采用了GA核心,与GeForceRTX/相同,下面我们来看一看RTXTi在GA中做了哪些改动。完整的GA核心完整的GAGPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而RTXTi的CUDA数量是40个,所以可以推断RTXTi屏蔽了两组TPC,所以只有80个SM单元,而完整GA核心的CUDA数量应该是个。为了查询方便,笔者将这几款显卡的核心参数列出,可以看到RTXTi与RTX的核心参数非常接近。相差的两个SM单元,也就是1组TPC,个CUDA,其实在实际应用中来讲差距并不是很大,最重要的是RTX相比RTXTi多了12GB的显存;而相比RTX来说提升就非常大了。可能有用户会问,既然和RTX的差距如此小,那这张卡的定位是什么?笔者个人感觉RTXTi更多的还是为游戏玩家而准备,24GB的显存其实大部分游戏是用不到的,当然8K除外。渲染8K素材占用了17GB显存(点击查看大图)但在专业渲染软件中,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTXTi就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。02NVIDIAAmpere架构GA解析GeForceRTXTi采用了GA核心,拥有亿(00million)个晶体管,平方毫米的面积,基于三星的8nmNVIDIA定制工艺,来自Micron的GDDR6X显存。本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的从1:1变为2:1。GeForceRTXTi共有40个CUDA,其实它有个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了40的CUDA数量。而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。在去年与GeForceRTX30系显卡一同发布的还有一项新技术——RTXIO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。虽然随着NVMeSSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。传统的数据交换在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTXIO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。RTXIO可以极大解放CPU负担当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTXIO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。同时搭配新增的HDMI2.1接口,可以支持单线8K的视频输出,而上一代HDMI2.0仅支持4K98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。03GeForceRTXTi外观首先还是来看一下外观,在外包装上相比之前的公版没有变化,不过GeForceRTXTi这款显卡本身相比GeForceRTX在细节上还是有不少变化的。GeForceRTXTiGeForceRTXTi配件盒展示外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线和说明书的配件盒,因为此次公版仍采用单12pin的供电插槽,所以需要转换成双8pin的接口才能使用。GeForceRTXTi正面拿出显卡后我们先来看一下正面(由于公版轴流式设计,两侧均有风扇,我们以插入机箱后的方向来区分反正面),相比GeForceRTX的设计整体基本无改动,不过边框部分的内角从哑光改为了镜面,这种略带跳跃的视觉效果相比之前的设计更好看。GeForceRTXTi内角的金属光泽GeForceRTXTi上机后灯光效果另外在这次GeForceRTXTi中出了显卡侧面的GeForceRTX的logo灯,在正面还增加了一个“X”的灯光效果,不过由于是显卡自内而外发出的灯效,所以并不明显,需要在较暗的环境下才能看出。GeForceRTXTi背面GeForceRTXTi边框部位NVIDIAlogo显卡背面部分(虽然这看起来更像正面),基本没有改动,边框配色为淡淡的玫瑰金,包括极细微的NVIDIAlogo。GeForceRTXTi单12pin供电接口在GeForceRTXTi显卡的侧面,可以看到单12pin的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采用了高度紧凑的PCB板,长度也小于一般尺寸,所以其实供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方说明,GeForceRTXTi的单卡功耗为W,下面我们也会详细测试。GeForceRTXTi视频接口GeForceRTXTi的挡板部位颜色也和GeForceRTX不同,后者采用了与散热鳍片相同的黑色,而在新版的GeForceRTXTi中也改为了正常的金属色,未作特殊处理。接口方面的配置依旧为DP1.4*3+HDMI2.1*1的4接口设计,另外由于新的HDMI2.1协议,最高已可支持单线8K的视频输出。散热系统示意另外如果是第一次了解公版显卡的朋友们,这里再给大家说一下挡板部位这个奇怪的“栅栏”的用处,由于公版卡采用了双轴流式设计,正面及背面均有散热风扇,正面风扇为主动吸入冷空气为GPU降温,挡板部位则是排出热空气的“出风口”,而背面的风扇则是向上排出显卡内热空气的作用。DMARK理论性能测试首先介绍一下测试平台,为了保证此次评测能够发挥GeForceRTXTi显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。GPU-Z参数首先看一下GPU-Z的参数,GeForceRTXTi采用GA核心,三星8nm工艺,芯片面积平方毫米,拥有40个CUDA,MHz频率。采用12GBGDDR6X显存,位宽为bit,显存带宽达到了.4GB/s,光栅单元和纹理单元为和。下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在P、2K、4K的理论性能,取显卡分数实际测试结果如下:3DMARKFS套装测试在针对显卡DX11性能的3DMARKFS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应GeForceRTXTi的性能水平。可以看到GeForceRTXTi的性能基本与GeForceRTX相同,差距微乎其微。另外对比GeForceRTX则提高了不少,整体差距在11%左右。而对比上一代旗舰GeForceRTXTi整体提升约为40%。3DMARKTS套装测试而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,GeForceRTXTi的分数与GeForceRTX的分数差距则要大一些,达到4%左右。而对比GeForceRTX的分数要高出7%左右;对比上一代GeForceRTXTi的分数要高出43%左右。3DMARK光追测试PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForceRTXTi的表现依旧紧咬GeForceRTX,分数差距不超过1%;对比GeForceRTX的分数提升约为11%;对比上一代GeForceRTXTi的分数提升则非常大,约为60%。05游戏性能测试在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。《刺客信条:英灵殿》游戏测试在游戏实测中我们更印证了前面的说法,GeForceRTXTi和GeForceRTX的大部分分数相同,仅有1-2帧的差距。而GeForceRTX的分数差距在P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。《德军总部新血脉》游戏测试《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,GeForceRTXTi与GeForceRTX的差距依旧微乎其微,而相比GeForceRTX的提升约为4%左右。《孤岛惊魂5》游戏测试《孤岛惊魂5》同样算是优化比较到位的3A大作,GeForceRTXTi均能达到帧以上的流畅运行标准,其中4K分辨率下的成绩要领先GeForceRTX15%左右。《无主之地3》游戏测试《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,在P分辨率下GeForceRTXTi能够跑到帧,而在4K分辨率下打了对折仅有70帧。《光明记忆:无限》游戏测试《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX最高/DLSS质量”模式下进行。在这款游戏的benchmark中出现了惊人的分数一致情况,虽然多测试几遍肯定会有所不同,但在整体趋同的情况下意义不大。《边境》游戏测试在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。06功耗及温度测试功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。功耗测试(点击查看大图)GeForceRTXTi经过我们的实测在满载状态下单卡功耗为W左右,作为目前整体性能与GeForceRTX相仿的情况下,建议搭配W电源。温度方面,本次的GeForceRTXTi经过10分钟左右的拷机,温度稳定为75℃左右,与GeForceRTX基本相同,并且频率稳定无降频情况。07部分游戏光追及DLSS效果展示上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。《赛博朋克》RTXON(点击查看大图)《赛博朋克》RTXOFF(点击查看大图)在《赛博朋克》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。RTXON(点击图片查看大图)RTXOFF(点击图片查看大图)在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。《堡垒之夜》RTXON(点击查看大图)《堡垒之夜》RTXOFF(点击查看大图)堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。《魔兽世界9.0》RTXON(点击查看大图)《魔兽世界9.0》RTXOFF(点击查看大图)《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。《控制》RTXON(点击查看大图)《控制》RTXOFF(点击查看大图)《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。《赛博朋克》DLSS模式对比DLSS的对比测试我们选择《赛博朋克》这款游戏,2K/RTXON/DLSS关闭原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。《逆水寒》DLSS模式对比画质说明在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。08软硬兼施铸就Ampere好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家
转载请注明:http://www.aierlanlan.com/grrz/9058.html