RTX 3070 Ti首发评测:锁算力难挡矿工热情
共 3896字,需浏览 8分钟
·
2021-06-15 01:08
NVIDIA用1年左右的时间,初步布局好基于安培(Ampere)架构GPU,桌面端从兼顾游戏、专业创作的GeForce RTX 3090布局到主流级别的RTX 3060,移动端更是发布GeForce RTX 3050的入门级型号。
按照以往的两年更新一次架构的节奏来看,“年中小改款”的GeForce显卡也需要积极推进。
NVIDIA在5月31日带来两款Ti系列的新品,分别是将于6月2日解禁上市的GeForce RTX 3080 Ti和6月9日解禁上市的GeForce RTX 3070 Ti。
我们在6月2日首发评测七彩虹的iGame GeForce RTX 3080 Ti Advenced OC,七彩虹送测战斧GeForce RTX 3070 Ti,下面就一起看看这款显卡的表现。
NVIDIA安培架构GPU沿用了特定组数的CUDA单元、RT核心、Tensor核心封装为SM单元,然后将一定组数的SM单元封装为一个GPC结构,最后将几组GPC单元和内部缓存等其他硬件组成GPU核心。
安培架构中每组SM单元内建4个Tensor Core核心、128个CUDA核心、一个RT核心。
RTX 3070 Ti核心采用完整版的GA104核心,拥有48组6144个CUDA核心、192个Tensor Core核心和48个RT Core核心。显卡的显存容量为8GB,显存位宽依然是256 Bit,但19Gbps速率的GDDR6x显存还是为显卡带来608GB/s的带宽。
七彩虹战斧GeForce RTX 3070 Ti 8G的核心频率为1580MHz,Boost频率为1770MHz,分别比RTX 3070高80MHz和40MHz。由于采用GDDR6x显存,整卡热设计功耗达到290W,比RTX 3070的220W高出不少。
安培架构解析
与图灵架构的RTX 20系列相比,采用安培架构的RTX 30系列在SM单元上的最大变化,是将用于传统计算的FP32单元翻倍,引入第二代RT Core以及第三代Tensor Core。
图灵架构中整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。
考虑到现代游戏多数以FP32进行运算,所以NVIDIA在安培架构上引入可同时支持INT32或FP32两种数据类型的新ALU,让两条不同数据路径能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
第二代RT Core核心负责进行实时光线追踪运算,增加动态模糊的加速运算支持。新加入的插值算法保证动态模糊精确性,同时提高实时光线追踪效率,最高可带来8倍于上代的计算速度。第二代RT Core的BVH计算也比第一代快2倍。
负责运行AI计算的Tensor Core在安培架构上升级到第三代,能够提供比第二代Tensor Core高出4倍的效能。
与A100计算卡上的Tensor Core相比,GeForce游戏卡上的Tensor Core经过一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core一半的性能。第三代Tensor Core带来的DLSS2.1,通过渲染1440P的画面输出4320P的8K游戏画面。
战斧GeForce RTX 3070 Ti外观设计
七彩虹战斧GeForce RTX 3070 Ti显卡配备一个HDMI 2.1,可以单线输出8K/60Hz或4K120Hz。
另外三个接口则是DisplayPort 1.4a。得益于非公版PCB设计,显卡的供电接口采用全新的12pin设计,能够为显卡提供稳定的功率输出。GPU支持PCIE 4.0接口,能够大幅减少系统的带宽瓶颈,Resizable BAR更是进一步提升CPU和GPU之间的数据交换。
七彩虹战斧GeForce RTX 3070 Ti采用经典的红黑配色,正面采用类似钻石的切割设计。三个9cm支持自动启停功能的风扇,能够让显卡在负载情况下保持安静、高负载确保散热能力,带来更人性化的的使用体验。
显卡是七彩虹“COLORFUL”的品牌LOGO,通电后LOGO可实现呼吸闪烁。显卡采用全金属背板,不仅提升显卡的强度,背部的个性化的涂鸦图案能更好地满足用户的个性化选择。显卡PCB与背板之间还有导热贴提升供电部分的散热性能。
七彩虹战斧GeForce RTX 3070 Ti显卡拆解
由于使用公版PCB,所以七彩虹战斧GeForce RTX 3070 Ti的元器件布局相当紧凑。供电采用NVIDIA新标准的12pin接口,配合内部的9+2相供电设计,让750W电源就能满足显卡正常使用,不仅省去升级高功率电源的需求,同时还能降低机箱内部走线的难度。
七彩虹战斧GeForce RTX 3070 Ti显卡使用于公版相同的PCB设计,核心为完整版的GA-104-400-A1,显存颗粒仍然来自美光,型号D8BWW的GDDR6X显存单颗容量1GB,位宽32bit,8颗组成8GB、256 Bit位宽。
性能测试
测试平台 |
基准性能测试
显卡基准性能测试依然采用3DMark,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。全部均在2K和4K分辨率下进行排分测试,具体的单项得分成绩见下表。
从基准性能测试来看,RTX 3070 Ti的性能比RTX 3070有3%左右提升,但明显落后于RTX 3080。4K分辨率下的游戏模拟Time Spy Extreme的性能更是落后RTX 3080多达30%。
传统光栅化游戏测试
传统光栅化游戏测试采用《古墓丽影·暗影》、《刺客信条·奥德赛》、《绝地求生》、《赛博朋克2077》、《GTA5》、《巫师3》,测试2K和4K两种分辨率,采用预设中最高画质设置。
在6款游戏2K分辨率的实测来看,RTX 3070 Ti平均表现就是RTX 3090的97%的性能,平均领先RTX 3080则达到12%,领先上一代的旗舰RTX 2080 Ti达到38%。
在4K分辨率下,RTX 3070 Ti小幅领先RTX 3070,《赛博朋克2077》的落后RTX 3080最高达60%,最小的《GTA5》月24%。
实时光追游戏测试
光追测试《赛博朋克2077》、《古墓丽影·暗影》、《控制》、《死亡搁浅》、《我的世界》五款游戏,光线追踪效果均设为“高”,DLSS 2.0均选择为“性能”模式。
开启光追后在2K分辨率下,RTX 3070 Ti的游戏性能领先RTX 3070约5%,落后RTX 3080在20%~40%之间。4K分辨率的情况与2K大致相同,RTX 3070 Ti与RTX 3080之间的性能差在17%~48%之间。
烤机测试
GPU烤机测试安装在机箱内,测试环境温度约为26℃。待机温度是开机以后记录10分钟。烤机软件为FurMark,通过GPU-Z的Log to File功能记录温度、各项功耗、频率等信息。
由于七彩虹战斧GeForce RTX 3070 Ti采用6热管和3个9cm风扇为显卡提供强大的散热性能,显卡在机箱内的待机温度为56℃,满载后的最高温度86℃,大部分时间的温度稳定在83℃。
官方的TGP整卡功耗为290W,测试中的显卡功耗始终控制在290W内,其中GPU功耗224W。频率方面,3Dmark跑分中的最高频率可加速至1905MHz,烤机的功耗始终控制在1770MHz。
评测总结
从硬件规格来说,GeForce RTX 3070 Ti和RTX 3070之间差别并不大,能够明显感受到RTX 3070 Ti将直接取代RTX 3070,硬件限制挖矿性能让显卡的市场和价格不再被“矿老板”左右。
只是从RTX 3080 Ti首发上市的情况来看,新品并不能在短时间内解决显卡稀缺的问题,虽然Ti系列已经限制了挖矿算力,但依然比上代RTX 20系列好不少,加上专用挖矿的CMP显卡毫无性价比的状态,相信“矿老板们”依然想冲RTX 3080/70 Ti这两款新显卡。
往期推荐
来都来了,点个在看再走吧~~~