280亿个晶体管，10496个核心，黄仁勋的 RTX 3090性能堪称「残暴」-技术圈

来源：anandtech

编辑：白峰、继鹏

等等党的胜利！英伟达最新RTX 3090简直残暴

黄教主又来厨房发显卡了！

黄仁勋带着NVIDIA下一代视频卡GeForce RTX 30系列来到观众面前。

这次发布的三个型号分别是：RTX 3090，RTX 3080和RTX3070，刚买了20系列的同学，心态应该都挺好的。。

三款显卡都是基于Ampere架构，并加持了三星的8nm工艺。

黄教主展示的第一张卡是 GeForce RTX 3080，性能将是RTX 2080的2倍以上，售价也很美丽，仅有700美元，货真价实的消费级产品，9月17日就可以下单了。

而RTX 3070定位更为亲民只售499美元，不过要多等一个月。

三款新卡和2080 Ti的性能价格对比

可以看到3080相对2080Ti运算速度提升了2倍不止，价格还更便宜，想搭建自己的深度学习服务器又觉得泰坦不划算的同学可以上车了。

接下来出场的RTX 3090 ，更是被黄仁勋称之为 BF GPU（big ferocious）。

RTX3090使用了GA102的GPU，CUDA核心数是10496，同时拥有和前一代持平的24GB DDR6X。

新产品使用的三星8nm工艺相比之前台积电的12nm工艺有了巨大的提升，新卡晶体管数量提升到了280亿，CUDA的核心数从2080Ti的4352提升至10496，张量性能也从114TFLOPS提升至了285TFLOPS。

在厨房没有看到GA102的真实尺寸，但是从照片中猜测它的面积应该超过了500mm^2，虽然相比Titan采用12nm的TU102核心小了非常多，但仍然是一块相当大的芯片，是目前三星生产过的最大的芯片。

RTX 30 系列相比上一代确实有了很大提升，24GB GDDR6X 的超大显存，支持 HDMI 2.1 的 GPU，8k 游戏单卡可玩，号称「世界上第一款8K游戏显卡」。

这次发布的新品，对游戏爱好者来说绝对是福音，新卡跟上一代基于Turing的RTX 20系列相比，游戏性能方面取得了重大突破！

三款新品都是基于安培架构，为什么在游戏图形方面的性能有了很大提升？

我们从计算匹配的角度来看一下，此前的GA100缺少一些图形加速特性，这次英伟达最大限度地挖掘了安培架构在图形计算方面的潜力。

虽然GA100和GA102都是安培架构的GPU，但这两者之间有很大的差异，虽然GA102没有引入新功能模块，但是容量和计算能力却提升了很多。

新显卡使用了更多的第三代张量核，在游戏中可以实现至少50%的性能提升，某些游戏中甚至提升超过了100%，此前的图灵架构最高只支持720P25帧播放，而新的安培架构则支持1440P30帧播放。

NVIDIA 已经确认，安培架构对稀疏张量的支持将会越来越多，在新架构上，稀疏张量的运算速度会提高一倍，同时支持 TF32、FP16、BFLOAT16 等多种精度。

而这种对张量核心性能的关注也可以看出英伟达对深度学习和人工智能的关注，现在，深度学习不仅是英伟达数据中心业务的驱动力，也是他们游戏业务的重中之重。

升级后的第二代光线追踪技术也得到了很大的提升，单个RT内核速度快了2倍，黄仁勋也宣布，「堡垒之夜」将支持光线追踪和DLSS技术（深度学习超级采样），游戏性能将得到大幅提升。

DLSS技术就是利用机器学习算法，实时将低分辨率通过AI 升级到高分辨率，大幅降低GPU的运算压力，使得开启光线追踪后的游戏画面更加流畅，有效消除锯齿等不和谐因素。

光线追踪技术第一次应用是在RTX20系列的显卡上，本次的第二代光追技术加上AI核心的协同工作，可以达到第一代RT Core性能的1.7x以上，将渲染延时从20ms缩短到12ms。

对游戏显卡来说，还有一个非常重要的部分就是着色器，虽然英伟达这块介绍的比较少，但是它对游戏性能的影响是最直接的。

新的 RTX 30系列卡包含惊人数量的 FP32 CUDA 核心，即使是RTX 3080也能提供29.8 TFLOPs 的 FP32着色器性能，比上一代 RTX 2080 Ti 高出一倍多。

当然，光影性能并不是一切，所以黄教主没有专门提到这一点。计算机图形学令人尴尬的并行特性，让着色器在很多情况下都成了性能瓶颈，只能提供更多的核心来解决。

英伟达的上一代游戏显卡已经一骑绝尘，新款产品将让英伟达如虎添翼，继续领跑游戏显卡市场。

英伟达DLSS 2.0，AI渲染的里程碑

除了光追和着色器，游戏性能的提升还要说下英伟达图像增强工具DLSS。

英伟达团队在过去的三年中一直在试图解决一个问题，就是ray tracing速度不够快的问题。

于是，NVIDIA 的DLSS 2.0（deep learning super sampling深度学习超级采样）应运而生。

DLSS2.0是一个改进版的深度学习神经网络，基于GeForce RTX GPU的Tensor Cores，实现了实时光影追踪，它可以使用AI将低分辨率图像放大到优于原生1080p的画质。

「我们目的是让AI认识到真正高清晰度的画面是什么样的，通过不同场景的训练，神经网络可以预测出下一帧高清画面的样子」。

使用DLSS2.0深度学习超分辨率从720p渲染到1080p比原生的1080p画面还要更加优质。

将RTX融入到著名游戏Minecraft 游戏当中，灯光效果相当惊人。

有没有RTX，效果显而易见。

总结说来，又是一次成功的厨房发布会，着实让消费者感受到了实惠。

新的安培架构正在加速医疗AI、自动驾驶、数据中心，英伟达已经开始向AI领域全面进军。

一个属于自己的高性价比显卡，兜里的钱准备好了吗？

参考链接：

https://www.anandtech.com/show/16057/nvidia-announces-the-geforce-rtx-30-series-ampere-for-gaming-starting-with-rtx-3080-rtx-3090