Nvidia GeForce RTX 4090 评测:浪费 1600 美元的最佳方式

RTX 4090既完全是浪费钱,又是有史以来最强大的显卡。诚然,这使得它成为一个难以评估的产品,尤其是考虑到普通 PC 游戏玩家希望在系统升级上花费多少。

RTX 4090 首次亮相 Nvidia 的新 Ada Lovelace 架构,一直饱受争议,并被认为是GPU 价格上涨的典型代表。尽管它的成本很高,但它提供了性能,尤其是 DLSS 3 提供的增强功能。您是否应该节省您的便士并为这款 GPU 野兽出售您的汽车?可能不是。但这绝对是这项技术真正能走多远的激动人心的展示。

视频回顾

Nvidia RTX 4090 规格

RTX 4090 和 RTX 3090 并排放置在桌子上。
雅各布·罗奇 / 数字趋势

如前所述,RTX 4090 引入了 Nvidia 的新 Ada Lovelace 架构,以及芯片制造商台积电更高效的 N4 制造工艺。尽管无法将 RTX 4090 规格与上一代产品进行比较,但我们可以了解 Nvidia 在设计 Ada Lovelace 时优先考虑的事项。

主要关注点:时钟速度。 RTX 3090 Ti的最高频率约为 1.8GHz,但 RTX 4090 展示了具有 2.52GHz 升压时钟的新节点的效率。相同的板功率为 450 瓦,但它在更多内核上运行。 RTX 3090 Ti 几乎没有 11,000 个 CUDA 内核,而 RTX 4090 提供 16,384 个 CUDA 内核。

RTX 4090 RTX 3090
建筑学艾达洛夫莱斯安培
进程节点5nm台积电8nm三星
CUDA 核心16,384 10,496
光线追踪核心144 第三代82 第二代
张量核心576 第四代328 第三代
基本时钟速度2235MHz 1394MHz
提高时钟速度2520MHz 1695MHz
显存 GDDR6X 24GB 24GB
内存速度21Gbps 19.5Gbps
总线宽度384 位384 位
TDP 450W 350W

很难说这些额外的核心有多重要,尤其是对于游戏而言。在堆栈中,16GB RTX 4080 的内核数量是 RTX 4090 的一半多一点,而 12GB RTX 4080 的内核更少。时钟速度仍然很高,但目前 RTX 40 系列家族的规格表明,增加的核心数量不会成为主要卖点,至少对于游戏来说是这样。

合成和渲染

3DMark 中的 RTX 4090 性能。

在进入完整的基准测试套件之前,让我们从高层次上看一下性能。来自 3D Mark 的 Port Royal 和 Time Spy 展示了 Nvidia 最新旗舰的扩展性如何,在 Time Spy 中显示比 RTX 3090 Ti 增加 58%,在 Port Royal 中比 RTX 3090 增加 102%。

需要注意的是,3DMark 并不是判断性能的最佳方法,因为它对CPU的影响远大于大多数游戏(尤其是 4K 时)。但是,在 RTX 4090 的情况下,3DMark 显示了良好的缩放比例。事实上,我从真实游戏中得到的结果实际上比这个综合基准所暗示的要高一点,至少在光线追踪之外。

Blender 中的 RTX 4090 性能。

我还测试了 Blender 以使用 RTX 4090 来衡量一些内容创建任务,这些改进令人震惊。 Blender 由 Nvidia 的 CUDA 内核加速,RTX 4090 似乎特别针对这些类型的工作负载进行了优化,它在 Monster 和 Junkshop 场景中的得分是 RTX 3090 和 RTX 3090 Ti 的两倍多,在教室场景。没有 CUDA 的 AMD 的 GPU 甚至还差得远。

4K游戏性能

RTX 4090 4K 性能的 Geomean。

到多汁的部分。我所有的测试都是在露天测试台上使用Ryzen 9 7950X和 32GB DDR5-6000 内存完成的。在整个测试过程中,我一直打开Resizeable BAR ,或者在 AMD GPU 的情况下,Smart Access Memory。

RTX 4090 在物理上是一个怪物,但在 4K 游戏性能方面它也是一个怪物。在我的测试套件中,不包括Bright Memory InfiniteHorizo​​n Zero Dawn(我的数据不完整),RTX 4090 比 RTX 3090 Ti 快 68%。与 RTX 3090 相比,您看到了将近 89% 的提升。

这是一个巨大的飞跃,远大于我们在RTX 3080发布时看到的 30% 的提升。这些数字都不是升级的因素。这是包括光线追踪在内的原始性能,RTX 4090 与上一代相比有着巨大的领先优势。

最令人印象深刻的展示可能是赛博朋克 2077。RTX 4090 在 4K 设置下比 RTX 3090 Ti 快 50% 以上,这已经足够令人印象深刻了。不过,RTX 4090 每秒可破解 60 帧 (fps) 的事实很突出。如果没有深度学习超级采样 (DLSS)的帮助,即使是上一代中最强大的显卡也无法超过 60 fps。 RTX 4090 可以在渲染每个像素的同时打破这一障碍,并且以相当大的优势做到这一点。

RTX 4090 在 Forza Horizo​​n 5 中的 4K 性能。 nvidia geforce rtx 4090 审查齿轮 4k 英伟达 geforce rtx 4090 评测地平线零黎明 4k 英伟达 geforce rtx 4090 评测 rdr2 4k 英伟达 geforce rtx 4090 评测 valhalla 4k 英伟达 geforce rtx 4090 评测赛博朋克 4k

Gears Tactics还展示了 RTX 4090 的强大功能,以 73% 的领先优势击败了 RTX 3090 Ti。在Red Dead Redemption 2Vulkan游戏中,收益较小,但根据我的测试,RTX 4090 仍然领先 52%。这是性能上的巨大代际飞跃,尽管仍低于 Nvidia 最初承诺的水平。

Nvidia 将 RTX 4090 推销为比 RTX 3090 Ti “快两到四倍”,但事实并非如此。它比以前的顶级狗快得多,但只有在考虑 DLSS 3 时,Nvidia 的说法才有意义。DLSS 3 令人印象深刻,我将在本次评测的稍后部分进行讨论。但它不是在每场比赛中,它仍然需要一些工作。值得庆幸的是,凭借 RTX 4090 的原始性能,DLSS 更像是“拥有”而不是“需要拥有”。

在诸如刺客信条瓦尔哈拉极限竞速地平线 5 等 AMD 推广的游戏中, RTX 4090 仍然显示出它的力量,尽管现在与AMD 的 RX 6950 XT相抗衡。在 4K 的Valhalla中,RTX 4090 比 RX 6950 XT 领先 63%。 Forza Horizo​​​​n 5的利润更小,这似乎与AMD目前的产品非常吻合。不过,即使领先优势较小,RTX 4090 也比 RX 6950 XT 领先 48%。

RTX 4090 的每帧成本。

这些比较令人印象深刻,但 RTX 4090 与竞争对手的竞争环境并不相同。 Nvidia 最新的旗舰产品售价 1,600 美元,甚至比当今最昂贵的 GPU 要贵得多。不过,凭借 RTX 4090 提供的性能,它实际上比更便宜的 RTX 3090 或 RTX 3090 Ti 更划算。

就每帧的成本而言,您看到的价格与 RTX 3080 10GB 的价格大致相同,为 700 美元。这不是判断价值的最佳方法——它首先假设你甚至有额外的现金可以花在 RTX 4090 上,而且它没有考虑 DLSS 3 等功能——但听起来很疯狂,1600 美元是RTX 4090 提供的 4K 性能价格相当公道。

1440p 游戏性能

RTX 4090 在 1440p 时性能的 Geomean。

如果您要购买 1440p 的 RTX 4090,那您就是在浪费钱(请阅读我们关于最佳 1440p 显卡的指南)。虽然它仍然比上一代提供了很大的改进,但利润率要小得多。您看到的是比 RTX 3090 Ti 增加了 48%,比 RX 6950 XT 增加了 68%。这些仍然是巨大的代际跳跃,但 RTX 4090 确实在 4K 上大放异彩。

你开始在 1440p 时受到一点 CPU 限制,如果你降到 1080p,结果会更紧。坦率地说,1440p 的额外性能并不像 4K 那样突出。例如,在Gears Tactics中,RTX 4090 比 RTX 3090 Ti 快 36%,低于 Nvidia 最新的 4K 显卡的 73%。实际的帧速率也不那么令人印象深刻。当然,RTX 4090 远远领先于 RTX 3090 Ti,但是当便宜 500 美元的 GPU 已经超过 160 fps 时,很难想象有人在Gears Tactics中需要超过 200 fps。

英伟达 geforce rtx 4090 评测 forza 1440p nvidia geforce rtx 4090 审查齿轮 1440p 英伟达 geforce rtx 4090 评测地平线零黎明 1440p 英伟达 geforce rtx 4090 评测 rdr2 1440p nvidia geforce rtx 4090 评测 valhalla 1440p 英伟达 geforce rtx 4090 评测赛博朋克 1440p

在 4K 时,RTX 4090 完成了重要的里程碑——在没有 DLSS 的赛博朋克 2077中超过 60 fps,在刺客信条瓦尔哈拉中接近 144Hz 标记的高刷新率显示器等。在 1440p 时,RTX 4090 肯定有更高的数字,但这个数字在纸上比在实际屏幕上更令人印象深刻。

光线追踪

RTX 4090 坐在桌子上。
雅各布·罗奇 / 数字趋势

自图灵一代以来,Nvidia 一直是光线追踪的冠军,但 Ada Lovelace 是第一代进行重大改革的人。 RTX 4090 的核心是重新设计的光线追踪核心,可提高性能并引入着色器执行重新排序 (SER)。 SER 基本上是一种处理光线追踪操作的更有效方式,允许它们在 GPU 功能可用时执行,而不是在必然会出现瓶颈的直线上执行。它还要求您在 Windows 中打开硬件加速 GPU 调度。

它有效。光线追踪的边距通常要小得多,但 RTX 4090 实际上在开启光线追踪时显示出更高的增益。例如,在赛博朋克 2077中,RTX 4090 比具有 Ultra RT 预设的 RTX 3090 Ti 快了近 71%。那是在考虑 DLSS 之前。 AMD 的 GPU 在光线追踪性能方面远远落后,表现出更大的差异。在这个基准测试中,RTX 4090 比 RX 6950 XT 快了整整 152%。

图表显示了《赛博朋克 2077》中 RTX 4090 在 1440p 中开启光线追踪的性能。 nvidia geforce rtx 4090 评测赛博朋克 4k 光线追踪 nvidia geforce rtx 4090 回顾明亮内存 4k nvidia geforce rtx 4090 回顾明亮内存 1440p 英伟达 geforce rtx 4090 评测 Metro 1440p 英伟达 geforce rtx 4090 评测 Metro 4k

同样, Metro Exodus 增强版显示 RTX 4090 比 RTX 3090 Ti 提升 80%, Bright Memory Infinite显示 RTX 4090 比 RTX 3090 快 93%。Nvidia 声称比 RTX 快“两到四倍”如果没有 DLSS 3,3090 Ti 可能无法承受,但光线追踪性能更接近该标记。

就像 4K 性能一样,RTX 4090 显示的性能改进在光线追踪打开时实际上会产生影响。在Bright Memory Infinite 中, RTX 4090 是利用高刷新率和勉强达到 60 fps 之间的区别。而在赛博朋克 2077 中, RTX 4090 从字面上看就是可玩和不可玩的区别。

DLSS 3 测试

在过去的几代中, DLSS 一直是 RTX GPU 的超级明星功能,但 DLSS 3 是该技术的重大转变。它引入了光流 AI 帧生成,归结为 AI 模型每隔一帧生成一个完全独特的帧。从理论上讲,这意味着即使是 100% 受 CPU 限制并且不会从较低分辨率中看到任何好处的游戏也将具有两倍的性能。

现实世界中的情况并非如此,但 DLSS 3 仍然令人印象深刻。我从 3DMark 的 DLSS 3 测试开始,它只是在关闭然后打开 DLSS 的情况下运行 Port Royal 基准测试。我的目标是尽可能地推动该功能,
因此我将 DLSS 设置为 Ultra Performance 模式,并将分辨率设置为 8K。这是 DLSS 3 能力的最佳展示,该技术将帧速率提高了 578%。这太疯狂了。

3DMark Port Royal 在 RTX 4090 上的 DLSS 3 性能。

在实际游戏中,收益并不那么明显,但 DLSS 3 仍然令人印象深刻。 Nvidia 提供了A Plague Tale: Requiem 的早期版本,并且 DLSS 在设置最大化的情况下设法将 4K 的平均帧速率提高了 128%。这是 DLSS 的自动模式。使用更激进的图像质量预设,增益甚至更高。

A Plague Tale: Requiem揭示了 DLSS 3 的一个重要方面:它会产生相当大的开销。 DLSS 3 分为两部分。第一部分是 DLSS 超分辨率,与您在前几代 RTX 中看到的 DLSS 相同。它将继续与 RTX 20 系列和 30 系列 GPU 一起使用,因此您仍然可以在使用上一代显卡的游戏中使用 DLSS 3 Super Resolution。

使用 RTX 4090 在 A Plague Tale Requiem 中的 DLSS 3 性能。

DLSS 帧生成是第二部分,它是 RTX 40 系列 GPU 独有的。 AI 每隔一帧生成一个新帧,但这在计算上很昂贵。因此,每当您打开帧生成时, Nvidia Reflex都会被强制打开,并且您无法将其关闭。

如果您通过帧生成的工作原理进行推理,它应该提供的帧速率是您使用超分辨率所获得的帧速率的两倍,但事实并非如此。正如您在下面的赛博朋克 2077中所见,帧生成结果意味着 GPU 仅渲染了大约 65 帧——其余的来自 AI。凭借自身的超分辨率,该结果可以提高近 30 fps。这就是 DLSS 帧生成开销。

使用 RTX 4090 在 Cyber​​punk 2077 中实现 DLSS 3 性能。

显然,帧生成提供了最佳性能,但不要将超级分辨率视为过时。尽管 Frame Generation 看起来使 DLSS 帧速率翻了一番,但实际上它本身更接近于超分辨率。

除了图像质量,你不能谈论 DLSS,虽然 DLSS 3 令人印象深刻,但它仍然需要在图像质量部门进行一些工作。因为其他每一帧都是在 GPU 上生成并直接发送到您的显示器,所以它无法绕过 HUD 等元素。这些是生成帧的一部分,它们已经成熟,可以制作人工制品,正如您在下面的赛博朋克 2077中看到的那样。移动的任务标记在屏幕上移动时会喷出,AI 模型不太确定在元素移动时将像素放置在哪里。通常,HUD 元素不是 DLSS 的一部分,但帧生成意味着您必须将它们考虑在内。

赛博朋克 2077 中的 DLSS 3。

同样的行为也出现在实际场景中。例如,在A Plague Tale: Requiem中,你可以看到当 AI 努力弄清楚草的位置和腿的位置时,在草丛中奔跑如何产生一层薄薄的像素炼狱。同样,Port Royal 显示出柔和的边缘和大量的像素不稳定性。

瘟疫传说安魂曲中的 DLSS 3。

这些伪影最好在运动中看到,所以我以 120 fps 的速度拍摄了一堆 4K 素材,您可以在下面观看。我将 DLSS 比较放慢了 50%,以便您可以看到尽可能多的帧,但请记住 YouTube 的压缩以及在捕捉游戏过程时很难获得真正的苹果对苹果质量比较的事实。最好亲眼看到。

在播放时,DLSS 3 带来的图像质量损失很容易被它提供的性能提升所抵消。但帧生成不是您应该始终打开的设置。当您推动光线追踪和所有视觉花里胡哨时,它处于最佳状态。希望它也会有所改善。我相信 Nvidia 将继续改进帧生成方面,但目前,它仍然显示出一些磨损的边缘。

电源和散热

Nvidia GeForce RTX 4090 的电源连接器。
雅各布·罗奇 / 数字趋势

在发布 RTX 4090 之前,谣言工厂充斥着关于淫秽电源需求的猜测。 RTX 4090 消耗大量功率——Founder's Edition 为 450W,而华硕 ROG Strix RTX 4090 等主板合作伙伴卡则更多——但它并不比 RTX 3090 Ti 所消耗的更多。而且根据我的测试,RTX 4090 实际上画得少了一点。

下图显示了我在测试时测得的最大功耗。这不是最大功率——专门的压力测试会进一步推动 RTX 4090——但游戏不是压力测试,你不会总是达到最大功率(甚至接近)。对比其他方正版机型,RTX 4090 实际功耗比 RTX 3090 Ti 少了约 25W。不过,超频的主板合作伙伴卡会爬得更高,所以请记住这一点。

RTX 4090 的温度图表。 RTX 4090 的功耗图表。

对于热量,RTX 4090 在我的测试套件中达到了 64 摄氏度的峰值,这正好在它应该坐的位置附近。较小的RTX 3080 Ti具有更高的时钟速度和核心数量,显示出最高的散热结果,峰
值为 78 度。不过,所有这些数字都是在露天测试台上收集的,因此一旦 RTX 4090 放入机箱中,温度会更高。

您应该购买 Nvidia RTX 4090 吗?

一只手握着 RTX 4090 GPU。
雅各布·罗奇 / 数字趋势

如果您有 1,600 美元可用于 GPU,是的,您应该购买 RTX 4090。不过,大多数人没有 1,600 美元可用于购买显卡,这就是 RTX 4090 的棘手之处。

我可以一个接一个地展示 RTX 4090 的强大功能,1,600 美元是一个相对合理的价格,以及 DLSS 3 如何大幅提升游戏性能。但事实仍然是,RTX 4090 的成本高于许多完整的游戏 PC。对于大多数人来说,这与显卡相去甚远。对于大多数发烧友来说,它甚至不是显卡。

RTX 4090 物有所值,但这并不意味着您应该购买它。我们对下一代的了解仍然很不完整——RTX 4080 型号将于 11 月到货,而AMD 将于 11 月 3 日推出其 RX 7000 GPU 。对于大多数人来说,最好的选择是等待。我们不会再次出现 GPU 短缺,因此没有理由相信一旦这些显卡推出,RTX 4090 会变得更加昂贵。

如果您只是因为它是最好的而想要最好的人中的一小部分人,那么 RTX 4090 将牢牢地保持这个头衔。 RTX 4090 比普通 PC 游戏玩家想要花费的要贵得多,但话又说回来,它比普通显卡要贵得多。


Posted

in

by

Tags: