很难说过去一周 RTX 5090 或 DLSS 4 是否为 Nvidia 赢得了更多关注。 RTX 5090无疑是您能买到的最好的显卡,但对话的很大一部分涉及 DLSS 4 及其多帧生成功能。这是有充分理由的。 DLSS 4 非常出色,可以毫不费力地以三位数帧速率实现《心灵杀手 2》中的全路径追踪等游戏体验。
尽管如此,我还是很担心。
DLSS 4 代表了所有 RTX 显卡的根本性变化,从最新RTX 50 系列 GPU的多帧生成到适用于 RTX 2060 Super 等显卡的新 AI 模型。尽管 DLSS 4 令人印象深刻,但我担心地板最终会从它下面掉下来。
转变 DLSS 模型
DLSS 4 是一个比您想象的更重要的更新。最主要的功能是 DLSS 多帧生成或 MFG,但这个新版本对 DLSS 的各个方面进行了调整。这意味着, DLSS 4 将会追溯性地使 DLSS 变得更好,即使对于不支持 MFG 的旧 GPU 也是如此。
最大的变化是 Nvidia 从卷积神经网络 (CNN) 转变为 Transformer 模型。有些游戏(例如《赛博朋克 2077》和《心灵杀手 2》)允许您在游戏中的不同模型之间切换。然而,我怀疑大多数采用 DLSS 的游戏只会继续使用 Transformer 模型。如果出于某种原因,您更喜欢 CNN,则可以通过 Nvidia 应用程序及其新的 DLSS 覆盖功能恢复到它。
Nvidia表示,新的Transformer模型有更多的参数,但更重要的是,Transformer模型是自引用的。新的 DLSS 模型可以跟踪特定像素以提高有问题区域的图像质量,而不是跟踪整个场景中的每个像素。 Nvidia 已经展示了这种功能,您可以在上面的视频中看到。有明显的改进,但它们并不普遍。
在上面,您可以看到《赛博朋克 2077》中 CNN 和 Transformer 模型之间的比较。如果没有标签,甚至实际上有标签,基本上不可能分辨出两个图像之间的差异。我搜索啊搜索,窥视每个像素,寻找两者之间某种明显的差异,但它就是不存在。两者看起来都很棒,特别是考虑到我正在 DLSS 的性能模式下运行,但我不会说 Transformer 模型明显更好。
《心灵杀手 2》中的情况也是如此,基本上无法区分两张图像。长凳上的细节略有不同,但当相机上有一层水模糊时,我很难将其归因于 DLSS。
但事情是这样的——新的 Transformer 模型不需要变得更好,尤其是现在。重要的是,它至少与 CNN 模型一样好,并且不会影响性能。您会在某些游戏和情况下看到好处,但变形金刚模型并不是覆盖所有 DLSS 的光滑新油漆。将其视为 Nvidia 较小的 DLSS 更新之一,该更新在过去几年中悄悄地使该功能变得更好。
这里也有一些改进。看看上面《赛博朋克 2077》中的另一个场景。新的 Transformer 模型不仅可以更清晰地再现反射,还可以处理 CNN 模型中的大量重影问题。当汽车通过 CNN 模型的摄像机时,每个尾灯后面都有这些长而明显的痕迹,而在 Transformer 模型中它们完全消失。
随着时间的推移,这可能会有所改善。 Nvidia 表示,它拥有一台超级计算机,在过去六年中一直在改进 DLSS,而且这项工作并没有因为新的变压器模型而停止。尽管这些好处可能不会随处可见,但它们仍然是一个受欢迎的补充。 Transformer 模型适用于所有 RTX GPU,它不仅涵盖 DLSS 超分辨率,还涵盖光线重建。
一帧、两帧
好吧,但我知道你们为什么都在这里。我们来谈谈MFG。 DLSS 4 是 RTX 5090 等 RTX 50 系列 GPU 独有的,可解锁高达 4X 的帧生成 — 一个渲染帧和三个生成帧。有75 款已确认的游戏将支持 DLSS 4,但并非全部都是原生的。有些在图形菜单中会有 MFG 选项,而其余的则需要 Nvidia 应用程序中的 DLSS 覆盖。
MFG 在 DLSS 4 中确实表现出色。上面的图表在这方面说明了一切。在《心灵杀手 2》中,我将 RTX 5090 上的每秒不到 30 帧 (fps) 提高到了超过 200 fps。这是性能的指数级增长,并且具有出色的图像质量。延迟也不是问题。如今,Nvidia 在限制帧生成带来的延迟方面做得非常出色,并且在混合中添加几个额外的帧并不会显着增加延迟 – 它几乎没有起到任何作用。
《赛博朋克 2077》中的情况也是如此。打开帧生成后几乎没有任何额外的延迟,甚至在 4X 模式下也是如此。将 DLSS 超分辨率添加到组合中以提高基本帧速率并减少总延迟,您在 4K 时的帧速率接近 240 fps。 MFG 的超能力在于它的乘法性;如果您为其提供更高的基本帧速率,您将获得更大的性能提升。
如果您以至少 60 fps 的速度提供 MFG,您将获得最佳的 MFG 体验, Marvel Rivals就是证明。在这个标题中,我的基本帧速率是可以接受的,并且延迟不是问题。在这样的游戏中,我不需要诉诸 DLSS 超分辨率。我可以使用 MFG 来提高游戏的流畅度,同时对整体系统延迟的影响很小。
只有当整体延迟一开始就很高时,整体延迟才会真正成为一个问题。当您快速接近 0 毫秒时,即使是“大”的延迟峰值或下降也仅代表几毫秒。如果您的基本帧速率较高,即使延迟增加 50%,也可能只会将您的时间从 20 毫秒缩短到 30 毫秒。如果基础帧速率较低,同样的跳跃可能会将您从 100 毫秒移动到 150 毫秒。百分比相同,但体验却截然不同。 《漫威对手》就是这种动态的一个很好的例子。
然而,这也暴露了我对 DLSS 4 发展的担忧,特别是当涉及到 Nvidia 产品线中较弱的 GPU 时。
旗舰的困境
在上面,您可以看到 DLSS MFG 在 4X 模式下运行的《赛博朋克 2077》视频。我在这里没有使用 DLSS 超分辨率,因此我为 AI 模型提供的基本帧速率略低于 30 fps – 如果我没记错的话,约为 27 fps。这不是您想要玩《赛博朋克 2077》的方式。一切都存在持续的运动模糊,以及大量的视觉伪影。
我在这里使用的是 RTX 5090,分辨率为 4K,值得庆幸的是,您无需满足于这种体验。轻按 DLSS 超分辨率即可提高基本帧速率,然后您就可以享受没有视觉伪影的流畅体验。
但我们总不能都买RTX 5090吧?
关于 DLSS,需要记住的重要一点是,当它推动更高水平的视觉质量时,它处于最佳状态。当它弥补无法达到目标的硬件时,它是最糟糕的。 DLSS 超分辨率在 4K 下看起来和性能最佳。在 1080p 下,性能增益较小,视觉质量较差。如果您在已经拥有可玩的基本帧速率的情况下尝试攀升至三位数,则 DLSS 帧生成会非常出色。如果你不以可玩的帧速率走进大门,它就会因视觉伪影和难以管理的延迟而崩溃。 MFG 也存在同样的问题,而且这些问题被放大了。
最终,Nvidia 将转向其产品堆栈中较低的 RTX 50 系列 GPU。它尚未正式透露其预算产品,但如果我们在某个时候没有看到 RTX 5060,我会感到震惊。它肯定会成为一款流行的 GPU,这在很大程度上要归功于 DLSS 4。但是 GPU 本身是否强大到足以利用 DLSS 4?对于在要求较高的游戏中无法达到 60 fps 标记的玩家来说,MFG 是否会成为一个选择?
这个想法让我想起了 Surface Laptop Studio 2。当这款配备 RTX 4060 的笔记本电脑发布时,我写了一篇有关 Nvidia 如何在硬件上实现新层次游戏体验的文章,否则这些体验将不适合《赛博朋克 2077》等知名游戏您可能会得到一些视觉伪影,并且可能无法获得完美的升级。但由于英伟达致力于渲染管道的快捷方式,至少可以玩这些游戏。
当审视 MFG 时,这种动态就被打破了。它可以提供看起来很高的帧速率,但如果没有足够的功率来支持,它就会崩溃。上面的视频就是一个明显的例子。我担心的是,当较弱的硬件加入到混合中时,DLSS 4 的底部会从它下面掉下来。您可以在升级方面做出妥协;您甚至可以在对延迟不敏感的游戏中妥协帧生成。在这里,对于 MFG,如果您不能以至少 60 fps 的速度向 AI 提供数据,就很难接受妥协。
这不是对 Nvidia 的批评。我不认为 300 美元的显卡(或者无论 RTX 5060 最终的价格如何)应该能与 RTX 5090 等 2,000 美元的显卡的体验相媲美。但是,这是一个重要的说明。查看基准测试并想象 DLSS 4 可以为预算 GPU 做些什么很容易,但我屏住呼吸,直到这些 GPU 出现,看看它们是否强大到足以利用该功能。
不过,一旦 GPU 到位,这个问题就需要解决。就目前而言,DLSS 4 令人印象深刻。如果你以至少 60 fps 的速度喂它,那感觉就像魔法一样。除此之外,新的 Transformer 模型有望随着时间的推移实现更大的图像质量改进,很明显 Nvidia 希望 DLSS 保持在 PC 游戏技术的最前沿。