Nvidia 在CES 2025上发布了RTX 5090,抢尽风头,尽管对该卡 2,000 美元的价格标签有很多讨论,但它还是引入了许多新技术。其中最主要的是 DLSS 4,它为 Nvidia 的 GPU 带来了多帧生成,当 Nvidia 的新型RTX 50 系列GPU 上市时,它可以立即将超过 75 款游戏的性能提升 4 倍。
不过,我见过太多关于DLSS 4 实际工作原理的误解。 Nvidia 首席执行官的误导性言论和对 DLSS 工作原理的彻底重新设计,难怪人们对这项新技术、它的能力以及它的局限性存在着错误的信息。
因此,让我们澄清事实,至少在 Nvidia 的新显卡问世之前尽可能多地澄清事实,让我们都亲身体验 DLSS 4 所提供的功能。
不,它不会“预测未来”

关于正确理解 DLSS 4 工作原理的主要问题之一来自 Nvidia 首席执行官黄仁勋在问答中的评论。 Tom's Hardware的 Jarred Walton 向黄询问 DLSS 4 在技术层面上的工作原理,黄断然否认 DLSS 4 使用帧插值。他说 DLSS 4“预测未来”,而不是“插值过去”。当然,这是一句很流行的话。可惜这是不正确的。
黄过去曾对 DLSS 帧生成充满诗意,虽然这种类型的框架有助于向主流观众解释像 DLSS 4 这样的技术,但它也会导致对其实际工作原理的一些误解。在这句话之后,实际上有几位读者联系我,告诉我我误解了 DLSS 4 的工作原理。事实证明,我并没有误解它的工作原理,但我理解为什么会有很多混乱。
DLSS 4 的多帧生成使用一种称为帧插值的技术。这与我们在 DLSS 3 中看到的技术相同,也与您在无损缩放和AMD 的 FSR 3等其他帧生成工具中发现的技术相同。帧插值的工作原理如下:您的显卡渲染两个帧,然后算法介入计算这些帧之间的差异。然后,它“生成”一个介于两者之间的帧,根据渲染的两个帧之间的差异猜测间隙帧的外观。

并且DLSS 4使用帧插值。已经有一些关于生成帧的新技术的早期研究,特别是英特尔关于帧外推的研究,但该技术仍处于早期阶段。有一些细节我还不能透露,但我已经通过多个来源确认了 DLSS 4 实际上正在使用帧插值。这也是有道理的。这些类型的渲染工具不会凭空出现,而且在任何新的渲染技术变成像 DLSS 4 这样的可销售产品之前,几乎总是有很长的研究论文。
这并不影响 DLSS 4 的功能。它可能使用与 DLSS 3 相同的技术来创建新框架,但这不应分散您对 DLSS 4 实际功能的注意力。
延迟并不是您想象的问题

我理解为什么 Nvidia 不想对 DLSS 4 对帧插值的使用发表太多评论。这是因为帧插值会引入延迟。您需要渲染两帧,然后在显示的序列中的第一帧之前执行插值,因此在使用任何帧插值工具时,您基本上都会有轻微的延迟。我看到的假设是这些额外的帧会线性增加延迟,但事实并非如此。
The Verge 表示担忧,称希望“看看新的帧生成技术如何影响延迟”,而TechSpot 则宣称“用户担心多帧渲染可能会加剧[延迟]问题。”它是对 DLSS 4 可能吐出的倍增“假”帧的自然反击。如果生成一帧会导致延迟问题,那么生成三帧肯定会导致更大的延迟问题。但事实并非如此。
这就是为什么了解 DLSS 4 使用帧插值如此重要。 DLSS 3 生成一帧额外帧和 DLSS 4 生成三帧额外帧之间的延迟播放理念没有任何区别 — 该过程仍然涉及渲染两帧并比较它们之间的差异。在渲染的两帧之间插入一帧、两帧或三帧额外的延迟不会显着增加。无论中间有多少帧,帧插值过程增加的延迟基本相同。
让我举例说明这一点。假设您正在以每秒 60 帧 (fps) 的速度玩游戏。这意味着您看到的每一帧之间有 16.6 毫秒。使用 DLSS 3,您的帧速率将加倍至 120 fps,但您的延迟不会减半至 8.3 毫秒。游戏看起来更流畅,但每个渲染帧之间仍然有 16.6 毫秒的间隔。借助 DLSS 4,您将能够达到 240 fps,将帧速率提高四倍,但延迟不会降至 4.2 毫秒。仍然是同样的 16.6 毫秒。
这是对 PC 延迟的一个非常简化的观察 – DLSS 帧生成运行有开销,加上显示器和鼠标增加的延迟 – 但它有助于理解向帧添加更多帧时核心延迟不会线性增加插值过程。每个渲染帧之间的时间不会改变。您遇到的延迟很大程度上仍然是 DLSS 帧生成之前的基本帧速率以及该工具的开销造成的。
你不必只相信我的话。 Digital Foundry 测试了 DLSS 4,包括延迟,并发现了我刚才所描述的情况。 Digital Foundry 的 Richard Leadbetter写道:“在我看来,大部分额外延迟仍然来自于缓冲额外的帧,但添加更多中间帧会带来相对最小的延迟增加。”少量的额外延迟只是由于 DLSS 在已渲染的两个帧之间计算了更多帧,因此 DLSS 4 的大部分延迟增加与 DLSS 3 没有太大区别。
DLSS 4 的延迟问题与 DLSS 3 基本相同。如果您以较低的基本帧速率进行游戏,您所体验到的响应能力和所看到的流畅度之间就会出现脱节。对于 DLSS 4,这种脱节会更加严重,但这并不意味着延迟会因此大幅增加。这就是为什么 DLSS 4 不需要 Nvidia 令人印象深刻的新 Reflex 2;而是需要它。就像 DLSS 3 一样,开发人员只需实现 Reflex 的第一个版本即可让 DLSS 4 工作。
一个全新的模型

阐明 DLSS 4 的工作原理可能会让您相信它大致相同,但事实并非如此。 DLSS 4 与 DLSS 3 有很大不同,这是因为它使用了完全不同的 AI 模型。或者,我应该说,人工智能模型。 正如 Nvidia 详细介绍的那样,DLSS 4 在使用超分辨率、光线重建和多帧生成时,为每个渲染帧运行五个独立的 AI 模型,所有这些都需要在几毫秒内执行。
由于 DLSS 4 的要求,Nvidia 放弃了之前的卷积神经网络 (CNN),现在使用视觉变换器模型。变压器模型有两大变化。首先是“自我关注”。该模型可以跟踪多个帧上不同像素的重要性。以这种方式进行自我参照应该可以让新模型更多地关注有问题的区域,例如超分辨率下可能会显示闪烁的薄细节。
Transformer 模型也更具可扩展性,使得 Nvidia 能够向 DLSS 添加比之前的 CNN 方法更多的参数。据该公司称,新的变压器模型实际上具有双倍的参数。
正如您在上面的视频中看到的,Nvidia 声称与之前的 CNN 方法相比,这种新模型具有更好的稳定性和精细细节的保留。这些改进也并非 RTX 50 系列 GPU 独有。所有 RTX 显卡都将能够在 DLSS 4 游戏中利用新的 Transformer 模型,至少对于每一代都支持的功能而言是如此。
我已经多次看到 DLSS 4 的实际应用,但该功能的真正测试将在 Nvidia 的下一代 GPU 推出时进行。然后,我将能够评估该功能在多个游戏和场景中的工作情况,看看它的效果如何。无论如何,该功能有很多变化,根据 Nvidia 迄今为止分享的内容,这些变化可以使 DLSS 变得更好。