
我不会撒谎:Nvidia 在深度学习超级采样 (DLSS) 3方面做得很好,而且这种成功几乎不可能不对销售做出贡献。 DLSS 3 能够将中端 GPU 转变为功能更强大的东西,这是相当具有开创性的,如果有的话,这也是一个强有力的卖点。
接下来会发生什么? RTX 40 系列即将结束,很快,Nvidia 就会推出新的 GPU 来尝试和销售——可能没有世代独有的升级技术的额外激励。 DLSS 3 将是一个很难遵循的举动,如果有关即将推出的显卡的传言是真的,Nvidia 可能真的需要 DLSS 4 才能大受欢迎。
当 GPU 几乎不重要时

由于我们正处于新一代 GPU 的风口浪尖,因此可以安全地回顾 RTX 40 系列并评判它的本来面目:并非没有缺陷,但仍然巨大。
追随 RTX 30 系列的脚步,Nvidia 无需做太多事情即可销售新 GPU。毕竟,市场刚刚经历了严重的短缺。门槛设置得相当低——消费者希望 GPU 价格实惠、能胜任工作,并且可以轻松使用。假设这是许多游戏玩家的标准,那么英伟达成功实现了三分之二。 RTX 40 系列很容易获得,这一代的一些 GPU 确实令人印象深刻。然而,缺少的一点——这就是事情变得更棘手的地方。
Nvidia 推出了带有两款 GPU 的 RTX 40 系列,售价分别为 1,600 美元和 1,200 美元,奇怪的是,价格较高的显卡性价比更高。随后推出的 GPU 并不都那么出色,性价比也低于您对新一代 GPU 的预期。一些卡,例如RTX 4060 Ti ,最终提供了与上一代同类卡几乎相同的性能。这不是您希望在下一代产品中看到的。
但无论具体的卡是什么,Nvidia 在这一代中都有一个重大优势:DLSS 3。
我们有大量示例来说明 DLSS 3 如何为入门级到中端显卡带来变革。在支持它的游戏中,DLSS 3 提供的性能远远超出您对某些卡的预期。

我们以RTX 4070 Super为例。当我们尝试在启用光线追踪的情况下以 4K 运行《赛博朋克 2077》时,GPU 理所当然地陷入困境,每秒只有区区 19 帧 (fps)。打开 DLSS 3,它会突然以 77 fps 的流畅速度运行。要在没有 DLSS 的情况下以 4K 舒适地运行该游戏,您需要更昂贵的 GPU。贵一倍。
Nvidia 通过 DLSS 为自己带来了一项很好的技术,而且它很聪明。它将其锁定在付费墙后面,通过使其仅在单代 GPU 上可用来结束所有付费墙。尽管 DLSS 的上一版本可供所有 RTX 卡所有者使用,但 DLSS 3 是 RTX 40 系列独有的。这对升级有什么激励作用?
鉴于 DLSS 2 与 DLSS 2 相去甚远,DLSS 3 不可能不足以吸引一些买家购买最新一代的显卡,或者根本就购买 Nvidia。就我个人而言,当我权衡 RTX 4080 和 AMD RX 7900 XTX 之间的差异时,DLSS 3 在我决定坚持使用 Nvidia 的过程中发挥了重要作用。
一些 RTX 40 系列卡非常出色。有些只是 DLSS 3 的容器,并且由于 Nvidia 帧生成的强大功能,它们仍然可以销售。 DLSS 3 使得显卡本身的重要性大大降低,Nvidia 可能不得不在RTX 50 系列上重复这一点。
严峻的猜测

尽管有传言称 RTX 50 系列将于今年晚些时候推出,但我们仍然对它知之甚少,这并非基于猜测。事实上,除了这一代被称为 Blackwell 之外,我不确定 Nvidia 是否真的确认过任何事情。因此,我们求助于泄密者,向我们提供可能真实也可能不真实的信息,但这并不都是好事。
关于 RTX 50 系列最令人垂涎的泄密都是关于规格,因为现在希望了解定价还为时过早。为此,最近的泄露来自 kopite7kimi, 《摩尔定律已死》也加入了他自己的一些猜测。
泄密者通过显示图形处理集群 (GPC) 数量乘以纹理处理集群 (TPC) 的方式,揭示了传闻中的每个 GPU 的流式多处理器 (SM) 数量,范围从高端 GB202 到入门级 GB207。将这个数字加倍就得到了 SM 的总数。反过来,这告诉我们每个 GPU 有多少个 CUDA 核心,这是一个很好的指标,表明它与前代产品相比如何。
撇开计算不谈,我们在 RTX 50 系列中可能看到的东西似乎是 RTX 40 系列的重复。顶级 GPU GB202 应该会带来全面的大幅提升,据称 SM 数为 192 个(AD102 中为 142 个 SM),即 SM 数提高了 33%。再看看 GB203,据报道该 GB203 已大幅削减并可能出现在 RTX 5080 中,但仅提高了 5%。
GB205 GPU 才是真正危险的地方。这不仅仅是没有 SM 提升,实际上与 AD104 相比(这一代没有 GB204)降低了 17%,从 60 个 SM 减少到 50 个。接下来,据说 GB206 具有完全相同的 SM 数量,而 GB207 SM 再次减少 17%:从 24 个减少到 20 个。
如果这一点得到证实,那么除了 RTX 5090 之外,我们正在研究全面的细微改进。即便如此,也不清楚显卡将实际使用多少芯片; RTX 4090 没有充分利用 AD102 芯片的全部功能,因此最终产品中的 SM 数量可能会更少。
GB202 12*8 512位GDDR7
GB203 7*6 256位GDDR7
GB205 5*5 192位GDDR7
GB206 3*6 128位GDDR7
GB207 2*5 128位GDDR6— kopite7kimi (@kopite7kimi) 2024 年 6 月 11 日
当然,新一代的好处不仅仅是计算能力的提高。摩尔定律已死推测 GB203 芯片 (RTX 5080) 的时钟速度应提高高达 10%,每锁指令 (IPC) 更好,并且带宽大幅增加。后者源于 Nvidia 据说正在转向更快的 GDDR7 内存,因此仅此一项就应该有很大帮助。
这些预测都比较乐观。 YouTuber 估计 RTX 5090 以下的每个级别都有 15-30% 的提升,对于旗舰产品,我们可能会看到高达 60% 的提升。不过,这仍然低于 RTX 3090 与 RTX 4090 的差距,而且 15% 的提升可能不足以吸引新买家。这取决于价格,尽管 Nvidia 似乎已经从RTX 40 Super 卡中吸取了教训,但我并不认为 RTX 50 系列会便宜。
如果预测成真,我们将获得新的 GPU,游戏性能不会有太大提升,但价格会上涨,Nvidia 将需要另一个卖点。它需要 DLSS 4,而且需要出色。
我们对 DLSS 4 有何期待?

与 RTX 50 系列非常相似,Nvidia 的下一代 AI 升级技术充满了神秘感。我们知道这很可能会发生,但会是今年吗?它会带来什么?我们不得不再次诉诸猜测,但这一次,它是由英伟达首席执行官黄仁勋本人推动的。
在 Computex 后的问答中(由More Than Moore分享),黄仁勋谈到了人工智能在游戏中的应用。我们都知道 Nvidia 热爱人工智能,随着G-Assist等技术的出现,我们只会在未来的游戏中看到更多的人工智能。
“将来,我们甚至会生成纹理和物体,物体的质量可以较低,我们可以让它们看起来更好。我们还将在游戏中生成角色——想象一组六个人,其中两个可能是真实的,其他的可能是长期使用的人工智能,”黄说。
在他的回应中,人工智能的大量使用仍在继续。他补充道:“游戏将用人工智能制作,它们内部将有人工智能,甚至可以使用 G-Assist 让 PC 变成人工智能。你可以把PC当作AI助手来帮助你玩游戏。”
黄的回答没有提到 DLSS,但它是对有关 DLSS 和 Nvidia ACE 的问题的回答。但这些功能最终会出现在 DLSS 4 中吗?它们只能在 DLSS 5 之前完全实现吗?他们会完全变成别的东西吗?现在下结论还为时过早,但很明显,英伟达希望让人工智能成为游戏体验的基础。
生成游戏内资产而不仅仅是帧可能听起来不像可以提高性能的东西,但它非常可以。这会将部分工作从 CUDA 核心转移到张量核心,后者用于处理人工智能和机器学习工作负载。因此,GPU 应该有更多的可用资源来专注于性能,而张量核心则处理人工智能方面的事情。
资产生成是我们从 DLSS 3 中了解到的帧生成的又一个进步。Nvidia 希望生成的不仅是游戏内资产,还有 NPC,大概由 Nvidia ACE 提供支持,使它们栩栩如生。如果这些东西中的一半能够进入 DLSS 4,那么 Nvidia 就可能拥有一颗真正的宝石,而且它已经越来越接近了。事实上,DLSS 3 现在是DLSS 3.7 ; 3.5版本为我们带来了光线重建,而3.7版本则提供了更多的小升级。
向后兼容?可能不会

我们假设 DLSS 4 很快就会推出——年内(这只是基于它将与 RTX 50 系列一起推出的假设,所以不要引用我的话)。我们还假设它会很出色。那么 DLSS 4 会向后兼容 RTX 40 系列吗?这是我不愿意押注的一个延伸。抛开所有硬件考虑因素不谈,我很难相信 Nvidia 可能会错过在 DLSS 4 上市后充分发挥其所有潜力的机会。
AMD 的做法与 Nvidia 不同。尽管 FSR 3.0 的采用速度非常缓慢,但其升级技术可在所有供应商的 GPU 上使用。与此同时,DLSS 3 正在缓慢但坚定地进入越来越多的游戏中。 DLSS 4 可能会重置计数器并从一张白纸开始,在变得更广泛之前出现在选定的游戏中。
无论如何,为了给大众留下深刻的印象,Nvidia 在这一点上可能需要采取大胆的举措——当有其他可用的选择时,游戏逐代提升 15% 并不会减少它。它应该在中端市场与AMD 的 RDNA 4展开激烈竞争,因此像 RTX 5070 这样的显卡可以利用额外的帮助来证明其价格合理。
如果 DLSS 4 按时到来,如果它成为 RTX 50 独有的,我不会感到惊讶,在幕后努力将“meh”GPU 变成相当出色的东西。我们得拭目以待。