英伟达已经生产了一些最好的显卡,但它也没有满足于现状。经过更新换代的RTX 40 系列现已推出近两年了,Nvidia 正在努力开发下一代 GPU。
距离 RTX 50 系列 GPU 的发布日期至少还有几个月的时间,但各种谣言和泄密事件让我们更好地了解了接下来会发生什么。以下是我们对 Nvidia 下一代显卡的了解。
RTX 50 系列:定价和发布日期
我们还没有从 Nvidia 那里听到有关发布日期的任何具体信息,但大多数估计将 Blackwell 的发布时间定在 2024 年底和 2025 年初。在这一点上,我们最早可以发布的可能性越来越大。希望是 2025 年 1 月。一些非常试探性的传言甚至提到可能会在 2026 年更新 RTX 50,但那是遥远的未来,无需太在意。
关于 RTX 50 系列发布日期的最新消息一致认为,我们可能要到CES 2025 之后才能看到任何 GPU。该信息最初来自可靠消息来源 kopite7kimi,随后又被其他几位泄密者重复。现在,我们已经从 Nvidia 本身得到了几乎切实的证据,因为 Nvidia 的首席执行官黄仁勋将在 CES 2025 上发表主题演讲,为这一理论提供了很多依据。
当然,2025 年并不总是人们所期望的,因为年初的泄密者都表示我们将在 2024 年下半年看到 RTX 50 系列。尽管现在大多数消息来源都认为这不太可能发生,但新的泄漏仍然暗示 RTX 5090 和 RTX 5080 可能会在今年上市。这是近几个月来我们听到的众多秘密报道之一。
据台湾财经新闻出版物UDN报道,据说 Nvidia 还将削减 RTX 40 系列卡的产量多达 50%。一些 GPU(例如 RTX 4080)现在越来越难获得,价格也开始上涨。这两件事都意味着下一代可能还没有到来,但它即将到来。
到目前为止,我们看到的大部分泄露信息都集中在旗舰 RTX 5090 和 RTX 5080 以及它们可能的发布日期上。现在,Board Channels 预测 RTX 5090 和 RTX 5080 将于 2025 年 1 月推出——这与其他泄密事件相吻合。但该消息人士还声称,我们将在 2025 年 2 月看到RTX 5070 和 RTX 5070 Ti 以创纪录的速度推出,然后是 RTX 5060 和 RTX 5060 Ti。这比我们在 RTX 40 系列中看到的发布时间表要快得多。
尽管如此,英伟达的实际发布节奏目前还是一个谜。 kopite7kimi 的另一份报告暗示RTX 5080 将首先推出,这标志着英伟达回归了之前先发布 xx80 卡、后发布 xx90 卡的策略。与此同时,《摩尔定律已失效》表示,RTX 5060 可能要过一段时间才会推出,以便 Nvidia 可以为其配备更多 VRAM。事实又是怎样呢?只有英伟达可以肯定地说。
目前这些 GPU 的定价纯粹是猜测。在这一代,英伟达采取了只能用“贵”来形容的定价策略。它可能会沿着这条路走下去,并推高价格,特别是如果对人工智能 GPU 的需求仍然像现在一样高的话。毕竟,当前的需求将 RTX 4090 推高至 2,000 美元以上,尽管它的上市价格已经非常高了,高达 1,600 美元。这固然让 RTX 5090 的前景令人担忧,但 Nvidia 对 RTX 40 系列超刷新的降价却给了很多发烧友一些希望。
摩尔定律已死最近表示,Nvidia 董事会合作伙伴目前预计 RTX 5090 的价格在 2,000 至 2,500 美元之间,其次是 RTX 5080,价格为 1,200 至 1,500 美元,RTX 5070 价格为 600 至 700 美元。希望这些价格不会是真的。就我个人而言,我认为 Nvidia 的 RTX 5090 价格不会超过 2,000 美元,但时间会证明一切。
RTX 50 系列:规格
Nvidia RTX 50 系列 | |
流程节点 | 台积电 3nm 或台积电 5nm (N4P) |
建筑学 | 布莱克威尔 |
芯片 | GB202、GB203、GB205、GB206、GB207 |
内存类型 | GDDR7 |
最大总线宽度 | 384 位/448 位/512 位 |
显示器连接器 | 显示端口 2.1、HDMI 2.1 |
由于 RTX 50 系列 GPU 的发布还有一段时间,Nvidia 尚未确认任何卡的任何规格。事实上,我们甚至不确定会推出哪些型号。然而,将各种硬件泄密者的猜测拼凑在一起,让我们对可以期待的事情有了一些了解。请记住,在 Nvidia 自己透露秘密之前,请以适当的怀疑态度对待以下内容。
工艺节点和芯片
台积电3
— kopite7kimi (@kopite7kimi) 2023 年 11 月 15 日
我们知道阿达·洛夫莱斯的后续产品将被称为布莱克威尔,以纪念美国数学家大卫·布莱克威尔。有传言称它将由台积电基于 3nm 工艺制造,但目前尚不清楚 Nvidia 是否会使用台积电现有的 3nm 节点之一或定制节点。
Blackwell B200 GPU 的发布打破了 3nm 传闻。 B200 专为高性能计算 (HPC) 和数据中心用例而设计,基于 TSMC 4NP(4nm Nvidia Performance)节点构建。如果 B200 使用 4NP 节点,很容易想象消费产品系列也可能会这样做。然而,这并不是一个既定的情况——Nvidia 可能会在其 RTX 50 系列中使用 3nm 节点。
据说该阵容包括从高端RTX 4090等效 GB202 到 GB203、GB205、GB206 和入门级 GB207 的芯片。如果被证明属实,这将是一个有趣的、也许令人担忧的变化。这意味着为RTX 4070提供动力的 AD104 GPU 在下一代将没有继任者。因此,RTX 5070 和 RTX 5070 Ti 可能会使用 GB205 芯片。
关于 RTX 50 系列最热门的信息来源之一是 X(以前称为 Twitter)上的 kopite7kimi。泄密者透露,我们预计新的 GPU 将支持 DisplayPort 2.1(Lovelace 系列不提供)以及 HDMI 2.1。
内存接口
我想我的坚持是正确的。所以区别在于GB202是512位,AD102是384位。
— kopite7kimi (@kopite7kimi) 2024 年 3 月 11 日
Kopite 的最新更新谈到了 Blackwell 的内存接口。泄密者现在表示旗舰卡确实将拥有 512 位内存总线,尽管他们之前声明它将坚持 384 位。与此同时, Chiphell 论坛上的一位用户声称 RTX 5080 将拥有 448 位内存总线。现在,我们仅为旗舰产品提供了三个而不是两个估计的总线宽度。
Blackwell 的最大总线宽度一直是热门泄密者中一个非常有争议的话题,因此很难知道真相是什么。然而,他们都同意的一件事是 Nvidia 将使用新的 GDDR7 内存标准,据说 AMD 不会在即将推出的RDNA 4系列中使用该标准。
泄密者还更新了对 RTX 50 系列中 GDDR7 内存模块速度的预期。尽管之前有传言称我们可能会立即看到 32Gb/s 模块,但 kopite7kimi表示Nvidia 将在这一代中使用 28Gb/s。这仍然标志着对 Ada 的坚实升级,在传闻中的 RTX 5090 上提供高达 1.8TB/s 的内存带宽——假设 512 位内存总线检查正常。
然而,与大多数有关 RTX 50 系列的泄密事件一样,人们对上述理论存在一些分歧。事实上,最近的一份报告称,将会有一款 GPU 从一开始就配备 32Gb/s 内存模块,而且它甚至不会是 RTX 5090。根据 Wccftech 援引其自己的消息来源称, RTX 5080将接收 32Gbps 内存,从而达到超过 1TB/s 的带宽。据说 RTX 5090 目前会坚持 28Gb/s,但它将拥有更多的 VRAM 和更宽的内存总线。
无论总线宽度如何,我们都知道 GDDR7 将是一次升级。内存制造商美光最近分享了其新型 VRAM 的一些性能数据,声称其在游戏场景中的性能将提升高达 30%,包括纯光栅化和光线追踪。 GDDR7 内存起始速度为 28Gb/s,系统带宽可能超过 1.5TB/s。
GPU 中的 VRAM 数量最近一直是一个热门话题,为此,RedGamingTech 推测我们可能会在 RTX 5090 中看到高达 36GB 的内存。但是,这些数字尚未最终确定,因此我们最终可能会看到与 RTX 4090 一样,配备 24GB。
传闻规格
图形处理器 | 流式多处理器 (SM) | CUDA 核心 | 内存接口 | 内存带宽 | |
RTX 5090 | 国标202 | 192 | 24,576 | GDDR7 28GB 448 位 | 1.5TB/秒 |
RTX 5080 | 国标203 | 84 | 10,752 | GDDR7 16GB 256 位 | 896GB/秒 – 1TB/秒 |
RTX 5070 | 国标205 | 50 | 6,400 | GDDR7 12GB(?)192 位 | 672GB/秒 |
RTX 5060 | 国标206 | 36 | 4,608 | GDDR7 8GB(?)128 位 | 448GB/秒 |
RTX 5050(?) | 国标207 | 20 | 2,560 人 | GDDR7 8GB(?)128 位 | ? |
那么,RTX 50系列的实际规格到底如何呢?您在上表中看到的内容通常被称为谣言规格,但这就是我们正在处理的内容 – 谣言。请以适当的怀疑态度对待以下所有内容。
与通常的情况一样,kopite7kimi 一直是有关 RTX 50 系列规格主题的良好情报来源。泄密者分享了每个 GPU 的(可疑)流式多处理器 (SM) 数量。这就是为什么我们认为 RTX 5090 可能有 192 个 SM,与 RTX 4090 相比,这标志着令人印象深刻的 33% 的提升;与此同时,RTX 5080 只会享受 5% 的提升,而 RTX 5070 实际上可能比其前身具有更少的 SM。然而,现在恐慌还为时过早。
一方面,我们不知道这些规格是否真实。即使是,Kopite 分享的实际上是 GPU 中 SM 的数量,这并不一定意味着 Nvidia 会在显卡中使用所有 SM。事实上, RTX 4090并没有充分利用 AD102 芯片的全部功能,GB202 也可能是这种情况。 YouTuber Graphically Challenged为这些 SM 期望提供了一些有关大多数 GPU 的带宽和 VRAM 数量的信息。
GB202 12*8 512位GDDR7
GB203 7*6 256位GDDR7
GB205 5*5 192位GDDR7
GB206 3*6 128位GDDR7
GB207 2*5 128位GDDR6— kopite7kimi (@kopite7kimi) 2024 年 6 月 11 日
抛开所有谨慎的怀疑论不谈,至少其中一些谣言可能会得到证实,因为它们已经从多个来源流传了一段时间。 YouTuber RedGamingTech此前也表示,这款旗舰芯片可能配备 192 个流媒体多处理器 (SM)。不过,RedGamingTech 还预测 GB203(RTX 5080)将有 108 个 SM,这仍然比 kopite7kimi 现在声称的现实要好。无论如何,我们看到 RTX 5080 和 RTX 5090 之间存在巨大的性能差距。
kopite7kimi 分享的更多猜测证实了这一点。根据泄密者的说法,GB203 芯片将是“GB202 的一半”,这标志着我们在 RTX 4090 与 RTX 4080 中看到的性能下降类似。值得注意的是,RedGamingTech 与 kopite7kimi 不同,它认为我们“最大总线宽度为 384 位,这会影响性能数据。
我认为GB203是GB202的一半,就像GB102和GB100一样。但不知道GB202是否有多芯片封装。
— kopite7kimi (@kopite7kimi) 2024 年 3 月 11 日
如果 RTX 5090 真的像看起来那样凶猛,很多人都会期待它是一张庞然大物,但有传言称RTX 5090 只会在 Founders Edition 中采用双插槽设计。与当前一代相比,这将是一个令人震惊的变化,RTX 4090 最多可以占用四个插槽。
我们甚至听说过有关称为Titan AI的 GPU 的传言。就像 Lovelace 一代一样,Nvidia 最终没有使用整个 AD102 芯片——RTX 4090 有更多可用的功能,但它从未被使用过——并且 Nvidia 可能会对 GB202 芯片做类似的事情。因此,RTX 5090 据称是 GB202 GPU 的精简版,比 RTX 4090 性能提升 48%。同时,Titan AI 显卡可能会解锁 GB202 芯片所提供的所有功能,即将推出性能提升 63%。
现在了解任何单张卡的具体细节还为时过早,所有这些都可能会发生变化。 Nvidia 很可能会发布从 RTX 5060 到 RTX 5090 的型号,并添加一些 Ti 选项,甚至可能是传闻中的 Titan AI 显卡。我们希望它能够保持规格平衡,为发烧友和入门级用户提供广泛的卡;否则, DLSS 4 可能会成为这一代人的救星。
RTX 50 系列:笔记本电脑
如果说 RTX 50 系列的桌面版本是一个谜,那么笔记本电脑版本则更加陷入阴影,泄密者几乎没有分享任何有关它们的信息。不过,笔记本电脑游戏玩家可以高兴了,因为我们最近得到了一些有关笔记本电脑 RTX 50 系列的重大消息。最棒的是,这不是又一个投机谣言,而是台湾笔记本电脑制造商蓝天的真实泄密。
不幸的是,该公司最近遭受勒索软件攻击,导致一些机密幻灯片在网上共享。根据幻灯片,Nvidia 将推出六款移动 GPU,但它们都将在 2025 年之前推出。这也意味着 Nvidia 不会淘汰其旧的低端 GPU。 RTX 4050、RTX 3050 甚至 RTX 2050 将继续出现在笔记本电脑中。
RTX 50 系列显卡在幻灯片中给出了代号,但很容易找出哪个是哪个,因为它们与 40 系列对应产品进行了比较。看来笔记本电脑版本的 RTX 5080 可能会获得急需的内存升级,现在配备了与 RTX 5090 相同的 16GB GDDR7 内存。据说这两张卡还共享相同的 GB203 GPU ,从而使 GB202 芯片缺席目前从笔记本电脑。
这些精美的新型笔记本电脑到底什么时候上市?这可能需要一段时间,因为摩尔定律已死声称Nvidia 目前正在调整 RTX 5080 和 RTX 5070/Ti 的移动版本。 RedGamingTech的一则轶事指出,GB207(意味着该系列中性能最低的芯片)可能首先只会出现在笔记本电脑中。这与我们在 RTX 40 系列中看到的情况相符,其中 RTX 4050 迄今为止仅出现在笔记本电脑中。
《摩尔定律已死》为我们提供了有关 Nvidia 笔记本电脑 GPU 中 VRAM 的最新更新,如果事实证明这是真的,这将是个好消息。 RTX 5090 的笔记本电脑版本可能会比预期晚到货,但据说由于更换了较新的 3GB GDDR7 内存模块而不是 2GB,因此它具有更多的 VRAM 。据称,笔记本电脑版本的 GPU 内存容量从 16GB 增加到 24GB。据说该系列的其余产品将使用 2GB 模块。
RTX 50 系列:架构
Nvidia 正在对 Blackwell 芯片中使用的架构保密,但这种状态不会持续太久。距离 GPU 发布还有几个月的时间,随着发布日期的临近,我们将了解更多信息。目前,Nvidia 谈论了其数据中心 Blackwell GPU 的架构,这可能并不能很好地表明消费产品阵容中可能发生的情况 – 但仍然有一些有趣的花絮。
第一个好奇的部分是Blackwell的企业版是基于台积电的4NP节点构建的,这实际上是5nm工艺。之前有传言称 RTX 50 系列可能采用 3nm 工艺,但鉴于最近的公告,现在看来可能性很小。此外,B200 GPU还配备了专用的解压引擎。虽然尚不清楚这是否会应用于消费级 GPU,但它可能会给显卡带来重大提升。
尽管英伟达讨论了与企业相关的 Blackwell 架构,但它对其消费者阵容保持沉默。因此,我们所得到的只是来自各种来源的更多猜测,但信息往往有些相互矛盾。
RedGamingTech 在最近的视频中详细讨论了 Blackwell 架构。 YouTuber 将其称为“最具影响力的图形架构之一”,并预测 RTX 50 系列将对路径追踪和光线追踪等功能进行重大改进,为发烧友级和中端卡带来收益。
为此,YouTuber 表示我们可能会看到重大的架构变化,包括 Nvidia SM 的重大重新设计。他还提到了添加降噪加速器,无论是作为芯片的一部分还是作为 Nvidia Tensor 核心的功能。更重要的是,RedGamingTech 最初戏称 Nvidia 可能会使用多芯片模块(MCM)设计。这意味着采用一种设计方法,将多个较小的芯片封装在一起,形成一个更大、更强大的处理器。转向 MCM 设计而不是单片设计可以为 Nvidia 带来主要优势,包括可扩展性、更高的良率和更大的设计灵活性。
不幸的是,同一 YouTuber 最近的更新显示 Nvidia 不会在 Blackwell 中使用 MCM 设计。据报道,Nvidia 最初计划使用粘合在一起的双 GB202 芯片,可能会切割一些 SM,但最终决定不这样做。这位 YouTuber 表示,高价格、两个芯片之间的延迟以及工作中的各种困难等问题使得 Nvidia 坚持使用以前的架构。
请以适当的怀疑态度对待这一点。 Nvidia 可能计划在未来转向 MCM,但这种架构变化从来不会在最后一刻进行,因此 Blackwell 的计划可能从未存在过。然而,Nvidia 也有可能会引入架构变化,而不是推动最高性能,以使新技术成熟,然后在几年后提升 RTX 6000 系列显卡的性能。
B200 数据中心 GPU 再次表明了我们的期待。 Nvidia 重新设计了该显卡中的 Tensor 核心。因此,它们现在原生支持用于 AI 推理的 FP4 和 FP6 数字格式。我们可能也会在消费级 GPU 中看到这种情况发生,但这只是目前的猜测。
RTX 50 系列:性能
由于RTX 50系列显卡的规格仍然是个谜,因此很难对其性能做出准确的预测。然而,许多人已经尝试过,这就是为什么我们在等待官方基准测试时有一些有趣的谣言可供挖掘。
根据摩尔定律已死,艾达和布莱克威尔之间的性能提升可能并不大。 YouTuber 的消息来源提到,“Blackwell 对 Ada 的光栅化提升不会像从 Ampere 到 Ada 那样令人印象深刻。”不过,该消息人士还表示,“如果感到受到威胁”,Nvidia 可能会让 RTX 5090 感觉类似的提升。这似乎不太可能,因为据报道AMD将不再生产下一代高端GPU ,英伟达可能成为未来几年高端显卡的唯一来源。
基于上述情况,我们可能会看到旗舰产品的性能提升大约 30% 到 50%。中端和入门级显卡的性能逐代提升通常较小,因此这些可能更不令人印象深刻。
然而,另一方面,来自 RedGamingTech 等来源的猜测。这位 YouTuber 在他的视频中声称,我们看到 Lovelace 和 Blackwell 之间的性能提升高达 2 倍。他提到,与 RTX 40 系列相比,RTX 50 系列的光线追踪性能应提高一倍,并提供高达 2 倍的性能提升。不过,RedGamingTech 不确定这是否意味着光栅化,因此很难知道衡量这些增益的指标。不过,他确实预测时钟速度将达到 3GHz 以上,这将比 Ada 有相当大的提升,但他也表示这仅适用于超频型号。
在后来的视频中, RedGamingTech 补充说,我们可能会看到从一款旗舰产品到下一款旗舰产品的性能提升高达 60%。随后他澄清说,我们预计会看到以下性能提升,但对此应该持怀疑态度:
- RTX 4090 到 RTX Titan AI:速度提高 63%
- RTX 4090 到 RTX 5090:速度提高 48%
- RTX 4080 Super 到 RTX 5080:快 29%
- RTX 4070 Super 到 RTX 5070:快 26%
这位 YouTuber 还强调,Nvidia 的重点主要放在光线追踪和路径追踪上,这些工作负载提高了 2.5 倍。再次,请以怀疑的态度对待所有这些信息。
我们目前掌握的唯一真实的性能数据提示来自 Nvidia 制作的一张幻灯片,但不幸的是,该幻灯片谈论的是其在数据中心使用的下一代高性能计算 (HPC) 显卡。该图测量了 GPT-3 175B 推理中的 GPU 性能,显示 H200 GPU 的速度将比 A100 快 18 倍,但这还不是 Blackwell 架构。 B100 是榜单上第一款 Blackwell 显卡,提供了显着更高的性能,尽管 Nvidia 没有给出具体数字。它看起来大约是 H200 的两倍。
虽然这对于那些需要 HPC GPU 的人来说是令人兴奋的,但游戏玩家和其他消费者需要等待才能了解 RTX 50 系列 GPU 功能的实际情况。
RTX 50 系列:功耗
在 RTX 40 系列发布之前,旗舰产品 RTX 4090 曾是很多谣言的主题,其功耗更是一个特别热门的话题。一些消息人士称,GPU 的功耗确实非常惊人,甚至高达 900 瓦。我们现在知道这些说法是错误的,因为 RTX 4090 的功耗为 450 瓦,其连接器支持高达 600 瓦的功率,但偶尔会熔化。很难想象 Nvidia 会在下一代 GPU 中将这些数字推得更高。
不过,RTX 50 系列无法避免一些与功耗相关的争议。摩尔定律已死最近透露,英伟达计划使用一种全新的连接器,这将标志着短短三年内第四次发生此类变化。 YouTuber 援引匿名消息人士的话说,Nvidia 正在改用 16 针连接器,全部专用于 12V 电力传输。然而,许多其他消息来源指出这不太可能。
Hardware Busters联系了自己的消息来源并确认“没有人知道有新的连接器”。 Nvidia 必须与主要 PSU 品牌合作,尤其是在 12VHPWR 连接器出现问题之后。如果这些品牌对此一无所知,那么英伟达可能还不会在这一代中做出这些改变。
事实上,Nvidia 可能会加倍选择使用 12VHPWR 连接器。据TechRadar报道,Nvidia 可能会将 12VHPWR 连接器作为整个 RTX 50 系列堆栈中每个 GPU 的必备配置,甚至是入门级 RTX 5060。据说这也适用于 Nvidia 主板合作伙伴制造的卡。
假设 Nvidia 坚持使用目前使用的(有些争议的)12VHPWR 连接器,最大功耗将保持在 600W。如果旗舰 RTX 5090 提供显着更高的性能,功耗可能会继续增加,但它仍然需要为潜在的超频留出一些空间,因此最大 500W 似乎是合理的。然而,新的消息来源仍然认为我们将在 RTX 5090 上看到 600W TGP 。
对于该系列的其余产品,Nvidia 可能会尝试保持更加保守,而不是推动更高的功耗。正如NotebookCheck指出的那样,Nvidia 目前增加主板总功耗 (TBP) 的趋势仍然相当新,尤其是在RTX 4080这样的卡上。从历史上看,xx80 卡的功耗远低于 300W,甚至有时会低于 200W。在过去几代中,RTX 3080 和 RTX 4080 都将 TBP 推向了新的高度,每台都需要高达 320W 的功率。
由于功耗如此之高,对于 Nvidia 来说继续推动更高的瓦数没有多大意义,特别是考虑到 AMD 可能会在 RDNA 4 中保持更加保守。如果 Nvidia 稍微调低一点,我们可能会看到 TBP 约为 250W 至 280W 的 RTX 5080。然而,如果 Nvidia 坚持其当前的方案,如果最新的泄露消息可信的话,它可能会走向另一个方向,达到 350W ……或更高。