英伟达已经生产了一些最好的显卡,但它也没有满足于现状。尽管经过更新支持的RTX 40 系列仍然是最近推出的,但 Nvidia 也在开发 RTX 50 系列的下一代 GPU。
距离 RTX 50 系列 GPU 的发布日期至少还有几个月的时间,但各种谣言和泄密事件让我们更好地了解了接下来会发生什么。以下是我们对 Nvidia 下一代显卡的了解。
RTX 50 系列:定价和发布日期
我们尚未从 Nvidia 听到有关发布日期的任何具体信息,但大多数估计将 Blackwell 的发布时间定在 2024 年底和 2025 年初。一些非常试探性的传言甚至提到可能会在 2026 年更新 RTX 50,但那是太遥远的未来了,不用太在意。
关于 RTX 50 系列发布日期的最新消息是,我们可能要到CES 2025 之后才能看到任何 GPU。此信息来自 kopite7kimi,他通常是可靠来源,但目前这仍然只是谣言。这是近几个月来我们听到的众多秘密报道之一。
据台湾财经新闻出版物UDN报道,据说 Nvidia 还将削减 RTX 40 系列卡的产量多达 50%。如果这是真的,这肯定表明 RTX 50 卡可能即将到来,但是,我们听到了许多与该理论相矛盾的谣言。
根据早期传言,Nvidia 应该要到 2025 年才能准备好推出新显卡,所以这种情况是这样的。这将给 AMD 带来重大优势,因为有传言称 AMD 将在今年晚些时候推出RDNA 4 GPU——尽管可能会有所延迟。然而,根据YouTuber和经常泄密者摩尔定律已死的说法,Nvidia可能不会给AMD如此急需的喘息空间。
摩尔定律已死在最近的一段视频中表示,Nvidia 的一位消息人士告诉他,“Blackwell 正准备在 2024 年第四季度推出”,但前提是 Nvidia 希望这样做。这取决于AMD 的 RDNA 4 卡是否具有足够的竞争力,能够在今年年底的假期期间夺走 Nvidia 的销量,以及 Ada (RTX 40) 在那段时间的销售情况。然而,最新的报告称AMD 可能要到 2025 年第一季度才会推出 RDNA 4 ,所以很难知道该相信什么。
不管怎样,据说 Nvidia 正计划“在 CES 2025 上大力宣传 RTX 5000 的效率”。据报道,这意味着 GPU 将于 2024 年底或 2025 年初推出,但UDN 的一份新报告告诉我们,我们可能会看到 Blackwell 的推出策略与 Ada 的推出策略类似。
报道称,Nvidia 准备在 2024 年最后一个季度首先推出 RTX 5090 ,几周后推出 RTX 5080。这反映了 RTX 40 系列的做法,即 RTX 4090 首先上架,RTX 4080 紧随其后。更经济实惠的显卡直到明年初才推出,这一次也可能会发生这种情况。
尽管如此,英伟达的发布节奏目前还是一个谜。 kopite7kimi 的另一份报告暗示RTX 5080 将首先推出,这标志着英伟达回归了之前先发布 xx80 卡、后发布 xx90 卡的策略。与此同时,《摩尔定律已死》表示,RTX 5060 可能要过一段时间才会推出,届时 Nvidia 可以为其配备更多 VRAM。事实又是怎样呢?只有英伟达可以肯定地说。
这不是真的。 RTX 5080应该会先发布。
— kopite7kimi (@kopite7kimi) 2024 年 5 月 7 日
目前这些 GPU 的定价纯粹是猜测。在这一代,英伟达采取了只能用“贵”来形容的定价策略。它可能会沿着这条路走下去,并推高价格,特别是如果对人工智能 GPU 的需求仍然像现在一样高的话。毕竟,当前的需求将 RTX 4090 推高至 2,000 美元以上,尽管它的上市价格已经非常高了,高达 1,600 美元。这固然让 RTX 5090 的前景令人担忧,但 Nvidia 对 RTX 40 系列超刷新的降价却给了很多发烧友一些希望。
假设旗舰 5090 的价格接近 1,800 至 2,000 美元,不幸的是,该系列的其他产品可能会随之全面涨价。然而,对于英伟达来说,要想继续对抗AMD,价格不可能永远持续上涨。人们希望英伟达能够意识到这一点,并保持下一代产品的定价更加合理,但现在下结论还为时过早。
RTX 50 系列:规格
Nvidia RTX 50 系列 | |
流程节点 | 台积电 3nm 或台积电 5nm (N4P) |
建筑学 | 布莱克威尔 |
芯片 | GB202、GB203、GB205、GB206、GB207 |
内存类型 | GDDR7 |
最大总线宽度 | 384 位/448 位/512 位 |
显示器连接器 | 显示端口 2.1、HDMI 2.1 |
由于 RTX 50 系列 GPU 的发布还有一段时间,Nvidia 尚未确认任何卡的任何规格。事实上,我们甚至不确定会推出哪些型号。然而,将各种硬件泄密者的猜测拼凑在一起,让我们对可以期待的事情有了一些了解。请记住,在 Nvidia 自己透露秘密之前,请以适当的怀疑态度对待以下内容。
工艺节点和芯片
台积电3
— kopite7kimi (@kopite7kimi) 2023 年 11 月 15 日
我们知道阿达·洛夫莱斯的后续产品将被称为布莱克威尔,以纪念美国数学家大卫·布莱克威尔。有传言称它将由台积电基于 3nm 工艺制造,但目前尚不清楚 Nvidia 是否会使用台积电现有的 3nm 节点之一或定制节点。
Blackwell B200 GPU 的发布打破了 3nm 传闻。 B200 专为高性能计算 (HPC) 和数据中心用例而设计,基于 TSMC 4NP(4nm Nvidia Performance)节点构建。如果 B200 使用 4NP 节点,很容易想象消费产品系列也可能会这样做。然而,这并不是一个既定的情况——Nvidia 可能会在其 RTX 50 系列中使用 3nm 节点。
据说该阵容包括从高端RTX 4090等效 GB202 到 GB203、GB205、GB206 和入门级 GB207 的芯片。如果被证明属实,这将是一个有趣的、也许令人担忧的变化。这意味着为RTX 4070提供动力的 AD104 GPU 在下一代将没有继任者。因此,RTX 5070 和 RTX 5070 Ti 可能会使用 GB205 芯片。
关于 RTX 50 系列最热门的信息来源之一是 X(以前称为 Twitter)上的 kopite7kimi。泄密者透露,我们预计新的 GPU 将支持 DisplayPort 2.1(Lovelace 系列不提供)以及 HDMI 2.1。
内存接口
我想我的坚持是正确的。所以区别在于GB202是512位,AD102是384位。
— kopite7kimi (@kopite7kimi) 2024 年 3 月 11 日
Kopite 的最新更新谈到了 Blackwell 的内存接口。泄密者现在表示旗舰卡确实将拥有 512 位内存总线,尽管他们之前声明它将坚持 384 位。与此同时, Chiphell 论坛上的一位用户声称 RTX 5080 将拥有 448 位内存总线。现在,我们仅为旗舰产品提供了三个而不是两个估计的总线宽度。
Blackwell 的最大总线宽度一直是热门泄密者中一个非常有争议的话题,因此很难知道真相是什么。然而,他们都同意的一件事是 Nvidia 将使用新的 GDDR7 内存标准,据说 AMD 不会在即将推出的RDNA 4系列中使用该标准。
泄密者还更新了对 RTX 50 系列中 GDDR7 内存模块速度的预期。尽管之前有传言称我们可能会立即看到 32Gb/s 模块,但 kopite7kimi表示Nvidia 将在这一代中使用 28Gb/s。这仍然标志着对 Ada 的坚实升级,在传闻中的 RTX 5090 上提供高达 1.8TB/s 的内存带宽——假设 512 位内存总线检查正常。
无论总线宽度如何,我们都知道 GDDR7 将是一次升级。内存制造商美光最近分享了其新型 VRAM 的一些性能数据,声称其在游戏场景中的性能将提升高达 30%,包括纯光栅化和光线追踪。 GDDR7 内存起始速度为 28Gb/s,可提供超过 1.5TB/s 的系统带宽。
GPU 中的 VRAM 数量最近一直是一个热门话题,为此,RedGamingTech 推测我们可能会在 RTX 5090 中看到高达 36GB 的内存。但是,这些数字尚未最终确定,因此我们最终可能会看到与 RTX 4090 一样,配备 24GB。
传闻规格
图形处理器 | 流式多处理器 (SM) | CUDA 核心 | 内存接口 | 内存带宽 | |
RTX 5090 | 国标202 | 192 | 24,576 | GDDR7 28GB 448 位 | 1.5TB/秒 |
RTX 5080 | 国标203 | 84 | 10,752 | GDDR7 16GB 256 位 | 896GB/秒 |
RTX 5070 | 国标205 | 50 | 6,400 | GDDR7 12GB(?)192 位 | 672GB/秒 |
RTX 5060 | 国标206 | 36 | 4,608 | GDDR7 8GB(?)128 位 | 448GB/秒 |
RTX 5050(?) | 国标207 | 20 | 2,560 人 | GDDR7 8GB(?)128 位 | ? |
那么,RTX 50系列的实际规格到底如何呢?您在上表中看到的内容通常被称为谣言规格,但这就是我们正在处理的内容 – 谣言。请以适当的怀疑态度对待以下所有内容。
与通常的情况一样,kopite7kimi 一直是有关 RTX 50 系列规格主题的良好情报来源。泄密者分享了每个 GPU 的(可疑)流式多处理器 (SM) 数量。这就是为什么我们认为 RTX 5090 可能有 192 个 SM,与 RTX 4090 相比,性能提升了 33%,令人印象深刻;与此同时,RTX 5080 只会享受 5% 的提升,而 RTX 5070 实际上可能比其前身具有更少的 SM。然而,现在恐慌还为时过早。
一方面,我们不知道这些规格是否真实。即使是,Kopite 分享的实际上是 GPU 中 SM 的数量,这并不一定意味着 Nvidia 会在显卡中使用所有 SM。事实上, RTX 4090并没有充分利用 AD102 芯片的全部功能,GB202 也可能是这种情况。 YouTuber Graphically Challenged为这些 SM 期望提供了一些有关大多数 GPU 的带宽和 VRAM 数量的信息。
GB202 12*8 512位GDDR7
GB203 7*6 256位GDDR7
GB205 5*5 192位GDDR7
GB206 3*6 128位GDDR7
GB207 2*5 128位GDDR6— kopite7kimi (@kopite7kimi) 2024 年 6 月 11 日
抛开所有谨慎的怀疑论不谈,至少其中一些谣言可能会得到证实,因为它们已经从多个来源流传了一段时间。 YouTuber RedGamingTech此前也表示,这款旗舰芯片可能配备 192 个流媒体多处理器 (SM)。然而,RedGamingTech 预测 GB203(RTX 5080)将有 108 个 SM,这仍然比 kopite7kimi 现在声称的现实要好。无论如何,我们看到 RTX 5080 和 RTX 5090 之间存在巨大的性能差距。
kopite7kimi 分享的更多猜测证实了这一点。根据泄密者的说法,GB203 芯片将是“GB202 的一半”,这标志着我们在 RTX 4090 与 RTX 4080 中看到的性能下降类似。值得注意的是,RedGamingTech 与 kopite7kimi 不同,它认为我们“最大总线宽度为 384 位,这会影响性能数据。
我认为GB203是GB202的一半,就像GB102和GB100一样。但不知道GB202是否有多芯片封装。
— kopite7kimi (@kopite7kimi) 2024 年 3 月 11 日
如果 RTX 5090 真的像看起来那样凶猛,很多人都会期待它是一张庞然大物,但有传言称RTX 5090 只会在 Founders Edition 中采用双插槽设计。与当前一代相比,这将是一个令人震惊的变化,RTX 4090 最多可以占用四个插槽。
我们甚至听说过有关称为Titan AI的 GPU 的传言。就像 Lovelace 一代一样,Nvidia 最终没有使用整个 AD102 芯片——RTX 4090 有更多可用的功能,但它从未被使用过——并且 Nvidia 可能会对 GB202 芯片做类似的事情。因此,RTX 5090 据称是 GB202 GPU 的精简版,比 RTX 4090 性能提升 48%。同时,Titan AI 显卡可能会解锁 GB202 芯片所提供的所有功能,即将推出性能提升 63%。
现在了解任何单张卡的具体细节还为时过早,所有这些都可能会发生变化。 Nvidia 很可能会发布从 RTX 5060 到 RTX 5090 的型号,并添加一些 Ti 选项,甚至可能是传闻中的 Titan AI 显卡。我们希望它能够保持规格平衡,为发烧友和入门级用户提供广泛的卡;否则, DLSS 4 可能会成为这一代的救星。
RTX 50 系列:笔记本电脑
如果说 RTX 50 系列的桌面版本是一个谜,那么笔记本电脑版本则更加陷入阴影,泄密者几乎没有分享任何有关它们的信息。不过,笔记本电脑游戏玩家可以高兴了,因为我们最近得到了一些有关笔记本电脑 RTX 50 系列的重大消息。最棒的是,这不是又一个投机谣言,而是台湾笔记本电脑制造商蓝天的真实泄密。
不幸的是,该公司最近遭受勒索软件攻击,导致一些机密幻灯片在网上共享。根据幻灯片,Nvidia 将推出六款移动 GPU,但它们都将在 2025 年之前推出。这也意味着 Nvidia 不会淘汰其旧的低端 GPU。 RTX 4050、RTX 3050 甚至 RTX 2050 将继续出现在笔记本电脑中。
RTX 50 系列显卡在幻灯片中给出了代号,但很容易找出哪个是哪个,因为它们与 40 系列对应产品进行了比较。看来笔记本电脑版本的 RTX 5080 可能会获得急需的内存升级,现在配备了与 RTX 5090 相同的 16GB GDDR7 内存。据说这两张卡还共享相同的 GB203 GPU ,从而使 GB202 芯片缺席目前从笔记本电脑。
这些精美的新型笔记本电脑到底什么时候上市?这可能需要一段时间,因为摩尔定律已死声称Nvidia 目前正在调整 RTX 5080 和 RTX 5070/Ti 的移动版本。 RedGamingTech的最后一则轶事指出,GB207(意味着该系列中性能最低的芯片)可能首先只会出现在笔记本电脑中。这与我们在 RTX 40 系列中看到的情况相符,其中 RTX 4050 迄今为止仅出现在笔记本电脑中。
RTX 50 系列:架构
Nvidia 正在对 Blackwell 芯片中使用的架构保密,但这种状态不会持续太久。距离 GPU 发布还有几个月的时间,随着发布日期的临近,我们将了解更多信息。目前,Nvidia 谈论了其数据中心 Blackwell GPU 的架构,这可能并不能很好地表明消费产品阵容中可能发生的情况 – 但仍然有一些有趣的花絮。
第一个好奇的部分是Blackwell的企业版是基于台积电的4NP节点构建的,这实际上是5nm工艺。之前有传言称 RTX 50 系列可能采用 3nm 工艺,但鉴于最近的公告,现在看来可能性很小。此外,B200 GPU还配备了专用的解压引擎。虽然尚不清楚这是否会应用于消费级 GPU,但它可能会给显卡带来重大提升。
尽管英伟达讨论了与企业相关的 Blackwell 架构,但它对其消费者阵容保持沉默。因此,我们所得到的只是来自各种来源的更多猜测,但信息往往有些相互矛盾。
RedGamingTech 在最近的视频中详细讨论了 Blackwell 架构。 YouTuber 将其称为“最具影响力的图形架构之一”,并预测 RTX 50 系列将对路径追踪和光线追踪等功能进行重大改进,为发烧友级和中端卡带来收益。
为此,YouTuber 表示我们可能会看到重大的架构变化,包括 Nvidia SM 的重大重新设计。他还提到了添加降噪加速器,无论是作为芯片的一部分还是作为 Nvidia Tensor 核心的功能。更重要的是,RedGamingTech 最初戏称 Nvidia 可能会使用多芯片模块(MCM)设计。这意味着采用一种设计方法,将多个较小的芯片封装在一起,形成一个更大、更强大的处理器。转向 MCM 设计而不是单片设计可以为 Nvidia 带来主要优势,包括可扩展性、更高的良率和更大的设计灵活性。
不幸的是,同一 YouTuber 最近的更新显示 Nvidia 不会在 Blackwell 中使用 MCM 设计。据报道,Nvidia 最初计划使用粘合在一起的双 GB202 芯片,可能会切割一些 SM,但最终决定不这样做。这位 YouTuber 表示,高价格、两个芯片之间的延迟以及工作中的各种困难等问题使得 Nvidia 坚持其以前的架构。
请以适当的怀疑态度对待这一点。 Nvidia 可能计划在未来转向 MCM,但这种架构变化从来不会在最后一刻进行,因此 Blackwell 的计划可能从未存在过。然而,Nvidia 也有可能会引入架构变化,而不是推动最高性能,以使新技术成熟,然后在几年后提升 RTX 6000 系列显卡的性能。
B200 数据中心 GPU 再次表明了我们的期待。 Nvidia 重新设计了该显卡中的 Tensor 核心。因此,它们现在原生支持用于 AI 推理的 FP4 和 FP6 数字格式。我们可能也会在消费级 GPU 中看到这种情况发生,但这只是目前的猜测。
RTX 50 系列:性能
由于RTX 50系列显卡的规格仍然是个谜,因此很难对其性能做出准确的预测。然而,许多人已经尝试过,这就是为什么我们在等待官方基准测试时有一些有趣的谣言可供挖掘。
根据摩尔定律已死,艾达和布莱克威尔之间的性能提升可能并不大。 YouTuber 的消息来源提到,“Blackwell 对 Ada 的光栅化提升不会像从 Ampere 到 Ada 那样令人印象深刻。”不过,该消息人士还表示,“如果感到受到威胁”,Nvidia 可能会让 RTX 5090 感觉类似的提升。这似乎不太可能,因为据报道AMD将不再生产下一代高端GPU ,英伟达可能成为未来几年高端显卡的唯一来源。
基于上述情况,我们可能会看到旗舰产品的性能提升大约 30% 到 50%。中端和入门级显卡的性能逐代提升通常较小,因此这些可能更不令人印象深刻。
然而,另一方面,来自 RedGamingTech 等来源的猜测。这位 YouTuber 在他的视频中声称,我们看到 Lovelace 和 Blackwell 之间的性能提升高达 2 倍。他提到,与 RTX 40 系列相比,RTX 50 系列的光线追踪性能应提高一倍,并提供高达 2 倍的性能提升。不过,RedGamingTech 不确定这是否意味着光栅化,因此很难知道衡量这些增益的指标。不过,他确实预测时钟速度将达到 3GHz 以上,这将比 Ada 有相当大的提升,但他也表示这仅适用于超频型号。
在后来的视频中, RedGamingTech 补充说,我们可能会看到从一款旗舰产品到下一款旗舰产品的性能提升高达 60%。随后他澄清说,我们预计会看到以下性能提升,但对此应该持怀疑态度:
- RTX 4090 到 RTX Titan AI:速度提高 63%
- RTX 4090 到 RTX 5090:速度提高 48%
- RTX 4080 Super 到 RTX 5080:快 29%
- RTX 4070 Super 到 RTX 5070:快 26%
这位 YouTuber 还强调,Nvidia 的重点主要放在光线追踪和路径追踪上,这些工作负载提高了 2.5 倍。再次,请以怀疑的态度对待所有这些信息。
我们目前掌握的唯一真实的性能数据提示来自 Nvidia 制作的一张幻灯片,但不幸的是,该幻灯片谈论的是其在数据中心使用的下一代高性能计算 (HPC) 显卡。该图测量了 GPT-3 175B 推理中的 GPU 性能,显示 H200 GPU 的速度将比 A100 快 18 倍,但这还不是 Blackwell 架构。 B100 是榜单上第一款 Blackwell 显卡,提供了显着更高的性能,尽管 Nvidia 没有给出具体数字。它看起来大约是 H200 的两倍。
虽然这对于那些需要 HPC GPU 的人来说是令人兴奋的,但游戏玩家和其他消费者需要等待才能了解 RTX 50 系列 GPU 功能的实际情况。
RTX 50 系列:功耗
在 RTX 40 系列发布之前,旗舰产品 RTX 4090 曾是很多谣言的主题,其功耗更是一个特别热门的话题。一些消息人士称,GPU 的功耗确实非常惊人,甚至高达 900 瓦。我们现在知道这些说法是错误的,因为 RTX 4090 的功耗为 450 瓦,其连接器支持高达 600 瓦的功率,但偶尔会熔化。很难想象 Nvidia 会在下一代 GPU 中将这些数字推得更高。
不过,RTX 50 系列无法避免一些与功耗相关的争议。摩尔定律已死最近透露,英伟达计划使用一种全新的连接器,这将标志着短短三年内第四次发生此类变化。 YouTuber 援引匿名消息人士的话说,Nvidia 正在改用 16 针连接器,全部专用于 12V 电力传输。然而,许多其他消息来源指出这不太可能。
Hardware Busters联系了自己的消息来源并确认“没有人知道有新的连接器”。 Nvidia 必须与主要 PSU 品牌合作,尤其是在 12VHPWR 连接器出现问题之后。如果这些品牌对此一无所知,那么英伟达可能还不会在这一代中做出这些改变。
事实上,Nvidia 可能会加倍选择使用 12VHPWR 连接器。据TechRadar 报道,Nvidia 可能会将 12VHPWR 连接器作为整个 RTX 50 系列堆栈中每个 GPU 的必备配置,甚至是入门级 RTX 5060。据说这也适用于 Nvidia 主板合作伙伴制造的卡。
假设 Nvidia 坚持使用目前使用的(有些争议的)12VHPWR 连接器,最大功耗将保持在 600W。如果旗舰 RTX 5090 提供显着更高的性能,功耗可能会继续增加,但它仍然需要为潜在的超频留出一些空间,因此最大 500W 似乎是合理的。
对于该系列的其余产品,Nvidia 可能会尝试保持更加保守,而不是推动更高的功耗。正如NotebookCheck指出的那样,Nvidia 目前增加主板总功耗 (TBP) 的趋势仍然相当新,尤其是在RTX 4080这样的卡上。从历史上看,xx80 卡的功耗远低于 300W,有时甚至低于 200W。在过去几代中,RTX 3080 和 RTX 4080 都将 TBP 推向了新的高度,每台都需要高达 320W 的功率。
由于功耗如此之高,对于 Nvidia 来说继续推动更高的瓦数没有多大意义,特别是考虑到 AMD 可能会在 RDNA 4 中保持更加保守。如果 Nvidia 稍微调低一点,我们可能会看到 TBP 约为 250W 至 280W 的 RTX 5080。然而,如果Nvidia坚持目前的方案,它可能会走向另一个方向并达到350W的高位。