Nvidia RTX 4080:我们从 GTC 2022 中学到了什么

Nvidia 首席执行官 Jensen Huang 刚刚结束了他 2022 年的第一个 GTC 主题演讲,在此期间,这位高管宣布了 Nvidia 的下一代 Hopper 架构。它在 H100 中推出,这是一款仅限数据中心使用的强大 GPU,但该公告也为RTX 4080和 Nvidia 的下一代消费级显卡提供了一些提示。

Nvidia 没有在 GTC 上谈论 RTX 4080,它不会使用 Hopper 架构,至少基于谣言。几年前,在 RTX 30 系列显卡推出之前,有传言称 Nvidia 将在其 RTX 40 系列显卡上使用 Hopper 架构。现在,Nvidia 似乎将在 2022 年发布两代产品:用于数据中心的 Hopper 和用于消费者的 Ada Lovelace。但这并不意味着我们无法从公告中收集信息。

双架构

两张显卡相互叠放。

这只是英伟达第二次拆分其消费者和数据中心产品。在 Pascal 和 Turing 之间,Nvidia 为数据中心引入了 Volta 架构。这有点权宜之计,使英伟达得以在其数据中心产品上转向小型制造工艺,为下一代消费产品做准备。

随着 RTX 30 系列的出现,这种情况发生了变化,Nvidia 在 Ampere 架构下统一了它的两个产品系列。所有这一切都是说,英伟达在这里所做的事情并没有太多先例。这是我们第一次真正看到 Nvidia 的两种架构并存。

对于 Hopper,我们了解到它将使用台积电的 N4 制造工艺,而 Nvidia 的目标是提高效率。有趣的是,传闻英伟达为 4080 使用了台积电的 N5 工艺,而不是 Hopper GPU 使用的更小、更高效的工艺。

N5 和 N4 生活在同一个家庭中,但 N4 的效率略高于 N5。根据我们看到的有关 RTX 40 系列显卡的巨大功率要求的传言,N5 似乎更有可能适用于消费者范围。这建立在泄密者的建议之上,即 RTX 4080 在效率方面存在很大问题

游戏 PC 中的 Nvidia RTX 2080 Super。

我们可能会看到 Pascal/Volta/Turing 情况的重复。为了在 RTX 4080 之后建立新一代,Nvidia 似乎在 Hopper 方面处于领先地位,它具有更高效的架构。到那时我们可能会转向更小的进程,但消费卡似乎仍将落后于数据中心的。

制造过程是最大的发展,但霍珀也掌握了其他一些线索。

NVLink 互连

料斗H100显卡。

Nvidia 专注于第四代 NVLink 的可扩展性。这是一个仅在今天与 Nvidia 数据中心相关的互连,但 Huang 宣布它将面向客户和合作伙伴推出。

随着 NVLink 的开放,英伟达表示其目标是让其他公司设计与英伟达产品配合使用的半定制芯片。这可能与 Nvidia 即将推出的消费级显卡有关。有传言称 AMD 正在为RX 7000 显卡采用多芯片模块 (MCM) 设计,本质上是将多个独立的计算集群组合在一个芯片上。

开放 NVLink 可以为 Nvidia 做类似的事情奠定基础。有传言称,AMD 将首次凭借其 RX 7000 显卡超越 Nvidia,这可能是由于 MCM 设计。目前尚不清楚 RTX 4080 是否会使用 MCM 设计,但 Hopper 的推出表明它不会。

最后一个提示来自 H100 CNX,它是 H100 GPU 的一个版本,与 Nvidia ConnectX-7 SmartNIC 相结合。这是为了减少延迟并提高 GPU 的吞吐量,从而消除服务器中的 CPU 瓶颈。

这与桌面 GPU 无关,但我们可能会在 RTX 4080 上看到类似的方法。Nvidia 和 IBM 已联手通过将 SSD 直接连接到 GPU 来提高内存带宽和吞吐量。我们认为这是一项遥不可及的技术,但 GTC 建议它可能会尽快出现。

不过,归根结底,RTX 4080 仍然是一个很大的问号。我们有关于性能和效率的泄漏,以及来自 Hopper 的一些提示,但我们必须等到卡启动才能了解有关它的所有信息。目前有传言称它将于今年秋天推出,尽管 Nvidia 尚未确认该时间表。


Posted

in

by

Tags: