
有人可能认为价格超过 40,000 美元的 GPU 将成为最好的游戏显卡,但事实远比这复杂得多。事实上,这款 Nvidia GPU 甚至跟不上集成显卡解决方案。
现在,在您过于沮丧之前,您应该知道我指的是 Nvidia 的 H100,它装有 GH100 芯片 (Grace Hopper)。它是一款功能强大的数据中心 GPU,专为处理高性能计算 (HPC) 任务而设计,而不是为 PC 游戏提供动力。它没有任何显示输出,尽管它具有广泛的功能,但它也没有任何冷却器。这是因为,您会再次在数据中心或服务器设置中找到此 GPU,在那里它会通过强大的外部风扇进行冷却。
虽然它“仅”有 14,592 个 CUDA 内核(比RTX 4090少),但它也有数量惊人的 VRAM 和庞大的总线。总的来说,GPU 拥有 80GB 的 HBM2e 内存,分为五个 HBM 堆栈,每个堆栈连接到 1024 位总线。与 Nvidia 的消费级 GPU 不同,该卡还具有 NVLink,这意味着它可以连接以在多 GPU 系统中无缝工作。
问题仍然存在:为什么这种类型的 GPU 在一般使用和游戏方面如此糟糕?
为演示此案例,YouTuber Gamerwan获得了四张 H100 显卡进行测试,并决定将其中一张置于常规 Windows 系统中以检查其性能。这是一个 PCIe 5.0 模型,由于缺少显示输出,它必须与 RTX 4090 配对。 Gamerwan 还 3D 打印了一个定制设计的外部冷却器,以保持 GPU 平稳运行。
甚至让系统将 H100 识别为合适的 GPU 也需要一些工作,但一旦 Gamerwan 设法克服障碍,他也能够打开光线追踪支持。然而,正如我们后来在整个测试过程中发现的那样,在非数据中心平台上对其他任何东西的支持都不多。
在标准的 3DMark Time Spy 测试中,GPU 仅达到 2,681 分。相比之下,RTX 4090 的平均得分为 30,353 分。这个分数让 H100 介于消费类 GTX 1050 和 GTX 1060 之间。更重要的是,它几乎与 AMD 的 Radeon 680M 相同,后者是集成 GPU。
游戏测试也很糟糕,显卡在Red Dead Redemption 2中达到平均每秒 8 帧 (fps)。缺乏软件支持在这里让人头疼——尽管 H100 可以以最大 350 瓦的功率运行,但系统似乎无法将其推到 100 瓦以上,从而导致性能受到极大限制。

这种游戏能力的糟糕表现有几个不同的原因。首先,虽然 H100 在纸面上是一款超强显卡,但它在架构层面上与为 RTX 4090 提供动力的 AD102 GPU 有很大不同。它只有 24 个光栅操作单元 (ROP),与RTX 4090 拥有 160 个 ROP。此外,112 个纹理处理集群 (TPC) 中只有四个可以渲染图形工作负载。
为了运行良好,Nvidia 的消费类 GPU 在软件方面得到了很多支持。这包括驱动程序,还包括来自开发人员的系统支持——包括游戏和基准程序。没有针对游戏玩法优化此 GPU 性能的驱动程序,如您所见,结果非常糟糕。
我们已经看到了英特尔 Arc驱动程序的强大功能,其中硬件保持不变,但改进的驱动程序支持带来了性能提升,如果您购买预算 GPU, Arc 是一个可以接受的选择。由于没有 Nvidia Game Ready 驱动程序并且无法访问 Nvidia 的其余软件堆栈(包括令人印象深刻的DLSS 3 ),H100 是一款价值 40,000 美元的 GPU,但没有运行任何类型游戏的业务。
从本质上讲,这是一个计算 GPU,而不是我们大多数人所了解的显卡。它专为各种 HPC 任务而设计,重点关注 AI 工作负载。 Nvidia 在 AI 方面保持领先于 AMD ,而像 H100 这样的显卡在其中发挥了重要作用。