英特尔如何通过简单的驱动程序更新将 Arc GPU 的性能提高一倍

作为独立显卡领域的新人,英特尔的 Arc A770 和 A750最大的希望就是它们不会太糟糕。英特尔主要提供原始功能,但两个以预算为重点的 GPU 在软件部门一直落后。在过去的几个月里,英特尔已经改正了路线。

通过一系列的驱动程序更新,英特尔在 DirectX 9 游戏中的性能比发布时提高了近一倍,并且在某些DirectX 11 和 DirectX 12游戏中实现了大幅升级。我采访了英特尔的 Tom Petersen 和 Omar Faiz,了解英特尔如何重新设计其驱动程序,更重要的是,它如何在未来继续推动软件修订。

游戏的驱动力

粉红色背景上的两张英特尔 Arc 显卡。
雅各布·罗奇 / 数字趋势

不过,在进入英特尔的进步之前,我们必须首先讨论驱动程序在您的游戏中做了什么。显卡驱动程序位于您正在玩的游戏的应用程序编程接口 (API) 之下,它将 API 的指令翻译成硬件可以理解的指令。

DirectX这样的 API 从游戏中获取指令并将它们翻译成任何图形卡都能理解的标准化命令集。驱动程序紧随其后,采用这些标准化指令并针对特定硬件架构优化它们。这就是为什么 AMD 驱动程序不适用于 Nvidia 显卡,或者 Intel 驱动程序不适用于 AMD 显卡的原因。

英特尔的问题主要集中在 DirectX 9 上。它在这一点上被认为是遗留的 API,但仍有大量游戏设计为在 DX9 上运行,包括反恐精英:全球攻势、军团要塞 2、英雄联盟和激战2.

DX12 和 Vulkan等现代 API 相比,DX9 的问题在于它是一个高级 API。这意味着它比现代 API 更通用,给驱动程序带来更多压力以挤出性能优化。 DX12 和 Vulkan 是低级 API,可以在开发人员创建游戏时更清晰地访问硬件并减轻驱动程序的压力。 Petersen 解释说,使用 DX12,“我们的驱动程序不太可能做任何次优的事情,因为游戏开发人员和我们的平台之间有更直接的联系。”

使用 AWP 瞄准的反恐精英玩家。

最初,Intel为DX9使用的是D3D9on12,这是一个使用DirectX 12来理解DirectX 9指令的翻译层。彼得森表示,他相信英特尔“当时做了正确的事情”,但事实证明 D3D9on12 效率太低。性能被搁置在桌面上,功能较弱的 GPU 有时在 DX9 游戏中提供两倍于英特尔显卡的性能。

英特尔基本上是从头开始,实现原生 DX9 支持并利用 DXVK 等翻译工具——DX9 的基于 Vulkan 的翻译层。它奏效了。在Counter-Strike Global Offensive 中,我使用启动驱动程序测得大约每秒 190 帧 (fps),使用最新驱动程序测得每秒 395 帧;增加了 108%。同样,根据我的测试,收获日 2从启动驱动程序到 Arc A750 的最新版本提升了大约 45%。

桌上还有更多

Arc A770 显卡上的 Intel 标志。

DX9 在发布时是英特尔 GPU 的杀手锏,但仍有性能优化摆在桌面上。彼得森明确表示:“与我们所处的位置和那个理论峰值相比,还有相当大的差距。”

不过,新领域不是 DX9。是DX11。 “我确实认为,尤其是对于 DX11 游戏,还有更多的余量,我们将继续努力,”彼得森说。 “DX12 将更像是一种永远的爱的劳动,因为它的粒度更细一些,而且它将成为每个标题的一种苦差事,以让所有这些变得精彩。但我确实认为我们前面还有提升,而且比你通常看到的车手要多。”

其中一个例子是Warframe,英特尔声称其最新驱动程序比启动驱动程序提高了 60% 以上。尽管英特尔无法大刀阔斧地支持所有 DX11 游戏,但彼得森解释说 DX11 仍然比 DX12 更高级。 “虽然 DX11 没有 DX9 厚,但在优化方面还有很多工作要做。”

平均性能是一个重点领域,但这并不是英特尔最初驱动程序的唯一问题。 Petersen 解释说,工程团队“修复了驱动程序中的一些基本资源分配”问题,通过确保驱动程序不会遇到导致帧时间大幅变化的瓶颈来帮助提高一致性。

《使命召唤现代战争 2》中升级的帧时间。

随着英特尔显卡的推出,该团队一直在以极快的速度发布新的驱动程序。我问彼得森和 Faiz,这种速度是否会持续下去,Faiz 直言不讳:“我们希望继续保持这种势头。” Petersen 补充说:“我们组织内部很清楚,驱动程序更新将决定我们的成功与否。”

两者都小心翼翼,不要过度承诺,​​这是英特尔过去在其 Arc GPU 上遇到的一个问题。但短期记录肯定对英特尔有利。自发布以来,这些卡已经有了 15 个新驱动程序(六个 WHQL,九个测试版),包括针对 27 款新游戏的发布日优化。这击败了 AMD 并与 Nvidia 的步伐相匹配。事实上,英特尔是唯一一家拥有适用于霍格沃茨遗产的驱动程序的公司 在发布时(Nvidia 仍未为其发布 Game Ready 驱动程序的游戏)。

XeSS 仍在进行中

英特尔 XeSS 可视化。

尽管英特尔在其驱动程序方面取得了长足进步,但前面的路还很长。一个需要注意的领域是XeSS ,这是英特尔基于 AI 的升级工具,可以替代Nvidia 的深度学习超级采样 (DLSS)

XeSS 是一个很棒的工具,但它缺乏几个方面:游戏支持和清晰度。英特尔一直在增加对Hogwarts LegacyCall of Duty: Modern Warfare 2 等新游戏的支持,但这与 Nvidia 多年来不得不为数百款游戏添加 DLSS 的工作背道而驰。不过,英特尔希望在这些游戏中实施 XeSS 对开发人员来说是一条轻松的道路。

正如 Petersen 解释的那样,“[DLSS 和 XeSS] 都有效地依赖于来自游戏的某些类型的数据到单独的 DLL 文件。与 XeSS 相同。而且我们有成为快速追随者的优势,因为很明显,他们是第一个出现的。因此,我们可以非常轻松地集成 XeSS。”这种骨干使改装者能够将 AMD 的 FidelityFX 超级分辨率拼接到仅支持 DLSS 的游戏中。理论上 XeSS 也是可能的。

现代战争 2 中的 XeSS、DLSS 和 FSR 图像质量比较。

我强调的一个领域是基于驱动程序的升级工具,类似于Nvidia Image Scaling或 AMD 的 Radeon Super Resolution。 Petersen 和 Faiz 再次谨慎地没有承诺任何事情,但他们指出这“在技术上并非不可能”。这将填补英特尔目前在其阵容中的空白,但我们可能暂时看不到这样的工具(如果有的话)。

另一个区域是柔软度。与 DLSS 相比,XeSS 通常没有那么锐利。我认为这只是应用的锐化量的差异,但彼得森说情况并非如此。 “我认为这是一个普遍的问题,我将你今天在某些情况下看到的大部分柔和归因于,你知道,一种艺术风格,它没有准确反映在我们用于模型的训练集中,”彼得森说。 “在新版本的 XeSS 中,这显然会随着时间的推移而改变。”

与 DLSS 一样,XeSS 使用神经网络来执行放大。 Nvidia 显然在其训练模型上有很大的领先优势,因此英特尔的训练数据可能还需要几年的时间才能与 Team Green 多年来的努力相媲美。

制作中的三号玩家

安装在测试台上的 Intel Arc A770 GPU。

英特尔通过其集成显卡成为全球最大的 GPU 供应商,但独立领域则是另一回事。该公司已证明它有能力在低端市场竞争,尤其是在Arc A750 的新激进定价下。但是还有很多工作要做。

泄密事件称,英特尔计划以此为基础,在 2023 年底更新 Alchemist,并在 2024 年更新新一代,但这只是目前的谣言。可以肯定的是,英特尔显然支持其游戏 GPU,在GPU 价格上涨的时代,第三方玩家是一个受欢迎的补充,可以带来一些急需的竞争。让我们只希望发布后驱动程序和游戏支持的势头能保持几代人。

本文是ReSpec的一部分——这是一个正在进行的每两周一次的专栏,其中包括对 PC 游戏背后的技术的讨论、建议和深入报道。


Posted

in

by

Tags: