二十多年来,我们一直听说摩尔定律已死。这是已故英特尔联合创始人戈登·摩尔的一个原则,他认为芯片中的晶体管数量大约每两年就会增加一倍。 2006年,摩尔本人表示,这种情况将在2020年代结束。麻省理工学院教授 Charles Leiserson 表示这一切在 2016 年就结束了。 Nvidia 的首席执行官宣布 2022 年死亡。几天后,英特尔的首席执行官提出了相反的说法。
毫无疑问,摩尔定律的概念——或者更确切地说是观察,以免我们将其视为某种物理定律——已经在桌面处理器中带来了令人难以置信的创新。但摩尔定律的消亡并不是一个瞬间。这是一个缓慢而丑陋的过程,我们终于在实践中看到了它的样子。
创意解决方案
我们有来自 AMD 和英特尔的两代全新产品,但它们都没有真正走出大门。正如您在我的Core Ultra 9 285K 评论中所读到的那样,英特尔的最新尝试以其全新的设计取得了许多令人印象深刻的成就,但它仍然无法与竞争对手抗衡。 Ryzen 9 9950X虽然比 Zen 4 同类产品有了明显的升级,但并没有提供我们已经习惯的世代改进。
考虑一下这一点 – 从 Cinebench R23 来看,从 Ryzen 9 5950X 到Ryzen 9 7950X的多核跳跃为 36%。 Ryzen 9 7950X 和 Ryzen 9 9950X 之间? 15%。这还不到一代人的进步的一半。在 Handbrake 中,与 Ryzen 9 5950X 相比,Ryzen 9 7950X 的转码速度提高了 34%。而 Ryzen 9 9950X 的提升幅度则缩减至仅 13%。
这也不仅仅是奇怪的一代。从 Core i9-101900K 和Core i9-12900K的单核性能来看,英特尔实现了 54% 的提升。即使将目前已经有三代历史的 Core i9-12900K 与最新的 Core Ultra 9 285K 进行比较,我们也只看到了 20% 的提升。更糟糕的是,英特尔的新 Core Ultra 系列在 Cinebench 中显示出奇高的结果,如果你转向其他应用程序,你实际上可以看到与一两代之前相比的一些回归。
即使在短短几年内,性能改进的速度也已大大放缓。摩尔定律并不直接谈论性能改进——它只是与芯片上晶体管的数量有关。但这对性能有明显的影响。投入更多的晶体管来解决这个问题并不像以前那样实际——如果你想了解更多原因,请阅读登纳德缩放的消亡。
AMD 和英特尔可能不会公开谈论这一点,但这两家公司都清楚地看到了不祥之兆。这可能就是英特尔首先转向混合架构的原因,也是英特尔对其 Arrow Lake CPU 进行彻底重新设计的原因。对于 AMD 而言, 3D V-Cache已成为该公司 CPU 的一项决定性技术,这已不是什么秘密,而且它是绕过摩尔定律瓶颈的明确方法。任何 CPU 芯片上的一大块晶体管都专用于缓存(大约在 40% 到 70% 的范围内),而 AMD 实际上在顶部堆叠了更多的缓存,而这些缓存无法安装到芯片上。
空间的函数
在研究摩尔定律和登纳德缩放比例时要记住的一个重要因素是空间。当然,你可以构建一个带有大量晶体管的大型芯片,但它会消耗多少功率?它能保持在合理的温度吗?放置在 PC 或企业服务器中是否实用?您无法将晶体管的数量与芯片的尺寸分开。
我想起了我与 AMD 的 Chris Hall 的一次谈话,我们告诉我:“很长一段时间以来,我们都在享受摩尔定律,但现在已经逐渐结束了。现在,每平方毫米的硅都非常昂贵,我们无法继续增加一倍。我们可以,我们可以制造这些芯片,我们知道如何制造它们,但它们变得更加昂贵。”
我并不是在这里为 Nvidia 疯狂的定价策略辩护,但据报道,该公司发现台积电的 RTX 40 系列 GPU 的定价高于三星的 RTX 30 系列 GPU 的定价。而且, RTX 4090在芯片尺寸非常相似的情况下提供的晶体管数量是 RTX 3090 的两倍多。如果跨芯片都遵守摩尔定律,我不确定我们作为消费者在升级 PC 时会喜欢这个结果。
更不用说像 RTX 4090 这样的卡所面临的其他问题——高功率要求、疯狂的冷却器尺寸和熔化的电源连接器。并非所有这些问题都是晶体管数量增加一倍的结果,甚至不是很接近,但它确实发挥了作用。更大的芯片需要更多的晶体管、更多的热量,而且通常成本更高,特别是随着硅成本的不断增加。
捷径
摩尔定律已经失效,个人电脑硬件变得越来越昂贵,一切都很糟糕——这不是我想要离开的方式。将会有更多的方法来逐年提供性能改进,而不仅仅依赖于相同尺寸的芯片上更多的晶体管。我们现在实现这一目标的方式有所不同。我说的是人工智能。
等等,不要点击掉这篇文章。科技公司对人工智能感到兴奋,因为它代表着大量资金——尽管这种观点很愤世嫉俗,但这正是微软和英伟达等万亿美元公司的运作方式。但人工智能也代表了一种带来新计算形式的方式。我不是在谈论大量的人工智能助手和幻觉聊天机器人,而是将机器学习应用于一个问题,以近似我们以前通过纯硅创新获得的结果。
看看DLSS 。使用升级来维持一定水平的性能的想法是有争议的,而且对于个别游戏来说这是一个微妙的对话。但 DLSS 无需严格的硬件改进即可实现更好的性能。再加上我们现在从 DLSS、FSR 和无损缩放等第三方工具中看到的帧生成,您将拥有大量从未由显卡渲染的像素。
一个争议较小的角度是Nvidia 的光线重建。众所周知,光线追踪的要求很高,而解决硬件需求的一部分是去噪过程——限制光线数量,然后通过去噪来清理生成的图像。光线重建所提供的结果需要更多的光线和更强大的硬件,而且它在完全不限制性能的情况下实现这一点——并且再次通过机器学习。
摩尔定律是死是活并不重要——如果 AMD、英特尔和 Nvidia 等公司想要维持下去,他们将不断需要考虑解决方案来满足不断增长的性能需求。 PC 硬件领域的创新远未消亡,但可能开始看起来有些不同。