埃隆·马斯克表示，世界上用于人工智能训练的数据即将耗尽

Tesla/X 首席执行官埃隆·马斯克 (Elon Musk) 似乎认为，仅使用人造数据训练人工智能模型已变得不可能。马斯克声称，用于训练人工智能模型（包括他的Grok AI 聊天机器人）的现实世界数据越来越缺乏。

“在人工智能训练方面，我们现在基本上已经用尽了人类知识的累积总和，”马斯克在接受 Stagwell 董事长马克·佩恩 (Mark Penn) 进行的 X 直播采访时说道。 “这基本上发生在去年。”

马斯克的言论反映了前 OpenAI 研究员 Ilya Sutskever 的观点，后者去年 12 月预测人工智能行业已达到“数据峰值”。马斯克对这个问题的解决方案——合成数据——也反映了更大的行业。 Google、OpenAI、Anthropic 和 Meta 已经利用合成数据来训练他们的模型。

“补充[现实世界数据]的唯一方法是使用合成数据，人工智能在其中创建[训练数据]，”马斯克说。 “通过合成数据……[AI] 会对自己进行评分并完成这个自我学习的过程。”

虽然使用合成数据可以为公司节省大量成本，但一些研究表明，过度依赖合成数据可能会导致模型崩溃，随着时间的推移，人工智能的响应会变得越来越缺乏创造性，并且随着时间的推移，人工智能的响应会变得更加有偏见，因为它们反复接受递归生成的训练。数据。

缺乏人类数据并没有阻止 X 在周四将其 Grok AI 功能剥离到自己的 iOS 应用程序中。聊天机器人和图像生成器以其完全缺乏知识产权或内容护栏而闻名，过去只有每月花 8 美元购买 X 高级帐户的人才能使用。不过，任何人都可以免费下载这款新应用程序。

Posted

9 1 月, 2025

技術新聞普遍器

Tags: