埃隆·马斯克表示,世界上用于人工智能训练的数据即将耗尽

Tesla/X 首席执行官埃隆·马斯克 (Elon Musk) 似乎认为,仅使用人造数据训练人工智能模型已变得不可能。马斯克声称,用于训练人工智能模型(包括他的Grok AI 聊天机器人) 的现实世界数据越来越缺乏

“在人工智能训练方面,我们现在基本上已经用尽了人类知识的累积总和,”马斯克在接受 Stagwell 董事长马克·佩恩 (Mark Penn) 进行的 X 直播采访时说道。 “这基本上发生在去年。”

马斯克的言论反映了前 OpenAI 研究员 Ilya Sutskever 的观点, 后者去年 12 月预测人工智能行业已达到“数据峰值”。马斯克对这个问题的解决方案——合成数据——也反映了更大的行业。 Google、OpenAI、Anthropic 和 Meta 已经利用合成数据来训练他们的模型。

“补充[现实世界数据]的唯一方法是使用合成数据,人工智能在其中创建[训练数据],”马斯克说。 “通过合成数据……[AI] 会对自己进行评分并完成这个自我学习的过程。”

虽然使用合成数据可以为公司节省大量成本,但一些研究表明,过度依赖合成数据可能会导致模型崩溃,随着时间的推移,人工智能的响应会变得越来越缺乏创造性,并且随着时间的推移,人工智能的响应会变得更加有偏见,因为它们反复接受递归生成的训练。数据。

缺乏人类数据并没有阻止 X 在周四将其 Grok AI 功能剥离到自己的 iOS 应用程序中。聊天机器人和图像生成器以其完全缺乏知识产权或内容护栏而闻名,过去只有每月花 8 美元购买 X 高级帐户的人才能使用。不过,任何人都可以免费下载这款新应用程序。


Posted

in

by

Tags: