OpenAI 的主要投资者微软目前正在调查中国公司 DeepSeek是否使用了邪恶的方法来训练其推理模型。据彭博社报道,该公司现在认为 DeepSeek 使用其应用程序编程接口(API)来训练其最近发布的 R1 模型,违反了其服务条款。
这一消息发布前不久,白宫人工智能和加密货币沙皇 David Sacks 在周二接受福克斯新闻采访时表示,DeepSeek“可能”“窃取了美国的知识产权”。
“有大量证据表明 DeepSeek 所做的就是从 OpenAI 的模型中提取知识,”萨克斯告诉媒体。
AI 行业一直对 DeepSeek 能够在一年内仅花费 560 万美元快速且经济高效地训练 AI 模型的能力赞不绝口。该公司之所以如此高效,有一个潜在的可能性是它使用了另一家公司的模型作为基准。
DeepSeek 可能使用了一种称为蒸馏的过程,该过程需要两个具有师生动态的模型,以便一个可以从另一个模型收集信息。一方面,这可以解释该公司运营成本低廉以及使用功能较弱的 Nvidia H800 芯片的原因。 DeepSeek 现在可能需要证明其在开发模型时是否采取了所有非法行为。
在这一最新进展之前,行业专家此前推测DeepSeek 可能使用逆向工程来训练其模型。此过程分析模型以识别其模式和偏差,以改进未来模型。逆向工程是开源开发人员中的常见做法,被认为是合法的。
受到微软制裁的安全研究人员已经拼凑出 DeepSeek 可能在 2024 年秋季从 OpenAI 的 API 中挖掘出大量代码。微软当时应该让 OpenAI 意识到了这一漏洞。 R1模型于上周发布,引起了这家中国人工智能公司和相关方的关注。
DeepSeek 也被誉为开源人工智能应用程序,任何人都可以在其上进行开发。这就是该平台令人兴奋的地方——除了它与ChatGPT和 Google Gemini 等顶级工具的比较之外。 OpenAI 不是一项开源服务;但是,任何人都可以注册访问其 API。 TechCrunch指出,该公司确实在其服务条款中明确表示,其他实体不能使用输出来训练其他人工智能模型。
OpenAI发言人告诉路透社,无论法规如何,各种国际公司试图复制美国知名公司的模型现在已经很常见。
“我们采取反措施来保护我们的知识产权,包括一个谨慎的过程,将前沿能力纳入已发布的模型中,并相信,在我们前进的过程中,与美国政府密切合作以最好地保护我们的知识产权至关重要。最有能力的模型来自对手和竞争对手获取美国技术的努力,”发言人说。