微软已经在 DeepSeek 上设置了合法的十字准线

在 iPhone 上运行的 DeepSeek AI。 — DeepSeek AI的首页聊天界面。纳迪姆·萨瓦尔 / 数字趋势

OpenAI 的主要投资者微软目前正在调查中国公司 DeepSeek是否使用了邪恶的方法来训练其推理模型。据彭博社报道，该公司现在认为 DeepSeek 使用其应用程序编程接口（API）来训练其最近发布的 R1 模型，违反了其服务条款。

这一消息发布前不久，白宫人工智能和加密货币沙皇 David Sacks 在周二接受福克斯新闻采访时表示，DeepSeek“可能”“窃取了美国的知识产权”。

“有大量证据表明 DeepSeek 所做的就是从 OpenAI 的模型中提取知识，”萨克斯告诉媒体。

AI 行业一直对 DeepSeek 能够在一年内仅花费 560 万美元快速且经济高效地训练 AI 模型的能力赞不绝口。该公司之所以如此高效，有一个潜在的可能性是它使用了另一家公司的模型作为基准。

DeepSeek 可能使用了一种称为蒸馏的过程，该过程需要两个具有师生动态的模型，以便一个可以从另一个模型收集信息。一方面，这可以解释该公司运营成本低廉以及使用功能较弱的 Nvidia H800 芯片的原因。 DeepSeek 现在可能需要证明其在开发模型时是否采取了所有非法行为。

在这一最新进展之前，行业专家此前推测DeepSeek 可能使用逆向工程来训练其模型。此过程分析模型以识别其模式和偏差，以改进未来模型。逆向工程是开源开发人员中的常见做法，被认为是合法的。

受到微软制裁的安全研究人员已经拼凑出 DeepSeek 可能在 2024 年秋季从 OpenAI 的 API 中挖掘出大量代码。微软当时应该让 OpenAI 意识到了这一漏洞。 R1模型于上周发布，引起了这家中国人工智能公司和相关方的关注。

DeepSeek 也被誉为开源人工智能应用程序，任何人都可以在其上进行开发。这就是该平台令人兴奋的地方——除了它与ChatGPT和 Google Gemini 等顶级工具的比较之外。 OpenAI 不是一项开源服务；但是，任何人都可以注册访问其 API。 TechCrunch指出，该公司确实在其服务条款中明确表示，其他实体不能使用输出来训练其他人工智能模型。

OpenAI发言人告诉路透社，无论法规如何，各种国际公司试图复制美国知名公司的模型现在已经很常见。

“我们采取反措施来保护我们的知识产权，包括一个谨慎的过程，将前沿能力纳入已发布的模型中，并相信，在我们前进的过程中，与美国政府密切合作以最好地保护我们的知识产权至关重要。最有能力的模型来自对手和竞争对手获取美国技术的努力，”发言人说。