DeepSeek：关于推翻 ChatGPT 的人工智能，您需要了解的一切

一家成立一年的中国初创公司发布了一款聊天机器人，其性能可与ChatGPT相媲美，同时所用的电力、冷却和培训费用仅为 OpenAI、Google 和 Anthropic 系统所需的一小部分，从而席卷了人工智能行业。以下是您需要了解的有关 Deepseek V3 和 R1 模型的所有信息，以及该公司为何能够从根本上颠覆美国的人工智能雄心。

什么是 DeepSeek？

DeepSeek（技术上为“杭州DeepSeek人工智能基础技术研究有限公司”）是一家中国人工智能初创公司，最初成立于2023年4月，是其母公司High-Flyer的人工智能实验室。同年5月，DeepSeek被分拆成自己的公司（High-Flyer 仍作为投资者），并发布了 DeepSeek-V2 模型。 V2 的性能与字节跳动、腾讯和百度等其他领先的中国人工智能公司相当，但运营成本却低得多。

该公司随后于 2024 年 12 月发布了 V3。V3 是一个 6710 亿参数的模型，据称训练时间不到 2 个月。更重要的是，根据 Jeffries 最近的分析，DeepSeek 的“培训成本仅为 560 万美元（假设租赁成本为 2 美元/H800 小时）”。这还不到 Meta 的 Llama 成本的 10%。”这只是谷歌、微软、xAI 和 OpenAI 等美国公司在模型训练上花费的数亿至数十亿美元的一小部分。

隆重推出 DeepSeek-V3！
迄今为止最大的飞跃：
⚡ 60 个令牌/秒（比 V2 快 3 倍！）
增强的能力
API 兼容性完好
完全开源的模型和文件
1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 2024 年 12 月 26 日

基准测试表明 V3 的性能与 GPT-4o 和 Claude 3.5 Sonnet 相当。 The Hill 2024 年 12 月的一篇专栏文章将 DeepSeek 的成功归类为美国的“人造卫星时刻”。

DeepSeek 于 2024 年 11 月发布了 R1-Lite-Preview 模型，声称新模型的性能可能优于 OpenAI 的 o1 系列推理模型（而且价格仅为 OpenAI 的一小部分）。该公司估计，根据任务的不同，R1 模型的运行成本比 OpenAI o1 低 20 到 50 倍。 DeepSeek 随后于 2025 年 1 月发布了 DeepSeek-R1 和 DeepSeek-R1-Zero。R1 模型与其 o1 竞争对手不同，是开源的，这意味着任何开发人员都可以使用它。

因此，V3 和 R1 自发布以来就迅速流行，DeepSeek 的 V3 驱动的人工智能助手取代了 ChatGPT，登上了应用商店的榜首。风险投资家马克·安德森 (Marc Andreesen) 在最近的社交媒体帖子中称 DeepSeek 的聊天机器人是“我见过的最令人惊奇和令人印象深刻的突破之一”，也是“给世界的一份深远的礼物”。

DeepSeek 能做什么？

作为一种开源大型语言模型，DeepSeek 的聊天机器人基本上可以完成 ChatGPT、Gemini 和 Claude 可以完成的所有操作。这包括文本、音频、图像和视频生成。此外，据报道，DeepSeek 新发布的多模态模型系列（称为Janus Pro ）在两项行业基准测试中的表现优于 DALL-E 3 以及 PixArt-alpha、Emu3-Gen 和 Stable Diffusion XL。 DeepSeek-R1与o1相媲美，专门用于执行复杂的推理任务，同时生成问题的逐步解决方案并建立“逻辑思维链”，在解决问题时逐步解释其推理过程。

哦男孩#deepseek
—亚历克西奥斯·曼查里斯 (@mantzarlis.com) 2025-01-27T16:50:40.640Z

DeepSeek的产品做不到的就是谈论天安门广场。或者黄雨伞抗议。或者习近平主席酷似小熊维尼。基本上，如果这是一个被中国共产党禁止的话题，DeepSeek 的聊天机器人将不会解决它或以任何有意义的方式参与。

谁可以使用 DeepSeek？

DeepSeek 暂时禁止注册 — 安德鲁·塔兰托拉 / DeepSeek / 数字趋势

作为开源法学硕士，DeepSeek 的模型可供任何开发人员免费使用。 OpenAI 对访问 o1 所需的 Pro 订阅收取每月 200 美元的费用。 DeepSeek 的模型可通过公司的 API 和移动应用程序在网络上获取。您需要在DeepSeek 网站上注册一个免费帐户才能使用它，但该公司已暂时停止新的注册，以应对“对 DeepSeek 服务的大规模恶意攻击”。现有用户可以正常登录并使用该平台，但目前还没有关于新用户何时能够亲自尝试 DeepSeek 的消息。

为什么 DeepSeek 突然变得如此重要？

自 2023 年 11 月发布 ChatGPT 以来，美国人工智能公司一直专注于构建更大、更强大、更广泛、更强大和资源密集的大型语言模型。 OpenAI、微软、Anthropic 和谷歌等公司并没有寻求建立更具成本效益和能源效率的法学硕士，而是按照美国传统，简单地投入大量资金和资源，以暴力方式推动技术进步。问题所在。仅 2024 年，xAI 首席执行官埃隆·马斯克 (Elon Musk) 个人预计将在人工智能项目上花费超过 100 亿美元。 OpenAI 及其合作伙伴刚刚宣布了一项价值 5000 亿美元的 Stargate 计划，该计划将大大加快美国各地绿色能源公用事业和人工智能数据中心的建设。首席执行官桑达尔·皮查伊 (Sundar Pichai) 表示，谷歌计划在 2025 年优先扩展 Gemini 平台，并预计今年将花费数十亿美元来实现这一目标。 Meta于1月中旬宣布，今年将花费高达650亿美元用于人工智能开发。

DeepSeek 刚刚向世界表明，这些实际上都没有必要——近几个月来一直在帮助刺激美国经济的“人工智能繁荣”，并使 Nvidia 等 GPU 公司比 2023 年 10 月时的财富成倍增加。无非是一场骗局。这也让人质疑美国在人工智能领域实际上领先了多少，尽管过去一年多次禁止向中国运送先进的 GPU 。

Truist 分析师基思·勒纳 (Keith Lerner) 告诉CNN ：“最重要的是，美国的优异表现是由科技和美国公司在人工智能领域的领先地位推动的。” “DeepSeek 模型的推出正在导致投资者质疑美国公司的领先地位、花费了多少以及这些支出是否会带来利润（或超支）。”

简而言之，DeepSeek 在自己的游戏中击败了美国人工智能行业，表明当前“不惜一切代价增长”的口号不再有效。 Raymond James 半导体分析师 Srini Pajjuri 告诉 CNBC ：“DeepSeek 显然无法获得像美国超大规模企业那样多的计算能力，但却设法开发了一种看起来极具竞争力的模型。”如果一家中国初创公司能够建立一个与 OpenAI 最新最好的人工智能模型一样有效的人工智能模型，并且在不到两个月的时间内，花费不到 600 万美元，那么 Sam Altman 还有什么用呢？

Third Seven Capital 的市场策略师迈克尔·布洛克 (Michael Block) 告诉 CNN，“时间会证明 DeepSeek 的威胁是否真实——关于什么技术有效以及西方大型企业将如何应对和发展的竞赛正在展开。” “在特朗普 2.0 时代开始时，市场变得过于自满，可能一直在寻找借口退出——而他们在这里找到了一个很好的借口。”