跳转至

DeepSeek:一家用实力“做空”美国科技股的量化背景初创

大家好,今天想跟大家聊聊最近引发全球关注的DeepSeek。这家成立于 2023年、由Liam Wenfeng创办的中国AI研究实验室,凭借其开放源码的DeepSeek-R1 模型,正对美国科技巨头主导的AI格局发起强力冲击。让我们一起来看看,究竟是哪些亮点让DeepSeek迅速登上全球焦点,并在资本市场引发如此巨大波动。

截止发稿时间:美国科技股大幅下跌!

  • Bloomberg 报道称,纳斯达克100期货与欧洲Stoxx 600科技子指数双双下跌,合计市值蒸发了 1.2万亿美元
  • “七巨头”(Magnificent Seven) 受创:

  • Nvidia股价狂跌-11%

  • Alphabet (GOOG/GOOGL) -3%
  • Amazon (AMZN) -2.4%
  • Meta (META) -1.4%
  • Microsoft (MSFT) -3.2%
  • Tesla (TSLA) -0.61%
  • Apple (AAPL)却逆势上涨1.2%,因为App Store里DeepSeek相关应用大受欢迎

  • 芯片股:ASML -6.2%,Broadcom (AVGO) -12%,Qualcomm (QCOM) -1.4%,AMD (AMD) -4.5%

可见,DeepSeek的“低硬件需求”理念,给不少芯片及云计算服务商带来了压力。

DeepSeek实验室及其两大背景

  1. 创始人:Liam Wenfeng
  2. 除了创建DeepSeek外,还曾创立了支持DeepSeek的对冲基金幻方量化。可见,这家实验室一开始就有“金融+技术”双重基因。
  3. 初步崭露头角:DeepSeek V3
  4. 2024年12月,DeepSeek首度发布开源LLM——DeepSeek V3,据说总投入不到600万美元,使用了Nvidia(英伟达)的 H800 芯片进行训练;
  5. 当时就打出了“高性能、低成本”的旗号,已经在全球AI社区里小有名气。

DeepSeek-R1:低成本、高性能的新标杆

DeepSeek在 V3 基础上进一步打造的R1版本,被视为直面OpenAI的王牌之作。

1. 强化学习直驱:突破常规SFT

  • DeepSeek-R1几乎完全依赖强化学习(RL) 来迭代模型,极大减少了对人工注释数据的依赖;
  • RL让模型能自行探索复杂的推理模式:自我验证(Self-verification)、反思(Reflection)和 Chain-of-Thought(CoT)等高级“思考”功能。

2. 性能对比:媲美OpenAI GPT-o1,成本却低95%

“DeepSeek-R1在数学、编程、推理三大维度,已接近OpenAI的o1,且成本仅其5%左右!”
——Roth Capital研究报告

  • 考试题:在AIME 2024数学竞赛中,DeepSeek-R1的一次性正确率(pass@1)达到了71%,通过“多数表决”可提升至86.7%
  • 用户评价:在App Store上,DeepSeek相关应用排名迅速攀升,目前高居榜首,许多用户称赞其“透明、轻量、易上手”的特色。

3. 开放源码,但数据未完全开放

  • MIT License:让研究者和开发者可以自由复用、修改、扩展模型;
  • 训练数据尚未100%公开,限制了完全重现的可能性。不过,DeepSeek还是给全球AI社区提供了宝贵的思路和技术参考。

Yann LeCun关于DeepSeek开源的评论

AI格局的挑战:低配芯片也能跑高端AI

DeepSeek在技术上最大的“杀招”,是证明了高端AI不再只能依赖昂贵的Nvidia A100、H100等顶级显卡。DeepSeek-V3的训练主要用了 H800 芯片,耗资不足600万美元,显著低于不少美国同行动辄数亿美元的投入。

“这意味着那些对昂贵AI硬件产生高估值的企业,前景可能被动摇。”

更广泛的影响:美国对AI的再投入

就在DeepSeek-R1公开后不久,OpenAI CEO Sam Altman美国总统唐纳德·特朗普会面,共同宣布了名为Stargate Project的AI基础设施建设计划,计划耗资5000亿美元、为期四年,希望继续保持在AI硬件上的全球领先地位。

然而,DeepSeek的横空出世表明,仅靠砸钱买顶配算力或许不足以拉开绝对差距。


DeepSeek如何看待自身定位?

  1. 减轻昂贵AI成本
  2. 核心理念:利用强化学习+开源合作,让大量研究机构、企业可以低门槛使用并部署高性能AI。
  3. 拉近中美AI实力差距
  4. DeepSeek的出现,被视为中国AI团队在高端模型上与美国OpenAI、Meta等同行一较高下的象征。
  5. 多元商业模式
  6. 从对冲基金的资金支持到App Store的C端产品,DeepSeek未来可能沿着多条路径快速扩张。

写在最后:DeepSeek只是序幕?

DeepSeek从2023年创立到2025年一鸣惊人,用短短两年时间完成了大部分人难以想象的积累与突破。

  • 对AI行业:它代表着“更少硬件消耗也能取得尖端成果”的新范式,或将引发资源重新分配;
  • 对资本市场:市值大幅震荡反映了投资者对未来AI版图的重新评估;
  • 对全球AI研究:开放源码但未公布全部数据,显示出DeepSeek在推进科研创新和保护自身竞争力之间的权衡。

不管怎样,DeepSeek-R1的横空出世为全球AI圈投下一颗重磅炸弹。接下来,随着Stargate Project等美国项目的推进,AI算力与算法之间的竞赛只会愈演愈烈。究竟哪个方向会成为下一阶段的主流?我们拭目以待。


参考资料