DeepSeek:一家用实力“做空”美国科技股的量化背景初创¶
大家好,今天想跟大家聊聊最近引发全球关注的DeepSeek。这家成立于 2023年、由Liam Wenfeng创办的中国AI研究实验室,凭借其开放源码的DeepSeek-R1 模型,正对美国科技巨头主导的AI格局发起强力冲击。让我们一起来看看,究竟是哪些亮点让DeepSeek迅速登上全球焦点,并在资本市场引发如此巨大波动。
截止发稿时间:美国科技股大幅下跌!¶
- Bloomberg 报道称,纳斯达克100期货与欧洲Stoxx 600科技子指数双双下跌,合计市值蒸发了 1.2万亿美元;
-
“七巨头”(Magnificent Seven) 受创:
-
Nvidia股价狂跌-11%
- Alphabet (GOOG/GOOGL) -3%
- Amazon (AMZN) -2.4%
- Meta (META) -1.4%
- Microsoft (MSFT) -3.2%
- Tesla (TSLA) -0.61%
-
Apple (AAPL)却逆势上涨1.2%,因为App Store里DeepSeek相关应用大受欢迎
-
芯片股:ASML -6.2%,Broadcom (AVGO) -12%,Qualcomm (QCOM) -1.4%,AMD (AMD) -4.5%
可见,DeepSeek的“低硬件需求”理念,给不少芯片及云计算服务商带来了压力。
DeepSeek实验室及其两大背景¶
- 创始人:Liam Wenfeng
- 除了创建DeepSeek外,还曾创立了支持DeepSeek的对冲基金幻方量化。可见,这家实验室一开始就有“金融+技术”双重基因。
- 初步崭露头角:DeepSeek V3
- 2024年12月,DeepSeek首度发布开源LLM——DeepSeek V3,据说总投入不到600万美元,使用了Nvidia(英伟达)的 H800 芯片进行训练;
- 当时就打出了“高性能、低成本”的旗号,已经在全球AI社区里小有名气。
DeepSeek-R1:低成本、高性能的新标杆¶
DeepSeek在 V3 基础上进一步打造的R1版本,被视为直面OpenAI的王牌之作。
1. 强化学习直驱:突破常规SFT¶
- DeepSeek-R1几乎完全依赖强化学习(RL) 来迭代模型,极大减少了对人工注释数据的依赖;
- RL让模型能自行探索复杂的推理模式:自我验证(Self-verification)、反思(Reflection)和 Chain-of-Thought(CoT)等高级“思考”功能。
2. 性能对比:媲美OpenAI GPT-o1,成本却低95%¶
“DeepSeek-R1在数学、编程、推理三大维度,已接近OpenAI的o1,且成本仅其5%左右!”
——Roth Capital研究报告
- 考试题:在AIME 2024数学竞赛中,DeepSeek-R1的一次性正确率(pass@1)达到了71%,通过“多数表决”可提升至86.7%;
- 用户评价:在App Store上,DeepSeek相关应用排名迅速攀升,目前高居榜首,许多用户称赞其“透明、轻量、易上手”的特色。
3. 开放源码,但数据未完全开放¶
- MIT License:让研究者和开发者可以自由复用、修改、扩展模型;
- 训练数据尚未100%公开,限制了完全重现的可能性。不过,DeepSeek还是给全球AI社区提供了宝贵的思路和技术参考。
AI格局的挑战:低配芯片也能跑高端AI¶
DeepSeek在技术上最大的“杀招”,是证明了高端AI不再只能依赖昂贵的Nvidia A100、H100等顶级显卡。DeepSeek-V3的训练主要用了 H800 芯片,耗资不足600万美元,显著低于不少美国同行动辄数亿美元的投入。
“这意味着那些对昂贵AI硬件产生高估值的企业,前景可能被动摇。”
更广泛的影响:美国对AI的再投入¶
就在DeepSeek-R1公开后不久,OpenAI CEO Sam Altman与美国总统唐纳德·特朗普会面,共同宣布了名为Stargate Project的AI基础设施建设计划,计划耗资5000亿美元、为期四年,希望继续保持在AI硬件上的全球领先地位。
然而,DeepSeek的横空出世表明,仅靠砸钱买顶配算力或许不足以拉开绝对差距。
DeepSeek如何看待自身定位?¶
- 减轻昂贵AI成本
- 核心理念:利用强化学习+开源合作,让大量研究机构、企业可以低门槛使用并部署高性能AI。
- 拉近中美AI实力差距
- DeepSeek的出现,被视为中国AI团队在高端模型上与美国OpenAI、Meta等同行一较高下的象征。
- 多元商业模式
- 从对冲基金的资金支持到App Store的C端产品,DeepSeek未来可能沿着多条路径快速扩张。
写在最后:DeepSeek只是序幕?¶
DeepSeek从2023年创立到2025年一鸣惊人,用短短两年时间完成了大部分人难以想象的积累与突破。
- 对AI行业:它代表着“更少硬件消耗也能取得尖端成果”的新范式,或将引发资源重新分配;
- 对资本市场:市值大幅震荡反映了投资者对未来AI版图的重新评估;
- 对全球AI研究:开放源码但未公布全部数据,显示出DeepSeek在推进科研创新和保护自身竞争力之间的权衡。
不管怎样,DeepSeek-R1的横空出世为全球AI圈投下一颗重磅炸弹。接下来,随着Stargate Project等美国项目的推进,AI算力与算法之间的竞赛只会愈演愈烈。究竟哪个方向会成为下一阶段的主流?我们拭目以待。
参考资料¶
- DeepSeek Repository on Github: https://github.com/deepseek-ai/DeepSeek-R1
- DeepSeek paper: https://arxiv.org/html/2501.12948v1
- DeepSeek on Hugging Face: https://huggingface.co/deepseek-ai