DeepSeek：一家用实力“做空”美国科技股的量化背景初创¶

大家好，今天想跟大家聊聊最近引发全球关注的DeepSeek。这家成立于 2023年、由Liam Wenfeng创办的中国AI研究实验室，凭借其开放源码的DeepSeek-R1 模型，正对美国科技巨头主导的AI格局发起强力冲击。让我们一起来看看，究竟是哪些亮点让DeepSeek迅速登上全球焦点，并在资本市场引发如此巨大波动。

截止发稿时间：美国科技股大幅下跌！¶

Bloomberg 报道称，纳斯达克100期货与欧洲Stoxx 600科技子指数双双下跌，合计市值蒸发了 1.2万亿美元；
“七巨头”（Magnificent Seven） 受创：
Nvidia股价狂跌-11%
Alphabet (GOOG/GOOGL) -3%
Amazon (AMZN) -2.4%
Meta (META) -1.4%
Microsoft (MSFT) -3.2%
Tesla (TSLA) -0.61%
Apple (AAPL)却逆势上涨1.2%，因为App Store里DeepSeek相关应用大受欢迎
芯片股：ASML -6.2%，Broadcom (AVGO) -12%，Qualcomm (QCOM) -1.4%，AMD (AMD) -4.5%

可见，DeepSeek的“低硬件需求”理念，给不少芯片及云计算服务商带来了压力。

DeepSeek实验室及其两大背景¶

创始人：Liam Wenfeng
除了创建DeepSeek外，还曾创立了支持DeepSeek的对冲基金幻方量化。可见，这家实验室一开始就有“金融+技术”双重基因。
初步崭露头角：DeepSeek V3
2024年12月，DeepSeek首度发布开源LLM——DeepSeek V3，据说总投入不到600万美元，使用了Nvidia（英伟达）的 H800 芯片进行训练；
当时就打出了“高性能、低成本”的旗号，已经在全球AI社区里小有名气。

DeepSeek-R1：低成本、高性能的新标杆¶

DeepSeek在 V3 基础上进一步打造的R1版本，被视为直面OpenAI的王牌之作。

1. 强化学习直驱：突破常规SFT¶

DeepSeek-R1几乎完全依赖强化学习（RL） 来迭代模型，极大减少了对人工注释数据的依赖；
RL让模型能自行探索复杂的推理模式：自我验证（Self-verification）、反思（Reflection）和 Chain-of-Thought（CoT）等高级“思考”功能。

2. 性能对比：媲美OpenAI GPT-o1，成本却低95%¶

“DeepSeek-R1在数学、编程、推理三大维度，已接近OpenAI的o1，且成本仅其5%左右！”
——Roth Capital研究报告

考试题：在AIME 2024数学竞赛中，DeepSeek-R1的一次性正确率（pass@1）达到了71%，通过“多数表决”可提升至86.7%；
用户评价：在App Store上，DeepSeek相关应用排名迅速攀升，目前高居榜首，许多用户称赞其“透明、轻量、易上手”的特色。

3. 开放源码，但数据未完全开放¶

MIT License：让研究者和开发者可以自由复用、修改、扩展模型；
训练数据尚未100%公开，限制了完全重现的可能性。不过，DeepSeek还是给全球AI社区提供了宝贵的思路和技术参考。

Yann LeCun关于DeepSeek开源的评论

AI格局的挑战：低配芯片也能跑高端AI¶

DeepSeek在技术上最大的“杀招”，是证明了高端AI不再只能依赖昂贵的Nvidia A100、H100等顶级显卡。DeepSeek-V3的训练主要用了 H800 芯片，耗资不足600万美元，显著低于不少美国同行动辄数亿美元的投入。

“这意味着那些对昂贵AI硬件产生高估值的企业，前景可能被动摇。”

更广泛的影响：美国对AI的再投入¶

就在DeepSeek-R1公开后不久，OpenAI CEO Sam Altman与美国总统唐纳德·特朗普会面，共同宣布了名为Stargate Project的AI基础设施建设计划，计划耗资5000亿美元、为期四年，希望继续保持在AI硬件上的全球领先地位。

然而，DeepSeek的横空出世表明，仅靠砸钱买顶配算力或许不足以拉开绝对差距。

DeepSeek如何看待自身定位？¶

减轻昂贵AI成本
核心理念：利用强化学习+开源合作，让大量研究机构、企业可以低门槛使用并部署高性能AI。
拉近中美AI实力差距
DeepSeek的出现，被视为中国AI团队在高端模型上与美国OpenAI、Meta等同行一较高下的象征。
多元商业模式
从对冲基金的资金支持到App Store的C端产品，DeepSeek未来可能沿着多条路径快速扩张。

写在最后：DeepSeek只是序幕？¶

DeepSeek从2023年创立到2025年一鸣惊人，用短短两年时间完成了大部分人难以想象的积累与突破。

对AI行业：它代表着“更少硬件消耗也能取得尖端成果”的新范式，或将引发资源重新分配；
对资本市场：市值大幅震荡反映了投资者对未来AI版图的重新评估；
对全球AI研究：开放源码但未公布全部数据，显示出DeepSeek在推进科研创新和保护自身竞争力之间的权衡。

不管怎样，DeepSeek-R1的横空出世为全球AI圈投下一颗重磅炸弹。接下来，随着Stargate Project等美国项目的推进，AI算力与算法之间的竞赛只会愈演愈烈。究竟哪个方向会成为下一阶段的主流？我们拭目以待。

参考资料¶

DeepSeek Repository on Github: https://github.com/deepseek-ai/DeepSeek-R1
DeepSeek paper: https://arxiv.org/html/2501.12948v1
DeepSeek on Hugging Face: https://huggingface.co/deepseek-ai