DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

🔥 事件核心：DeepSeek 官方宣布，V4-Pro 模型 API 价格将于5月31日结束2.5折优惠后，正式永久调整为原定价的1/4。与此同时，API 完成输出提速与服务扩容，默认支持500并发同时在线。永久降价+全面提速，国产大模型在价格上的"内卷"再次升级。

⚡ 一、降价幅度有多大？先看数字

DeepSeek-V4-Pro 的 API 原价与永久降价后价格对比如下：

编号	计费维度	原价	永久降价后	降幅
1	输入（缓存命中）	0.1元/百万Tokens	0.025元	75%
2	输入（缓存未命中）	12元/百万Tokens	3元	75%
3	输出	24元/百万Tokens	6元	75%

简单算一笔账： 如果你每天调用100万输出Tokens，原价每天24元、每月720元；降价后每天仅6元、每月仅180元。一年省下近6500元。一个中型创业团队如果每月消耗5000万输出Tokens，年省成本高达32.5万元——这已经够雇一名初级工程师了。

同步上线的还有两项重磅升级：

🚀 输出速度大幅提升：模型推理速度明显加快，用户体验从"等几秒"变为"瞬间出"
🌐 默认500并发：API默认支持500个请求同时在线，企业级用户可在线申请更高配额

这意味着什么？低成本+高并发+快速度，DeepSeek 正在把自己打造成"AI界的性价比之王"。

🎯 二、为什么 DeepSeek 敢这么降？

1️⃣ 技术底牌：百万上下文+前缀缓存

DeepSeek-V4 的核心技术优势是 百万Token超长上下文 和 前缀缓存（Prefix Caching） 机制。缓存命中时的输入成本仅为0.025元/百万Tokens——这个价格已经低到几乎可以忽略不计。当大量用户请求共享相同的前缀（如系统提示词、长文档前缀）时，缓存命中率大幅提升，边际成本趋近于零。

2️⃣ 规模效应：用户越多，成本越低

DeepSeek-V4 自4月下旬开源上线以来，用户量爆发式增长，DAU已破亿。推理规模越大，硬件利用率越高，单次推理成本越低。 这是所有大模型厂商降价的核心逻辑——用规模换成本，用成本换市场。

3️⃣ 意图明确：抢生态、抢开发者

降价从来不是做慈善。DeepSeek 的目标很清晰——用最低的价格把开发者留在自己的生态里。一旦开发者的产品深度绑定了 DeepSeek API，迁移成本就会上升。这是典型的"先亏后赚"策略。

4️⃣ 融资底气：500亿弹药在途

据消息，DeepSeek 正在寻求约 500亿元融资，下月将发布 V4.1 更新。充裕的资金储备让 DeepSeek 有底气长期打价格战——先烧钱占市场，再考虑盈利。

🌍 三、国内外大模型竞品价格横评

将 DeepSeek-V4-Pro 降价后的价格与国际竞品做个对比：

编号	模型	输入价格（百万Tokens）	输出价格（百万Tokens）
1	DeepSeek-V4-Pro（降价后）	3元 / $0.41	6元 / $0.82
2	通义千问2.5-Max	4元 / $0.55	12元 / $1.65
3	GLM-5	5元 / $0.69	15元 / $2.06
4	文心一言4.5	4元 / $0.55	12元 / $1.65
5	Kimi K2	8元 / $1.10	20元 / $2.75
6	GPT-4o	~2.50∣ 2.50∣ 10.00
7	Claude 3.5 Sonnet	~3.00∣ 3.00∣ 15.00
8	Gemini 1.5 Pro	~3.50∣ 3.50∣ 10.50

结论很清楚： 国内市场中，DeepSeek 的输出价格仅为通义千问/文心一言的 1/2，为 GLM-5 的 2/5，为 Kimi K2 的 不到1/3。国际市场对比更悬殊——输出价仅为 GPT-4o 的 1/12，约为 Claude 3.5 Sonnet 的 1/18。

当然，价格不是一切。在复杂多步推理、代码生成、多模态理解等前沿能力上，国际头部模型仍有优势。但 DeepSeek 的策略是——"我打八折你可能不换，我打一折你一定会试试"。

🧑‍💻 四、对开发者的六大利好

利好①：成本断崖式下降
API调用成本直降75%。对中小团队和个人开发者，之前每月花费数千元的 AI 能力，现在只需数百元。

利好②：500并发免去扩容烦恼
默认500并发支持，意味着中小型应用无需额外配置负载均衡，开箱即用。

利好③：输出速度翻倍
模型推理速度提升后，用户等待时间大幅缩短，产品体验质的飞跃。

利好④：支持图文多模态
DeepSeek 已大范围开放"识图模式"，正式跨入图文交互时代。降价后的多模态API成本同样大幅降低。

利好⑤：开源可自部署
DeepSeek-V4 模型本身已开源。企业可以在自己的服务器上部署私有实例，结合公有云API做混合架构，灵活性远高于闭源模型。

利好⑥：生态工具正在完善
DeepSeek 组建了 Harness 团队，主攻代码智能体产品，内部对标 Claude Code。同时正在招聘 Harness 产品经理和研发工程师，目标是打造"DeepSeek 桌面端 Agent 产品"。从模型到工具链，DeepSeek 正在搭建完整开发生态。

⚔️ 五、竞品会如何应对？

🟦 可能反应一：被迫跟进降价

如果 DeepSeek 的用户量持续爆发，其他国产模型（通义千问、文心一言、GLM、Kimi 等）大概率会被迫跟进降价。不降，开发者就会流向 DeepSeek；降，利润空间进一步压缩。这是一个两难选择。

🟦 可能反应二：差异化竞争

明智的做法不是硬拼价格，而是 在产品体验和垂直场景上拉开差距。比如：

百度文心一言走"搜索+AI"闭环
阿里通义千问主打"电商+企业级AI"
Kimi 在超长文档处理上继续深耕

🟦 可能反应三：出海与开源

面对国内市场的惨烈竞争，部分国产模型厂商可能转向海外市场或开源生态。DeepSeek 本身已证明：高质量开源 + 极低价格 = 全球开发者社区的爆发式增长。

🟦 国际巨头的视角

Google Gemini 3.5 Flash 刚刚在 I/O 大会上发布，每秒289 tokens的输出速度4倍于GPT-5.5。国际市场的主战场是能力竞赛而非价格战——OpenAI、Google、Anthropic 在追求的是"别人做不到的事"，而非"同样的事更便宜"。这使得 DeepSeek 在全球市场有独特的生存空间。

🔮 六、展望：AI 普惠化的临界点

DeepSeek-V4-Pro 永久降价至1/4，可能被历史记住为 AI 普惠化的一个临界点。

这个临界点的意义在于：当顶尖大模型的 API 调用成本降低到"可以随意使用"的水平时，AI 将从一个需要精打细算的稀有资源，变成一个可以随手调用的公共基础设施。

开发者可以构建更复杂的 AI 应用而不必担心成本失控；创业者可以用极低的门槛验证 AI 产品创意；教育机构可以让每位学生都拥有 AI 助教——这些都因为价格门槛的消失而变为可能。

一句话总结： 这不是一次普通的降价。这是 DeepSeek 用技术实力和资金储备，向整个行业宣告——AI 的基础设施时代，来了。

📌 一张表看懂

编号	维度	原价	永久降价后	变化
1	输出价格	24元/百万Tokens	6元	↓75%
2	默认并发	未公布	500	大幅提升
3	输出速度	标准	显著提速	体验升级
4	缓存命中输入	0.1元	0.025元	接近免费

原文链接 https://www.yijunzhao.cn/archives/deepseek-v4-pro-yong-jiu-jiang-jie-zhi-1-4-guo-chan-da-mo-xing-da-xiang-jie-ge-zhan-di-er-qiang

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

⚡ 一、降价幅度有多大？先看数字

🎯 二、为什么 DeepSeek 敢这么降？

1️⃣ 技术底牌：百万上下文+前缀缓存

2️⃣ 规模效应：用户越多，成本越低

3️⃣ 意图明确：抢生态、抢开发者

4️⃣ 融资底气：500亿弹药在途

🌍 三、国内外大模型竞品价格横评

🧑‍💻 四、对开发者的六大利好

⚔️ 五、竞品会如何应对？

🟦 可能反应一：被迫跟进降价

🟦 可能反应二：差异化竞争

🟦 可能反应三：出海与开源

🟦 国际巨头的视角

🔮 六、展望：AI 普惠化的临界点

评论

2026 年信创国产化产品名录（权威完整版）

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

MinIO 已死！2026 年最全开源替代方案终极指南

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

💾 2026 年 NAS 全面横评：极空间/绿联/华为 vs 群晖/威联通，国产品牌逆袭了吗？

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"