DeepSeek V4 Pro永久降价75%,激进架构突破硅谷Token护城河

DeepSeek上周末宣布将旗舰模型V4 Pro的75%降价永久化,这一举动直接冲击硅谷前沿实验室以资本密集为核心的商业模式。降价后的V4 Pro在输入和输出成本上分别比Anthropic的Claude Sonnet和OpenAI的GPT 5.5-Med低7倍和17倍;其轻量级版本V4 Flash则比入门级模型Claude Haiku便宜10至25倍。原本作为企业生产工作马的西方模型,如今面临显著的成本挑战。

DeepSeek V4 Pro永久降价75%,激进架构突破硅谷Token护城河 -

高性能开源与双模型架构

大幅降价并未牺牲模型能力。V4 Pro在编码智能体评测SWE-bench Verified上达到80.6%,在高级推理MMLU-Pro上取得87.5分,与西方前沿模型的差距已非常微小。V4 Flash是专为开发者优化的超高速版本,适合延迟敏感的多步自主智能体调用。V4 Pro与V4 Flash均开放权重,采用宽松的MIT许可证。这种双模型策略允许技术团队将最重的多步自主智能体工作负载路由至闪电般快速的Flash模型,而将深层推理任务保留给Pro模型,在预算关注度大幅提升的当下显著降低总体成本。

缓存技术创新驱动效率跃升

价格竞争力源于一系列软硬件协同创新,特别是缓存(cache)环节的效率突破。通过优化缓存命中率与读取效率,模型推理时的计算资源需求被大幅压缩。当模型在中国本土数据中心托管时,其缓存读取定价相比西方云服务商低87倍。这一价格地板甚至吸引了手机巨头小米,直接在其新部署的MiMo架构中匹配了完全相同的定价层级。

企业成本压力与市场分化

此次永久降价的时间点恰逢西方封闭实验室面临严峻的投资回报审视。OpenAI和Anthropic数十亿美元的通用硬件基础设施投资正在被内部与市场仔细评估。企业用户的真实感受更为直接:Uber在2026年前四个月就耗尽了全年Claude Code与Cursor的预算,其COO承认部分工程师的高Token使用量成本“并没有更好的产品成果来回报”。Airbnb CEO Brian Chesky去年亦表示,公司虽使用OpenAI最新模型,但更青睐更快、更便宜的替代方案。这些案例显示企业界对AI调用成本的敏感度已达新高。

报道指出,这一价格通缩的冲击并不会均等地影响所有硅谷实验室。企业AI市场正出现永久性分化:关键任务工程工作流所需的高确定性模型层仍将维持溢价,但高容量的后台智能体层正被开放权重快速商品化。这一分化给OpenAI带来更危险的风险敞口,因其收入高度依赖通用型API流;而Anthropic等拥有软件隔离保护的同行,所受直接冲击相对有限。DeepSeek的激进架构正在击穿硅谷围绕Token建成的护城河,并推动企业AI服务进入不可逆的定价重构。

本文参考来源:VentureBeat



微信扫描下方的二维码阅读本文

DeepSeek V4 Pro永久降价75%,激进架构突破硅谷Token护城河 -

发表回复