DeepSeek V4 永久降价后开源工具 Reasonix 实现 99.82% 缓存命中率，成本降至 2 折

DeepSeek V4 系列发布已满一个月，官方于近期宣布将折上折价格正式定为永久降价。与此同时，开源社区推出了一款名为 Reasonix 的新工具，其缓存命中率最高可达 99.82%。这意味着原本消耗 4 亿 + token、费用 61 美元（约合人民币 414 元）的账单，能够直接降至 12 美元（约合人民币 81 元），相当于仅需支付原始成本的 2 折。

Reasonix 是一款专为 DeepSeek 打造的终端 coding harness，核心目标是降低长会话场景下的输入 token 成本。在长会话中，该工具能将缓存命中率稳定保持在 90% 以上，使输入 token 成本降至原来的五分之一。

京东618红包

淘宝红包

百亿补贴
多多金蛋

京口令：！J6NHf5HOewRhyCM3！ CZ154

淘口令：88￥ MF168 h0W85DSomYr￥

Reasonix 工具示意图 — 公开信息显示，Reasonix 通过缓存优先循环大幅降低成本

Reasonix 的技术架构

缓存优先循环

自动前缀缓存（prefix-cache）仅在当前请求的精确字节前缀与先前请求匹配时才会激活。多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳，这不利于缓存命中。Reasonix 的解决方案是将上下文划分为三个区域：
- 固定前缀区：前缀被固定下来，在每个会话中仅计算一次；
- 只追加历史区：历史消息只追加不重写；
- 草稿区：草稿区中的任何信息在归入日志前，均需通过 Tool-Call Repair 进行提炼。

这种基于字节稳定 prefix-cache 的仅追加运行循环，使得旧上下文固定不动，新消息只向后追加，从而保证每一轮请求的前半部分完全一致，大幅提高缓存命中率。

工具调用修复

DeepSeek 在工具调用方面比较容易遇到以下几类问题：工具调用 JSON 在内部已生成但最终消息中消失；模型想调用工具但参数写歪（JSON 参数畸形）；同一工具被反复调用且参数完全相同（重复调用风暴）；JSON 被截断。Reasonix 通过四轮处理在真正执行前尝试修复这些问题，从而保证工具调用的稳定性和准确性。

成本控制与易用性

多级成本控制策略

Reasonix 在成本控制上采用分层机制：

默认优先使用 v4 flash，仅在处理困难任务时才会切换到 v4 pro；
每一轮对话结束后自动压缩上下文，减少后续请求体积；
用户可在需要时输入 /pro，主动将下一轮对话模型切换为 v4 pro，该轮结束后自动切回便宜模型；
失败信号会触发自动升级：当失败次数到达警戒线后，当前轮次的剩余部分将自动切换至 v4 pro 运行。

安装与使用

Reasonix 的安装使用十分简单。用户只需进入项目目录并执行 npx reasonix code 即可启动终端 TUI 会话，无需全局安装。对于不习惯使用终端的用户，Reasonix 也提供了桌面版本。官方特别提醒，Reasonix 为 DeepSeek 量身打造，每个抽象层都基于 DeepSeek 的特性构建，因此不建议用于其他模型。

社区反响与讨论

Reasonix 在开源社区内迅速积累了相当高的关注度，项目星级增长明显。不过也有开发者提出疑问：是否一定需要一个 DeepSeek 原生编程 Agent？有网友分享了替代方案——其编写了一个微型桥接程序，在 Codex 中使用 DeepSeek V4 Pro，同样实现了 95% 以上的高缓存命中率，且未做任何特殊处理，仅调整了 API 格式。另有网友指出，不同 harness 之间的差异仍然存在，在 Claude Code 中使用 DeepSeek V4 比在 OpenCode 上更省钱。

无论使用哪种方案，在保证缓存命中率的前提下降低 API 调用成本，已成为 DeepSeek 生态中开发者共同关注的热点。如果希望亲自尝试，Reasonix 的项目地址已公开（github.com/esengine/DeepSeek-Reasonix），架构文档、Agent 相关内容均可在其官方页面中找到。

本文参考来源：量子位

微信扫描下方的二维码阅读本文

DeepSeek V4 还能更省！开源工具 Reasonix 实现 99.82% 缓存命中率，成本降至 2 折

Reasonix 的技术架构

缓存优先循环

工具调用修复

成本控制与易用性

多级成本控制策略

安装与使用

社区反响与讨论

阿逸

发表回复取消回复

Reasonix 的技术架构

缓存优先循环

工具调用修复

成本控制与易用性

多级成本控制策略

安装与使用

社区反响与讨论

阿逸

相关文章

NVIDIA博客发文：全球前十的AI大模型，全部使用MoE架构

AMD MI355X AI显卡实测：288GB显存碾压NVIDIA B200，软件优化弥补互联短板

DeepSeek AI 用指向机制取代文本描述，视觉 Token 消耗减少 90%

发表回复取消回复