DeepSeek V4 系列发布已满一个月,官方于近期宣布将折上折价格正式定为永久降价。与此同时,开源社区推出了一款名为 Reasonix 的新工具,其缓存命中率最高可达 99.82%。这意味着原本消耗 4 亿 + token、费用 61 美元(约合人民币 414 元)的账单,能够直接降至 12 美元(约合人民币 81 元),相当于仅需支付原始成本的 2 折。
Reasonix 是一款专为 DeepSeek 打造的终端 coding harness,核心目标是降低长会话场景下的输入 token 成本。在长会话中,该工具能将缓存命中率稳定保持在 90% 以上,使输入 token 成本降至原来的五分之一。
- 京口令:
!J6NHf5HOewRhyCM3! CZ154- 淘口令:
88¥ MF168 h0W85DSomYr¥

Reasonix 的技术架构
缓存优先循环
自动前缀缓存(prefix-cache)仅在当前请求的精确字节前缀与先前请求匹配时才会激活。多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳,这不利于缓存命中。Reasonix 的解决方案是将上下文划分为三个区域:
- 固定前缀区:前缀被固定下来,在每个会话中仅计算一次;
- 只追加历史区:历史消息只追加不重写;
- 草稿区:草稿区中的任何信息在归入日志前,均需通过 Tool-Call Repair 进行提炼。
这种基于字节稳定 prefix-cache 的仅追加运行循环,使得旧上下文固定不动,新消息只向后追加,从而保证每一轮请求的前半部分完全一致,大幅提高缓存命中率。
工具调用修复
DeepSeek 在工具调用方面比较容易遇到以下几类问题:工具调用 JSON 在内部已生成但最终消息中消失;模型想调用工具但参数写歪(JSON 参数畸形);同一工具被反复调用且参数完全相同(重复调用风暴);JSON 被截断。Reasonix 通过四轮处理在真正执行前尝试修复这些问题,从而保证工具调用的稳定性和准确性。
成本控制与易用性
多级成本控制策略
Reasonix 在成本控制上采用分层机制:
- 默认优先使用 v4 flash,仅在处理困难任务时才会切换到 v4 pro;
- 每一轮对话结束后自动压缩上下文,减少后续请求体积;
- 用户可在需要时输入
/pro,主动将下一轮对话模型切换为 v4 pro,该轮结束后自动切回便宜模型; - 失败信号会触发自动升级:当失败次数到达警戒线后,当前轮次的剩余部分将自动切换至 v4 pro 运行。
安装与使用
Reasonix 的安装使用十分简单。用户只需进入项目目录并执行 npx reasonix code 即可启动终端 TUI 会话,无需全局安装。对于不习惯使用终端的用户,Reasonix 也提供了桌面版本。官方特别提醒,Reasonix 为 DeepSeek 量身打造,每个抽象层都基于 DeepSeek 的特性构建,因此不建议用于其他模型。
社区反响与讨论
Reasonix 在开源社区内迅速积累了相当高的关注度,项目星级增长明显。不过也有开发者提出疑问:是否一定需要一个 DeepSeek 原生编程 Agent?有网友分享了替代方案——其编写了一个微型桥接程序,在 Codex 中使用 DeepSeek V4 Pro,同样实现了 95% 以上的高缓存命中率,且未做任何特殊处理,仅调整了 API 格式。另有网友指出,不同 harness 之间的差异仍然存在,在 Claude Code 中使用 DeepSeek V4 比在 OpenCode 上更省钱。
无论使用哪种方案,在保证缓存命中率的前提下降低 API 调用成本,已成为 DeepSeek 生态中开发者共同关注的热点。如果希望亲自尝试,Reasonix 的项目地址已公开(github.com/esengine/DeepSeek-Reasonix),架构文档、Agent 相关内容均可在其官方页面中找到。
本文参考来源:量子位
微信扫描下方的二维码阅读本文



