小米大模型负责人：Claude封杀第三方工具背后的工程纪律思考

Anthropic 禁止订阅用户通过第三方工具接入 Claude API 后，引发了行业广泛讨论。小米大模型团队负责人罗福莉凌晨发文，从工程实践角度提出了不同观点。

核心观点：短期成本上升，长期工程优化

罗福莉认为，Anthropic 的做法虽然会短期内推高用户使用成本，但从长期来看会带来更好的 工程纪律 。所谓工程纪律，是指社区会因为模型成本上升，在开发产品时做更合理的工程优化来提升 token 使用效率。

她特别点名批评了第三方工具龙虾，指出其上下文管理存在问题：一个用户请求会触发多轮工具调用，每次都是携带长上下文的独立 API 请求，这种设计模式极其浪费 token。

罗福莉同时呼吁模型厂商不要打价格战。她指出，一些厂商靠低价吸引用户入坑后，却用缩水的模型和不稳定的服务损害用户体验。这种做法看似降低了门槛，实际上伤害了整个行业生态。

小米旗下 MiMo Token Plan 目前定价相对其他厂商同等套餐偏贵，罗福莉没有直接承认这一点，但间接回应了这个问题：小米的目标是 "长期稳定地交付高质量的模型和服务"。

这一事件反映出 AI 应用开发中的几个关键问题：

上下文管理 是 token 消耗大户。合理的上下文窗口设计、增量更新机制、缓存策略都能显著降低成本。

工具调用模式 需要优化。避免每个请求都携带完整上下文，而是采用差异化的数据传输方式。

成本结构 要透明化。用户需要清楚知道钱花在哪里，才能做出合理的工程决策。

对于正在使用大模型 API 的开发者，罗福莉的建议值得参考：

Anthropic 的这一决策虽然激进，但确实迫使开发者重新审视 token 使用效率问题。在 AI 成本仍然居高不下的当下，工程优化不是可选项，而是必选项。