Anthropic 禁止订阅用户通过第三方工具接入 Claude API 后,引发了行业广泛讨论。小米大模型团队负责人罗福莉凌晨发文,从工程实践角度提出了不同观点。

核心观点:短期成本上升,长期工程优化
罗福莉认为,Anthropic 的做法虽然会短期内推高用户使用成本,但从长期来看会带来更好的 工程纪律 。所谓工程纪律,是指社区会因为模型成本上升,在开发产品时做更合理的工程优化来提升 token 使用效率。
她特别点名批评了第三方工具 龙虾 ,指出其上下文管理存在问题:一个用户请求会触发多轮工具调用,每次都是携带长上下文的独立 API 请求,这种设计模式极其浪费 token。
行业痛点:价格战损害服务质量
罗福莉同时呼吁模型厂商不要打价格战。她指出,一些厂商靠低价吸引用户入坑后,却用缩水的模型和不稳定的服务损害用户体验。这种做法看似降低了门槛,实际上伤害了整个行业生态。
小米旗下 MiMo Token Plan 目前定价相对其他厂商同等套餐偏贵,罗福莉没有直接承认这一点,但间接回应了这个问题:小米的目标是 "长期稳定地交付高质量的模型和服务"。
工程实践启示
这一事件反映出 AI 应用开发中的几个关键问题:
上下文管理 是 token 消耗大户。合理的上下文窗口设计、增量更新机制、缓存策略都能显著降低成本。
工具调用模式 需要优化。避免每个请求都携带完整上下文,而是采用差异化的数据传输方式。
成本结构 要透明化。用户需要清楚知道钱花在哪里,才能做出合理的工程决策。
对开发者的建议
对于正在使用大模型 API 的开发者,罗福莉的建议值得参考:
- 评估真实需求:不是所有场景都需要长上下文,根据实际需求选择合适的模型规格
- 优化调用策略:减少不必要的重复请求,合理使用缓存和批处理
- 关注服务质量:选择 API 时不能只看价格,稳定性、延迟、支持水平同样重要
Anthropic 的这一决策虽然激进,但确实迫使开发者重新审视 token 使用效率问题。在 AI 成本仍然居高不下的当下,工程优化不是可选项,而是必选项。

