Anthropic 发布 Claude Opus 4.8 模型，判断与代码能力显著增强

Anthropic 于 2026 年 5 月 28 日正式发布了旗下最新大语言模型 Claude Opus 4.8。此次更新距离上一版本 Opus 4.7（4 月 16 日发布）仅六周时间，升级节奏明显加快。新模型即日起面向全球用户开放，定价与 Opus 4.7 保持一致。

Claude Opus 4.8 升级详解

更强的判断与协作能力

Anthropic 将 Opus 4.8 描述为拥有“更敏锐的判断力、更诚实的进展汇报、以及更长的独立工作能力”。早期测试者反馈，该模型更倾向于标记工作中的不确定性，且较少做出缺乏依据的陈述。官方称之为“更有效的协作者”。

在官方公布的基准测试中，Opus 4.8 相比 Opus 4.7 在多个维度取得进步：

代理编码（Agentic coding）得分从 64.3% 提升至 69.2%；
多学科推理与工具运用（Multidisciplinary reasoning with tools）从 54.7% 提升至 57.9%；
代理计算机使用（Agentic computer use）从 82.8% 提升至 83.4%；
知识工作（Knowledge work）得分从 1753 提升至 1890；
代理财务分析（Agentic financial analysis）从 51.5% 提升至 53.9%。

这些指标覆盖了编码、推理、工具使用和知识工作等关键领域，体现了模型综合能力的提升。

性能与成本优化

Opus 4.8 的快速模式速度达到前代的约 2.5 倍，同时使用成本降至原先的三分之一。这意味着用户可以在更短时间内获得相同质量的输出，同时降低 API 调用成本。

在编码与代理任务方面，Opus 4.8 默认启用高努力水平（High effort），据 Anthropic 称，该模式下 token 消耗与 Opus 4.7 编码任务相当，但性能更优。同时，Anthropic 在 Claude Code 中引入了 Extra 和 Max 两种更高努力档位。用户可通过 --extra 或 --max 参数调用，模型将投入更多 token 以获得更佳结果。官方建议在困难任务或长时间异步工作流中使用 Extra 模式。为匹配更高的 token 消耗，Claude Code 的速率上限也同步提升，用户可根据项目需求灵活选择努力级别，在成本和性能之间取得平衡。

此外，Anthropic 还宣布将在未来几周内向所有客户推出 Mythos 级网络安全模型。该模型此前已在部分关键软件平台面向特定利益相关方开放，此次将扩大至全部用户。

Claude Opus 4.8 自发布之日起已在全球范围内可用，用户可通过 Anthropic 平台体验。