Anthropic 于 2026 年 5 月 28 日正式发布了旗下最新大语言模型 Claude Opus 4.8。此次更新距离上一版本 Opus 4.7(4 月 16 日发布)仅六周时间,升级节奏明显加快。新模型即日起面向全球用户开放,定价与 Opus 4.7 保持一致。
Claude Opus 4.8 升级详解
更强的判断与协作能力
Anthropic 将 Opus 4.8 描述为拥有“更敏锐的判断力、更诚实的进展汇报、以及更长的独立工作能力”。早期测试者反馈,该模型更倾向于标记工作中的不确定性,且较少做出缺乏依据的陈述。官方称之为“更有效的协作者”。
在官方公布的基准测试中,Opus 4.8 相比 Opus 4.7 在多个维度取得进步:
- 代理编码(Agentic coding)得分从 64.3% 提升至 69.2%;
- 多学科推理与工具运用(Multidisciplinary reasoning with tools)从 54.7% 提升至 57.9%;
- 代理计算机使用(Agentic computer use)从 82.8% 提升至 83.4%;
- 知识工作(Knowledge work)得分从 1753 提升至 1890;
- 代理财务分析(Agentic financial analysis)从 51.5% 提升至 53.9%。
这些指标覆盖了编码、推理、工具使用和知识工作等关键领域,体现了模型综合能力的提升。
性能与成本优化
Opus 4.8 的快速模式速度达到前代的约 2.5 倍,同时使用成本降至原先的三分之一。这意味着用户可以在更短时间内获得相同质量的输出,同时降低 API 调用成本。
在编码与代理任务方面,Opus 4.8 默认启用高努力水平(High effort),据 Anthropic 称,该模式下 token 消耗与 Opus 4.7 编码任务相当,但性能更优。同时,Anthropic 在 Claude Code 中引入了 Extra 和 Max 两种更高努力档位。用户可通过 --extra 或 --max 参数调用,模型将投入更多 token 以获得更佳结果。官方建议在困难任务或长时间异步工作流中使用 Extra 模式。为匹配更高的 token 消耗,Claude Code 的速率上限也同步提升,用户可根据项目需求灵活选择努力级别,在成本和性能之间取得平衡。
此外,Anthropic 还宣布将在未来几周内向所有客户推出 Mythos 级网络安全模型。该模型此前已在部分关键软件平台面向特定利益相关方开放,此次将扩大至全部用户。
Claude Opus 4.8 自发布之日起已在全球范围内可用,用户可通过 Anthropic 平台体验。
本文参考来源:9to5Mac

微信扫描下方的二维码阅读本文


