Anthropic 于2026年5月28日发布了最新的 AI 模型 Claude Opus 4.8,本次更新的核心宣传点在于模型的“诚实性”(honesty)。Anthropic 表示,其所有模型都基于诚实原则进行训练,例如避免做出没有依据的论断。但公司也承认,AI 模型普遍存在一个问题:它们有时会轻易下结论,在证据不足时自信地展示进展。
诚实性:更主动的不确定性标识
据 Anthropic 称,早期测试者发现 Opus 4.8 更愿意标记其工作结果中的不确定性,也更少做出无根据的声明。在公司内部评估中,Opus 4.8 在代码审查方面表现突出——它允许已编写代码中的缺陷被忽略的可能性比前一代降低约4倍。这意味着模型在生成代码后更有可能主动指出潜在错误,减少遗漏。
新功能:任务努力控制与动态工作流
除了诚实性改进,Opus 4.8 还允许用户指定 Claude 对任务的投入程度。高努力模式会消耗更多 token,生成更深入的响应;低努力模式则有助于节省速率限制,适合简单查询。这种灵活性让用户根据需求平衡响应质量和 token 消耗。
此外,Anthropic 以研究预览形式推出了“动态工作流”(Dynamic Workflows)功能。该功能让 Claude 能够承担更复杂的任务:它可自主规划工作,在单个会话中并行运行数百个次代理,并在向用户报告前验证输出。在 Opus 4.8 上,这些次代理可以运行更长时间,进一步强化了模型处理大规模、多步骤任务的能力。
从整体来看,Claude Opus 4.8 的更新聚焦于提升模型的可信度与实用性。诚实性改进直接回应了 AI 模型“自信犯错”的痛点,而任务控制与动态工作流则为用户提供了更灵活、更强力的工具。这些变化共同体现了 Anthropic 在模型可靠性和应用广度上的持续投入。
本文参考来源:The Verge
微信扫描下方的二维码阅读本文


