Claude Opus 4.8 发布：更“诚实”的AI模型

Anthropic 于2026年5月28日发布了最新的 AI 模型 Claude Opus 4.8，本次更新的核心宣传点在于模型的“诚实性”（honesty）。Anthropic 表示，其所有模型都基于诚实原则进行训练，例如避免做出没有依据的论断。但公司也承认，AI 模型普遍存在一个问题：它们有时会轻易下结论，在证据不足时自信地展示进展。

诚实性：更主动的不确定性标识

据 Anthropic 称，早期测试者发现 Opus 4.8 更愿意标记其工作结果中的不确定性，也更少做出无根据的声明。在公司内部评估中，Opus 4.8 在代码审查方面表现突出——它允许已编写代码中的缺陷被忽略的可能性比前一代降低约4倍。这意味着模型在生成代码后更有可能主动指出潜在错误，减少遗漏。

新功能：任务努力控制与动态工作流

除了诚实性改进，Opus 4.8 还允许用户指定 Claude 对任务的投入程度。高努力模式会消耗更多 token，生成更深入的响应；低努力模式则有助于节省速率限制，适合简单查询。这种灵活性让用户根据需求平衡响应质量和 token 消耗。

此外，Anthropic 以研究预览形式推出了“动态工作流”（Dynamic Workflows）功能。该功能让 Claude 能够承担更复杂的任务：它可自主规划工作，在单个会话中并行运行数百个次代理，并在向用户报告前验证输出。在 Opus 4.8 上，这些次代理可以运行更长时间，进一步强化了模型处理大规模、多步骤任务的能力。

从整体来看，Claude Opus 4.8 的更新聚焦于提升模型的可信度与实用性。诚实性改进直接回应了 AI 模型“自信犯错”的痛点，而任务控制与动态工作流则为用户提供了更灵活、更强力的工具。这些变化共同体现了 Anthropic 在模型可靠性和应用广度上的持续投入。

本文参考来源：The Verge

微信扫描下方的二维码阅读本文

Claude Opus 4.8 发布：模型在出错时表现更“诚实”

诚实性：更主动的不确定性标识

新功能：任务努力控制与动态工作流

阿逸

发表回复取消回复

诚实性：更主动的不确定性标识

新功能：任务努力控制与动态工作流

阿逸

相关文章

教皇利奥十四世发布AI通谕：人工智能应服务人类而非集中权力

Anthropic 每月向 xAI 支付 12.5 亿美元，锁定 Colossus 数据中心全部算力

Anthropic 的 AI 漏洞发现模型 Mythos：危险、矛盾与即将到来的公开

发表回复取消回复