Claude Opus 4.8 发布:模型在出错时表现更“诚实”

Anthropic于5月28日发布Claude Opus 4.8,新模型强调“诚实性”,能更主动标识不确定性并减少无依据声明。代码评估中缺陷通过率比前代低约4倍。同时新增用户可调任务投入等级与动态工作流功能。

Anthropic于5月28日发布Claude Opus 4.8,新模型强调“诚实性”,能更主动标识不确定性并减少无依据声明。代码评估中缺陷通过率比前代低约4倍。同时新增用户可调任务投入等级与动态工作流功能。

2026年5月23日,Electrobun 2.0 宣布完全脱离 Bun 运行时,原因是 Bun 的 Rust 重写缺乏人工代码审查与规范发布流程。同日,yt-dlp 也限制对 Bun 支持,指责其“vibe coded”式开发。两起事件引发对 AI 代码质量管控的讨论。