Anthropic推出Claude Opus 4.8:快速模式成本降3倍,编码与智能体能力显著提升

Anthropic发布Claude Opus 4.8,标准定价不变,快速模式成本降低3倍($10/百万输入、$50/百万输出),速度提升2.5倍,最小缓存提示长度降至1024 tokens。模型支持1M上下文窗口,编码与智能体能力显著增强,安全对齐接近Mythos级别,现已于全平台上线。

Anthropic于今日正式推出旗舰大语言模型更新版本——Claude Opus 4.8。该模型在维持标准定价不变的同时,引入了成本大幅降低的快速模式(Fast Mode),并强化了编码、智能体任务及专业工作的表现。Opus 4.8已同步在Anthropic旗下多个平台上线,包括claude.ai、Claude Code、API以及Cowork。

快速模式定价大幅下调

快速模式是本次升级的核心亮点之一。该模式以研究预览(Research Preview)形式推出,允许用户在使用Opus 4.8模型时以约2.5倍的响应速度获得输出,而价格仅为此前快速模式的三分之一。具体计费标准为:输入tokens每百万10美元(约合人民币72元),输出tokens每百万50美元(约合人民币360元)。这一调整使得快速模式在保持高性能的同时,具备了更具竞争力的单token成本。

Anthropic推出Claude Opus 4.8,大幅提升自主与编码能力
Anthropic推出Claude Opus 4.8,大幅提升自主与编码能力

除了直接降价,Anthropic还进一步降低了最小可缓存提示长度(minimum cacheable prompt length)的阈值,从先前的2048 tokens下调至1024 tokens。这意味着需要频繁复用前缀提示词的应用——如长期对话、重复性分析任务——可以更充分地利用缓存机制,从而进一步减少预处理时间与成本。

快速模式适用场景

快速模式特别适用于延迟敏感、吞吐量较高的应用场景。开发者可以通过API启用该模式,在保持模型输出质量的前提下获得更快的响应速度。目前该模式仍处于研究预览阶段,Anthropic将根据实际使用反馈持续优化其性能与稳定性。

编码与智能体能力增强

在模型能力层面,Opus 4.8被Anthropic定义为“混合推理模型”(Hybrid reasoning model),表明其融合了多种推理策略,以更好地平衡响应速度与输出深度。

百万token上下文窗口

该模型支持高达100万tokens的上下文窗口(1M context window),使其能够一次性处理极大规模的数据集、完整代码库或超长对话记录。对于需要持续记忆和推理的AI智能体任务,这一能力尤为关键。模型能够在长时间运行的工作流中保持连贯性与自主性,显著减少人工介入的需求。

编码与专业工作表现提升

根据Anthropic提供的评估,Opus 4.8在编码、AI智能体以及复杂专业工作等任务上均表现出优于前代的连贯性与任务完成率。模型能够更独立地处理多步骤问题,降低对人工干预的依赖,这对于软件开发和自动化流程管理具有实际意义。

安全对齐进展

此外,据VentureBeat报道,Opus 4.8在安全合规与价值观对齐方面亦有进步,其对水平已接近Anthropic此前提出的“Mythos”标准。这意味着模型在有害内容过滤、指令遵循等方面可能具备更为出色的表现,有助于开发者在高风险场景中更安心地部署。

全面上线与成本结构

Claude Opus 4.8现已通过Anthropic所有主要渠道开放使用,包括对话式AI服务claude.ai、开发者工具Claude Code、应用程序编程接口(API)以及团队协作平台Cowork。标准模式的定价保持与Opus 4一致,未进行任何调整;快速模式则采用单独计费,目前以研究预览形式供应。用户可根据使用场景在标准模式与快速模式之间灵活选择,以实现成本与推理速度的平衡。

总体来看,Opus 4.8的发布在保持旗舰模型定价稳定的前提下,通过快速模式的降价显著降低了高吞吐场景的使用门槛;同时,1M上下文窗口以及更强的编码、智能体能力,进一步巩固了Claude系列在开发者和专业用户中的定位。对于已经基于Claude API构建应用的用户,升级至Opus 4.8能够以更低的成本获得更好的性能体验。

本文参考来源:Neowin



微信扫描下方的二维码阅读本文

Anthropic推出Claude Opus 4.8:快速模式成本降3倍,编码与智能体能力显著提升 - AI智能体, Anthropic, Claude Opus 4.8, 上下文窗口, 大语言模型, 快速模式, 混合推理模型, 编码能力

发表回复