任务成本仅为Claude Opus 4.6 1/9,阶跃刷新Flash模型效率

阶跃星辰发布并开源Step 3.7 Flash,面向生产级Agent,在SWE-Bench Verified测试中达成Claude Opus 4.6编码性能的97%,单任务成本仅为其1/9。该模型通过“推理引擎+外部感知”的设计强化多模态与工具调用能力,兼顾速度、成本与可靠性。

阶跃星辰发布并开源Step 3.7 Flash,面向生产级Agent,在SWE-Bench Verified测试中达成Claude Opus 4.6编码性能的97%,单任务成本仅为其1/9。该模型通过“推理引擎+外部感知”的设计强化多模态与工具调用能力,兼顾速度、成本与可靠性。

Maia Chess团队发布基于Llama架构的开源AI国际象棋引擎Maia 3,在2.5亿局人类对局数据上训练,Elo评分达约1800分,较上代提升近300分,完全免费开源且支持本地部署,推动AI棋类引擎平民化。

Prusa Research推出开源ColorMix颜色混合模型,集成于PrusaSlicer与EasyPrint,仅用CMYKW五种耗材即可实现数十种色彩的FDM打印,并带来更准确的预览效果。

面壁智能联合清华大学、OpenBMB开源社区发布BitCPM-CANN,中国首个完全基于华为昇腾的三值(1.58-bit)大模型,覆盖0.5B至8B参数,实现国产算力全链路训练。