5月21日消息,第三方评测机构Artificial Analysis公布了最新的全球大模型榜单。阿里云旗下旗舰模型Qwen3.7-Max以56.6分位列总榜第五,超越Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1等所有国产模型,登顶国产模型第一。该模型即将在阿里云百炼平台上架提供API服务。
榜单成绩
Artificial Analysis是一个独立的大模型评测与分析平台,通过多维度基准测试形成系统性智能水平综合排名,被业内视为最具影响力的三方榜单之一。千问系列此前多次上榜,一个月前发布的Qwen3.6-Max-Preview曾创下国产模型最佳成绩,而这次Qwen3.7-Max再度刷新纪录。
本次榜单中,Qwen3.7-Max得分56.6,比上一代旗舰模型提升4.8分,性能表现已逼近GPT-5.4(xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7(max)等头部模型,在全球所有模型中排名第五,稳居国产模型首位。
技术特性
Qwen3.7-Max专为Agent智能体场景进行了创新设计,在编程、智能体协作、推理等核心能力上实现了大幅突破。该模型可与Claude Code、OpenClaw、Hermes Agent、Qwen Code等多种Agent框架协同工作,通过自主编程和工具调用,能够独立完成长达35小时、涉及超过1000次工具调用的复杂长程任务,交付生产级成果,适用于企业级复杂场景。
目前Qwen3.7-Max已准备就绪,即将通过阿里云百炼平台对外提供API服务,供开发者和企业调用。
本文参考来源:量子位

