Artificial Analysis发布最新大模型榜单:千问3.7拿下国产第一,全球前五

Artificial Analysis最新榜单显示,阿里Qwen3.7-Max得分56.6,排名全球第五、国产第一,即将上线阿里云百炼提供API服务。

5月21日消息,第三方评测机构Artificial Analysis公布了最新的全球大模型榜单。阿里云旗下旗舰模型Qwen3.7-Max以56.6分位列总榜第五,超越Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1等所有国产模型,登顶国产模型第一。该模型即将在阿里云百炼平台上架提供API服务。

榜单成绩

Artificial Analysis是一个独立的大模型评测与分析平台,通过多维度基准测试形成系统性智能水平综合排名,被业内视为最具影响力的三方榜单之一。千问系列此前多次上榜,一个月前发布的Qwen3.6-Max-Preview曾创下国产模型最佳成绩,而这次Qwen3.7-Max再度刷新纪录。

Artificial Analysis官网截图显示Qwen3.7-Max位列全球第五、国产第一
Artificial Analysis官网截图显示,Qwen3.7-Max位列全球第五、国产第一

本次榜单中,Qwen3.7-Max得分56.6,比上一代旗舰模型提升4.8分,性能表现已逼近GPT-5.4(xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7(max)等头部模型,在全球所有模型中排名第五,稳居国产模型首位。

技术特性

Qwen3.7-Max专为Agent智能体场景进行了创新设计,在编程、智能体协作、推理等核心能力上实现了大幅突破。该模型可与Claude Code、OpenClaw、Hermes Agent、Qwen Code等多种Agent框架协同工作,通过自主编程和工具调用,能够独立完成长达35小时、涉及超过1000次工具调用的复杂长程任务,交付生产级成果,适用于企业级复杂场景。

目前Qwen3.7-Max已准备就绪,即将通过阿里云百炼平台对外提供API服务,供开发者和企业调用。

本文参考来源:量子位

发表回复