在AI Agent等应用带动下,全球词元消耗量进一步攀升。2026年5月24日,AI模型聚合与调用平台OpenRouter公布了最新数据测算结果。数据显示,在2026年5月18日至5月24日这一周内,全球AI大模型总调用量达到28.9万亿Token,与之前一周相比增长7.4%。这是全球AI大模型周调用量连续第五周呈现环比上涨,表明大模型调用需求仍在持续释放过程中。
调用量持续攀升,中国大模型周调用量连续四周超美国
OpenRouter是一个专门用于AI模型聚合与调用的平台,其核心功能包括提供透明的Token级别监控与计费系统,旨在帮助开发者解决在调用多个AI模型时面临的接口碎片化、密钥管理复杂以及成本控制等多方面问题。根据OpenRouter平台的用户数据,其用户群体以海外开发者为主,中国开发者在平台中的占比约为6%。
从地域分布来看,在5月18日至5月24日的统计周期内,中国AI大模型周调用量达到9.22万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量已连续四周超越美国,稳居全球首位,这一数据反映出中国模型正在更深地进入全球开发者的调用体系。在具体模型排名方面,DeepSeek-V4-Flash已经登顶OpenRouter全球AI大模型调用榜,成为当周调用量最大的模型。
Token消耗增长驱动力
国内Token调用量增长加速
在国内市场,Token调用量的大幅增长已不是新鲜事。根据国家统计局公布的数据,2026年3月,豆包日均使用量在3个月内翻倍,达到120万亿。
Agent应用带来Token耗用乘数效应
中金公司测算显示,在中度使用场景下,当AI Agent的渗透率达到8%时,Agent的总Token消耗量已经与Chatbot相当。Agent的普及呈现出对Token消耗的乘数效应,随着单任务复杂度、使用时长与渗透率的协同提升,Agent有望推动日均Token消耗实现5倍以上的增长。
运营商加速布局Token服务
随着Token消耗与日俱增,Token工厂及Token运营商陆续落地。
三大运营商Token套餐相继推出
根据各公司官方网站公布的信息,中国移动于4月21日面向个人用户推出了Token算力服务产品,该产品支持DeepSeek、Qwen等主流大语言模型,用户最低只需5.99元即可购买一个次包,用于使用Token进行模型调用。中国电信于5月17日正式推出了系列试商用Token套餐,其中面向中小微客户的基础版月费为39.9元。中国联通上海分公司于5月16日宣布,向上海OPC客户提供Token服务。
Token工厂项目与算力租赁新模式
在基础设施领域,中国电信已经发布了“Token工厂”生成能力服务集中采购项目招标公告,表明运营商正在积极建设Token相关的基础设施。天风证券指出,AI数据中心正在向“Token工厂”演进,强调对大规模数据处理能力的需求,这一趋势将推动算力租赁市场从当前以“裸金属”服务器租赁时长为基础的固定月租模式,转向按照实际Token用量进行计费的新模式。
天风证券进一步强调,当Token成为算力的计价单位后,算力租赁服务商能够充分收获Token需求持续膨胀带来的红利,所有AI应用场景的高速渗透。算力租赁行业当前的高景气度主要源于国内算力市场的供需错配,这使得掌握高端算力芯片资源的头部租赁公司卡位优势更加凸显。综合赛道景气度与当前行业逐渐出清、向头部集中的趋势,天风证券看好头部算力租赁厂商在Token用量新一轮增长趋势下的增长弹性。
本文参考来源:互联网数据资讯网-199IT
微信扫描下方的二维码阅读本文


