小米MiMo-V2.5 API永久降价:最高降幅达99%,全面拥抱开发者生态

北京时间5月27日凌晨,小米旗下AI大模型平台MiMo宣布推出V2.5版本API,并同步实施永久性降价策略,新定价最高降幅可达99%,且不再区分上下文窗口长度。这标志着小米在AI大模型规模化落地道路上迈出了最为激进的一步。

小米MiMo-V2.5 API降价

永久降价:最高99%

相比原始API定价,MiMo-V2.5系列的新定价体系实现了大幅下调,最高降幅达99%。具体而言,新定价不再区分输入Token和输出Token的上下文窗口长度,而是采用统一计费标准,大幅简化了开发者的成本计算模型。

该调价已于北京时间5月27日0点在全球范围内同步生效。小米方面表示,此举旨在降低开发者使用MiMo模型的门槛,推动大模型技术的广泛应用。

Token Plan全面升级:加量不加价

在降价的同时,MiMo还对Token Plan计费体系进行了优化。新规则下,用户可用的Token用量提升至原来的5到8倍,真正实现了加量不加价。计费规则也变得更加清晰透明,开发者可以直观地了解自己的使用成本。

例如,在Agent或代码生成等高消耗场景下,同等价格可获得的Token数量大幅增加,这对中小开发者和创业团队来说是实实在在的利好。

百万亿Token激励计划收官

与此同时,小米此前推出的「百万亿Token创造者激励计划」也圆满落下帷幕。该计划自4月28日上线以来,受到了全球开发者的广泛关注和积极参与。截至5月26日16:08,总计100T(百万亿)Tokens已全部提前发放完毕。

值得注意的是,Apache软件基金会成员专属福利活动不受此次收官影响,长期有效,符合条件的成员可继续申请。

现有用户惊喜:额度全量重置

小米还宣布了一项针对现有用户的特别福利:所有已订阅Token Plan且当前仍在有效期内的用户,包括参与了百万亿Token激励计划获得Token Plan的用户以及Apache软件基金会专属福利用户,其Credits额度将于北京时间5月27日0点全量重置,并按新计费规则执行。

此外,针对Token Plan已过期的历史付费用户,小米也准备了惊喜好礼,将在未来一周内宣布具体方案。

推理技术深度优化

此次大幅降价的底气,来自于小米技术团队在推理系统上的持续深耕。据官方透露,MiMo团队基于SGLang HiCache完整支持了SWA(Sliding Window Attention,滑动窗口注意力机制),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近七分之一。

同时,可缓存的Token数量提升至优化前的近5倍,显著提高了缓存命中率和推理效率。此外,团队还通过优化专家并行方案、输入长度分桶策略等手段,进一步提升了集群的整体吞吐能力,从而在保障服务质量的前提下持续降低单位Token的服务成本。

这些技术优化意味着,降价并非牺牲利润的短期竞争策略,而是建立在实实在在的技术进步之上——更高效的推理系统支撑更低的价格,形成正向循环。

市场影响与展望

MiMo此次最高99%的降价幅度,在国内AI大模型市场中极具冲击力。当前国内主流大模型厂商如百度文心、阿里通义千问、讯飞星火等均在加速布局,价格战已经从单纯的推理成本竞争,延伸到了开发者生态建设、Token计划等更深层次的较量。

小米此举显然意在抢占开发者心智——通过极低的价格门槛和慷慨的Token计划,吸引更多开发者在MiMo平台上进行应用开发,从而构建自身的大模型生态壁垒。在AI大模型进入规模化应用的关键阶段,谁能积累更多的真实推理请求和场景数据,谁就将在下一阶段的竞争中获得更大的优势。

正如小米在公告中所说:「技术的价值,最终要体现在被使用的广度上。」依靠技术创新降低使用门槛,推动完整AI基础设施链条的建设,这或许是MiMo在这场大模型价格中最核心的战略考量。

随着此次调价的正式生效,中国AI大模型市场的竞争格局或将迎来新的变数。对于广大开发者和企业用户而言,这无疑是一个更加友好的时代。



微信扫描下方的二维码阅读本文

小米MiMo-V2.5 API永久降价:最高降幅达99%,全面拥抱开发者生态 - AI大模型, API降价, MiMo, 大语言模型, 小米, 开发者生态

发表回复