MiMo-V2.5 系列 API 永久降价,额度最高提升 8 倍

5月27日起,小米大模型 MiMo-V2.5 系列 API 永久降价,最高降幅 99%,不再按上下文窗口长度区分定价。同时 Token Plan 计费体系优化,用户可用额度提升至原来的 5-8 倍。

MiMo-V2.5 系列 API 定价

API 永久降价

新定价不再区分上下文窗口长度,统一计费。相比原始 API 定价,最高降幅可达 99%。

Token Plan 额度提升 5-8 倍

定价不变,Credits 大幅提升:

套餐定价调整后 Credits
Lite¥3941亿
Standard¥99110亿
Pro¥329380亿
Max¥659820亿

套餐 Credits 升级

Credits 与 Token 换算:

模型命中缓存未命中缓存输出
mimo-v2.5-pro2.5300600
mimo-v2.52100200

推理技术优化

价格下降背后是推理系统优化。小米技术团队基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,可缓存 token 数量提升至优化前的近 5 倍。

推理技术优化

其他信息

  • 百万亿 Token 创造者激励计划已于 5 月26 日 16:08 提前收官
  • 当前有效 Token Plan 用户额度已全量重置
  • MiMo-V2-Pro 和 V2-Omni 即将下线,建议迁移至 V2.5
  • TTS 系列限时免费

来源:Xiaomi MiMo 公众号

相关推荐