众力资讯网

小米 MiMo 负责人罗福莉今日对此前 MiMo-V2.5 API 大幅降价(网

小米 MiMo 负责人罗福莉今日对此前 MiMo-V2.5 API 大幅降价(网页链接)作出了回应:

MiMo-V2.5 系列 API 永久降价最高降幅能达 99% 核心得益于两项技术优化:推理框架支持 SWA 分层 KV 缓存优化,缓存 Token 容量提升 5 倍、降低 80% 缓存成本;模型架构实现 1:7 极致 Full:SWA 稀疏比,让原始推理成本远低于行业平均水平。即便大幅让利开发者,小米在新定价下仍可基本维持收支平衡,当前推理引擎已接近满负载运行。罗福莉同时提到,此次降价并非盲目价格战,高性价比模型 API 能拉动大规模真实推理需求,带动 AI 全产业链发展,也能为 AGI 演进提供更廉价易得的算力,推动行业形成良性循环,后续小米还将发布 Blog 披露更多技术细节。