Token效率优化 关键字列表
小米发布MIT授权MiMo模型,专为长任务AI智能体设计

小米发布MIT授权MiMo模型,专为长任务AI智能体设计

小米以MIT许可证开源发布MiMo-V2.5和MiMo-V2.5-Pro两款模型,支持百万token上下文窗口。Pro版采用万亿参数稀疏MoE架构,每次请求仅激活420亿参数,混合注意力设计可将KV缓存存储压缩近7倍。基准测试显示,其token消耗比Claude、Gemini等主流模型低40%至60%。分析师认为,该模型在编码、测试、自动化等高频智能体任务中具备显著成本优势,有望推动企业AI部署走向开放模型与专有API并行的混合格局。