3090亿参量硬刚Deepseek？小米发布MiMo大模型

姜维 / 2025-12-17 13:02108435

近日，小米宣布推出自主研发的大模型MiMo-V2-Flash，它兼顾了模型能力与推理效率，能和用户进行连续、自然对话处理复杂逻辑问题，能阅读、总结长文本摘要，能主动实现多场景设备联动并给用户提供个性化端侧智能服务。

据介绍，小米MiMo-V2-Flash大模型采用1:5的Global Attention与Sliding Window Attention (SWA) 混合结构，拥有3090亿参数、150亿激活参数量，其模型权重和推理代码均采用MIT协议全面开源。

从官方放出的技术报告资料可以看到，小米MiMo-V2-Flash在数学推理、代码生成和多轮对话场景中接近第一梯队水平，如图其73.4% SWE-Bench Verified编程能力已经逼近GPT-5-High水平；在AIME 2025数学竞赛、GPQA-Diamond科学知识测试等硬核场景中，它同样跻身开源模型前列，与当前市场主流的DeepSeek-V3.2差距并不明显。

现阶段，用户可以通过Xiaomi MiMO Studio网页进行在线AI聊天，它搭载的MiMo-V2-Flash大模型支持深度思考、联网搜索选项，热点科技实测常规问题思考回答仅需3.4s左右，给出的答案也基本符合事实逻辑。

开发者也可以便捷调用MiMo的API，快速为自己的应用（尤其是小米生态内的）注入顶尖的对话、生成、推理能力，无需从零开始训练大模型，这无疑会降低AI应用开发门槛、成本，让第三方开发商制造出体验统一的AI原生应用。

目前，AI大模型产业正在迈入“精耕细作”的规模化应用阶段，Gemini 3、GPT 5.1等国际巨头凭借先发优势在核心技术和品牌认知上领先，Deepseek、豆包、通义千问、文心一言等国产模型通过开源、成本控制全力突围。此次小米MiMo-V2-Flash的上市能否凭借硬件生态优势走通差异化路径，还需要时间验证，不过感兴趣的朋友可以在Xiaomi MiMO Studio网页体验，感受不同企业对AI的调度开发差异。

3090亿参量硬刚Deepseek？小米发布MiMo大模型

发表评论注册|登录

热点资讯

好物推荐