3090亿参量硬刚Deepseek?小米发布MiMo大模型

3090亿参量硬刚Deepseek?小米发布MiMo大模型

姜维 / 2025-12-17 13:0251030

近日,小米宣布推出自主研发的大模型MiMo-V2-Flash,它兼顾了模型能力与推理效率,能和用户进行连续、自然对话处理复杂逻辑问题,能阅读、总结长文本摘要,能主动实现多场景设备联动并给用户提供个性化端侧智能服务。

0.png

据介绍,小米MiMo-V2-Flash大模型采用1:5的Global Attention与Sliding Window Attention (SWA) 混合结构,拥有3090亿参数、150亿激活参数量,其模型权重和推理代码均采用MIT协议全面开源。

2.png

从官方放出的技术报告资料可以看到,小米MiMo-V2-Flash在数学推理、代码生成和多轮对话场景中接近第一梯队水平,如图其73.4% SWE-Bench Verified编程能力已经逼近GPT-5-High水平;在AIME 2025数学竞赛、GPQA-Diamond科学知识测试等硬核场景中,它同样跻身开源模型前列,与当前市场主流的DeepSeek-V3.2差距并不明显。

3.png

现阶段,用户可以通过Xiaomi MiMO Studio网页进行在线AI聊天,它搭载的MiMo-V2-Flash大模型支持深度思考、联网搜索选项,热点科技实测常规问题思考回答仅需3.4s左右,给出的答案也基本符合事实逻辑。

1.png

开发者也可以便捷调用MiMo的API,快速为自己的应用(尤其是小米生态内的)注入顶尖的对话、生成、推理能力,无需从零开始训练大模型,这无疑会降低AI应用开发门槛、成本,让第三方开发商制造出体验统一的AI原生应用。

目前,AI大模型产业正在迈入“精耕细作”的规模化应用阶段,Gemini 3、GPT 5.1等国际巨头凭借先发优势在核心技术和品牌认知上领先,Deepseek、豆包、通义千问、文心一言等国产模型通过开源、成本控制全力突围。此次小米MiMo-V2-Flash的上市能否凭借硬件生态优势走通差异化路径,还需要时间验证,不过感兴趣的朋友可以在Xiaomi MiMO Studio网页体验,感受不同企业对AI的调度开发差异。


发表评论注册|