小米集团深研系列之二:小米AI登顶!

全文4100字,阅读需要约15分钟。

接上文,这篇重点分析一下小米集团现在AI部门的发展,未来借助AI可能达到的高度。

小米当前市值8500亿港币,约等于7560亿人民币,对应2025年年度利润415亿,相当于是18倍PE

2026年营收正增长问题不大,但利润大概率负增长,主要是因为存储等零部件涨价,汽车、AI、芯片、具身智能(机器人)的巨量研发投入还没有实际变现导致的,大部分是暂时性因素,即使净利润萎缩至350亿以下,现在的PE也只有22倍左右

这显然只是一家硬件公司,或缓慢增长的消费品公司应有的估值。

小米大量的创新业务,快速发展并可能铺向海外的电动车,AI、芯片和具身智能未来将创造的价值,都没有给估值。

1、小米的AI处在什么水平?

很多人对小米在AI领域的发展不甚了解,豆包、Qwen3、Seedance2.0等国产模型我们已经非常熟悉了,而对小米的模型使用不多,主要是小米目前最厉害的模型MiMo系列没有很好的流量入口,没有抖X、微X这样的超级日常应用。

小米的MiMo系列,现在主要给自家的“人车家”生态提供底座,属于“基础设施”,必须首先是小米的硬件用户,才能直接感受到。

4.1 初代MiLM

我自己做了一个图,帮大家理解小米从初代自研的MiLM,到第二代的MiLM2,再到今年发布的MiMo-V2系列(可以认为是MiLM3),有哪些进步:

首先小米的模型名称都是Mi打头的,第一代的MiLM中的LM,意为Large Language Model大语言模型。

小米2023年8月发布MiLM-6B,1个B是10亿,6B级别,模型总参数其实是64亿。2023年年底MiLM接入了澎湃OS,到2024年5月的时候才逐步应用在汽车、手机、智能家居等各种产品上,所以小米在AI领域的起步是比较晚的。

这里要说一下小米在发展AI大模型上,相比其他厂家的差异化打法。

雷军最早制定的战略就是,要走轻量化路线,要做本地部署(端侧),要做端云协同。

什么叫端侧?

就是计算的核心和模型就部署在本地,在硬件“端”的一边,与之对应是“云端”和“云侧”,端侧硬件的水平要求模型必须轻量化。比如自动驾驶这个功能,你使用云端模型去处理的话,延迟会很高,对通讯的稳定性要求极高,所以自动驾驶未来基本都会使用端侧模型。

小米的优势在于其生态,在于手机、车、家居设备的全场景布局。上一篇内容我们说过,小米现在除了手机、平板、笔电三电平台外的AIOT设备数、用户数,2025年底已经增长到了10.79亿,同比增长了19.3%,而且还在继续快速增长。

这里手机还好,迭代速度够快,端侧的处理能力和计算能力还可以,和云端的通讯能力也在线,但你想用车和其他家居产品实现AI覆盖,就有点儿强人所难了,比如手表、音箱这种低级形态。

这个时候小米如果一味地追求参数规模,追求模型的性能,追求逻辑、数学、编程等能力,就没法儿发挥出它硬件和生态的优势。

你不可能要求一个3年前出的电动车,或者手表、音箱这种低端硬件,拥有很好的算力和芯片性能。

而且当时的小米认为,和智谱、阿里、月之暗面这种云端模型厂商比性能,完全不是小米的强项。

所以这边儿发布的第一个模型MiML只有6B的参数,这个模型的特点就是极致的轻量化,牺牲复杂推理能力,强化在中文知识问答、文科类任务上的表现,最后小米也确实实现了在自家旗舰手机上的“无损部署”,成为了第一家在手机上无损部署6B以上模型的厂商。

4.2 第二代MiML2

之后到2024年11月的时候,小米发布了MiML的第二代模型,MiML2,模型参数扩展到了0.3B到30B的多个挡位,即从3亿到300亿,从这个模型开始逐渐覆盖了端侧和云端。

因为小米的设备众多,芯片算力和存储能力参差不齐。你可以理解为,设备越低端,可以部署更小的,比6B规模更小的0.3B、0.7B这样的微模型,效率更高。而到复杂任务的时候,又可以用更先进的设备比如手机、平板,部署13B或30B的模型。

二代模型对比一代,除了能力更强,还使用了量化、投机推理、剪枝等新的技术:

这些概念有点复杂,就不赘述了,我也不太看得懂,有需要的我可以把技术文档分享给大家。

总之这些量化、投机推理、剪枝一类的创新技术,能显著提升模型性能,提升推理速度和长文本处理的精准度,或者能大幅减少对硬件性能的需求,减少算力消耗。

4.3 第三代模型MiMO-V2系列

到2025年12月,小米正式发布了第三代模型,这是性能突飞猛进的一代,不再命名为MiML3,更名为MiMO-V2-FLASH

有FLASH这个词条的存在,证明是一个追求快速和轻量化的版本:

以及之后发布的满血版MiMO-V2-PRO(2026年3月19日发布),MiMo-V2-Omni,MiMO-V2-TTS,以上这些模型有什么区别?

首先看命名,MiMo中的Mi还是小米的意思,后半部分MO,至少包含两层含义。

一个是混合专家架构MOE(mixture of experts),简单地说从MiMO-V2开始,小米全面转向了混合专家模型架构,这是一种基于稀疏注意力机制的架构,可以动态选择一小部分称为“专家”的子网络进行计算,能提升模型的容量和计算效率,特点是“高参数,低计算量”。

比如说MiMo-V2-PRO,总参数达到1T,也就是一万亿!但激活参数只有42B。

不过现在MOE架构其实不稀罕了,大部分主流大模型都在使用了,且都有总参数和激活参数,比如阿里的千问Qwen3-30B-A3B,意思就是总参数30B,激活参数3B(Actived3B)。

第二层应该是包含多模态输入,多模态输出(Multiple-Input Multiple-Output)的意思,也就是模型除了能理解输入的文字以外,还可以理解图像、语音,甚至视频,同时也能生成多模态的内容。

所以MiMo-V2是一个系列,后缀FLASH、PRO、Omni等是不同版本,其中FLASH是高效轻量化版本,PRO是旗舰级的推理基座模型,Omni是全模态感知模型(Omni就是全能的意思),TTS是语音合成模型(Text-to-Speech文本信息到语音)。

第三代的MiMo-V2系列相比前两代有哪些进步?

我做个表格方便大家对比研究:

MiMo-V2相比前两代的主要特点是:规模更大,面向Agent时代打造,是多模态模型,上下文长度达到1M token(比上一代扩展了5倍以上),采用多层MTP推理加速技术。

这里过多堆砌AI领域的名词,对于投资人朋友理解起来有些困难,先说说小米最新一代几个模型取得的成绩。

4.4 小米大模型的真实能力

Artificial Analysis大模型榜单,也叫AA榜单,是当下较为权威的,针对大模型的第三方独立测评平台。他会对全球排名前列的大模型进行智能、逻辑推理、代码生成,以及面向智能体的能力测试,并进行排名,新的模型发布后测试分数会随时更新。

AA官网大家可以自行检索,这里避免违规不放链接了,直接给大家看看小米的几个模型的实力。

4.4.1 智能Intelligence

截至今天3月31日,在智能指数(Intelligence index)榜上,小米最顶尖的MiMo-V2-PRO得分49分,排在全球第7位

这是一个非常牛X的成绩,要知道小米在大模型领域其实算是新兵,之前一直是藉藉无名的。

上图中,我将小米的两个模型MiMo-V2-RPO和MiMo-V2-FLASH用橙色箭头标注。

轻量模型V2-FLASH仅以309B的总参数(激活参数15B),就拿到了41的高分,超越英伟达最强的模型Nemotron3的36分。

国产的,取得好成绩的几个模型,上图我用蓝色箭头标注。

目前排在小米V2-PRO前面的大模型有:Gemini3.1 PRO(57分)、GPT-5.4(xhigh版本,57分),Claude Opus 4.6(53分)、Claude Sonnet 4.6(max版,52分),以上几个来自GOOGLE、OPENAI、Anthropic三大美国AI巨头就不多说了,小米在资历、技术层面,投入的资源等,和这几个其实都没有可比性。

接下来是国产模型的骄傲,智谱的GLM-5,得到50分,排名全球第5,国内第1;MiniMax-M2.7得50分,排名全球第6,国内第2;之后就是小米的Mino-V2-PRO了,排在全球第7,国内第3,得分甚至高于马斯克的Grok 4.20和月之暗面的Kimi K2.5。

而排在后面的轻量FLASH版本,也只是以微弱的劣势输给大名鼎鼎的Qwen3.5和DeepSeek V3.2,可见其实力不俗。

4.4.2编程Coding和Agentic能力

体现逻辑推理的编程能力指数(Coding Index)方面:

MiMo-V2的PRO和FLASH两个版本,以41和33的分数,分别排在全球大模型总榜的第10和第14位。

推理和Coding能力不是小米的强项,但这个排名也相当不错了。

面向智能体的能力,自主感知、推理、规划与执行层面的指数Agentic Index

MiMo-V2的PRO版本以63分的好成绩,排在全球第5位,国内第2位,第1是智谱的GLM-5,同样是63分。

以上从智能、编程、AGENT三大能力综合来看,小米的第三代大模型MiMo-V2系列已经跻身绝对的第一梯队。

4.4.3 价格

以上谈的都是性能。

而我们知道模型的价格也非常重要,也就是单位性能,或单位token调用需要支付的马尼。

小米自己公布的,在256K上下文以内,它的输入和输出(input和output)的价格,只有Claude Sonnet 4.6的1/3,是Claude Opus 4.6的1/5:

前面我们看到Claude Opus 4.6和Claude Sonnet 4.6的智能Intelligence得分也不过53和52分,仅比小米MiMo-V2-PRO的49分略高,价格却是小米大模型的3到5倍!

而在AA榜单里的智能关联价格对比(Intelligence vs Cost)一项:

纵坐标代表智能,智能分数越高越好(在上图中越靠上越好),横坐标代表价格,价格越低越好(在上图中越靠左越好)。

也就是说,综合智能和价格,在上图坐标系中,越靠左上越好。可以看到小米的旗舰模型PRO和轻量模型FLASH,都在极其靠左上的位置(两个橙色箭头)。

4.4.4 Omni版本的Agentic

小米在发布MiMo-V2-RPO的同时,还发布了一个Omni版本,是面向全模态的底座模型,重点用于Agent领域。

这个分项需要看PinchBench榜,是专门用于评估模型在‌真实工作流中的执行能力,比如发一封邮件,直接调用 API,或者直接生成一份报告的能力,而不是传统意义上的知识问答,或者推理。

下图是截至3月31日的分数,V2-Omni版本在任务最佳完成率一项拿到85.6分的不错成绩,任务平均完成率得分81.9%,排名全球第三位,仅次于Minimax M2.7的83.2%和Claude Opus 4.6的83.1%。‌

可以说最近半年,小米在AI大模型领域的能力是突飞猛进的,从之前几乎没什么存在感,到最近各种刷榜,好评如潮。

最后总结一下:

小米在人工智能领域的发展空间极其广阔,属于是既有场景和生态(总量十几个亿,双位数增长的智能终端设备),又有塑造顶尖大模型的技术水平(MiMo-V2系列模型的能力前面已经论证过)。

未来双剑合璧,会演化出一个什么样的终极形态?

不敢想。

而且小米的这个生态位,在国内还看不到有其他的竞争对手,差异化明显。

字节、腾讯、阿里只有大模型和超级APP,缺乏硬件和底层系统支持,KIMI、智谱、Minimax、Deepseek等只是模型相对优秀,连个流量入口都没有。

现在看来唯一在生态位上对小米有挤压的只剩华X(苹果属于半残状态),但华X的硬件总数少很多,华X的底座大模型现在也并不出彩。

目前小米20到22倍PE的市盈率,是完全没有给AI估值的,只有车的估值。

2025年小米集团整体的研发投入达到331亿,同比增长37.8%,其中1/4,也就是80亿的规模投给了AI,就砸出了MiMo-V2系列这么优秀的产品。

今年3月雷军又豪言2026年在AI上要投160亿,占全年研发投入400亿的40%以上!未来三年AI领域要投超过600亿!

2025年小米集团在AI领域的研发人员规模达到了3000人以上,同比暴增45%!

这么多钱,这么多人砸下去,未来三年小米将孵化出怎样一个AI怪物?

也许只有时间才能给我们答案~

关注我,分享更多投资干货~

展开阅读全文

更新时间:2026-04-01

标签:科技   小米   集团   模型   能力   智能   参数   版本   领域   硬件   系列   性能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号

Top