过去一周,全球大模型开发者社区被两个神秘大模型彻底搅动了。代号“Hunter Alpha”和“Healer Alpha”的两匹黑马悄然空降知名模型平台 OpenRouter,在零宣传的情况下一路冲上趋势榜第一、周榜第三,日榜持续领先。整个社区沸腾了,猜测声不断:这难道是 DeepSeek V4 的内测版?

就连OpenClaw 创始人 Peter Steinberger 也在 X 平台发文打听,进一步点燃了社区的猜测热情。就在刚刚,谜底正式揭晓,小米官方宣布:Hunter Alpha 和 Healer Alpha 均为小米 MiMo-V2 系列大模型的早期内测版本。小米 MiMo 大模型负责人罗福莉也同步在 X 平台公开认领。

说来也巧,罗福莉正是 DeepSeek 的前研究员。换句话说,来自 DeepSeek 的她,在小米做出了让全网以为是 DeepSeek 的模型。这个反转,比任何营销都有力。
一、MiMo系列模型,跻身第一梯队
小米这次带来的,是三款定位清晰的模型。
MiMo-V2-Pro Preview,是面向 Agent 时代的旗舰基座模型。它拥有超过 1 万亿总参数量,激活参数控制在 42B,同时支持 1M 超长上下文。在单次对话中消化一部长篇小说、一整套代码库,或一个复杂项目的全部文档,并在此基础上驾驭极其复杂的多步任务流。

MiMo-V2-Omni,是全模态理解模型,专为需要快速反应和低延迟的真实场景打造。它能够同时处理文本、图像、音频,乃至长达一小时的视频输入,是智能体感知世界的“感官系统”。这款模型是为 Agent 落地的最后一公里准备的。
MiMo-V2-TTS,则是小米首款语音大模型。受限于 OpenRouter 平台的功能边界,它未能参与此次盲测,但其在语音合成领域的突破同样值得关注,尤其是在小米手机和小爱同学的应用场景下,这款模型的潜力将在后文展开。
在全球权威大模型综合智能排行榜 Artificial Analysis 上,MiMo-V2-Pro 目前位列全球第八、国内第二。但榜单之外,小米更强调“实际体感”。
在 Coding Agent、通用 Agent 和 Tool Use 等核心维度,MiMo-V2-Pro 与 Claude Sonnet 4.6 处于同一梯队。而在小米内部工程师的深度评测中,其代码工程能力已接近 Claude Opus 4.6 的水准,并展现出更出色的系统设计能力与更优雅的代码风格,这对于工程师来说,往往比跑分更重要。

市场数据同样在说话。Hunter Alpha 匿名内测期间,调用量最高的几类应用,多为编程专用工具。用户用脚投票,这本身就是对模型能力最直接的验证。在 OpenClaw 框架内,MiMo-V2-Pro 还展示了前端开发能力,能够一步生成设计精致、功能完备的网页,兼顾视觉质感与实际可用性。
二、小米大模型,把价格打下来
定价层面,小米对自己下了狠手。
小米给 MiMo-V2-Pro 定了一个极具冲击力的价格:在 256K 上下文长度内,输入 token 单价为每百万 1 美元,输出为每百万 3 美元;即使扩展到 100 万上下文,输入也只需每百万 2 美元,输出每百万 6 美元。
对比行业标杆 Claude Opus 4.6,后者类似服务的价格大约是 MiMo-V2-Pro 的五倍。对于需要大规模调用 API 的开发者来说,这个价差意味着成本直接打了两折。
小米的策略很明确:用接近顶级模型的能力,加上腰斩再腰斩的价格,快速抢占 Agent 开发者的心智和预算。

为了加速生态渗透,小米还联合了 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 五大主流 Agent 开发框架,向全球开发者提供为期一周的限时免费接口支持。
三、小米MiMo的机会:手机、制造和智驾
当然,发布会的高光时刻之后,真正的问题才刚刚开始:小米如何在强手如林的世界大模型舞台,占领自己独特的生态位?
看看竞争对手的布局就能理解这道题的难度。阿里 Qwen 走的是全面布局路线,深度渗透电商、金融、健康等行业应用,凭借阿里云的基础设施优势构建了庞大的企业客户网络;字节的豆包与 Seedance 系列,在推理能力和多模态生成上持续发力,依托抖音、飞书等超级 App 形成了强大的流量飞轮;DeepSeek 则走开源路线,以综合能力强悍著称,在全球开发者社区积累了极高的技术声誉。
这三条路,小米都不是最优选择。但小米有一张别人都没有的牌:一个横跨消费电子、智能制造与智能驾驶的完整硬件生态。
从这次发布的三款模型来看,小米聚焦的是世界模型与多模态模型,这绝非偶然,而是精准瞄准了小米最独特的三个应用场景。
1、手机:端侧 AI 的最佳载体
小米每年出货数千万部智能手机,这是一个天然的、规模庞大的 AI 端侧部署平台。MiMo-V2-Omni 的多模态能力——文本、图像、音频、视频全覆盖,与手机的传感器矩阵高度契合。
2、制造:工业场景的多模态刚需
小米工厂是全球少数几个真正落地“黑灯工厂”的制造基地之一。在工业质检、设备运维、生产调度等场景中,多模态理解能力是刚需而非加分项,摄像头拍到的瑕疵、传感器传来的异响、操作日志里的文字,需要被同一个模型统一理解和处理。
3、智驾:世界模型的终极考场
这或许是最令人期待的方向。小米汽车已经上路,智能驾驶是其核心竞争力之一。自动驾驶本质上是一个需要实时感知、动态推理、长程规划的多模态任务,摄像头、雷达、高精地图、实时路况,所有信息必须被融合理解,并在毫秒级时间内做出决策。
小米大模型这次的出场方式,本身就很“小米”:不声不响地把产品丢进市场,让能力说话,让数据说话,最后才揭开面纱。从 Hunter Alpha 到 MiMo-V2-Pro,这场为期一周的“猜谜游戏”,最终变成了一次全球开发者社区共同参与的“养成系”产品发布。
谜底揭晓的那一刻,反转的不只是模型的身份,还有外界对小米 AI 能力的预期。
更新时间:2026-03-23
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号