小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT｜钛快讯

小米总部园区

在小米公司CEO雷军演讲前夕，其研发的人工智能（AI）大模型产品悄然现身。

钛媒体App获悉，8月11日，小米公司开发的大规模预训练语言模型 MiLM-6B/1.3B登陆代码托管平台GitHub，参数规模最高达64亿，而且现身在C-Eval、CMMLU基准评测榜单。

截至当前，小米大模型MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1，平均分为60.2分，超过了阿里云Qwen-7B、OpenAI研发的ChatGPT（今年5月数据）等，而MiLM-1.3B排行第30名，平均分45.8分，接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。

这是小米大模型产品的首次曝光，也是小米史上首个GPT大模型产品亮相。

事实上，随着ChatGPT风靡全球，今年4月14日，小米公司宣布成立小米 AI 实验室大模型团队，由栾剑带队向王斌汇报。据悉，AI实验室是小米AI战略的核心部门，而大模型负责人王斌曾在中科院从事了20多年NLP（自然语言处理）相关的研究和开发工作，2018年加入小米，2019年起负责AI实验室。

小米CEO雷军当时表示，公司正在研发一些技术和产品，等打磨好了再给大家演示。小米集团总裁卢伟冰称，小米目前拥有超过1200人的AI团队，会积极拥抱大模型，与业务深度结合，但不会像OpenAI一样。

今年6月，王斌对外透露，小米会去自研通用语言大模型，但不会单独发布一款类ChatGPT产品。他表示，小米第一步的目标基座模型参数在几百亿，而且小米大模型将会落地小爱同学、loT、自动驾驶、机器人等现有场景中，并利用丰富的应用场景反哺大模型能力。

成立仅仅四个月后的今天，小米公布了大模型产品——MiLM-6B，并在C-Eval和CMMLU基准评测上均取得同尺寸较好效果。

其中，在C-Eval评估中，MiLM-6B的平均得分为60.2，在不同学科和难度级别（如STEM、社会科学、人文学科等）得分从42分到71.7分不等。在CMMLU评估中，MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分，表现出良好的知识和推理能力。

据悉，C-Eval榜单是清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件，而CMMLU则是综合汉语模型基准。

预计小米将会于8月14日举行2023雷军年度演讲，但目前雷军暂未透露是否会发布MiLM-6B大模型技术。

钛媒体App向团队询问关于MiLM-6B/1.3B是否开源、产品是否已经落地内测等问题，截至发稿前暂未得到小米官方回复。（本文首发钛媒体App，作者林志佳）

展开阅读全文

页面更新：2024-03-20

标签：小米模型汉语基准此前快讯实验室平均团队参数媒体产品公司

1 2 3 4 5

小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT｜钛快讯

日行2万步，为列车“体检”

济南国家级“双跨”平台增至2家！新增火石工业互联网平台

万佳安发布“行业首创”小值带屏智能看护摄像机Q45

在字节跳动，我劝你不要这样做......

世卫组织将EG.5列为“需要留意的”新冠变异株……一起来听健康早闻！2023年8月11日

健康日历 - 猴痘来袭，以下重要信息别错过！

英伟达GeForce Game Ready 536.99 WHQL驱动：优化多款支持DLSS 2的游戏

《柳叶刀》子刊：二甲双胍抗衰的潜在通路找到了！港大团队对32万余人开展分析发现，二甲双胍可通过GDP1和AMPKγ2促进健康衰老

“最强对手”正在回归？荣耀赵明：拿出最好状态迎接挑战

我国半导体量子计算芯片封装技术进入全新阶段

马斯克透露与扎克伯格“约架”场地：“古罗马风格”的“史诗级地点”！

“星池一号B星”成功入轨！苏州企业研制的光学相机同步“上天”！

俄罗斯“月球-25”号探测器发射升空

在渝央企研发国家级“双跨”工业互联网平台服务18行业每年为客户创造价值超50亿元

美吉姆（中国）总部就部分加盟中心闭店致歉：将对未消课时协调制定解决方案

《柳叶刀》子刊：二甲双胍抗衰的潜在通路找到了！港大团队

国网莱州市供电公司推进光伏帮扶项目提供稳定“阳光收

一加携手瑞声科技成立仿生触感实验室共同引领手机振

国内出境团队游首条国际邮轮航线起航

小米全新MIX折叠屏：创新与实用的完美结合

松下就蜂窝通信标准必要专利起诉小米和 OPPO

北京一公司倒卖酒和中药被罚

新希望集团10亿公司债将到期兑付利率为4.20%

蓝海华腾：股东合计拟减持不超5.35%公司股份

青岛胶东临空经济示范区媒体见面会举行