华为官宣开源盘古7B/72B大模型，写作能力强劲，性能跻身开源第五

今日上午，华为在官方微信公众号正式官宣开源盘古7B、72B两款大模型，以及为华为昇腾NPU芯片优化的推理代码，目前均已在国内代码托管平台GitCode正式上线。其中盘古7B（盘古 Embedded）拥有70亿参数量，盘古72B（盘古 Pro MoE）则拥有720亿参数量。

根据华为官方的介绍，盘古7B模型为双系统框架，具备“快思慢想”功能，能够根据任务复杂度自动选择合适的模式，即在常规请求下使用“快思考”模式，在复杂推理任务下使用“慢思考”模式，从而在延迟和推理深度之间实现平衡。在多款复杂推理测试中，盘古7B的性能要强于阿里巴巴旗下的Qwen3-8B、智谱旗下的GLM4-9B，

盘古72B则为MoE混合专家模型，与一般的MoE模型不同，华为提出了一种新型的分组混合专家模型MoGE，其优点在于可以在专家选择阶段对专家进行分组，约束token在每个组内激活等量专家，进而实现负载均衡。

性能方面，华为声称该模型针对昇腾300I Duo、800I A2平台进行优化，在后者上可以实现单卡1148 token/s的推理速度。

根据SuperCLUE中文大模型基准测评5月的数据，盘古72B在开源排行榜中位列第五，总分为58.75分，超越Qwen3-14B、Qwen3-8B，仅次于DeepSeek-R1满血版、DeepSeek-V3满血版以及Qwen3-32B和235B。

值得一提的是，盘古72B的文本理解与创作得分位居榜单之首，为80.48分，但在科学推理能力上仅有39.6分，明显弱于位居榜单前列的其余模型。

此外，在推理模型榜单中，盘古72B的推理能力得分为60.3，并未有明显领先优势。一定程度上说明盘古系列开源模型的推理性能还有待进步。

展开阅读全文

更新时间：2025-10-10

标签：科技盘古华为强劲模型性能专家模式旗下参数能力代码

1 2 3 4 5

华为官宣开源盘古7B/72B大模型，写作能力强劲，性能跻身开源第五

天玑9500中杯工程机被曝四等边直屏、无线充、潜望镜

Gary Marcus:纯LLM上构建AGI彻底没希望!MIT、芝大、哈佛论文火了

罗若铁路全线最长特大桥架梁完成

OpenAI 高管回应Meta挖人：“就像有人闯入我们家偷东西一样”

7.58英寸+48MP双摄，这新机有点意思

黄仁勋亲自“挖角”，清华AI双雄被揽入英伟达麾下！

数字人民币新消息，“碰一碰”试点扩容！

6月30日汇率中间价：1美元对人民币7.1586元，1欧元对人民币8.4024元

河北省雄安新区概况

中国石化表彰“两优一先”，这些集体个人获奖！

李泽钜突遭港府“精准除名”！李嘉诚家族痛失最后政坛门票？

华安财险安康中支被罚7.5万！两责任人因违规经营与虚构业务受罚

狂风暴雨致成都地铁大量进水？官方回应

景兴纸业股价平收公司披露债务担保情况

中美刚握手言和，特朗普就制定访华行程，可能出席阅兵式吗？

科技+古风+非遗+美食！海淀有场山林生活文化节

2025杭州奇妙夜盛大开幕！“科技旅游十景”正式首发，上城

供销大集：旗下大集数科运营跨境电商业务，暂无跨境支付业

赢合科技超高速多工位切叠一体机实现量产交付

协和医院科技创新转化大楼落成，签署超2.5亿元的重大成

山东大学等申请基于超网络边缘侧设备小循环神经网络气

黎兵谈平局：球员们都很努力，但球队需要提升破密集防守能

早安安徽｜安徽开启升温模式！最高气温37℃

从RTX 2060升级至RTX 5060，性能提升有多大？7款游戏测试

时尚产业周报|Lululemon将全球裁员150人；地素时尚将关