从神话里借来的名字
华为给自家的大模型起名盘古,这个选择本身就挺有意思,盘古是中国神话里开天辟地的神,用这个名字,暗示的野心不言而喻。
2021年盘古大模型第一次发布的时候,国内做大模型的公司还不多,大家的注意力都在国外的GPT身上。
三年过去,大模型赛道已经挤满了玩家,盘古也迭代到了第五代,这次5.0版本的发布,华为云没有搞那种特别宏大的发布会,但放出来的技术细节足够让业内人士认真看一看。
跟通用模型的差异化路线
盘古从一开始走的就不是纯通用路线,OpenAI的GPT系列是做一个什么都懂的模型,你问什么它都能答,华为的思路不太一样,他们更倾向于针对特定行业做深度优化,金融,制造,矿山,气象,医药,这些方向都有专门的行业模型。
这种策略的好处是落地快,企业客户拿来就能用,不需要自己再花大量时间做微调,坏处是通用能力上可能不如那些专门做基座模型的公司,5.0版本在这个基础上做了升级,行业模型的数量增加了,同时基础能力也有提升,长文本理解,多模态处理,代码生成这些方面都有改进。
一个气象预测的例子
说到盘古在行业里的应用,有个例子经常被提起,去年他们跟国家气象局合作,用盘古气象大模型做台风路径预测,据说精度超过了传统的数值预报方法。
气象预测这件事,以前主要靠超级计算机解物理方程,算力消耗巨大,预测一次需要几个小时,用大模型之后,预测时间缩短到几分钟,而且准确率还提高了,这个案例被华为反复讲,因为它很好地说明了行业大模型的价值,不是取代人,而是把原来做不到或者做不好的事情变得可行。
5.0版本的新东西
这次5.0版本有几个值得关注的技术点,一个是多模态能力的强化,不仅能处理文本,还能理解图像,视频,雷达信号这些不同类型的数据。
这在工业质检,自动驾驶这些场景里很有用,因为真实世界的信息本来就是多模态的,另一个是长文本处理能力,现在支持百万字级别的上下文,这对于需要阅读大量文档的工作,比如法律合同审查,医学文献分析,意义很大。
还有一个是模型效率的优化,同样的能力,推理成本更低,这对企业客户来说直接关系到能不能大规模用起来。
华为云的算盘
华为云在大模型这件事上的布局,不能孤立来看,他们有自己的芯片,昇腾系列AI处理器,有自己的框架,MindSpore,现在又有自研的大模型。
这一套东西组合起来,形成了一个相对完整的闭环,企业客户如果选华为云的大模型服务,从算力到模型到工具链都是一家提供的,集成成本会低一些。
这种垂直整合的能力,在国内云厂商里算是独一份,当然,这也意味着客户会被锁定在华为的生态系统里,这是一个需要权衡的地方。
竞争格局的变化
国内大模型市场现在的格局还在快速演变,百度,阿里,腾讯都有自己的大模型,创业公司里也有几家做得不错的,比如智谱,月之暗面。
华为的优势在于B端客户的信任度和行业know-how的积累,劣势是在C端的影响力相对弱一些,普通消费者知道盘古的人不多,5.0版本的发布,某种程度上是在强化自己的长板,把行业大模型这件事做得更深更透。
接下来的看点
大模型技术本身还在快速迭代,今天的领先不代表明天的优势,盘古5.0发布之后,真正的考验在于有多少企业愿意真金白银地用起来,用起来的效果怎么样,能不能产生实际的业务价值。
这些问题的答案,会比发布会上的参数更有说服力,华为云接下来要证明的,不只是技术能力,还有把技术变成商业价值的能力。
更新时间:2026-04-06
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号