IDC大模型评估报告:文心大模型综合评分第一

北京日报客户端 | 记者 孙奇茹

国内百“模”大战如火如荼,IT市场研究和咨询公司IDC近日最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5获得12项指标的7个满分,综合评分第一。这是IDC首次提出AI大模型技术能力评估框架,国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。

IDC评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。结果显示,百度AI大模型整体竞争力位于领先水平,并在算法模型、行业覆盖分项获上得第一。阿里巴巴通义千问大模型在服务能力上获得分项第一。

当前大模型正处于快速发展阶段,产品技术能力、行业应用能力显得尤为重要。产品技术能力中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。

在行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。

“算法模型”、“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力持续提升提供源源不断的正向反馈,形成持续迭代提升的飞轮。

AI大模型已经从拼参数发展到拼应用,进入大规模可复制的产业落地阶段。以能源电力为例,在全球最大的公用事业企业——国家电网有限公司,面向复杂电网的专业场景,基于百度文心大模型,双方联合训练的电力行业大模型,在电网设备、客服等实际业务场景进行试点验证,可以显著增强电网运营的精细化、自动化、智能化水平。百度也和深圳燃气联合发布了燃气行业大模型,破解燃气企业运营场景繁杂、安全风险识别困难等难题。

图片来源:IDC《AI大模型技术能力评估报告,2023》

展开阅读全文

页面更新:2024-05-01

标签:模型   维度   广度   电网   算法   燃气   评分   指标   能力   行业   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top