IDC大模型评估报告：文心大模型综合评分第一

北京日报客户端 | 记者孙奇茹

国内百“模”大战如火如荼，IT市场研究和咨询公司IDC近日最新发布的《AI大模型技术能力评估报告，2023》显示，百度文心大模型3.5获得12项指标的7个满分，综合评分第一。这是IDC首次提出AI大模型技术能力评估框架，国内主流大模型，包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。

IDC评估报告围绕产品技术、服务生态以及行业应用三大维度，考察大模型的10余项指标，其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。结果显示，百度AI大模型整体竞争力位于领先水平，并在算法模型、行业覆盖分项获上得第一。阿里巴巴通义千问大模型在服务能力上获得分项第一。

当前大模型正处于快速发展阶段，产品技术能力、行业应用能力显得尤为重要。产品技术能力中，“算法模型”维度是重中之重，是大模型能力最为核心的要素，也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破，实现具有通用效果优势的大模型底座，才能支撑更广泛的行业覆盖，才能使各行各业充分享受技术突破带来的红利，破解AI落地门槛高的困境。

在行业应用能力中，应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数，体现了大模型在产业落地上的实力，是大模型效果通用领先性、行业结合能力两方面的综合体现。

“算法模型”、“行业覆盖”两个核心指标有其内在的关联性，行业覆盖的广度是算法模型通用领先性的集中体现，也将为算法模型能力持续提升提供源源不断的正向反馈，形成持续迭代提升的飞轮。

AI大模型已经从拼参数发展到拼应用，进入大规模可复制的产业落地阶段。以能源电力为例，在全球最大的公用事业企业——国家电网有限公司，面向复杂电网的专业场景，基于百度文心大模型，双方联合训练的电力行业大模型，在电网设备、客服等实际业务场景进行试点验证，可以显著增强电网运营的精细化、自动化、智能化水平。百度也和深圳燃气联合发布了燃气行业大模型，破解燃气企业运营场景繁杂、安全风险识别困难等难题。

图片来源：IDC《AI大模型技术能力评估报告，2023》

展开阅读全文

页面更新：2024-05-01

标签：模型维度广度电网算法燃气评分指标能力行业技术

1 2 3 4 5

IDC大模型评估报告：文心大模型综合评分第一

省属高校排名第一！苏州大学25项成果获2022年度江苏省科学技术奖

部分景区内10元每小时，共享充电宝小时收费模式合理吗

舟山市委书记何中伟赴特斯联考察：以AIoT促数字海洋经济发展

小米发布会来了，这次的新机有点猛！

刚刚才知道，身份证后4位原来是这个意思，真是涨知识了

99怎么玩？ - 浙妇儿首次推出“老友激励”“新锐后浪”新玩法，还有1500万激励等你来拿

西媒：中国采矿业用AI助力安全生产

支付宝：不会以FaceTime、个人社交账号等方式联系用户，此类“客服”均为骗子

可连续工作80年！俄研制出小型核电池

国家发改委：近期发放2023年棉花关税配额外优惠关税税率进口配额

消费需求恢复物价涨幅回落丨今年上半年梧州市CPI同比上涨0.5%

探访绍兴北站：站房漏水点已修补天桥设服务台和推车

梁山县开展庆“八一”青年退役军人就业创业座谈会

烟台啤酒厂即将提升改造，山海步道6公里示范段建设基本完成

生产线上的中国丨技能人才的发展空间有多大？我们和几位00后聊了聊

省属高校排名第一！苏州大学25项成果获2022年度江苏省科

美银：标普500指数上涨的广度将继续扩大

暴雪承认《守望先锋2》热度低迷：但相信PVE将能力挽狂澜

交互欣赏模式让技术与艺术擦出火花

明确导游、旅行社等12个涉旅行业标准！郴州发布这些系列

中国能在不依赖外国技术的情况下发展完全自主的芯片制

蔚来发布20kW V2G充电桩可反向给电网充电

市场监管总局关于发布《磁电式速度传感器检定规程》等

丈夫鼓励妻子产后下床：走一步给100元，“钞能力发挥了作

「护理动态」传承中医文化推广适宜技术