工联院大模型测评：360智脑在工业领域表现优异

近日，中国工业互联网研究院（以下简称“工联院”）针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示，360集团(601360.SH，下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5，综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业，集合五大院士，八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题，主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度，最终八大行业共计超过1100道题，对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

从评测结果可以看出，GPT4表现最佳，国内大模型表现亮眼，360智脑在多个行业均处于前列，其中装备制造业和纺织行业更是超过GPT-3.5，表现优异。

虽然国内大模型在本次评测表现较好，以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5，但工联院评测报告也指出，国内外通用大模型在工业知识问答领域探索仍处于初级阶段，缺乏行业针对性训练。

据了解，360近期已推出一个企业级AI大模型解决方案，基于360智脑的能力，综合行业和企业的专业知识库，打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型，目前已在智慧城市、智慧企服场景下落地应用实践，且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。“这并不是360智脑第一次在第三方评测中表现出优异成绩，早在不久前中文通用大模型基准（SuperCLUE）评测中，360智脑就数次上榜，且多项能力蝉联国产大模型第一。”相关负责人介绍。（雷渺鑫）

来源：光明网

展开阅读全文

页面更新：2024-03-08

标签：工联模型领域工业人工智能企业级中文前列优异能力行业

1 2 3 4 5

工联院大模型测评：360智脑在工业领域表现优异

1000.08元“超清4K wifi创维” 创维：？？？

曝iPhone 15全系将配备更大的电池续航会大大改善

研究人员在三江源地区发现古岩溶地貌

这就是涨价的底气！曝iPhone15全系砍掉128GB，电池容量飙升

科技中国-我国6G研发有新突破

两江新区江北嘴金融城9号项目预计10月封顶

前5月全球动力电池装机排名出炉，这家中企增速居首 - 动力电池月度排名㉖

中国人寿寿险公司十大典型理赔案例

超能机器人亮相上海国际医疗器械展

明星代言、多项营销，增长超五成的跑鞋品牌HOKA变“高调”

四川广元：提高公积金贷款额度，单职工最高可贷70万元

探索产业协同发展新模式我国多地崛起食品产业集群

溆浦县三江镇：开展食品安全检查，以行动之手引“安全”入口

ICT 龙头，中兴通讯：转型算力中军，第二曲线打开成长空间

生物基可降解材料产业园：建成后每年可减少白色垃圾7000吨

SQLServer 学习笔记5 RFM模型

稀土永磁行业专题报告：机器人浪潮下的崭新投资机遇

《终极太空突击队：反击势力》将于7月推出支持中文

兰州红古工业强区激发新动能招商引资实现大跨越

湖南工业经济持续恢复 5月份规模工业增加值较上月增长

芯片股暴涨！美国对中国芯片行业实施新一轮制裁

要想过得好，你一定得有“伤害”别人的能力

深夜，中概股狂飙！商务部、海关官宣：出口管制，涉及两大稀有

AI大模型垂直场景落地探索行业数据供给、安全可信成

天眼查与华为云发布全球首个商查大模型：“天眼妹”可信