MLPerf权威发榜!英伟达「史上最强GPU」H100,被12nm芯片碾压

编辑:好困

【新智元导读】MLPerf Inference v2.1榜单正式公布!中国AI芯片企业首次超越英伟达「史上最强GPU」H100,以95784 FPS的单卡算力,夺得ResNet-50模型算力全球第一。


9月9日,全球权威AI基准评测MLPerf Inference v2.1榜单公布结果。

中国AI芯片企业首次超越英伟达「史上最强GPU」、未来4nm产品——H100:中国AI芯片明星创业公司——墨芯人工智能(以下简称「墨芯」)S30计算卡以95784 FPS的单卡算力,夺得ResNet-50模型算力全球第一。

MLPerf是业内公认的国际权威AI性能基准评测,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、英伟达 、英特尔、Facebook、浪潮等全球AI领军企业,以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。

该测评以其标准严格、测评严谨而著称,英伟达、高通等国际AI芯片企业均携最强产品参加测评,竞争十分激烈,各赛道均有数百项产品提交成绩。

以上数据摘自MLCommons官网MLPerf Inference v2.1测试结果

墨芯首次参赛,单卡算力全球第一


众所周知,「单卡算力」是检验AI计算产品的「真标准」。

墨芯夺冠项目是数据中心最常用主流模型ResNet-50,该赛道竞争尤为激烈,竞争者包括H100、A100。

S30以ResNet-50 95784 FPS的单卡算力夺得第一,是英伟达未来4nm产品——H100的1.2倍,是A100的2倍。

同时,墨芯S30运行BERT-Large是A100的2倍,仅次于H100,在Bert-large高精度模型(99.9%),单卡算力达3,837 SPS。

值得强调的是此次是「12nm」战胜「4nm」。

从竞争者角度看,墨芯参与的ResNet-50和BERT-Large都是数据中心最常用主流模型,因此竞争尤为激烈。

特别是竞争者包括H100,是英伟达迄今推出的最强大的GPU,据悉使用台积电最新的4nm工艺,可谓「最强王者」。而战胜「最强王者」,足以体现墨芯S30采用12nm,性能已经站在世界顶尖水平。

精度要求99%以上,经受严格检验


更值得一提的是,MLPerf的测试要求非常严格:不仅考验各产品算力,同时设置精度要求在99%以上,主要为了考察AI推理精度的高要求对计算性能的影响。

换句话说,参赛厂商无法以牺牲精度的方式换取算力提升,在这种严要求下夺冠,充分表明了墨芯的硬核技术实力。

参考资料:

https://mlcommons.org/en/inference-datacenter-21/

展开阅读全文

页面更新:2024-03-04

标签:英伟   最强   芯片   竞争者   中国   精度   模型   权威   全球   产品   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top