Intel AVX-512指令集带来17倍性能提升:自家CPU却不能跑

Intel近日更新了开源的C++头文件库,正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。

基于AVX-512指令集,C++头文件库可以对16位、64位数据类型进行快速排序,实测在一套Intel Tiger Lake 11代酷睿系统上,NumPy Python的性能提升了多达10-17倍。

具体来说,16位数据排序性能提升了17倍,32位数据也有12-13倍,64位浮点数据则可以提速10倍。

这证明,AVX-512只要适配优化得当,带来的性能提升是十分显著的,而且不一定非得吃掉多高功耗。

不过,Intel 12/13代酷睿因为引入混合架构,不得不牺牲了AVX-512,自然无法从中受益,AMD Zen4架构的锐龙7000系列则首次加入了AVX-512。

这就有点尴尬了。

展开阅读全文

页面更新:2024-03-05

标签:性能   浮点   功耗   得当   数据类型   架构   此前   尴尬   近日   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top