酷睿Ultra发布详解:标配NPU,新核显游戏帧率提升3倍!


就在今天,酝酿已久的英特尔酷睿Ultra系列处理器正式发布,标志着英特尔消费级产品正式进入Intel 4制程工艺,并且首次采用分离式模块和3D封装,是英特尔有史以来效能最高的处理器产品,同时处理器还将核显更换成了Xe-LPG的Arc GPU,核显性能提升两倍,首次加入NPU模块,加速笔记本AI性能表现,将AI PC全面普适化。



在这些诸多新技术Buff叠加的前提下,基于酷睿Ultra系列的新品和DEMO也集体亮相于2023英特尔新品发布会暨AI技术创新派对上。现在,就让我们花点时间,深度了解酷睿Ultra。



H与U两大阵营


按照惯例让我们先奉上首发的全套阵营。



可以看到首发阵营包括H系列(28W)、U系列(15W)的Core Ultra 7和Core Ultra 5,而在2024年第一季度,则会推出最高阶的Core Ultra 9 185H以及两款U系列产品。从整体上来看产品型号简化了许多。按照英特尔的说法,这基本上是规划中所有Meteor Lake型号的产品,不会在增加更多版本,比如之前的H45在这一代是不存在的。


因此可以认为Core Ultra 7和Core Ultra 5是未来一段时间笔记本的主打阵营,Core Ultra 9在核心数量上没有变化,仅在功耗和频率上有所提升,对于大多数主打高性能轻薄本的产品而言,首发的Core Ultra 7 165H就已经代表着未来旗舰级轻薄本的方向。



Core Ultra H最高拥有6个P-Core和8个E-Core,以及在SOC Tile中用于省电的LP E-Core,因此共计16个核心22个线程,最高5.1GHz,TDP 28W,最高功耗看情况可至64W、115W。Core Ultra H将标配Arc GPU核显,核显架构来自于Xe-LPG,Core Ultra 7包含8个Xe-LPG核心,Core Ultra 5包含7个。


Core Ultra U系列则统一使用2个P-Core,8个E-Core,2个LP E-Core设计,共计12个核心14线程,最高频率4.9GHz,TDP 15W,最高功耗57W。不过Core Ultra U核显并非来自Arc,而是沿用上一代架构Xe-LP的Iris Xe。


在内存支持上,上述所有产品内存频率最高支持到64GB LPDDR5/x-7467,或者96GB DDR5-5600,并配备2个基于第三代引擎的NPU,用于在低功耗状态下加速笔记本的AI性能。由于英特尔xPU架构的特殊性,AI加速其实会同时调用CPU、iGPU、NPU同时进行,用于解决不同场景的AI加速问题。


由于在SOC Tile中为了省电而引入了2个LP E-Core核心,因此线程的具体调度会由Windows 11参考英特尔硬件线程调度器(Intel Thread Director,ITD)的中间层进行,因此笔记本出厂的系统版本也应该是Windows 11 22H2以后版本,否则就会按照传统的核心分配,效率会低很多。


在扩展上,Core Ultra支持Thunderbolt 4、Wi-Fi 6E,同时还可以通过英特尔的独立芯片实现Wi-Fi 7和Thunderbolt 5的支持。



P-Core与E-Core的跨越


Core Ultra对P-Core与E-Core的微架构都进行了较大幅度改变,其中P-Core由Golden Cove升级到了Redwood Cove,E-Core由Gracemont升级到了Crestmont,两者构成的计算模块均是基于Intel 4进程所打造的消费级产品架构,相对前几代产品在电源效率上有很大的提升,并且结合3D Foveros获得更好的效能优化效果。



虽然英特尔没有提及Redwood Cove与Crestmont的细节,但从最终成品来看Redwood Cove确实带来了明显的代际IPC收益提升,并且Redwood Cove核心本身也增加了缓存和内存带宽,性能监控单元得以加强,用于解决不同工况下的核心调度问题。



相对应的,Crestmont也提升了IPC表现,并通过矢量神经网络指令(VNNI)实现E-Core对AI应用场景的加速。同样,Crestmont也使用了增强的核心调度单元,包括LP E-Core同样也是使用了完整的Crestmont架构,以解决SOC Tile中的不那么密集的工作负载。



从整体而言,P-Core与E-Core主要围绕提升IPC性能、分支预测能力,增强版Intel Thread Director调度器,提升缓存和内存带宽进行的。


而从结论上看,Core Ultra在多线程与单线程上的处理能力都有不错的表现。以Core Ultra 7 165H为例,SPECrate2017_int_base多线程相对AMD Ryzen 7 7840U性能提升11%,相对Core i7-1370P提升8%。同时英特尔也不忘拿最近发布的高通骁龙8cx Gen 3进行对比,差距不是一点半点了。



在单线程中,SPECrate2017_int_base单线程性能则依然是Core i7-1370P强势,但Core Ultra 7 165H相对AMD Ryzen 7 7840U和高通骁龙8cx Gen 3都有很好的表现。



多线程带来的收益还是非常明显的,如果进行实际应用对比,无论是UL Procyon Video Editing,PugetBench for Premiere Pro和PugetBench for Lightroom,Core Ultra 7 165H相对AMD Ryzen 7 7840U和Core i7-1370P提升还是非常明显的。



核显进阶


核显Xe-LPG是Core Ultra的另一个飞跃,它同样属于Arc GPU体系,对应的独显架构称为Xe-HPG。相对于之前Xe-LP架构的Iris Xe,每瓦性能提升2倍。



之前在做架构分析的时候我们有提过,Core Ultra的GPU Tile是基于台积电N5节点设计的,与AMD和NVIDIA的GPU制程节点处于相同一代。Xe-LPG的特点是给核显带来许多独显中才有的特性,比如8个Xe内核中包括128个矢量引擎,8个采样器,4个像素后端,8个光线追踪单元等等。


其中16个矢量引擎总线宽度为256-bit,每个内核配备192KB L1共享缓存,每个矢量引擎在每个时钟支持16个FP32或者32个FP16计算,64个INT8计算,并共享1个FP64端口。同时Xe-LPG也是对DX12进行优化的,引入独显上才有的无序采样(Out of Order Samplng,OoOS)。



另外,由于借助Foveros 3D封装技术,媒体引擎和显示引擎不在GPU Tile中,而是分配到了SOC Tile内,以实现更好的能效表现。在编码支持方面,除了常见的H.265、H.264之外,Xe-LPG也增加了对AV1 encode支持,最高可以支持到8K 10bit HDR。显示引擎则是最高支持4路显示输出,以及HDMI 2.1、DP 2.1、eDP 1.4b等规范。


另外Xe-LPG还支持DP4A AI指令集,用于AI加速计算。同时也基于AI特性支持XeSS超采样,可以给游戏带来更好的流畅度和清晰度。



这里英特尔也列举一些游戏案例。包括相对Core i7-1370P在《博德之门3》中有100%的帧率提升,《生化危机8》、《无主之地3》、《CS2》、《英雄联盟》、《PUBG》中都有显著的性能提升。


英特尔给轻薄本选取了18款游戏,Core Ultra 7 165H相对AMD Ryzen 7 7840U提升有16%。



顺带英特尔也强调了基于XeSS超采样技术,通过AI加速XeSS在不改变硬件条件的前提下降低了渲染时间和渲染分辨率,从而获得更高的帧率,并且可以保持原画质甚至更好。



从实际游戏过程来看,提升幅度最高可以达50%以上,再加上Arc GPU,相对上一代处理器的帧率提升大概有3倍。



AI PC将成标配


在英特尔酷睿Ultra中参与AI性能加速并非只有NPU一个模组,而是CPU、GPU、NPU三个硬件构成的XPU共同分配任务,总算力可以达到34 TeraOPS,这也是酷睿Ultra推动AI PC加速普及的重要原因。预计在2025年前,全球会出货超过1亿台AI PC。合作涉及100家ISV合作伙伴,覆盖300余项AI加速功能,AI应用将会得到更大范围的推广。



在AI加速分工上,VNNI用来做加速AI工作负载处理,其中CPU启动速度最快,用来应对语音控制、识别等需要延迟低的AI应用场景。NPU用于低功耗AI计算,比如长时间视频通话时的背景模糊,会由CPU转给NPU执行。GPU则是最耗电的,但是在推动诸如Stable Diffusion这样对AI加速要求高的场景中充当主力。


而凭借着OpenVINO的优势,酷睿Ultra也是当下支持AI计算类型最广的产品。与此同时,英特尔的AI加速在对业内的模型、应用有很广泛的加持,比如Stable Diffusion、Microsoft 365、LLaMA、ChatGLM等等,在笔记本上就可以直接运行。



与此同时,英特尔也宣布LLaMa2-7B已经能够在酷睿Ultra上本地运行,这里的7B中B代表Billion,即70亿个参数模型。



Evo进阶


在推进AI PC的同时,英特尔Evo认证平台也进一步升级,认证范围也更为广泛,如果一台笔记本带有Evo标签,通常也意味着在性能、体验、智能化与便携上都有较好的表现。


在Meteor Lake Evo体系中,主要围绕快速连接、快速唤醒、性能、AI表现、电池续航、快速充电、外形创新进行。例如笔记本的快速唤醒方式,人脸识别、指纹识别、手机靠近后蓝牙唤醒都是Evo快速连接的考核范围。



在性能方面除了要求使用酷睿Ultra 5、7、9处理器之外,使用英特尔锐炫或者第三方独显也会成为加分项。另外笔记本系统除了要支持最新的Windows系同时,还需要搭配英特尔自适应技术,通过机器学习让笔记本在实际使用过程中增强优化。


而在搭载NPU之后,Evo对AI性能,续航能力也有了更高的要求。同时标配Wi-Fi 6E级别以上的模块,雷电4接口,甚至5G都将会是加分项。



最后一个则是对笔记本的体验和外形都有更高的要求。比如时候键盘、触控板的规格,笔记本厚度核显版本不能超过15mm,独显版本不能超过20mm,摄像头分辨率应该大于1080p 30FPS,支持人脸识别等等。英特尔特别强调了通过VCX对摄像头镜头和品质都有了更严苛的量化标准,让全新的Evo平台在视频通话方面有更好的表现。



这里以马上要发布的戴尔灵越13Pro为例,不仅使用了英特尔酷睿Ultra处理器,获得英特尔Evo认证,13英寸机身厚度控制在了14.35mm,重量1.25kg,并在设计上使用了窄边框和下沉式转轴设计,提供全尺寸背光键盘。



而在性能上,戴尔灵越13Pro可以带动160 亿参数量的大语言模型运行,支持英特尔所构建的BigDL-LLM库,能够很好的对市面上主流的大模型离线运算。同时还配备AI降噪、AI语音输入、AI背景虚化、AI修图和视频编辑等功能。



在接口上,戴尔灵越13Pro还标配了Thunderbolt 4接口,9小时的续航时间,300nit亮度的16:10且支持DC调光的屏幕。重点是灵越13Pro系列在价格定位上本身就很亲民,相信正式开卖之后是个不错的升级选择。



与此同时,英特尔还增强了尔多设备协同技术Intel Unison,将支持范围扩展到更多系统,包括Andorid、iOS,笔记本与手机之间的文件、相册共享,并且增加了名为Universal Control的功能,可以通过一个鼠标控制不同的屏幕和设备。


对应的,Evo认证工作也扩展到了鼠标、键盘、蓝牙耳机、听力辅助器、雷电Dock、显示屏、存储器、无线接入点等等。



写在最后:轻薄本新发力


可以预见在未来一段时间内,笔记本GPU升级速度趋于平和,而基于CPU打造的轻薄本将成为发力的重点。英特尔已经与35家以上的OEM厂商展开合作,并计划推出230款以上的Meteor Lake产品,在性能上相对友商略胜一筹,同时NPU与CPU、Arc GPU组合使用展现出了更好的性能调配和AI能力,Intel 4制程与Foveros 3D封装技术已然开始发力。



这是一场更关乎于移动工作、内容创作、AI加速的发布会,正如酷睿Ultra的改名一样,轻薄笔记本设计也很快来到一个全面转型的临界点。相信我们很快就能买到更多个性出众、体验友好的智能便携轻薄笔记本了。


展开阅读全文

页面更新:2024-04-22

标签:英特尔   戴尔   轻薄   详解   架构   处理器   性能   核心   笔记本   引擎   产品   游戏

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top