亚马逊最强服务器CPU登场!3nm、192核、暴增L3缓存,苹果力挺

L3缓存容量飙到5.3倍。

作者 | ZeR0

编辑 | 漠影

芯东西拉斯维加斯12月4日报道,刚刚,在年度云计算盛会AWS re:Invent上,全球最大云计算巨头亚马逊云科技(AWS)发布第五代自研服务器CPU——Graviton5

Graviton5在单个封装中集成192个核心,核心数较上一代翻倍,核心架构升级为Neoverse V3,并优化了内存系统,搭配大容量缓存,支持DDR5-8800内存,IO系统支持DDR5内存,且是亚马逊云科技服务器集群中首款支持PCIe Gen 6的CPU。

该芯片配备2MB二级缓存(L2 Cache);三级缓存(L3 Cache)容量达到前代产品的5.3倍,达到192MB,这意味着每个核心能获得高达2.6倍的三级缓存,带来更优的整体性能和稳定性。

在AWS re:Invent大会期间,亚马逊云科技副总裁、杰出工程师Ali Saidi与芯东西等少数媒体进行了深入交流。Saidi告诉芯东西,Graviton5采用3nm制程,已掌握成熟的电压控制技术,主频适中,同时通过系统层面的创新优化散热,例如采用裸片冷却技术,去除CPU顶盖,减少顶盖带来的热阻,直接在CPU上安装散热器,确保核心能够有效散热,无需担心散热问题。

据Saidi透露,亚马逊云科技正与内存供应商合作,推动现有产品支持更高频率,对不同工作负载的测试表明,这是一套平衡的系统,能够为核心提供充足的内存带宽,同时实现显著的性能提升。

亚马逊在2018年发布了首款Graviton处理器,2019年推出Graviton2,2021年推出Graviton3,2023年发布Graviton4。每一代产品都力求实现25%~30%的性能提升,Graviton5也不例外——每个核心性能比上一代提升约25%

亚马逊云科技针对多种工作负载进行了测试:在CPU密集型机器学习场景中,Graviton5比Graviton4快32%;在Nginx等负载均衡场景中,速度提升27%;作业类应用速度提升30%至40%;数据库场景中,不同类型数据库的性能普遍提升约30%。

亚马逊云科技计算与机器学习服务副总裁Dave Brown在演讲中分享了一些Graviton5早期客户的测试数据:Airbnb性能提升高达25%,Atlassian性能提升30%、延迟降低20%,Honeycomb.io延迟降低25%、每核心性能提升36%,SAP的SAP HANA分析查询性能提升60%。

苹果云系统与平台副总裁Payam Mirrashidi也来到现场为AWS Graviton CPU站台。

他分享说,目前,苹果每天通过运行在亚马逊云科技和Graviton上的Swift应用处理数十亿次请求。将核心服务用Swift重构并迁移到Graviton后,苹果实现了40%的性能提升和30%的成本降低。从x86到Graviton的迁移过程极为顺畅,几乎可以直接替代Java环境。苹果早在十多年前就将移动设备迁移到Arm架构。

“如今,迁移到基于Arm的Graviton,我们再次收获了基础设施效率提升的巨大价值。”Mirrashidi说,“我们迫不及待地想看到大家用AWS Graviton和Swift创造出更多精彩成果。”

据Saidi分享,亚马逊云科技与Arm在核心定义方面密切合作:Graviton2采用Neoverse N1核心,Graviton3采用Neoverse V1核心,Graviton4采用Neoverse V2核心,Graviton5采用Neoverse V3核心。每一代都通过与Arm合作,确保核心满足需求,进而为客户带来显著性能收益。

”Graviton的成功证明,通过授权Arm IP,我们能够打造出具有行业竞争力的系统。未来,我们将继续专注于这一模式,持续为客户创造价值。”Saidi说。

基于Graviton5的M9g实例(预览版)今日同步发布,相比M8g实例性能提升高达25%,是目前Amazon EC2中性价比最高的实例。

Saidi在媒体沟通会期间分享说,该实例每核心配备4GB内存,将于2026年正式全面可用,后续还将拓展更多实例类型。

以Graviton4为例,亚马逊云科技提供的实例最高支持3TB内存、190个核心、600Gbps网络带宽和100TB存储容量,涵盖多种实例类型,可满足客户各类工作负载需求。

目前Graviton5仅推出一款实例类型,未来将拓展更多选择。

亚马逊云科技公用计算高级副总裁Peter DeSantis在演讲中谈道,亚马逊云科技云服务的核心属性包括安全性、可用性、弹性、成本等,亚马逊云科技正在大规模投资数据中心、电力和容量建设,以支持AI转型,同时大力投入降低模型构建和工作负载运行的成本。如今亚马逊云科技的芯片系列包括Graviton专用服务器CPU和Trainium AI训练芯片等。

亚马逊云科技计算与机器学习服务副总裁Dave Brown回顾了亚马逊云科技造芯历程和设计思路的演变。据他分享,Nitro系统改变了人们对云计算可能性的认知,证明只要能掌控芯片、硬件和系统架构,就能实现商用硬件无法企及的性能和效率提升。在深入研究Nitro系统的过程中,亚马逊云科技自然产生了一个疑问:

“既然定制芯片能同样改善网络和存储性能,为什么不能将其应用于计算领域?”

于是,亚马逊云科技重新思考:如果专门为云工作负载设计一款服务器处理器 —— 不是适配、不是改造,而是从零开始为云原生场景打造——会是什么样子?

这就是Graviton处理器的由来。

这款全新设计的处理器,核心目标是为客户在云中日常运行的工作负载提供最优性价比。

如今,各行各业的企业都在通过Graviton获得更高性能和更低成本:Adobe将碳排放减少37%,Epic Games借助它支撑全球大规模低延迟游戏工作负载,F1通过Graviton使模拟运算速度提升40%,Pinterest降低了47%的成本,SAP的云原生SAP应用性能提升35%。

这些正在运行的生产系统,通过Graviton实现了更快、更环保、更经济的运行。

其软件合作伙伴通过优化编译器、改进运行时、完善库文件,并在平台上全面支持Graviton。围绕Graviton形成的长期架构和行业协作生态还在持续成长和成熟。

要在Amazon EC2中实现最优性价比,需要关注每一个层级。除了提高芯片性能外,这还涉及系统的构建和运行方式。

由于亚马逊云科技同时设计处理器和服务器,它能够实现全栈优化,其中就包括客户不常关注的散热环节。

大多数处理器采用传统散热方案:芯片之上是热界面材料,然后是保护顶盖,再覆盖一层热界面材料,最后是散热器。这种方案可靠且易于制造,几十年来一直是行业标准,但亚马逊云科技深入分析后发现,其物理原理存在优化空间。

热传递的物理逻辑很简单:散热路径中的每一层都会减缓热量传导,阻力越大,结温越高;而高温会增加漏电率,漏电率上升又会导致功耗增加,低效问题会迅速累积。

传统CPU采用这种设计,是因为需要适配多种系统、形态和工具方案,顶盖能提供稳定的接口。

但由于亚马逊云科技掌控着Graviton的整个系统,有机会尝试不同思路。

因此,它没有遵循传统模式,而是设计了 “直接贴合芯片” 的散热方案:移除顶盖和对应的热界面材料,减少热阻,让热量传导更高效。这需要精密制造和精心选材,但成果显著——风扇功耗降低了33%。

提升系统效率只是实现卓越性能的一部分,芯片本身必须一代比一代更出色。Graviton的研发是长期且持续迭代的过程:每一代产品都会拓展支持的工作负载类型,而新工作负载的出现会让亚马逊云科技发现新的瓶颈,进而指导下一代产品的研发,形成持续优化的循环。

每一款Graviton处理器都基于前代成果,不断推动架构向前发展。

亚马逊云科技针对实际应用性能优化Graviton。在Graviton3时代,亚马逊云科技发现二级缓存(L2 Cache)缺失对实际工作负载性能有明显影响。

缓存是CPU性能最重要的影响因素之一,因此成为其核心优化方向。缓存的作用是存储频繁访问的数据,若数据不在缓存中,处理器就必须访问主内存,速度会慢得多。

现代CPU采用三级缓存架构:一级缓存(L1)最快但容量最小,二级缓存(L2)容量更大但速度稍慢,三级缓存(L3)容量最大且为所有核心共享。

如果三级缓存都未命中,就必须访问DRAM,耗时可达100ns。对CPU周期而言,这是很长的时间。

因此,大容量缓存至关重要:能将更多数据留在核心附近,减少慢速内存访问。

基于此,Graviton4将每个核心的二级缓存容量从1MB翻倍至2MB,这也是其相比Graviton3性能提升高达30%的原因之一。

二级缓存扩容显著降低了二级缓存缺失率。

但CPU设计始终需要权衡取舍:Graviton4的核心数增加了15%,三级缓存仅增加12%。

这对于当时要支持的纵向扩展工作负载是合适的平衡,但更多核心共享相对少量增加的三级缓存,导致每个核心能分配到的三级缓存反而减少,进而使三级缓存缺失率上升。这就是芯片设计中需要不断评估的权衡问题。

此外,亚马逊云科技还进行了一项重大架构调整:在两个CPU之间添加一致性链路,使其能为数据库和大型分析工作负载提供最多192个核心。

但链路连接会带来额外开销:当一个核心需要访问另一个CPU上的内存时,请求必须通过互连链路传输,增加延迟、协议开销,有时还会出现排队,在某些场景下,耗时可能达到原来的3倍。

因此,其团队思考:能否在单个封装中实现192个核心,同时让所有核心都能均匀、快速地访问内存,并配备更大容量的缓存?

这就是Graviton5设计的来源。

如今,使用亚马逊自研服务器CPU Graviton系列的客户数量已超过90000家,实现数百万颗CPU量产。

其中包括前1000名Amazon EC2大客户中的98%,涵盖初创企业、大型企业等不同规模的客户,部分客户的大部分甚至全部计算工作都运行在Graviton上。这些客户包括Adobe Analytics、SAP、亚马逊自身、Stripe、Pinterest、Airbnb等知名企业。

多年来,Graviton一直是Amazon EC2中性价比最高的选择,让客户“以更少成本实现更多价值”。

客户采用Graviton后,通常有两种方式转化性能提升的价值:一种是改善应用延迟,对于延迟敏感型场景,Graviton带来的更高性能和更低延迟,能直接推动业务成果优化;另一种是在保持服务等级协议(SLA)或延迟不变的前提下,提升每秒事务数或请求数。

对于拥有大规模服务器集群的客户而言,如果每个实例的处理能力提升25%,意味着服务器数量可减少25%,性能提升直接转化为成本降低。

再加上Graviton本身相比x86产品的成本优势,客户能获得显著的性价比提升。

展开阅读全文

更新时间:2025-12-08

标签:数码   亚马逊   缓存   最强   苹果   服务器   核心   性能   科技   负载   系统   客户   工作   内存

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top