Arm 发布 Lumex CSS、支持 3nm 制程
在今日举行的 ARM UNLOCKED 峰会上,Arm 正式发布面向移动端的 Arm Lumex CSS 计算子系统。该平台集成先进组件,支持 3nm 制程,实现了显著性能提升,致力于为旗舰智能手机与下一代 PC 带来变革性 AI 体验。
该平台集成搭载 SME2 技术的 Armv9.3 CPU,在 CPU 性能上表现卓越。C1 CPU 集群实现重大突破,SME2 单元将矩阵计算效率提升 5 倍,Gemma 3B 模型推理速度提升 4.7 倍。旗舰级 C1-Ultra 通过创新微架构,单线程性能较前代提升 25%,在视频流媒体等场景速度增益 15%。其具备丰富的 CPU 层级,C1-Ultra 提供峰值性能,C1-Premium 注重面积效率,C1-Pro 实现持续效率,C1-Nano 适用于可穿戴设备,满足不同设备需求 。
GPU 方面,Mali G1-Ultra 同样出色。其 RTUv2 光追单元采用创新模块化设计与空闲断电机制,为《原神》等游戏节省 15% 能耗。单光线模型架构使《崩坏:星穹铁道》渲染速度提升 19%,FP16 矩阵计算路径推动 AI 推理速度提升 20%,扩大的 L2 缓存设计让 GPU 能并行处理图形与 AI 负载,语义分割任务性能跃升 104%。
在实际应用中,SME2 技术成效显著。“智能瑜伽教练” 应用的文本转语音生成速度提升 2.4 倍;Arm、支付宝与 vivo 合作,大语言模型交互响应时间缩短 40%。并且,该技术已获阿里巴巴、腾讯等众多领先生态伙伴采用。
此外,Lumex 平台为合作伙伴提供了灵活选择。可直接采用平台及定制物理实现方案,缩短产品上市时间;也能对寄存器传输级设计进行配置,实现个性化。同时,其配套完整的软件堆栈与工具,助力开发者轻松实现 AI 加速与性能调校。
Arm 全新 Lumex CSS 平台 核心指标
1、CPU-C1-Ultra:较 Cortex-X925性能、单线程均升25%,视频快15%,宽微架构提效
2、CPU-C1-Pro:较 Cortex-A725 性能升12%,节能12%,优化Cortex A75
3、CPU-SME2:C1 集群含 SME2,矩阵效率升 5 倍,Gemma 3B 推理等降延迟4.7 倍
4、GPU-Mali G1-Ultra:首持移动下一代光追,性能升20%、能效升9%
5、系统架构:SI L1优带宽延迟,SLC 功耗降 71%,支持 MTE 保安全
6、软件生态:获阿里、腾讯等采用
- End -
更新时间:2025-09-12
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号