平头哥甩出首款智能网卡!400Gbps带宽、发布即量产,存算网全栈拼图就位

智东西

作者 | 程茜

编辑 | 漠影

智东西4月29日报道,昨日下午,阿里平头哥旗下首款智能网卡产品磐脉920正式发布,该产品发布即量产,并首先在阿里云数据中心部署。

这是AI算力浪潮下,平头哥在AI基础设施网络领域的关键落子。

磐脉920的几项性能参数也颇有代表性:采用全自研ASIC芯片架构,国内首个内置PCIe Switch的400G智能网卡,支持多路径RDMA,最大支持400Gbps吞吐带宽,可在万卡智算集群、通算集群、高性能存储场景部署。

磐脉920

这些性能都指向了当下AI基础设施中的关键一环——数据传输

大模型正从单一大参数基座走向超大模型、多模态融合、长上下文、端边云协同、Agent规模化、实时推理的演进路线,模型参数暴涨、上下文窗口扩容、训练数据量级指数级增长、推理并发需求爆发,算力、存力、网力不再是配套基础设施,而是决定大模型性能上限、落地成本、迭代速度与产业规模化的三大核心底座,三者互为约束、缺一不可。

此次磐脉920的发布,也意味着平头哥完成了算网存的全栈布局。

一、平头哥首款自研智能网卡亮相,打通低时延互联壁垒

模型参数规模迈向万亿级、AI计算集群规模突破万卡,通信瓶颈已成为制约算力发展的核心难题,高性能互联更成为AI基础设施的刚需。

但值得注意的是,AI训练与推理两大核心场景,对网络及网卡的性能需求存在显著差异,传统企业级网卡已难以适配其严苛要求。

在AI训练场景,训练任务往往需要数千张甚至上万张GPU同时协同运算,不仅要高频、大批量传输训练数据,还要保证所有节点同步完成数据搬运与计算任务。而整个集群的运行效率会受限于全网最慢节点,也就是说即便多数GPU计算、传输速度出众,只要存在一处慢速链路或节点,整个任务就需等待其完成,会拖累效率。

反观AI推理场景,其无需高强度同步协作,但核心诉求集中在小包高并发、低响应时延,且流量具有明显突发性。同时,推理场景中混合流量并存,各类流量在时延敏感度、带宽需求、突发特性上差异显著,这就要求智能网络既能实现低时延、高可靠传输,又能兼顾全网流量的高效均衡转发。

平头哥产品总监李旭慧透露,若网络架构、网卡性能及传输调度未做好优化就会出现算力浪费,高端GPU的实际利用率往往较低,会导致大量高性能算力闲置。

正因如此,高性能网卡的重要性不言而喻。而作为平头哥首款产品,磐脉920的性能参数也十分过硬。

磐脉920支持PCIe 5.0和112G PAM4,提供最大400Gbps吞吐带宽,收发包率超400Mpps,具有512个超线程核心,搭建高效可编程平台;同时集成芯片级网络架构、内置PCIe Switch。

硬核指标对应的正是磐脉920超低时延互联、多路径喷洒与传输稳定性、细粒度拥塞控制能力、强适配通用性四大优势,以匹配AI训推场景需求。

首先在时延层面,磐脉920依托内置PCIe Switch,能打破传统网卡的物理限制,确保网卡以极低时延直连GPU和SSD,减少对外部交换芯片的依赖,使系统成本降低30%。

其次是多路径喷洒与传输稳定性,其支持多路径RDMA突破了传统RDMA依赖单一路径的技术限制,可有效缩短训推任务完成时间。李旭慧称,他们内部实测的数据显示,基于磐脉920实际训练和推理的完成时间提升了14%。

第三是灵活拥塞控制能力,其通过集成细粒度网络感知手段和用户可编程拥塞控制算法,开放自定义API,可适配智算、通算等不同网络环境部署,在微秒级拥塞响应和选择性重传布局下,能保证通信稳定。

最后是强适配通用性,磐脉920是半高半长单宽的标准尺寸,能适配各种主流服务器、兼容主流操作系统和通信库,做到即插即用。

在应用方面,它能为政企、云厂商、AI企业等客户,提供高带宽、低时延、高可靠、可灵活定制的网络加速能力,有效降低算力集群通信损耗、削减整体运维成本;另一方面,其直面大模型训练、智算集群互联、多模态推理、分布式超算等高速增长的AI核心场景,为其增长提供了更高效且具性价比的解决方案。

二、补齐AI网力关键一环,算存网全链路自研

算力与网络的关联密不可分,二者相辅相成、缺一不可。

李旭慧做了形象的比喻,如果把算力比作AI时代的石油,网力则是输油管道,算力提供动力,网力保障效率,二者协同才能释放有效算力。但当下在AI算力产业中“网络拖了后腿”。

如今一个很明显的产业趋势是,AI算力重心从训练单边主导向训练+推理共同驱动,且推理需求已显著超过训练。

区别于训练,智能体驱动下的推理业务,混合流量场景会愈发复杂,对网络的综合调度能力要求大幅提升。传统TCP网卡普遍依赖内核转发架构,数据搬运转发开销大、性能瓶颈明显,单路实际有效吞吐能力受限,而智能体业务天然具备交互频繁、链路复杂、数据流转量大的特点,会进一步放大传统网卡的短板。

在这样的判断下,下一代AI网络,需要打造大带宽、低时延的高性能网卡方案,才能承接持续上涨的业务需求,同时联动算力、存力协同发力,共建新一代一体化AI基础设施体系。

与绝大多数独立芯片公司和互联网公司芯片业务不同,平头哥已完成了算力、存力、网力的全布局。目前其已推出真武系列AI芯片、倚天系列Arm服务器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片四大数据中心核心芯片,形成完整的底层芯片矩阵。

这一产品矩阵已形成清晰的分工体系:算力芯片为AI训练、通用计算提供核心性能支撑,存储芯片保障海量数据高速读写与稳定存储,智能网卡则专攻高速通信传输难题。而更具想象力的是,未来这三大产品还可协同优化,提供更有竞争力的基础设施解决方案。

三、阿里“通云哥”打造全栈AI,产业价值已显现

从芯片、云服务到大模型,阿里一直在构建全栈AI优势。

这一布局的底层逻辑,是全球科技赛道行业巨头竞争范式的迭代升级。单纯依靠单项技术优势的时代已然落幕,取而代之的是全链条协同布局的角逐,覆盖底层核心芯片、基础硬件设施、大模型,直至云服务,全栈综合实力正成为核心竞争的关键分水岭。

而作为国内科技企业的代表,阿里已经把通义大模型事业部、阿里云和平头哥组成的阿里巴巴AI黄金三角“通云哥”,打造为一台AI超级计算机

正如李旭慧所说,平头哥布局磐脉920的核心思路,始终围绕AI全栈解决方案的落地需求展开:凡是制约整体算力性能的关键环节,便是重点布局的方向。

自研芯片侧,平头哥在算力、存力和网力三大领域均实现了业界领先水平,例如,其“真武”PPU已成为出货量最高的国产GPU之一。

大模型领域,2023年8月起,千问系列模型的编程和Agent能力稳居国内第一梯队,是千行百业众多头部企业的首选模型。

云服务方面,阿里云已跻身全球头部阵营。今年4月,Gartner发布的《2025年全球IaaS公有云服务市场份额》报告显示,2025年中国IaaS市场阿里云以32.8%的份额位居第一,较2024年的30.1%提升2.7个百分点。

Gartner全球IaaS公有云服务市场份额报告

如今,阿里“通云哥”三位一体的布局全面成型,形成研发、验证、迭代到商业化落地的良性循环,规避传统各环节独立设计、简单衔接的技术模式,通过环环相扣、双向赋能的闭环效应,构筑起芯片适配模型、平台承载芯模、三者双向优化的深度适配关系。

放眼全球,能做到芯片、云、大模型三者的互相优化协的公司寥寥可数,而这也是阿里在全球AI产业竞争中的核心壁垒。

展开阅读全文

更新时间:2026-04-30

标签:科技   平头   量产   拼图   网卡   带宽   智能   阿里   芯片   模型   核心   网络   集群   布局

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top