AMD在2026年5月正式发布了Instinct MI350P,一款基于CDNA 4架构的PCIe形态AI加速器。这是AMD近五年来首次推出Instinct系列的PCIe显卡,外界都在讨论这是对标NVIDIA的新动作,但我注意到一个被忽略的本质:这场竞争的核心从来不是参数比拼,而是客户需求的错位填补。真正让AMD拿到窗口期的,是巨头们集体放弃了中小企业的本地部署需求。为什么偏偏是AMD,在这个时间点选择切入这个被遗忘的市场?

AMD Instinct MI350P显卡 / 蓝底展示的AMD Instinct MI350P双槽
过去几年AI芯片市场的玩法很统一:NVIDIA和AMD都把主力放在OAM/SXM模块和整柜GPU集群上,卖一柜子高端芯片赚得盆满钵满。这种路线下,高端AI GPU的PCIe版本基本处于断档状态。
想在现有标准服务器上加AI算力,客户只有两个选择:要么选显存偏小的工作站级消费卡,要么砸几十万重建专用GPU集群。对于基础设施跟不上的中小企业来说,这两个选项都没法用。
MI350P的做法很直接:把旗舰MI350X直接切一半,塞进标准双槽PCIe卡。核心规格砍半,但完整保留了CDNA 4架构的所有能力,FP16、BF16、FP8、MXFP4全精度支持一个没少。

AMD Instinct MI350P显卡及宣传页 / 展示MI350P外观、PCB及三大核心优势的
更关键的调整在功耗和形态。MI350X的TBP高达1000W,必须用专用OAM模块加液冷方案,而MI350P把功耗卡在了600W,正好符合PCIe CEM规范的上限,能用标准风冷直接散热。
这不是简单的规格降级,而是从"赚大客户整柜钱"到"满足中小客户 incremental 需求"的路线反转。
很多人把这次发布解读成AMD对NVIDIA的偷袭,说AMD抓住了NVIDIA没推出PCIe版Blackwell的窗口期。但换个视角看,这其实是AI普及到一定阶段的必然结果。
AI落地从来不是一蹴而就的事情,不是所有企业都能一步到位上马整柜集群。绝大多数中小企业的AI落地,都是从单卡推理、单场景验证开始的。

AMD Instinct MI350P规格参数表 / MI350P的峰值与实际交付性能等参数对比表
大多数旧数据中心的机架功率密度,根本撑不住现代AI节点11kW的功耗要求。这些客户不是不需要AI,是基础设施跟不上,没办法一次性砸大钱改造。
MI350P的核心优势,就是给了这些客户一个"不换房子就能升级"的选项:不需要改造机房供电制冷,现有的EPYC双路服务器直接插卡就能用。这种渐进式扩展的灵活性,正好击中了市场的空白点。
AI普及的下一个阶段,拼的不是谁能做更大的集群,而是谁能让更多中小客户用得起、用得方便。
第一个细节,是AMD主动披露了实际交付性能。市面上绝大多数GPU厂商只公布峰值算力,但实际跑模型的时候,受功耗墙、散热、带宽瓶颈影响,峰值只是理论值。

AMD Instinct MI350P显卡PCB板 / 带芯片die的MI350P显卡PCB拆解图
AMD这次直接公开了峰值性能和实际交付性能两张表,哪怕实际性能低于理论峰值也不隐瞒。对于采购者来说,实际性能比纸面数据重要太多,这种透明度在行业里并不多见。
第二个细节,是144GB HBM3E显存的定位。144GB容量是什么概念?一个70B参数的大模型用4-bit量化大约需要40-50GB显存,这个容量足够同时加载模型、大上下文窗口,甚至塞下完整的RAG知识库。
产品型号 | 显存容量 | 功耗 | 接口形态 |
AMD MI350P | 144GB HBM3E | 600W | PCIe AIC |
NVIDIA H200 | 141GB HBM3E | 700W | SXM5 |
NVIDIA B200 | 192GB HBM3E | 1000W | SXM5 |
对于企业内部的知识库问答、Agent工作流、文档分析这些常见场景来说,这个容量刚好够用,不多不少。既不会因为容量不够限制场景,也不会因为过度堆料抬高成本。
现在来看,MI350P切出来的市场位置非常舒服:和NVIDIA L40S这类PCIe卡定位相似,但它基于最新的CDNA 4架构,显存比L40S的48GB大了两倍,还保留了完整的当前代架构特性。
当然局限性也很明显:砍掉了Infinity Fabric互联,多卡通信只能走PCIe Gen5总线,更适合8卡跑8个独立模型,不适合拆分大模型跨卡运行。所以做推理完全没问题,搭建大规模训练集群就不太合适。

AMD芯片die / 两款不同规格的AMD芯片die对比图
目前最大的不确定性,还是定价和供货节奏。行业预测价格大概在3万到4万美元之间,对中小企业来说依然不算便宜,但和一次性改造机房比,成本已经低了太多。
很多人说本地部署大模型是伪需求,反正云端API越来越便宜。但有三个需求永远不会被API替代:数据安全、隐私合规、延迟控制。尤其在企业场景里,客户数据不能出机房是硬约束,这和成本无关。
AMD这次的选择,本质上是尊重了市场的分层:不是所有客户都需要顶级集群,更多客户需要的是一个能快速上车的台阶。
NVIDIA不会一直缺席这个市场,但AMD先走了一步。这场比赛比的不是参数,而是谁能先接住中小客户的真实需求。当AI落地从头部企业向中小企业渗透,这种"做台阶"的产品,反而可能成为撬动市场格局的那个支点。下一个跟进的玩家,会比我们预想的来得更快。
#AI家庭四大件让家更有温度##AMD##芯片#
更新时间:2026-06-03
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号