
当生成式AI的浪潮从云端奔涌至端侧,算力的形态正在发生根本性的重构。2026年4月23日,英特尔以“非常6+7”为号角,正式发布了至强600系列处理器与锐炫Pro B70专业显卡。这不仅是一次硬件的迭代,更是英特尔针对AI工作站生态打出的一套组合拳。
在发布会后的深度专访中,英特尔中国区技术部总经理高宇、中国区显卡和AI高级产品总监徐金平以及技术专家王巍巍,向我们揭示了这套“双芯协同”方案背后的底层逻辑:如何在HPC与AI之间架起桥梁,以及如何打破封闭生态的壁垒。

▲高宇(Gary Gao),英特尔中国区技术部总经理
AI PC和AI工作站在硬件形态和用户群体上有没有什么差异?面向快速分化的AI硬件市场,英特尔首先表明了消费级 AI PC与专业AI工作站的核心差异,为市场与用户提供清晰的选择逻辑。在AI硬件市场快速分化的当下,厘清“AI PC”与“AI工作站”的边界至关重要。
高宇在专访中一针见血地指出:
“一般的AI PC,首要任务是用户的办公、学习、娱乐,AI是辅助作用;而AI工作站就是为AI而生,是为了完成定向的AI任务。”
这一定位决定了工作站必须具备处理80B以上大模型、企业级RAG以及文生视频等重负载的能力。面对市场对硬件组合的猜测,英特尔展现出了极大的开放性。
这种“不强买强卖”的策略,实则是英特尔对至强平台通用算力自信的体现,也为用户提供了极具弹性的配置空间。
普通AI PC面向海量大众用户,以日常场景为核心;而AI工作站则专注文生图、视频生成、80B以上大模型运行以及企业RAG等生产级负载,对电脑硬件系统的算力、稳定性和可靠性有更高的要求。
本次推出的“非常 6+7”组合,是英特尔面向智能体时代的标志性方案。高宇特别强调:“‘6+7’这个口号很好,但不用过度硬捆绑。至强600可以搭载任何 AI加速卡,包括市场上的其他产品,包括搭配国产显卡都有非常好的表现。” 从高宇表现出的这一开放态度,似乎也昭示着英特尔新一代“6+7”平台具备了更灵活的适配能力。
HPC(高性能计算)与AI(人工智能)一直被认为存在性能权衡,而至强600从架构层面实现二者兼顾,成为科研与产业场景的通用算力平台。
“至强恰恰在这两方面都很强。HPC应用上英特尔追求FP64算力,毋庸置疑至强表现非常好;同时我们(英特尔)有AMX指令集,支持INT8、BF16、FP16矩阵运算,对AI应用来说至关重要。”高宇指出,至强600保留强悍双精度算力,持续占据全球HPC集群主流地位;内置AMX加速引擎,配合MRDIMM高带宽内存,大幅提升AI推理效率。
新一代产品的另一个明显优势在于,至强600单核可支持4TB内存,远超现有GPU水平。同时技术专家王巍巍补充道:“HPC不是每天24小时都在运行,空闲时可以用来运行AI模型,同样能获得很好的效果。至强CPU支持4TB内存,这是目前任何GPU都做不到的。” 这一特性让其完美适配AlphaFold 3等生物分子模拟、大规模科学计算与AI融合场景。
在可靠性方面,至强600搭载48项RAS功能,十余项针对内存通路的优化,支持 ADDDC双比特错误纠正。“打开RAS功能没有任何成本增加,也不会损失性能。” 高宇强调,该设计可保障高频率内存下的信号稳定,满足工作站7×24小时运行需求。

▲王巍巍(WeiWei Wang),英特尔技术专家
作为本次发布会展示的专业显卡产品,锐炫Pro B70以32GB超大显存为核心卖点,精准解决本地大模型部署、高并发推理、专业创作的显存瓶颈。
“单张锐炫Pro B70有32GB显存,4卡互联就可达到128GB,运行100B左右的模型,还能留下大量显存跑 KV Cache,支持高并发。”王巍巍表示,单卡可满足个人专业创作者需求,四卡集群则可支撑企业级100B大模型本地部署,稳定性与安全性远超云端。这一规格精准狙击了本地大模型部署的痛点——在保证高并发推理的同时,解决了KV Cache对显存的“贪婪”需求。
在产品布局上,英特尔同步完善产品线,B65型号定位B60与B70之间。“B65价格比B70更便宜,但是保留了32GB大显存,对需要大显存、但不那么需要高算力、对价格敏感的用户非常适合。” 高宇透露,该产品目前市场需求强劲。
面对显存成本上涨,徐金平直言:“显存涨价还没有把优势拉平,我们价格竞争力仍然很强。” 他同时释放重磅信号:“未来会更惊喜,下一代显卡显存会比这个大很多。”当然,下一代专业显卡应该就是传言中的“Cresent Island”,具体性能仍有待英特尔公布更多后续信息。
长期以来,在AI生态圈中似乎总是离不开CUDA,这一某种意义上可以说是生态壁垒的技术专利,是专业显卡在AI市场绕不开的话题。英特尔从生态开放与编程工具两方面,也努力构建差异化破局路径。

▲徐金平(JP Xu),英特尔中国区显卡和AI高级产品总监
“突破CUDA有不同维度。整个生态都不希望被单一厂商或技术锁定,所以PyTorch、vLLM、SGLang崛起,让应用可以不关心底层硬件。”徐金平表示,基于通用框架开发的应用,可实现跨硬件无缝运行。同时,英特尔支持OpenAI、Triton等通用Kernel语言,一次编译适配多平台,可以大幅降低开发者迁移成本。同时,为降低用户使用门槛,英特尔还持续深化软件适配。“ComfyUI在官网上下载时,原生支持英特尔的 GPU。” 徐金平强调,英特尔将持续加大新模型、新生态投入,实现 “新模型早上发布、中午英特尔GPU即可兼容”。
在性能方面,本次发布的至强600系CPU的AMX引擎与锐炫Pro B70的XMX引擎,形成英特尔独有的“I+I”软硬协同方案,可以实现算力最优调度。
“很重的矩阵加速运算一定是运行在GPU上,但前处理、后处理、数据准备以及Embedding等,完全可以放在CPU的AMX上运算,通过Offload大大提高整体吞吐量。” 徐金平解释道。
目前这种“I+I”的组合方案已实现商业化落地。高宇分享:“我们与趋境合作的 MoE Offload,把热专家(常用的子模型)跑在GPU上,把冷专家(不常用的子模型)扔回CPU主存,用AMX推理,节省数据搬运时间,实测效果很好。” 这种异构协同模式,极大地提升了稀疏大模型的运行效率。
在生态合作方面,锐炫Pro系列已与铭瑄、蓝戟、Sparkle、撼与科技及ASRock等多家AIC厂商达成合作,大陆市场在售品牌达4家,华硕、技嘉等英特尔主板核心合作伙伴的合作信息暂未披露。
谈及当前供应链,高宇坦言:“Agentic AI带来的需求爆发,超越了所有人预判。芯片扩产难度极大、需求短期不会下滑,缺货情况在一段时间内会持续。”
针对用户对小型化、静音化工作站的需求,英特尔设定明确目标:单卡机型机箱≤8L、噪声≤35dB;2卡互联机型≤14L、噪声≤40dB;4卡互联机型≤35L,并全面向液冷方案升级,告别“傻大黑粗”的传统形象,适配个人工作室与紧凑型办公环境。
“我们设定目标:1卡机型机箱≤8L、噪声≤35dB;2卡≤14L、≤40dB;4卡≤35L,搭配液冷实现超静音,既小巧又算力强。” 高宇表示。
从 HPC 科学计算到 AI 推理创作,从个人专业工作站到企业边缘部署,英特尔以至强600系列+锐炫 Pro B70的“非常 6+7”组合,构建起开放、高效、高性价比的AI工作站生态。凭借CPU与GPU的深度协同、开放的生态策略、持续升级的大显存路线,英特尔正重新定义专业AI生产力标准,为智能体时代的创作者与企业提供更强劲、更可靠、更易用的算力支撑。
看得出来,从至强600的通用算力底座,到锐炫Pro B70的大显存突围,再到MoE卸载技术的软件优化,英特尔正在构建一个开放、异构且高性价比的端侧AI生态。在Agentic AI爆发的前夜,这场关于“6+7”的布局,不仅是对硬件性能的刷新,也是对专业生产力标准的一次重新定义。期待“6+7”在市场上的更好表现!
更新时间:2026-04-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号