卖了30年显卡,黄仁勋终于把Windows电脑变成自己家的了

#文章新锐创作者认证#

图源:英伟达

2026年6月1日,台北。

COMPUTEX的舞台灯打在黄仁勋身上。他穿皮衣,站在一块标着RTX Spark的芯片旁边。

“15到20年前,我们想了个点子叫手机。今天,我们有个更好的点子叫PC。”

台下坐着的Acer、Asus、Dell、Gigabyte、HP、Lenovo、Microsoft、MSI的高管没人笑。八家平时在货架上抢市场的公司,齐刷刷站在同一颗芯片背后。



图源:英伟达 GTC 直播

我盯着直播画面,想起2012年我自己装第一台电脑的样子。那时候英伟达的GTX 660是插在技嘉主板上的配件,我为了打游戏多花两百块买它。现在它不卖配件了,要卖整台电脑。

三十年卖卡,一朝造机。英伟达把插在别人主板上的配件,变成了整台电脑的心脏。

过去四十年,PC行业的分工像焊死了一样。微软做操作系统,定义软件入口。Intel和AMD守着x86处理器,把CPU市场攥得死死的。英伟达从图形计算起家,后来把AI加速做到第一,始终是“插进去的那个”——强,但永远是配件。


RTX Spark把这分工砸了。

它是一颗完整的SoC。CPU、GPU、内存焊在一起。Windows笔记本会围着它造。没有x86授权,英伟达绕去Arm阵营,和联发科联合做了20核Grace CPU,缝上自家的Blackwell GPU。第一次,主流Windows笔记本最核心的位置,挂的是英伟达的名字,不是Intel,不是AMD。

笔记本市场一年出货1.5亿台。靠数据中心GPU坐上全球市值头名的公司,专程走进来,不是试水。它要拿的,是PC的“大脑”。



我翻了下参数,坐直了。

FP4 AI性能1 petaflop。等于1000 TFLOPS。20核Grace CPU。最高128GB统一内存。NVLink C2C带宽600GB/s。台积电3nm工艺,700亿晶体管。

这些数字单独看没意义。放一起看,可怕。

1 petaflop的AI性能,128GB统一内存,过去属于工作站,属于机房。现在塞进一台14毫米厚、3磅重的笔记本里。覆盖14到16寸机型,铝合金机身,tandem OLED屏,支持G-SYNC。

英伟达说它能干这些:本地剪12K视频,渲染大型3D场景,跑百亿参数大模型。现场演示里,用户给个草图和需求,运行在上面的智能体调用Rhino做建筑设计,导入Blender用Flux 2生成渲染图,过程中随时改。Adobe的Photoshop、Premiere都在给它做优化,接进本地智能体,变成自动化工作流的一部分。


我得说句实在话。这东西不是给所有人的。

你只用电脑刷网页、写文档、开线上会议,用不上1 petaflop,也用不上128GB内存。就像大多数人不需要一台能渲染电影的工作站。

但你是开发者,是内容创作者,是把本地大模型当生产工具的人,这是这两年最对路的一块硅。

过去你想本地跑大模型,只有几条路:背一台风扇狂转的游戏本,买一台靠大统一内存硬扛的Mac,或者开云端GPU。每条路都别扭。

RTX Spark把CUDA和128GB统一内存塞进轻薄本。CUDA的分量,做AI开发的人都懂。这些年所有训练推理框架,都是先给CUDA写,再考虑别的。现在你有了Mac之外的选择,内存够大,生态还在。

我查了下最新消息,DGX Spark也就是桌面版的RTX Spark已经全面投产,手掌大的机身,专为开发者做AI推理和微调用。链博会上展出的样机,比很多人想象的小得多。工作人员说九十月份正式上市,除了开发者,未来当家庭智慧大脑管智能家居也没问题。

黄仁勋说这台电脑要跑“所有东西”。传统Windows应用能跑,CUDA软件栈能跑,图形工作流、基因组学、天体物理的专用软件也能跑。能连本地模型,也能接云端Claude、Codex。



RTX Spark只是入口。

同一场发布会,英伟达掏了三套东西:笔记本、台式机、工作站。都兼容Windows、CUDA和AI软件栈。台式机像家庭AI主机,24小时跑智能体,连摄像头、安防、家电。工作站叫DGX Station for Windows,748GB内存,20 petaflops算力,8TB/s内存带宽,桌面环境跑万亿参数模型,开发者本地调试完直接推云端。

还有个叫Claw的小盒子。家用AI代理,7×24小时跑agent,连家里所有设备,当永远在线的私人助理。

我以前觉得PC行业没新故事了。现在知道,新故事的核心是两个字:Agent。

所有产品背后都绕着它转。黄仁勋把PC放到新位置:从手动操作软件的工具,变成智能体调度平台的入口。

他类比手机到智能手机。现在打电话已经不是智能手机的核心功能。10年后的PC,打开应用、点击输入的操作会消失,变成家庭和个人工作流里的AI超级计算机。

GitHub的数据摆在这:2023年commit约3亿,2024年4亿,2025年前几个月5亿,2026年前几个月接近翻三倍。全球3000万到4000万职业开发者。


有人说AI会减少就业。黄仁勋直接反驳。AI提高工程师产出,同样人力成本创造更高生产力,企业反而愿意招更多人。软件开发的价值在扩大。

支撑智能体跑的底座,英伟达也重新做了。

Vera Rubin平台进入全面投产。这是英伟达迄今最大的POD级平台,专为Agentic AI设计。Rubin GPU负责主要计算,Vera CPU负责调度数据管线,BlueField 4管安全隔离存储,Spectrum X管大规模联网。

Vera CPU是给智能体做的,不是给人做的。过去CPU服务于人类用户,响应速度按秒算。智能体要频繁调用工具、访问数据库、跑代码,每步都要低延迟。

88个自研Olympus核心,单片网格结构,不拆chiplet,减少跨芯片延迟。支持PCIe Gen6,内部通信3.6TB/s,内存带宽1.2TB/s。比x86 CPU峰值内存延迟低40%,智能体sandbox性能1.8倍,SQL性能3倍,实时流处理6倍。

智能体越多,CPU越不能成瓶颈。GPU是AI工厂最贵的资产,CPU的延迟直接影响GPU利用率,影响Token产出。


AI的商业逻辑变了。

过去算力是成本。现在Token是能带来收入的单位。算力的身份从成本变成生产能力。

想靠Token赚钱,看英伟达的AI工厂。DSX是构建运营AI工厂的蓝图,基于Omniverse用数字孪生模拟布局、电力、冷却、网络。未来1GW级AI工厂投资500亿到1000亿美元。资本成本越高,系统效率、可靠性越关键。

DSX的生态里,有CoreWeave、Nebius这些云服务商,客户包括Cursor、Shopify、Google。企业用的智能体能力分四类:模型、调度系统、工具技能、运行环境。对应产品是Nemotron、OpenShelf、CUDA X libraries和AI平台。

Nemotron 3 Ultra刚发布。SSM状态空间模型加MoE混合专家架构,比Kimi K2.6、Qwen 3.5、智谱GLM 5.1快5倍,运行成本低30%。模型、训练脚本、训练数据全开源,企业可以加自己的行业数据。

5500亿参数的版本已经跑在CrowdStrike、Palantir的系统里,OpenAI、Anthropic、字节跳动、纽约证券交易所都排进了Vera CPU的客户名单。




我看了下英伟达的路线图,铺到了2030年。

从现在的Blackwell,到接下来的Rubin,再到Feynman。桌面、笔记本、工作站的迭代节奏都排好了。

RTX Spark秋季上市,定价没公布,各家OEM的机型陆续亮相。Windows的应用适配进度,决定它是少数人手里的利器,还是多数人的下一台电脑。

你桌上的RTX Spark,客厅里的Claw,机房里的Vera和Nemotron,拼起来是英伟达要的东西:从终端到云端,整条给智能体用的栈。

PC行业四十年,从来都是微软定系统,Intel/AMD定CPU,英伟达定GPU。现在英伟达跳出来,要定整台电脑的规则。

联手微软,拉上所有OEM厂商,把Agent钉进Windows PC的核心。


我以前总觉得PC死了,被手机抢了所有存在感。现在才知道,它只是等着换个心脏,重新活过来。

这个心脏,英伟达造好了。

PC会经历手机变成智能手机那样变。十年后回头看,今天我们站在起跑线上。





#分享我的头条荣誉##新锐领航权益升级#

展开阅读全文

更新时间:2026-06-03

标签:数码   显卡   电脑   英伟   内存   智能   模型   开发者   工作站   云端   工作流   核心

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号

Top