2025年可谓显卡发展的“大年”,在这一年,AMD、英伟达和英特尔都发布了自己的新品,RTX 50系列、RX 9000系列成为玩家的新欢。另外,AI技术的发展,带来了图形计算和AI技术最深入的结合,诸如DLSS 4、FSR 4及XeSS 2等超分辨率、帧生成技术纷纷粉墨登场,带来更高帧率的同时还降低了系统消耗,画质也不受影响。国内自主GPU在2025年的发展也如火如荼,不但有新品上市,IPO以及资本市场的介入,也大大推动了国内GPU的加速发展。这一年新闻很多,惊喜很多,期待和希望也更多。
2025年1月,英伟达在CES展会上发布了基于Blackwell架构的GeForce RTX 50系列显卡,包括RTX 5090、RTX 5080、RTX 5070 Ti和RTX 5070四款新品。RTX 5090作为旗舰,拥有高达920亿个晶体管,AI算力最高可达3352 TOPS(FP4精度)。Blackwell架构引入了第五代Tensor Core和第四代RT Core,实现了性能的大幅提升:相比上一代Ada架构,Blackwell在AI算力上提高3倍,光线追踪性能提高2倍,传统FP32性能提高1.5倍,显存带宽也几乎翻倍,达到1.8TB/s。核心规格方面,RTX 5090集成21760个CUDA核心、170个RT核心和680个Tensor核心,显存改用GDDR7 32GB,显存位宽512-bit,大幅增强了大显存、高带宽的支持。

▲2025年开年,英伟达就发布了RTX 50系列显卡。

▲RTX 50采用全新的Blackwell架构
在AI特性方面,Blackwell架构专为神经网络渲染优化,引入了第五代张量核心,可在GPU上实时执行复杂的AI计算。在图形计算方面,AI加速后大幅度优化的DLSS 4是本代最大亮点,英伟达称其为“图形行业首个实时Transformer模型应用”,大幅提升了图像质量和帧率表现。DLSS 4在每渲染帧基础上可以额外生成多达3帧额外画面,结合整套DLSS技术可使帧率最多提升至传统渲染的8倍。同时,DLSS 4采用Transformer架构的超分辨率和光线重建模型,相比传统CNN模型参数量增加2倍、计算量增加4倍,实现了更稳定的画面、更少的重影和伪影,以及更优秀的细节和抗锯齿效果。首批支持DLSS 4的游戏和应用超过75款,包括《黑神话:悟空》《GTA 6》等热门大作。

▲DLSS 4是发布会的最大亮点
在玩家关注的光线追踪性能方面,Blackwell架构集成了全新RT Core,使光线追踪性能提升至上一代的2倍,并引入了Opacity Micromap引擎来加速alpha测试材质的光线追踪,性能提升2.5倍。Reflex 2技术也随RTX 50系显卡推出,通过Frame Warp技术在渲染帧发送至显示器前根据最新鼠标输入进行更新,从而将系统延迟降低高达75%。此外,RTX 50系显卡首次全面支持DisplayPort 2.1 UHBR20(80Gbps),突破了DP1.4a的限制,可驱动8K@165Hz高刷新率显示器。它们还将支持PCIe 5.0,成为首批实现这一转变的消费级GPU。视频编码/解码功能也得到增强,支持4⁚2⁚2专业级色彩格式的视频处理。

▲RTX 50系列技术特性一览
RTX 50系列发布后,立刻成为市场的主流焦点,其中RTX 5070系列以及随后发布的RTX 5060系列引发了玩家的换卡、升级热潮。从技术角度来说,无论是全新的Blackwell架构、第五代张量核心还是更强大的RT核心、更大的核心规模以及DLSS 4等技术的应用,都使得RTX 50系列成为目前显卡市场上最佳选择,甚至对很多玩家来说没有之一。
2025年2月,AMD发布了新一代RDNA 4架构,并推出Radeon RX 9000系列显卡,首发包括RX 9070 XT和RX 9070两款型号。RDNA 4采用台积电4nm工艺,单芯片集成度提升,为游戏玩家和创作者带来了性能、视觉效果和价值的强大融合。相比上一代RDNA 3,RDNA 4的光栅化性能提升近2倍,光线追踪性能提升近2.5倍,每个计算单元的ML(FP16矩阵)性能提升3.5倍。RX 9070系列搭载第三代光线追踪加速器,可以实现高速、高分辨率游戏渲染,提供逼真的照明、阴影和反射效果。

▲AMD RDNA 4架构特性一览
AMD RDNA 4在AI和图形技术上也有多项改进。RX 9000系列引入第二代AI加速器,每个AI加速器的INT8吞吐量提升8倍(稀疏矩阵模式),用于加速生成式AI应用,相比RDNA 3效率显著提高。此外,FSR 4超分技术随RDNA 4同步推出,全面转向AI驱动,这是FSR技术的最重大升级。FSR 4采用机器学习算法,可在4K分辨率下实现150%的帧率提升,同时降低功耗30%。同时,RDNA 4在光线追踪方面进行了架构优化,每个计算单元的光线追踪吞吐量相比前代提高了2倍。RDNA 4架构通过AI和硬件优化,在保持高性价比的同时,大幅增强了图形和AI性能,为AMD在高端游戏市场提供了有力的竞争武器。

▲AMD RDNA 4大幅度提升了光线追踪和AI性能。
首发的RX 9070 XT和RX 9070均配备16GB GDDR6显存,256-bit总线,显存频率提升至20Gbps,总带宽达644.6 GB/s。两者在计算单元规模上有所区别:RX 9070 XT拥有64个计算单元(4096个流处理器),而RX 9070为56个计算单元(3584个流处理器)。在年中,AMD还发布了RX 9070GRE、RTX 9060系列显卡来面向主流市场,并将价格定位在2000元档位,得到了主流玩家的好评。

▲首发产品包括RX 9070和RX 9070XT,得到了玩家青睐。
总的来说,AMD在2025年通过新品迭代,在产品技术方面极大地贴近了竞争对手,尤其是FSR 4的发布,使其在AI驱动图形计算方面可以和对方的DLSS 4有一战之力。不过AMD在本年度依旧未布局高端和顶级产品线,高端市场的缺失,让AMD在市场竞争中的优势无法完全展现,略显遗憾。

▲RX 9060系列展示出出色的性价比
此外,2025年英特尔也推出了新一代Arc独立显卡,代号Battlemage。不过Arc B系列定位中低端市场,性能与英伟达、AMD仍有差距。英特尔在发布会上强调其XeSS 2.1技术在游戏中引入了AI帧生成和低延迟功能,并通过开放SDK使非英特尔显卡也能使用XeSS 2.1,再加上显卡价格定位较低,显示出和AMD、英伟达错位竞争的意图。

▲英特尔Arc B580在2025年推出,但并未引发太大市场波澜。
2025年在显卡发展中另一个值得关注的点是,AI相关技术被大规模使用在了全新的GPU、全新的游戏和应用中。三大核心技术DLSS 4、FSR 4以及XeSS 2.1的发布和应用,带来了显卡尤其是图形计算行业的革命。
DLSS 4目前是英伟达最重要的图形计算加速工具。完整版本的DLSS 4,带来了超分辨率、帧生成以及多帧生成、光线重建和延迟降低等一系列功能。由于多帧生成技术的引入,游戏玩家可以在游戏帧率低于60fps(但至少高于fps)的情况下,依旧能够体验到完整和流畅的游戏效果。英伟达官方数据显示,DLSS 4可以使得游戏帧率平均提升至原生渲染的8倍。在实际游戏中,DLSS 4还与英伟达的Reflex低延迟技术相结合,进一步降低了输入延迟,确保即使在高帧率下游戏也能即时响应。DLSS 4还与英伟达的新编码器NVENC结合,可加速实时视频流和录制的质量。截至2025年底,已有数百款游戏支持DLSS 4,普及率远高于AMD的FSR 4。英伟达DLSS 4以其卓越的性能和画质表现,继续巩固了其在超分辨率技术领域的领先地位。

▲DLSS 4带来了创新的多帧生成技术

▲DLSS 4改用了全新的Transformer引擎
AMD FSR技术在2025年推出了第四代升级也就是FSR 4。FSR 4基于AMD RDNA 4架构的第二代AI加速器,采用机器学习算法来提升帧率和画质。相比前代FSR 3.1,FSR 4全面转向AI驱动,不仅能将低分辨率画面放大至高分辨率,还可以插入中间帧以提升帧率,从而在不牺牲太多画质的情况下大幅提升流畅度。FSR 4提供了多种模式,用户不仅可以选择单纯画质提升,也可以选择画质提升+帧生成模式,无需在画质和帧率之间取舍。在性能提升方面,AMD官方宣称FSR 4结合帧生成和光线重建可将帧率提升高达4.7倍。不过,由于FSR 4的AI加速模块只原生兼容FP8操作,因此FSR 4的硬件支持目前仅限Radeon RX 9000系列显卡(RDNA 4架构),AMD RDNA 1/2/3/3.5架构显卡仍支持传统FSR(FSR 3.1),但不具备ML加速能力。在驱动支持方面,Radeon Software Adrenalin 25.12.1版本开始支持FSR升频、帧生成和光线再生。截至2025年底,AMD计划为超过30款游戏提供FSR帧生成支持。总体而言,FSR 4代表了AMD在AI图形技术上的重大进步,其与FSR 3相比在画质和帧率上都有显著提升,为玩家提供了高效的图形性能提升方案。

▲AMD在FSR 4中终于引入了AI相关功能。

▲FSR 4带来了更好的性能。
除了英伟达和AMD外,英特尔在2025年也发布了XeSS 2。XeSS 2.0版本提供了超分辨率(XeSS-SR)、帧生成(XeSS-FG)和低延迟(XeSS-LL)三种模式。其中,XeSS-FG是首次引入的AI帧生成功能,可通过深度学习生成中间帧,提升游戏流畅度而不降低画质。XeSS 2还通过XeLL低延迟技术,在高帧率下保持输入响应。

▲英特尔XeSS 2也带来了多帧生成技术,效果和性能都有大幅度提升。
值得一提的是,英特尔在2025年8月扩展了XeSS 2技术并推出XeSS 2.1 SDK,允许非英特尔显卡也能使用XeSS帧生成和低延迟功能。这意味着只要支持DirectX 12 Ultimate,包括英伟达和AMD显卡在内,都可以通过驱动调用XeSS 2.1来提升帧率。目前,XeSS 2的整体采用率仍落后于AMD的FSR 4和英伟达的DLSS 4。不过随着新SDK发布和合作加强,XeSS有望吸引更多游戏开发者关注。总体来看,XeSS 2代表了英特尔在超分辨率领域的追赶步伐,其通过开放生态和不断升级的算法,为用户提供了另一种AI超采样选择。
2025年,中国国产GPU产业取得了一系列重要进展,在技术突破和市场替代方面迈出了坚实步伐。
摩尔线程:发布MUSA 5.0架构,IPO上市
摩尔线程在2025年12月发布了全新的MUSA 5.0架构,代号“花港”,标志着国产GPU技术的一次飞跃。MUSA 5.0架构集成了AI生成式渲染(AGR)和第二代光线追踪硬件加速引擎,首次完整支持DirectX 12 Ultimate标准,实现了图形渲染与智能计算的高度协同。这意味着国产GPU终于补齐了在3A游戏和专业图形设计上的短板,能够支持下一代游戏的黄金标准——DirectX 12 Ultimate。在AI计算方面,MUSA 5.0引入了全精度端到端加速技术和新一代异步编程模型,专门针对大模型训练和推理进行了优化。此外,MUSA 5.0支持10万卡级的超大规模智算集群扩展,突破了国产GPU过去在集群扩展能力上的限制。这一系列创新展示了摩尔线程在“图形+AI”双修上的野心,也使国产GPU首次具备了支撑超大模型训练的底层能力。

▲摩尔线程在2025年底发布了全新架构,代号“花港”。
在产品落地方面,摩尔线程已推出消费级桌面显卡MTT S2000、S80等,以及企业级服务器加速卡MTT S4000等。2025年上半年,摩尔线程AI智算产品收入占比高达94.85%,成为国产GPU中AI场景渗透最快的企业。在市场应用上,摩尔线程的GPU已应用于字节跳动、百度等互联网企业的智算集群。
2025年9月26日,摩尔线程科创板首发上会并顺利过会。12月5日,摩尔线程正式登陆科创板,发行价114.28元,发行7000万股,募资总额80亿元。上市首日公司股价大涨425.46%,市值一度超过4000亿元,成为国产GPU第一股。这一成功上市标志着国产GPU产业获得资本市场高度认可,也为摩尔线程进一步研发投入和市场拓展提供了有力支持。
沐曦股份:推出曦云C600,IPO上市
沐曦(沐曦集成电路)是国内另一领先的GPU初创企业。2025年10月,沐曦发布了新一代GPU曦云C600,定位训推一体和高性能计算,性能介于英伟达A100和H100之间,预计2026年上半年正式量产。下一代产品曦云C700将基于国产供应链打造,综合性能对标H100,计划2026年下半年流片。沐曦在技术上采用自主研发的统一GPU架构,支持“高性能计算+AI训练”双场景,其MXMACA软件栈兼容CUDA生态,可直接迁移英伟达GPU上的应用程序,解决了“生态迁移成本高”的行业痛点。

▲沐曦推出了推出曦云C600系列产品
2025年12月17日,沐曦股份正式登陆科创板,发行价104.66元,发行4010万股,募资约41.97亿元。上市首日公司股价大涨692.95%,报收829.90元,总市值3320亿元,成为继摩尔线程之后的第二家国产GPU上市企业。沐曦的成功上市同样彰显了国产GPU赛道的广阔前景,也为其技术研发和市场推广提供了雄厚资金支持。
壁仞科技:筹备港股上市,Chiplet技术突破
壁仞科技是另一家备受瞩目的国产GPU企业,专注于高端通用GPU研发。2025年,壁仞推出了新一代云训练及推理芯片BR166,它采用两颗BR106裸晶与四颗DRAM芯片共封装成一颗芯片,实现了单芯片容量的大幅扩展。这种Chiplet技术突破了单颗芯片受制于光罩面积的限制,使单颗芯片拥有更多晶体管,可放置更多计算单元和存储单元,从而显著提升芯片整体性能。BR166在峰值算力、内存、视频编解码、互联等方面性能是BR106的两倍。两颗BR106裸晶之间的D2D双向带宽可达896GB/s,几乎将两颗裸晶融为一体。这一技术创新使壁仞在高端GPU性能上迅速逼近国际领先水平。2025年12月15日,证监会官网披露了壁仞科技境外发行上市备案通知书,拟发行不超过3.72亿股境外上市普通股并在香港联合交易所上市。

▲壁仞科技推出了自主研发的166系列产品
除了上述三家企业,国内还有多家GPU企业取得了阶段性成果。例如,天数智芯发布了面向AI推理的天垓1000系列和面向通用计算的天垓2000系列,产品在性能和生态上持续改进;寒武纪的思元系列AI加速卡也在云端和边缘端广泛应用;景嘉微等公司在军用图形芯片领域深耕多年。在政策和资本的双重支持下,国产GPU正呈现出“百家争鸣”的发展态势。
当然,国产GPU仍面临技术积累不足、生态不完善等挑战。但总体来看,2025年无疑是中国GPU产业的一个里程碑之年:技术上实现了突破,市场上迎来了资本和应用的双重青睐。国产GPU正逐步从实验室走向市场,在AI计算、图形渲染等领域展现出强大的竞争力。
2025年的显卡市场呈现出技术加速迭代、竞争格局重塑与供应链挑战并存的复杂局面。英伟达的RTX 50系列和AMD的RX 9000系列将性能推向新高,而以DLSS 4和FSR 4为代表的AI超分辨率技术,则成为提升游戏体验的关键驱动力,标志着显卡行业全面进入AI计算时代。市场竞争层面,英伟达依旧保持领先,但AMD凭借RDNA 4架构奋起直追。尤为引人注目的是,国产GPU在2025年迎来了历史性突破,摩尔线程、沐曦等企业接连上市,在技术上实现关键追赶,市场替代进程显著加速,为全球GPU市场注入了新的变量。然而,地缘政治引发的供应限制、存储芯片价格暴涨等因素也给市场带来了不确定性。展望未来,AI与图形的深度融合、国产GPU的持续崛起以及全球供应链的重构,将共同塑造下一阶段显卡行业的发展路径。
更新时间:2026-01-05
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号