华为昇腾加持,DeepSeek-V4发布,开源AI迎来新拐点?

2026年4月24日,继OpenAI推出GPT-5.5后,DeepSeek官宣全新DeepSeek-V4预览版上线并同步开源,凭借百万字超长上下文、顶尖推理与智能体能力,成为开源领域标杆,延续高性价比优势。

此次更新距上一代大版本时隔15个月,发布后海内外热度暴涨,海外网友纷纷评价“鲸鱼回归”“便宜又能打”,成为开源大模型领域的重磅突破。

V4模型按大小分为Pro和Flash两个版本,也对应目前官方网页端和APP界面的专家模式和快速模式。其中Pro参数为1.6万亿,激活490亿,预训练数据33万亿;Flash参数为2840亿,激活130亿,预训练数据32万亿。

Pro和Flash两个版本的上下文都是1M(百万),均同时支持非思考模式与思考模式。

核心技术上,V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。

作为业内知名“价格屠夫”,DeepSeek-V4定价延续普惠策略,具体API收费标准:

受高端算力限制,当前Pro版本服务吞吐有限;下半年华为昇腾950超节点批量上市后,Pro价格将大幅下调,性价比进一步提升。

在性能表现上,V4-Pro性能比肩顶级闭源模型,而V4-Flash是更快捷高效的经济之选。

DeepSeek-V4-Pro内部使用体验优于AnthropicSonnet4.5,交付质量接近Opus4.6非思考模式;世界知识评测中,大幅领先开源模型,仅稍逊于Gemini-Pro-3.1;在数学、STEM、竞赛型代码的测评中,超越所有公开开源模型,比肩全球顶级闭源模型;在推理上,推理扩展后在标准推理基准上优于OpenAI的GPT5.2、谷歌Gemini3.0Pro,略逊于GPT5.4、Gemini3.1Pro,整体较前沿闭源模型落后3-6个月。

此次发布前,DeepSeek传出启动外部融资消息,拟以超100亿美元估值募资不少于3亿美元,用于算力扩充与人才储备。

作为长期坚持独立研发、全面开源的大模型企业,此次融资被视为其战略关键转向。目前,V4暂未推出多模态版本,业内推测与算力、资金投入相关,而未来多模态能力将成为众多模型厂商的重点布局方向。

综合自第一财经等

展开阅读全文

更新时间:2026-04-25

标签:科技   华为   拐点   模型   版本   模式   大幅   上下文   注意力   融资   业内   性能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top