梁文锋称DeepSeek V4于4月下旬发布,将以Apache 2.0协议开源

PChome 4月10日消息,据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于本月下旬正式发布。

近期网页端上线 “快速模式”与“专家模式”,支持简洁搜索与长程复杂任务处理,被视为V4能力的预演。“专家模式”实测在代码生成、数学推理等复杂任务中表现突出,但高峰时仍需排队。

据悉,新模型将实现重大技术突破,包括万亿参数规模、百万级上下文窗口,并在推理阶段首次全面适配华为昇腾等国产AI芯片,成为国内首个在全链路算力上彻底摆脱英伟达依赖的万亿级大模型,推理速度较V3提升35倍,能耗降低40%。

3月29日 DeepSeek经历了13 小时服务中断,恢复后开发者实测模型逻辑严谨性、代码生成能力均显著提升,疑似为V4灰度测试。同时,新版本通过“存算分离”机制搭建创新架构,将静态知识存储与动态推理解绑,实现降低算力消耗并提升长文本连贯性。

DeepSeek V4预计将以Apache 2.0协议开源,支持企业自主部署,并已被阿里、腾讯、字节等科技巨头提前预订算力资源,计划集成至其云服务与AI产品中。

展开阅读全文

更新时间:2026-04-13

标签:科技   下旬   协议   梁文锋   模型   长程   模式   华为   英伟   能力   代码   专家   连贯性   灰度

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top