今天,Deepseek在微信中,宣布上线了V3.1版本,3.1版本的上线,说明版本4距离我们好像又远了一步。毕竟所有人都在等的是V4。
Deepseek 的V3.1主要的升级点是上下文长度拓展至128k。其他升级点没有说,实测下来属于升级的正常表现,不是巨大的升级和提升。
扩展上下文处理能力:V3.1版本的核心升级在于上下文窗口的翻倍扩容,使模型能够处理更长的多轮对话序列和复杂的查询任务,为用户提供更连贯和深入的交互体验。
优化输出结构:根据早期用户反馈,V3.1在语言表达风格方面进行了显著优化,模型现在更倾向于生成结构化输出内容,包括表格、列表等格式化数据呈现,提升了信息的可读性和实用性。
增强物理理解能力:新版本在物理现象模拟和相关概念理解方面表现出明显改进,为科学计算和工程应用场景提供了更强的支撑能力。
架构延续与优化:V3.1继续采用经过验证的专家混合(MoE,Mixture of Experts)架构设计,针对常规推理任务进行了专门优化,在此类应用场景下无需启用"DeepThink"深度思考模式,既保证了处理效率又维持了输出质量。
目前Deepseek的官网,APP,API都同步上线了新的模型,调用方式不变。
虽然截至发稿时,Hugging Face平台尚未提供V3.1版本的模型权重文件下载,但DeepSeek重申了其对开源社区的长期承诺,承诺将继续遵循开源发布策略,为全球AI研究社区和开发者提供技术支持。
DeepSeek-V3.1的发布进一步巩固了该公司在中国AI技术创新领域的领先地位,也为全球开源大语言模型的发展贡献了重要的技术进步。随着上下文处理能力的显著提升和多项性能优化的实现,V3.1有望在企业级应用、学术研究和个人用户场景中发挥更大的价值。
更新时间:2025-08-20
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号