阿里通义:发布Qwen3-Next,训练成本降超90%

【9月12日,阿里通义发布下一代基础模型架构Qwen3-Next】9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。该架构针对大模型在上下文长度和总参数两方面不断扩展的未来趋势设计,采用全新高稀疏MoE架构,重构经典Transformer核心组件,创新混合注意力机制,实现模型训练和推理的双重性价比突破。 基于新架构,阿里通义推出Qwen3-Next-80B-A3B系列模型,开源指令和推理两大模型版本。新模型总参数80B仅激活3B,性能媲美千问3旗舰版235B模型,计算效率大幅提升。训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,支持百万Tokens超长上下文。 近期,阿里通义动作不断,推出超万亿参数的Qwen3-Max-Preview等多个模型,持续推进“全尺寸”“全模态”开源。全球AI HuggingFace数据显示,通义千问Qwen衍生模型数超17万,位居全球第一开源模型。沙利文报告显示,2025年上半年,在中业级大模型调用市场中,阿里通义占比17.7%排名第一。

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

本文来自和讯财经,更多精彩资讯请下载“和讯财经”APP

展开阅读全文

更新时间:2025-09-13

标签:科技   阿里   成本   模型   架构   参数   本文   出超   基础   财经   全球   吞吐量

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top