智通财经APP获悉,据通义千问Qwen公众号消息,继 Qwen3-2507 系列发布之后,阿里云通义千问推出其迄今为止规模最大、能力最强的模型—— Qwen3-Max。
目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。
通义团队表示,Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了通义提出的global-batch load balancing loss。
此外,Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking已展现出非凡潜力。通过集成代码解释器并运用并行测试时计算技术,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。
更新时间:2025-09-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号