阿里发布Qwen3-Max大模型,总参数超万亿

9月24日, 2025云栖大会上,阿里通义旗舰模型Qwen3-Max亮相,为通义千问家族中最大、最强的基础模型。据介绍,其性能超过GPT-5、Claude Opus 4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度实现突破。该模型预训练数据量达36T tokens,总参数超过万亿。

阿里云方面表示,由于自然数据的数量有限,当前有部分学者认为预训练的Scaling Law即将逼近上限,而Qwen3-Max的性能突破显示,继续增大数据、模型参数,依然能锻造出更强的模型,给予了大家更多的信心。(澎湃新闻记者 胡含嫣)

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

展开阅读全文

更新时间:2025-09-26

标签:科技   阿里   模型   参数   澎湃   数据   义旗   性能   更多   新闻   新闻记者

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top