阿里云Qwen3模型重大更新:性能全面提升,超越行业顶尖水平

IT之家 7 月 22 日消息,阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为
Qwen3-235B-A22B-Instruct-2507-FP8

阿里云表示,在经过与社区沟通和深思熟虑后,决定停止使用混合思考模式,转为分别训练 Instruct 和 Thinking 模型,以获得最佳质量。

据介绍,新的 Qwen3 模型通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。

模型概述

FP8 版本的
Qwen3-235B-A22B-Instruct-2507
具有以下功能特点:

阿里云表示,本次更新的 Qwen3 模型,还增强了以下关键性能:

目前,Qwen3 新模型已在魔搭社区和 HuggingFace 上开源更新,IT之家附官方地址:

展开阅读全文

更新时间:2025-07-23

标签:科技   阿里   模型   性能   水平   行业   能力   上下文   文本   社区   参数   语言   版本   模式

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top