K2.6发布一周持续位居开源模型榜首


4月20日,海淀人工智能大模型企业Kimi发布的KimiK2.6模型,在多项基准测试中取得持平或优于全球顶尖闭源大模型的成绩。一周以来,K2.6模型在相关评测中以最高分持续位居开源模型榜首,在大模型API三方调用平台OpenRouter调用量周榜单中位居第一。

连续位居榜首

4月27日,记者在第三方评测机构ArtificialAnalysis智能指数榜单上看到,KimiK2.6模型和小米公司的MiMo-V2.5-Pro模型,均是54分。K2.6模型在开源模型中位列第一,排在前四位的均是美国公司的闭源模型,第一名分数为60分,二、三、四名分数均是57分。

在国际知名的大模型API三方调用平台OpenRouter上,K2.6发布后迅速跃居每日榜单的榜首。4月27日,记者看到,K2.6依然位于每日榜单的榜首。

4月20日发布这一周,K2.6调用量在OpenRouter调用量周榜单中位居第一。4月27日是新的一周的开始,在当天的调用量周榜单中,K2.6依然位居第一位。

据了解,全球排名前五的开源模型中,K2.6是同时支持图片和视频理解的多模态模型,其他四个是纯文本模型。凭借更强的多模态编程能力,K2.6能够更精准地将图像和视频素材转化为代码。Kimi创建了一套专门的前端开发设计评测基准,涵盖视觉输入任务、落地页构建、全栈应用开发以及通用网页开发四个维度。对比谷歌AI原生开发平台中的Gemini3模型,基于kimi.com框架的K2.6智能体展现出了非常明显的领先优势。

对标闭源模型

4月20日Kimi发布并开源的KimiK2.6模型,带来行业领先的代码、长程任务执行和智能体集群能力。

K2.6的通用智能体、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试、在考察模型真实软件工程能力的SWE-BenchPro、评估智能体深度检索能力的DeepSearchQA等基准测试中均取得行业领先的成绩,持平或优于美国OpenAI公司3月发布的GPT-5.4、美国Anthropic公司2月发布的ClaudeOpus4.6和美国谷歌公司2月发布的Gemini3.1Pro等全球顶尖闭源模型。

K2.6长程编码能力也得到显著提升,在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成复杂系统的开发和优化。通过将代码与视觉能力的深度融合,K2.6将代码驱动的设计能力提升到了新高度,可以交付极具设计创意的专业级网页应用。

KimiK2.6大幅增强了智能体自主化执行能力,进一步扩展智能体的能力范围。由K2.6模型驱动的智能体集群架构迎来一次大升级,支持300个子智能体并行完成4000个协作步骤,实现更大规模的并行化,同时任务完成度和交付质量相比于K2.5有显著提升。针对OpenClaw(俗称“龙虾”)、HermesAgent(“爱马仕”智能体)等主动式智能体框架,K2.6展现出极强的自动化任务处理能力,支持长达5天的持续自主运行。

记者 倪恒虎

展开阅读全文

更新时间:2026-04-30

标签:科技   榜首   模型   智能   能力   长程   美国   代码   基准   公司   视觉

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top