JetBrains开源Mellum2模型:12B参数,升级AI智能体编程

IT之家 6 月 2 日消息,JetBrains 昨日(6 月 1 日)发布博文,宣布开源 Mellum2 模型,这是面向软件工程系统的新机器学习模型。

官方表示相比原版 Mellum,它从代码补全模型升级为完整编码助手,并把上下文窗口从 8192 Token 扩到 131072 Token。开发者可在 Apache 2.0 许可证下部署基础版、指令版和思考版。

参数上,Mellum2 总规模为 12B,高于 Mellum 的 4B。该模型采用稀疏 Mixture-of-Experts(混合专家)框架,激活时参数量为 2.5B,在标准硬件上仍能保持较快计算。

能力方面,Mellum2 可生成和编辑代码、调用外部工具、执行多步骤 Agentic(智能体式)工作流、维持长对话。

JetBrains 将 Mellum2 定位在 AI 工作负载路由与编排、低延迟 RAG(检索增强生成)管线、复杂工作流中的快速 Sub-agent(子智能体),以及私有本地 AI 部署。

训练方面,团队称预训练阶段采用三阶段数据课程。数据混合逐步从多样化网页内容,转向精选代码和数学内容,从而让模型更贴近软件工程任务。

IT之家附上参考地址

展开阅读全文

更新时间:2026-06-03

标签:科技   模型   参数   智能   工作流   软件工程   代码   阶段   体式   内容   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top