
公司情报专家《财经涂鸦》获悉,4月28日,商汤正式发布并开源日日新SenseNova U1 系列原生理解生成统一模型。
该模型基于商汤今年三月自主研发的NEO-unify架构,在单一模型架构上统一了多模态理解、推理与生成。
据悉,本次开源发布的是SenseNova U1的轻量版系列SenseNova U1 Lite,包含SenseNova-U1-8B-MoT(基于稠密骨干网络)与SenseNova-U1-A3B-MoT(基于混合专家(MoE)骨干网络)两个不同规格的模型。
与传统多模态模型经常出现的等待、误解和信息损耗相比,SenseNova U1基于统一表征空间构建,可以将不同模态的信息以更紧凑、更高密度的方式组织起来。
该模型下,图像和语言不再是两套系统之间的接力,而是在同一个大脑中自然融合,令信息流转更快捷、理解更直接、生成更高效。
在涵盖图像理解、图像生成与编辑、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模型SOTA水平,为统一多模态理解与生成树立了新的标杆,甚至仅凭8B-MoT的较小规格,就能达到甚至超越部分大型商业闭源模型,展现出全维度多领域的统治力。

(SenseNova U1 Lite的商业级复杂信息图生能力)
商汤表示,正在沿着当前的技术路径继续Scale,计划在未来推出体量更大的模型,“我们相信,基于高效的原生架构,可以以低得多的计算成本达到国际顶尖模型的水平。”
因此同时,凭借NEO-Unify架构的优势,SenseNova U1亦在业内首次实现连续性的图文创作输出,且只需单次单模型调用,就能输出更高质量的作品,较传统范式实现了效率的大幅提升。
SenseNova U1 所具备的原生图文理解生成能力,能天然将图像和文本底层融合信号完整的保留上下文中,区别于过去只能利用多模型串联勉强实现,它的图像间风格具备明显的高一致性,能在统一表征空间进行高效连贯思考。
例如,绘制一个钢铁侠图案时,它可以从扫描草稿出发,逐步进行连续创作,最终做出一个完成度很高的图像。每一步创作的过程对于前一步的结构和细节都做了精准的保持,一个统一表征的共享上下文在其中发挥了关键作用。
据悉,该模型即将上线办公小浣熊。未来,该模型还能为机器人提供具身大脑,实现在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行的全过程,为推动技术与产业发展提供重要基础与关键引擎。
“我们相信,原生统一的多模态智能是通往 AGI 的必经之路”。商汤表示,未来还将持续推动开源生态建设,并发布更大参数规模的 U1 系列模型,与广大用户和开发者共同定义智能交互的未来。
更新时间:2026-04-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号