【来源:劳动观察】
4月10日,商汤科技在徐汇西岸大剧院举办的技术交流日上正式发布全新一代“日日新 SenseNova V6”多模态融合大模型,聚焦“强推理、强交互、长记忆”三大核心突破。
“日日新V6”系列包含四大模型版本,其中SenseNova V6 Pro为原生多模态通用大模型,采用6200亿参数混合专家架构,实现文本、图像、视频的原生融合;SenseNova V6 Omni则是轻量级全模态交互模型,支持语音、视频实时交互。
在现场,商汤工作人员向记者展示了SenseNova V6的多模态在购物比价场景中的能力。用户只需上传商品页面图片,模型即可同步分析价格标签、商品参数,并快速计算出结果,并通过语音交互推荐最优购买方案。比如不同电商平台上,同一个品牌的不同优惠价格、不同抽数及包数的商品价格比较,模型能够精确计算出最终每张抽纸的实际购买价格,最终得出最优惠结果。
智能剪辑功能则依托SenseNova V6 Video的长视频理解能力,用户导入原始素材后,模型可自动识别场景切换、人物动作等关键信息,生成结构化剪辑方案。比如工作人员现场演示导入了一段篮球比赛视频,要求“将进球画面剪成一个视频”,模型也能准确识别最终呈现出一个只有进球片段的视频。
在教育领域,模型可实时解读绘本内容,根据儿童的提问动态调整故事讲述风格;企业服务中,财务审核、商铺运营等场景的人工流程可被替代,例如通过分析货架图片与销售数据,模型能自动生成补货建议。
此外,在技术交流日上,商汤还展示了和具身智能企业傅利叶的合作。基于SenseNova V6 Omni,傅利叶的机器人可以通过融合图像、视频、语音和文本信息理解环境,进行思考与表达,洞察用户的需求与情绪,与人类进行交互。机器人在输出语音的同时,还能同步生成与语义相匹配的动作,实现语言与行为的统一。
“靠单纯的技术很难形成长久的壁垒,现在一个新的模型发布后很快就会有一系列模型追赶上来,开源也会进一步缩小大家在技术上的差距。技术和行业的深度结合才能形成持久壁垒。”商汤方面表示,希望能够把模型嵌入到真实的业务场景中,真正替代掉业务链条中的某些环节。
头图为工作人员正在展示大模型“购物比价”能力,劳动报记者陈宁摄
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com
更新时间:2025-04-16
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号