“商汤日日新”大模型体系全面升级,为《三体》打造沉浸式科幻空间

昨天举行的2023世界人工智能大会“大爱无疆·日日新”人工智能论坛上,记者获悉,“商汤日日新SenseNova”大模型体系已完成多方位升级,正在金融、医疗、汽车等行业落地应用。商汤科技董事长兼CEO徐立表示:公司希望通过“大模型+大装置”持续推动AI基础设施能力的提升,构建更懂行业、更具专长的专业大模型,让大模型的产业价值在千行百业中绽放。

在“大模型+大装置”的AGI(通用人工智能)战略布局下,商汤大模型体系正在高速迭代。作为千亿级参数的自然语言处理模型,“商量SenseChat”2.0版突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求。今年4月首次发布以来,生成式大模型“秒画SenseMirage”3.0版的模型参数已从10亿提升至70亿量级,能完成专业摄影级的图片细节刻画。

“如影SenseAvatar”2.0版数字人生成平台与1.0版相比,数字人的语音和口型流畅度提升30%以上,实现了4K高清视频效果,并增加了生成形象及数字人歌唱功能。“琼宇SenseSpace”2.0版的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成。“格物SenseThings”2.0版对小物体的纹理及材质还原达到毫米级精细度,并突破了对高反光和镜面物体的采集难题。

徐立介绍,依托大模型体系在底层技术上的快速迭代,商汤正在利用大模型的多模态能力赋能多个产业领域。

在金融领域,商汤与银行、保险、券商等客户合作,利用数字人开展智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效。挂载金融知识库后,数字人还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。

在医疗场景,商汤基于海量医学知识和临床数据,打造了中文医疗语言大模型“大医”。它在导诊、问诊、健康咨询、辅助决策等场景中具备多轮会话能力,即将有能力支持医学图像、文本、结构化数据等多模态综合分析,并不断提升医疗语言理解和推理能力。

结合“商量”2.0版和“秒画”3.0版的综合能力,公司还为移动终端客户带来多种智能交互解决方案。在以刘慈欣小说《三体》为故事蓝本打造的《三体·引力之外》沉浸式科幻体验空间,商汤利用大模型的能力突破想象力边界,创作出极具未来感的科幻航程。

在智能汽车领域,商汤“绝影”智能座舱、智能驾驶、车路协同等行业应用也在大模型的加持下,突破创新边界。在智能座舱里,通过视觉、听觉等多模态融合,全方位感知用户需求,并通过标签化数据记录用户习惯和偏好,提供专属个性服务。

在车舱外,依托“大模型+大装置”,“绝影”部署端云协同,统一流量入口,支持私有化部署及千万量级的应用需求。在近日举行的2023年CVPR(国际计算机视觉与模式识别会议)上,商汤与合作单位提出了感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,相关论文摘得CVPR最佳论文奖,为自动驾驶技术与产业发展提出了新的方向。

基于此,公司正在打造车路云协同的交通体系,借助多模态、多任务通用大模型开发路侧视觉感知大模型,并结合“琼宇”2.0版和“格物”2.0版,构建智能交通孪生与仿真,推动车路云共同向大模型的对话式交互模式演进。

栏目主编:黄海华

来源:作者:俞陶然

展开阅读全文

页面更新:2024-03-19

标签:商汤   模型   体系   座舱   人工智能   科幻   能力   语言   医疗   数字   智能   空间

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top