5分钟真人视频素材生成数字人?商汤发布“日日新”大模型体系

“ChatGPT之后,感觉中国的科技公司‘卷’起来了。”发布几个月后,ChatGPT带来的余波犹在,全球巨头和创业圈正在前赴后继投入大模型领域。

在近日举行的商汤技术交流日活动上,商汤科技正式发布了“日日新”大模型体系,并向外界分享了以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局。

开发人工智能大模型对大算力的需求非常旺盛。商汤历时5年建设了AI大装置SenseCore,装置上共有27000块GPU芯片卡,每秒能完成百亿亿次浮点运算,是亚洲最大的智能计算平台之一。基于大装置的能力,商汤推出了“日日新”大模型体系。

根据介绍,“日日新”大模型体系包含自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。在某种意义上说,该体系提供了一个大模型的“超市”,不仅提供语言大模型“商量”,还有“如影”数字人视频生成平台、“秒画”文生图创作平台以及“琼宇”和“格物”3D内容生成平台。

商汤展示的数字人分身和3D内容

在商汤科技提供的资料中,语言大模型“商量”是一个千亿级参数的自然语言处理模型,经过大量数据训练,并充分考虑了中文语境,能更好地理解和处理中文文本。数字人视频生成平台仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。3D内容生成平台可以高效、低成本地生成大规模三维场景和精细化物件,为元宇宙、虚实融合应用打开新的想象空间。

据悉,这个大模型体系已为商汤自身的业务带来了诸多突破。如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,并构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。

目前,“日日新”面向B端,为政企客户提供多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注等服务。

来源:上海徐汇

展开阅读全文

页面更新:2024-02-09

标签:商汤   模型   体系   数字   自然语言   人工智能   真人   素材   装置   能力   内容   平台   视频

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top