腾讯:数智人使用成本将降至千元级别

中国青年报客户端讯(中青报·中青网记者王林)4月25日,腾讯云发布智能小样本数智人生产平台。腾讯方面称,该平台可实现“自助式”数智人生产制作,只需经过3分钟真人口播视频、100句语音素材的训练,便可在输入音频、文本等多模态数据后,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”,其使用成本也将被降至千元级别,使用门槛大幅降低。

当前,越来越多的数智人被投入实际应用,但高昂的制作和运营成本让企业望而却步。过往复杂的训练样本数据采集,导致数智人定制过程长、成本高,一定程度上限制了数字人应用的快速落地。

在腾讯云智能“数智人媒体沟通会”上,腾讯云智能数智人产品总经理陈磊介绍,腾讯云智能致力于打造自动化的“AI+数智人工厂”,提供“自助式”生成数智人的服务;并且将广泛开展生态集成合作,携手合作伙伴将更逼真、更智慧、更高效的数智人应用落地到千行百业。

陈磊表示,此次发布的小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等商用场景。此外,小样本数智人无需专业影棚录制素材,成本更低;还可根据文本设计手势,唇动、口型、表情复现真人风格。

“时间成本、金钱成本、稳定性,(如果)这三个如果都解决了,做每个人自己的‘数智分身’都是触手可及的,用户可以独立生成自己的数字人。”陈磊认为,随着相应技术的发展,数智人的使用门槛还将进一步降低。

腾讯优图实验室研究总监汪铖杰表示,小样本数智人从直观上感受是2D视频,但背后其实是3D人像技术在支撑。“通过3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。”此外,基于自监督机制的通用多模态模型,经过大规模数据训练,可以将语音、文本与人像的表情、口型关联。

目前,腾讯云智能数智人已经覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种形象风格,未来或将实现用户只录制普通话即可合成英文及方言语音。

责任编辑:宁迪

来源:中国青年报客户端

展开阅读全文

页面更新:2024-02-21

标签:智人   腾讯   中国青年报   成本   口型   样本   人像   真人   语音   级别   智能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top