阿里通义首个音频生成模型ThinkSound正式开源

新榜讯 7月5日讯,阿里“通义大模型”公众号发布消息,通义实验室首个音频生成模型ThinkSound正式开源,此举将突破“静音画面”所带来的想象力限制。ThinkSound开创性地将CoT应用于音频生成领域,促使AI能够逐步明晰画面事件与声音之间的关联,进而达成高保真、强同步的空间音频生成效果。这并非简单的“看图配音”,而是真正意义上的“听懂画面”。

展开阅读全文

更新时间:2025-07-08

标签:科技   阿里   模型   音频   正式   画面   开创性   明晰   静音   此举   想象力   高保真

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top