Google AI公司发布了一篇关于名为Muse的新技术的研究论文。Muse是一种文本到图像生成技术,能够快速生成与竞争对手相媲美的高质量照片。
Muse被训练成使用已经训练过的大型语言模型的文本嵌入来预测随机蒙版图像令牌。
Muse使用了一个9亿参数的模型,称为蒙版生成变换器来创建视觉效果。
Google声称,使用TPUv4芯片,可以在0.5秒内创建256x256的图像,而使用Imagen的扩散模型需要9.1秒,他们称这种模型提供了“照片级真实度的前所未有程度”和“深度语言理解”。
页面更新:2024-03-07
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号