Stable Diffusion vs Midjourney vs DALL.E2横向对比分析

参考自https://analyticsindiamag.com/stable-diffusion-vs-midjourney-vs-dall-e2/

自今年以来,文生图的AI绘图软件越来越流行。从一开始的DALL.E 2,到现在的midjourney和stable diffusion,甚至后续出现了更多类似的软件。那么现在主流的三款程序里,他们的区别究竟是什么?Midjourney, DALL.E-2 或 Stable Diffusion, 谁是最好的文生图软件呢?


DALL.E 2是DALL.E的第二代模型,是由openAI开发创作的。尽管它比第一代模型更小,但它的生成表现却更好。DALL.E 2可以创建几乎任何东西,它使用一种称为unCLIP的方法,是一种足够精密复杂算法,它甚至可以创建我们人类难以表达的图像。虽然它有很多优点,但它仍然有其局限性。

(credit: AI Network)

因为该模型并不向公众开放。尽管OpenAI可能有其自己的原因,但市场现在已经看到了文-图像生成器开源模型的崛起(例如Stable Diffusion)。就像当初在GPT-3的情况下,开源支持者推出GPT-Neo时一样。然而,目前AI绘图程序火爆的背后也是由于OpenAI开源了CLIP算法,CLIP是DALL.E 2的基础之一,这也是Midjourney和Stable Diffusion等平台今天存在的根本原因之一。

由于DALL.E 2是训练是基于数百万张库存图像上的,所以它所创造的输出更加复杂,最适合企业使用。根据Stable Diffusion的创始人Emad Mostaque的说法,DALL.E 2的修复功能是其最佳特性,使其与其他图像生成器区分开来。此外,与Midjourney或Stable Diffusion相比,DALL.E 2在有超过2个角色的情况下生成的图像要好得多。

(credit: Fabians)

另一方面,Midjourney 是一种以其艺术风格而闻名的工具。它生成的图像几乎从不像照片,而是更是像画作。一些艺术家认为它是一名艺术学生。“我觉得 Midjourney 是一位有自己风格的艺术学生。当你用我的名字来创造一张图片时,就像是请一位艺术学生来创作受到我的艺术风格而启发的作品,”一位艺术家说道。当然,现在的Midjourney已经可以完美的生成照片一样的图片了。

Midjourney使用一个Discord机器人来发送和接收对AI服务器的远程呼叫,几乎所有的事情都可以在Discord上进行。Midjourney还拥有约100万活跃社区,您可以在其中看到每个人都创造出神奇的艺术作品。

Midjourney的创始人David Holz表示,他不希望这些图像看起来像照片。他认为他可能会在某个时候制作逼真的版本,但公司不希望这成为默认设置。“完美的照片现在让我有点不舒服,尽管我确实看到了你想要更真实的东西的合理理由。”

(credit: Fabians)

虽然DALL.E 2和Midjourney都不愿意完全开源,但Stable Diffusion声称自己是一个开源模型,每个人都可以使用。这也是stable diffusion目前最为火爆的原因,webUI的出现,似使得每一个人都可以快速、方便、免费的使用AI绘图工具。

Stable Diffusion同样对现代艺术插图有相当好的理解,并可以制作非常详细的艺术作品。然而,它缺乏对复杂的prompt的理解,也就是说复杂繁复的tag可能使Stable Diffusion迷惑,并且无法了解到每个tag对于程序的影响。另外,stable diffusion在复杂的艺术插图方面表现出色,但在生成标志或者文字等一般图像方面则表现较差。

(credit: Fabians)

当然,还有一些人指出,Stable Diffusion本身是不受限制的,因此,它会生成一些裸露、血腥暴力的图片,甚至还会生成在不恰当场景下的政治和宗教人物。


(image of Barack Obama created by Stable Diffusion, credit: stability)

(Boris Johnson wielding various weapons, generated by Stable Diffusion. Image Credits: Stability AI)

然而,即便是这样,Stable Diffusion也将成为文本到图像生成市场的里程碑。由于它是开源的,越来越多的开发人员可以基于源代码而创建更多、更复杂的工具或者插件。至于哪个是最好的,Midjourney的艺术能力,DALL E2的逼真图像和Stable Diffusion的不受限制的使用使得所有AI模型在某种程度上都更好。最终,这取决于用户的要求。

展开阅读全文

页面更新:2024-04-29

标签:生成器   插图   横向   逼真   创始人   算法   模型   图像   照片   程序   艺术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top