老板AI应用课:哪里不对改哪里,AI让改图像打字一样简单

太卷了,阿里千问团队最近发布了很多新模型,昨晚凌晨又开源推出了 Qwen-Image-Edit版本。

这个版本是之前Qwen-Image的图像编辑版本,说白了就是改图的。

之前文章中已经介绍过类似的SeedEdit 3.0视觉模型,好像现在豆包已经上线了。

豆包的改图功能长期使用下来主要是听话能力(指令遵循)不是很强,用是可以用的。

那么今天我们就来看看Qwen-Image-Edit到底表现如何吧。

据官方介绍,Qwen-Image-Edit主要特性包括原创IP编辑、视角转换、风格迁移、新增/消除/重绘、人物背景调整及服装修改、以及精准的文字编辑。

其中文字编辑还能编辑中英文,链式、逐步编辑的方式可以定点修改文字错误。

目前Qwen-Image-Edit已经是开放可以免费使用的,当然也是开源的,有条件的可以自行部署。

开源地址:

https://github.com/QwenLM/Qwen-Image

体验使用的话,就在电脑浏览器打开以下网址:

https://chat.qwen.ai/

打开后,建议登录一下,然后在对话框下面就能看到图像编辑的按钮,点击即可,如图:

那下面老马就用官方测试过的案例,一起来演示一下Qwen-Image-Edit的改图效果。

1、人物IP编辑

老马先是设计了一个卡通人物IP,然后通过这个IP去延伸一下,用Qwen-Image-Edit设计一系列的表情包,原IP图如下:

老马输入的提示词如下:

根据这个卡通人物IP形象,生成一系列的表情包,不要脱离人物自行创造,表情包内容包括:愤怒、高兴、大笑、流汗、无语、大骂,总共6个

经过两到三轮的抽卡,Qwen-Image-Edit总算是生成了一个相对过关的图片,并且直接给出了拼图,而不是一张张图输出,如图:

从这里老马就发现,Qwen-Image-Edit的指令遵循能力还不是很强,勉勉强强能用。


2、视角转换


视角转换就是让一个人或者物体90度转一下,180度转一下的意思。


如果是人物的话,只需要一张正面图,就很容易做成不同角度的三视图。


同样老马也是准备了一个人物图片,让其转换视角看看,原图如下:

输入的提示词分别是转换两个视角,如下:

让人物朝向左侧,让人物背向

为什么不是写让人物朝向后侧呢,哈哈,测试后发现背是转过去了,回了个头,所以提示词还是得多调调,最终生成效果如下:

瞧,头还没完全转过去,还在回头看老马,估计得加多一句提示词:“头转过去”。


3、风格迁移


风格迁移这个是最简单的,就比如把真实的照片换成卡通风格,老马准备的是下面这张图,如图:

然后提示词就写让Qwen-Image-Edit改成卡通风格吧,其它风格都一个道理的,就不多演示了,提示词如下:

将图片改成卡通风格

很明显,这个任务对Qwen-Image-Edit没啥难度,效果如图:

4、新增/消除/重绘

这三种经常性的改图操作,要求模型对细节的把控要到位,还是拿隆江猪脚饭举例吧,上老图:

提示词的话老马就写在一起了,分别对应新增、删除、重绘三个操作,如下:

把图片上的白色外卖盒盖子去掉、把图片上的白色外卖盒盖子去掉,其它保持不变、把黑色的外卖盒改成绿色的,其它保持不变

怎么说呢,以上三个操作Qwen-Image-Edit都会重绘原图,导致效果跟原图就有点出入,加深了AI的塑料感,遗失了真实感,如图:

5、人物背景调整及服装修改

人物的背景调整和服装修改,这个在电商场景用得比较多,比如做一些商品图啥的。


老马就以一个服装的电商模特为例,准备了一张原图,如图:

提示词就写换个宫殿的背景,以及换一身汉服吧,两个操作的提示词照例写在一起,如下:

把背景换成皇宫宫殿,写实风格、把人物的服装换成汉服,其它不变

难受,老马提示词没限制它不要改脸,结果出来的效果就是美女的脸变了,如图:

还是老毛病,Qwen-Image-Edit会在重绘之后,把不该改的小细节也改了。


6、精准文字编辑


精准文字编辑考验模型对图片上的文字进行修改的能力,尤其是有背景的图片,既要正确改掉文字,也不能改动背景,老马就准备了一张古诗词的图,如图:

然后在图片中用红色框框选了“昏昏”两字,让它修改成“你好”,提示词如下:

将红色方框内的中文字修改成“你好”,红色方框外的保持不变

鼓掌,这回Qwen-Image-Edit表现优秀,效果如图:

改是改成功了,只是这红框没有帮我去掉是咋回事,另外这字体也不是太统一,难道还是因为老马的提示词没加够。


到这里,官方做过的,老马都给大家测试演示过一遍了。


有一说一,Qwen-Image-Edit目前的状态是能用,但要达到好用的级别,还不够。


首先是对提示词的遵循不是很好,不大听话,其次是重绘后的图片,AI味加重了,最后是对细节把控不是很好,容易丢失和瞎改。


跟FLUX Kontext比,还是存在一定差距的,甚至于豆包的SeedEdit 3.0,暂时都还比不上。


如果你是要求不是太高的话,日常改图是够用了,希望后期Qwen-Image-Edit能进一步优化,给我们带来更多的惊喜。

展开阅读全文

更新时间:2025-08-20

标签:科技   图像   老板   简单   提示   人物   风格   编辑   文字   背景   图片   原图   视角   效果

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top