不好好喂养豆包、即梦、可灵,可能也会让你不能如愿

如今是智能AI创新时代,智能AI,用途越来越广,各行各业几乎离不开AI,特别是在制图上,更是离不开它。

这段时间,我一直使用AI制作图片,生成视频,都取得了非常满意的效果。但今天却让我大失所望,它们给我上演了这么一出。

下面是我给豆包、即梦和可灵发出的生图指令:

橙猫戴着棕色宽边帽,身穿灰色上衣和棕色背带裤,脚蹬棕色靴子,驾驶着由雄狮拉着的棕色拖车。拖车上坐着一只穿着蓝色外套的白猫,怀里抱着一只橙白相间的小猫。背景是山间河流,两岸绿树成荫,路边开满五彩野花,远处山峦起伏,写实风格,全景。高清4K,电影画质。图片风格为写真,比例 9:16。

下面是豆包生成的4张图片:





上面4张图片,看上去只有第4张符合指令要求。但也有一点瑕疵,就是橙猫的左爪拖在地上,不像骑行的样子。

我们再来看看用同样指令,让即梦AI生成的4张图片如何:





这4张即梦按指令生成的图片,只有第2张符合指令要求。其余3张,完全跑偏了,跟指令大相径庭。

接着,我又用指令让可灵生成4张图片,结果如下:





这可灵生成的图片更是离奇,除了山水景色相符,其它简直像没经过大脑思考一样,离题万千。

我始终不甘心,我又让deepseek来帮忙,让它根据我的指令,重新生成提示词,再将提示词交给三款软件去生成图片。

deepseek生成的指令,是英文格式。我随即将这英文指令,交给“豆包”“即梦”“可灵”三种AI软件去帮我生成的图片。

你们来看一看,下面的哪个软件生成的图片最符合指令词要求:

"Hyper-detailed illustration of anthropomorphic ginger . cat, <服装细节>, driving vintage wooden wagon pulled by majestic lion through mountain river valley, <环境元素>, morning golden hour lighting, photorealistic textures with whimsical charm, ultra-wide cinematic composition --ar 9:16 --v 6.0"。

豆包AI生成的四幅图如下:




即梦Al生成的四幅图如下:





可灵AI生成的四幅图如下:




生成后,真的让我大跌眼镜,哭笑不得。十二张图片,一张也不符合要求。看样子,这三款软件不听老外指令。

我是不到黄河心不甘,我又给他来个中西结合的指令,看效果如何。下面是我给豆包的指令,也是deepseek生成的。

橙猫戴着棕色宽边帽,身穿灰色上衣和棕色背带裤,脚蹬棕色靴子,驾驶着由雄狮拉着的棕色拖车。拖车上坐着一只穿着蓝色外套的白猫,怀里抱着一只橙白相间的小猫。背景是山间河流,两岸绿树成荫,路边开满五彩野花,远处山峦起伏,写实风格,全景。高清4K,电影画质。图片风格为写真,比例 9:16。"Hyper-detailed illustration of anthropomorphic ginger tabby cat, <服装细节>, driving vintage wooden wagon pulled by majestic lion through mountain river valley, <环境元素>, morning golden hour lighting, photorealistic textures with whimsical charm, ultra-wide cinematic composition --ar 9:16 --v 6.0"。




看到这结果,我真的做不下去了,也不想折腾即梦和可灵了。

我不知问题出在哪里,以往从未遇到这种情况。我估摸着是我没有用精准的提示词喂养它们而造成的。但我又疑惑了,为什么这三款制图软件,制作人物风景图画没话说。唯独让它们制作人、物、景混合的画面就出问题了呢?

看来设计精准的生图提示词,显得尤为重要。要想驯服AI,能得心应手,如愿以偿的驾驭她们,学习永远在路上。

展开阅读全文

更新时间:2025-05-12

标签:科技   豆包   指令   棕色   图片   拖车   全景   风格   提示   软件   小猫

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top