如今是智能AI创新时代,智能AI,用途越来越广,各行各业几乎离不开AI,特别是在制图上,更是离不开它。
这段时间,我一直使用AI制作图片,生成视频,都取得了非常满意的效果。但今天却让我大失所望,它们给我上演了这么一出。
下面是我给豆包、即梦和可灵发出的生图指令:
橙猫戴着棕色宽边帽,身穿灰色上衣和棕色背带裤,脚蹬棕色靴子,驾驶着由雄狮拉着的棕色拖车。拖车上坐着一只穿着蓝色外套的白猫,怀里抱着一只橙白相间的小猫。背景是山间河流,两岸绿树成荫,路边开满五彩野花,远处山峦起伏,写实风格,全景。高清4K,电影画质。图片风格为写真,比例 9:16。
下面是豆包生成的4张图片:
上面4张图片,看上去只有第4张符合指令要求。但也有一点瑕疵,就是橙猫的左爪拖在地上,不像骑行的样子。
我们再来看看用同样指令,让即梦AI生成的4张图片如何:
这4张即梦按指令生成的图片,只有第2张符合指令要求。其余3张,完全跑偏了,跟指令大相径庭。
接着,我又用指令让可灵生成4张图片,结果如下:
这可灵生成的图片更是离奇,除了山水景色相符,其它简直像没经过大脑思考一样,离题万千。
我始终不甘心,我又让deepseek来帮忙,让它根据我的指令,重新生成提示词,再将提示词交给三款软件去生成图片。
deepseek生成的指令,是英文格式。我随即将这英文指令,交给“豆包”“即梦”“可灵”三种AI软件去帮我生成的图片。
你们来看一看,下面的哪个软件生成的图片最符合指令词要求:
"Hyper-detailed illustration of anthropomorphic ginger . cat, <服装细节>, driving vintage wooden wagon pulled by majestic lion through mountain river valley, <环境元素>, morning golden hour lighting, photorealistic textures with whimsical charm, ultra-wide cinematic composition --ar 9:16 --v 6.0"。
豆包AI生成的四幅图如下:
即梦Al生成的四幅图如下:
可灵AI生成的四幅图如下:
生成后,真的让我大跌眼镜,哭笑不得。十二张图片,一张也不符合要求。看样子,这三款软件不听老外指令。
我是不到黄河心不甘,我又给他来个中西结合的指令,看效果如何。下面是我给豆包的指令,也是deepseek生成的。
橙猫戴着棕色宽边帽,身穿灰色上衣和棕色背带裤,脚蹬棕色靴子,驾驶着由雄狮拉着的棕色拖车。拖车上坐着一只穿着蓝色外套的白猫,怀里抱着一只橙白相间的小猫。背景是山间河流,两岸绿树成荫,路边开满五彩野花,远处山峦起伏,写实风格,全景。高清4K,电影画质。图片风格为写真,比例 9:16。"Hyper-detailed illustration of anthropomorphic ginger tabby cat, <服装细节>, driving vintage wooden wagon pulled by majestic lion through mountain river valley, <环境元素>, morning golden hour lighting, photorealistic textures with whimsical charm, ultra-wide cinematic composition --ar 9:16 --v 6.0"。
看到这结果,我真的做不下去了,也不想折腾即梦和可灵了。
我不知问题出在哪里,以往从未遇到这种情况。我估摸着是我没有用精准的提示词喂养它们而造成的。但我又疑惑了,为什么这三款制图软件,制作人物风景图画没话说。唯独让它们制作人、物、景混合的画面就出问题了呢?
看来设计精准的生图提示词,显得尤为重要。要想驯服AI,能得心应手,如愿以偿的驾驭她们,学习永远在路上。
更新时间:2025-05-12
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号