我如何训练ChatGPT 撰写Midjourney 提示语?AI 绘图四个阶段

最近我开始尝试让Midjourney 设计部落格文章的主图,制作课程简报当中的某些情境图、封面图,熟练操作与提示语之后,比找图库更节省时间,而且也更能直接产生相对适合自己需要的特殊图片。
也在这样的使用过程中,虽然一开始没有想要认真研究Midjourney 的提示语,但也不知不觉累积了一份属于我自己惯用的AI 绘图工具咒语笔记,包含可以下什么样的参数、用什么样的关键字结构,以获得更符合自己需要的结果。
不过当每一天都会用到Midjourney 生成图片的时候(文章图、简报图),我就希望「设计提示语」的流程可以更快一点,也就想到透过ChatGPT来快速生成。
尝试了一段时间,发现真的可以训练ChatGPT 来自动撰写我需要的Midjourney 提示语,而且:
很多时候训练好的ChatGPT 比我更会描述图片场景、艺术风格。
训练好的ChatGPT 也比我更会使用专业摄影、3D 技术的参数。
训练好的ChatGPT 也会自己下好Midjourney 可能需要的参数。
训练好的ChatGPT 可以让我有时候只要发想一个「概念」,就能生成上述图片主题、场景,自动选择适合的艺术风格,自动下好需要的技术参数或Midjourney 参数。
今天这篇文章,就来跟大家分享我自己搭配ChatGPT 辅助,加速学习与应用Midjourney 提示语的流程。
阶段一:让ChatGPT 翻译Midjourney 提示语:从简单开始就好
首先,我的大前提是:
如果可以简单解决,就尽量不要把事情复杂化。
在这里的意思是, Midjourney 虽然有些很厉害的图片是利用很厉害的提示语来完成(看起来复杂,有各种关键字,有各种技术参数)。不过,也有不少时候,简单的提示语就能产生不错的效果。
例如我单纯下这样的指令:「Sunrise at Alishan, Taiwan. --ar 16:9 --v 5」,即使我没有使用任何的摄影专业术语,其实也能产生可用的(阿里山)日出照片。
所以,第一阶段,我们可以先不用想得太复杂,就用ChatGPT 来「翻译」我们的提示语构想即可。
我会先建立一个专门的ChatGPT 对话频道,之后所有跟Midjourney 提示语有关的问题都在这个频道询问,慢慢建立起我需要的ChatGPT 绘图提示语助理。
这里的「翻译」,就是把我们中文的概念构想,翻译成英文的绘图提示语。
如果这样就能产生自己满意、需要的照片,那么其实不需要把Midjourney 的提示语写得太复杂。
阶段二:让ChatGPT 改写Midjourney 提示语:从概念想法,转译成图片语言
但是有些时候,更专业的提示语确实更能产生自己需要的特殊图片,或是让图片的效果更好。例如我提供这样的提示语:「Sunrise at Alishan, Taiwan, captured in a stunning photograph, featuring majestic mountains and lush forests, birds-eye view perspective, inspired by professional travel photography, breathtaking beauty, vivid colors of morning sky, peaceful atmosphere, realistic style, high dynamic range (HDR), long exposure, optimal camera settings for perfect sunrise capture, golden hour lighting, --ar 16:9 --v 5」
在这样的Midjourney 提示语中,除了台湾阿里山日出外,我还强调了照片的风格(专业旅行摄影、让人屏息的美景)、拍摄的角度(鸟瞰、远景)、想要的颜色、摄影照片术语(HDR效果)等等。这时候产出的照片效果,确实又提升了一个层级。
但是问题来了,如果我不是专业摄影师、不是专业绘图者,我怎么知道如何有效地描述一张图片的各种场景、细节、技术呢?这时候,可以利用ChatGPT 来「转译」。
请ChatGPT 把我的想法「转译」成更好的AI 绘图提示语。
例如我会这样问:「我要用AI 绘图工具制造一张个人照片的宫崎骏卡通风格版本,请建议我可以在提示语上加上哪些英文关键字?」
这样一来,我可以获得许多原本想不到、不知道的专业术语,都可以用在Midjourney 提示语中。
或者另外一种「转译」,是帮我把单纯的概念,转换成一张图片需要的场景、构图、细节,我可以这样问:
「请根据所有你知道的AI 绘图提示语结构与逻辑,设计一张「现代港口,真实摄影照片」的英文提示语,要设定适合的摄影技术参数。」
「请根据所有你知道的AI 绘图提示语结构与逻辑,设计一张「安静」的英文提示语。」
很多时候,我其实是卡在没有什么绘制图片的构想,只有一个想要的主题(例如:现代港口、真实摄影照片),或者想要的概念(例如:安静),这时候,可以利用ChatGPT 帮我转译成一个完整的绘图提示语。
虽然ChatGPT 在其2021 年前的资料库中其实并不认识Midjourney,但是只要我问他「请根据所有你知道的AI 绘图提示语结构与逻辑」,那么他就真的会认真地用各种角度描绘一张图片的元素,例如下面的港口照片中, ChatGPT 转译了:
港口的景观细节。
拍摄真实照片的关键(例如during golden hour)。
也帮我提供了摄影需要的光圈、 ISO 等细节。
我只是说了「现代港口,真实摄影照片,摄影技术参数」,而ChatGPT 透过转译,提供给我Midjourney 需要的更完整细节描述。
阶段三:让ChatGPT 模仿Midjourney 提示语:把专家语法换上我的需求
前面的「转译」,比较像是ChatGPT 自己天马行空的想像,他可以把我们的概念描述成图片语言,但是到底适不适合Midjourney 呢?其实ChatGPT 并不知道,所以有时候阶段二产出的提示语,用在Midjourney 上会产不出好结果。
在Midjourney 中确实有些语法、结构、逻辑更能产出有效的图片,如果要让不认识Midjourney 的ChatGPT 学习,最好的方式就是让他「模仿」。
例如有一次,我在Midjourney 的探索图库中看到一张很棒的奇幻风格图片,于是我先把该张图片的提示语复制下来。(我建议可以常常到Midjourney 的探索图库中去找自己需要的优质图片并收集其提示语来用)
接着,我就请ChatGPT 「模仿」该张图片的提示语,设计一个我自己想要主题的Midjourney 指令,我是这样下指令的:「请帮我根据下面的AI 绘图提示语逻辑,撰写一份关于XXXXX 的AI 绘图工具英文提示语:」
这里关键之处在于要提示ChatGPT 「根据范例的逻辑来思考」:
「根据范例的逻辑来思考」、「根据范例的逻辑来思考」、「根据范例的逻辑来思考」!很重要,所以说三次,如果是其他提示语,可能会变成只是在替换关键字而已。
这样ChatGPT 就会开始去理解范例背后的设计流程,并用同样流程设计不同内容。(类似我在这篇教学:「ChatGPT 提示语说明书:通用三层结构与9 个技巧提高AI 生产力」提到的思维链提示法)
可以看到ChatGPT 确实会根据范例提示语的「逻辑」,重新修正成我需要的内容,而且「不只是替换关键字而已」,像是原本的范例场景是海洋, ChatGPT 根据我的主题自动把场景换成城市与天空(我并没有下这样的指令),并重新设计了整个描述。
于是就产出下面这张图。
我们可以收集很多自己需要的类型提示语的「目前最佳范例」,例如我收集了海报用的、照片用的、抽象概念用的、人物用的、食物用的等等提示语。需要哪一种类型,就请ChatGPT 根据最佳范例模仿,然后生成出我需要的新主题的提示。
阶段四:让ChatGPT 理解后创作Midjourney 提示语:拆解指令逻辑
前面第三阶段,其实对于一开始不太会设计Midjourney 提示语的我来说,或是对没有艺术、绘图、摄影专业的我来说,已经可以有模有样的请ChatGPT 设计出专业的Midjourney 提示语,并且产出我需要的图片效果。
不过我还想要更节省时间,也想更有效学习Midjourney 提示语,所以我进一步这样做:
我开始「喂给」 ChatGPT 一些自己很喜欢的Midjourney 照片的提示语,但是这次请他「拆解出里面的结构与逻辑」。
我会这样问:「请帮我分析下面这段AI 绘图提示语有哪些结构,用表格呈现: 贴上Midjourney 提示语范例」
这样做可以带来两大好处:
对我自己来说,我开始看懂原来Midjourney 的高手是用这样的结构、逻辑来设计提示语啊!我也开始更懂提示语的一些关键技巧、重要参数了。
对ChatGPT 来说,这个AI 绘图专用频道里的ChatGPT ,开始懂得用这些结构与逻辑来设计Midjourney 提示语了!
不一定要一次性喂给ChatGPT 很多提示语范例,我都是偶尔看到很棒的Midjourney 图片与提示语时,就把他喂给ChatGPT ,让他产生一些片段的学习。
更重要的反而是:偶尔就更新一下最近觉得不错的提示语,毕竟ChatGPT 的记忆不是永久。只要持续更新,就能让自己下次使用的时候有更好的设计逻辑。
接着,当我要生出一张图片的Midjourney 提示语时,我会这样请ChatGPT 帮忙:
请根据前面所有你记得的提示语结构逻辑,设计一张「XXXXX」的AI 绘图工具提示语。
这时候,我不用说太多,甚至都不用说要使用英文, ChatGPT 根据前面片段记住的各种提示语结构、逻辑,就会自动产出有用的Midjourney 提示语。我们可以看到:
我只给出「安静」两个字,但是ChatGPT 自动描绘出了一个安静的场景细节。
不过,这是前面所说的「阶段二」就有机会做到的!但下面就是经过阶段三、四学习,才能做到的提示。
而且ChatGPT 会主动加上图片艺术风格、技术技巧的描述(这些对Midjourney 来说很重要),例如这张图给的是插画风格。
并且ChatGPT 对图片的描述会有更多细节,例如更会加上镜头焦点、颜色描述等等细节。
甚至,还会加上Midjourney 专属的参数,例如要用v5 引擎、图片比例、品质强化、风格强化等等。
如果在这样学习后,再请ChatGPT 设计一张「现代港口,真实摄影照片」的Midjourney 提示语呢?
这时候,整个提示会变得更专业,有更多、更正确描述的摄影技术语言,也有更多光影的专业描述,当然也有加上Midjourney 的特殊参数,最后就产生了一张我更满意的港口照片图。
如果跟前面阶段二生成的图片做比较,其实阶段二生成的港口图也不错,但重点在于,阶段四产出的照片更像是我想要的「真实摄影照片」,这是ChatGPT 学习后的结果。
最后,再提供几个阶段四的应用案例给大家参考,这时候我可以更直接给一些抽象概念,让ChatGPT 帮我设计有用的Midjourney 提示语。
例如我说我要简报封面,就自动帮我加上midjourney 的图片比例参数--ar 16:9 。
也别忘了, ChatGPT 是对话机制,如果测试Midjourney 提示语后发现效果有落差,只要在ChatGPT 用对话请他修正即可。
小结
我想说的是,前述四个训练ChatGPT 帮我撰写Midjourney 提示语的阶段,并不是说阶段四就会比阶段三好!
所以有时候简单一句话, ChatGPT 翻译成英文的Midjourney 提示语,就是最好的做法(阶段一)!
但是,我们也可以从阶段二、阶段三、阶段四的不同训练方式,看到利用ChatGPT 撰写Midjourney 提示语还可以有这些弹性作法,从而让自己更能设计出符合需要的创意图片。
阶段一:让ChatGPT 翻译Midjourney 提示语:从简单开始就好
阶段二:让ChatGPT 改写Midjourney 提示语:从概念想法,转译成图片语言
阶段三:让ChatGPT 模仿Midjourney 提示语:把专家语法换上我的需求
阶段四:让ChatGPT 理解后创作Midjourney 提示语:拆解结构逻辑
而且,在这样的学习过程中,除了每天更快速生成我需要的图片,我也渐渐学会Midjourney 提示语的关键结构、逻辑、参数(并且整理成笔记),有些时候,我就利用阶段一自己写出提示语,反而可以达到更想要的效果。
而想要知道在Midjourney 中可以设定哪些提示语?不同参数有什么不同意义?最好的方式,就是先参考这份Midjourney 的官方教学文件,会学到非常多。
基本上Midjourney 提示语的结构,和ChatGPT 提示语的结构很像,都是:目的优先、输入资料、设定输出三个阶段:
目的优先:图片主题、场景、人物描述。
输入资料:设定图片、照片细节,例如构图方式、使用的摄影技术或绘画技术、艺术风格、时间年代等等。(尤其艺术风格影响很大)
设定输出:利用各种参数设定图片长宽比例、品质高低、艺术化程度等细节。
也提供大家参考。