超越 ChatGPT:文本到图像 AI 生成器


人工智能的发展让创作者保持警惕。每隔一周就会有一个新的 AI 工具、平台或功能可供探索。在我的列表顶部是为几个即将进行的项目制作动画人物面孔。我需要创建一致的、分层的或复杂的图像以用于这些项目。例如,D-ID是一款网络应用程序,它使用实时面部动画和高级文本到语音转换来创建身临其境的类人对话式AI体验。

Midjourney 的“/describe”功能可让您将图像转换为文字。它会根据您上传的图片生成四种不同的描述,并且可以轻松生成新的变体。底部的四个数字是混音按钮——每个数字都与相应的描述相匹配。单击数字将根据新描述重新混合图像。然后,你复制/粘贴你喜欢的,你也可以对文本进行修改。
首先,我合成了现有图像,然后使用 /describe 输出作为文本提示来创建新图像。后来,我使用 CLIP Interrogator 等其他工具生成新提示,以便使用 ViT-H-14 OpenCLIP 模型与 Stable Diffusion 2.0 一起使用。我使用 Midjourney 创建了一个图像,该图像成为其他工具的基础图像或源图像(见下文)。然后,我在 Midjourney 中复制并粘贴了 CLIP 描述输出,并使用 Adobe Photoshop 合成了结果。



文本在 AI 图像生成中发挥的关键作用。它可用于为动画序列创建独特的角色,并且可以生成带有录音的面部动画。