鱼子酱的AI绘画快速上手指南(2023年7月)—— [1] 基础导论和webui安装





Hi,这里是鱼子酱,我将在这里根据我自2022年11月以来不断积累的经验做一个目前(2023年7月)的AI绘画的快速上手指南。

什么是AI绘画?
AI绘画是指,使用者根据自己的意愿,通过输入各种各样的参数,从而使用训练好的AI模型生成图片的过程。
很多人看到AI这个字眼,就会联想到电影或者游戏里那种超级聪明智慧的人工智能抑或是仿生机器人,完全可以模拟人类的情感,做到和人类对答如流的那种。其实完全不是,至少目前的AI完全没有达到那种发展阶段。
我们说的AI,是指按照某一种方法,经过了成千上万的步数而训练好的模型。举个不恰当的例子说明一下,我们在学习编程语言,比如说C,Java的时候,会经常用到函数(function)或者方法(method),这两个东西意思和效果差不多,大概就是我们提前制作并保存好了一套指令方便我们后续反复调用。用通俗的话来说就是,我们提前制作好了一套工具并把这套工具保存好,那我们后面就方便使用这个工具来做一些事情了,而不是说这个工具用了一次就丢了,后面还要用的时候又得重新制作。AI模型也差不多,类似一套高级的工具,只不过我们要用它做一些更加牛逼的事情。
也因此,AI绘画最为关键的东西就是模型,模型的好坏决定了生成图片的质量的上限和下限。

目前主流的AI绘画底模有哪些?
首先说明一下,AI模型具有可存档 (save),可融合 (merge),可迁移学习(transfer learning)的特性。也就是说AI模型是可以在一个最原始最根本的模型,即, 底模 (base model) 的基础上不断魔改的。底模是相当重要的东西,它决定了这个模型后续的升级和魔改的方向和上限。
目前主流的AI绘画底模有:Stable diffusion, niji journey, midjourney, Novel AI。
其中只有Stable diffusion是开源 (公开源代码),也就是完全免费的。其他的niji journey, midjourney, Novel AI都是由一些公司独立开发的模型,有一些他们的黑科技(比如说midjourney的图片效果相当惊艳,并且人体结构的稳定性相当好,特别是手部)。你只能到他们的网站在线生成AI图片,无法在你自己的电脑上本地部署,并且每一次生成图片都需要消耗相应的点数,想要长久的玩的话必须得氪金。
Stable diffusion是由Stability AI公司制作并决定开源的底模,拥有着最为广大的用户和开发者社区。其中最著名的就是github用户automatic1111发起的开源项目Stable Diffusion web UI,该项目直接让AI绘画在民间爆火。
而我进行AI绘画的平台就是Stable Diffusion web UI。

Stable Diffusion web UI
1. 什么是Stable Diffusion web UI?
Stable Diffusion web UI,简称webui,是由github用户automatic1111发起的开源项目。github项目链接在这里:https://github.com/AUTOMATIC1111/stable-diffusion-webui
webui是目前最主流的进行AI绘画的平台,功能相当强大。除了拥有文生图 (text2img),图生图 (img2img) 的基础功能外,还具有良好的扩展性,可以按需求安装很多插件,比如说controlnet,各种各样的upscaler等等。
但是webui的界面操作相对比较繁琐,对于新手来说需要一定时间来学习适应。同时如果选择将其装在自己的电脑上运行,对于电脑的性能,特别是显卡有着很高的要求。
2. 我该怎样安装Stable Diffusion web UI?
安装webui主要有两种方法,一种是将其装在自己电脑上,另一种是将其安装在云端算力平台上 (比如google colab)。由于目前越来越多的云端算力平台禁止了免费用户在他们的平台上运行webui (氪金用户不受影响,但是氪金价格相当昂贵,一个月10刀的那种),加上云端部署webui操作也会相对比较繁琐,我是不怎么推荐在云端部署webui的(其实是我根本没搞过云端部署webui)。如果你想要云端部署webui可以参考这个视频超详细云端部署Stable Diffusion教程!100%还原本地操作,免费试用3个月,自由切换模型、扩展,阿里云的函数计算太香了!| 在线安装Web UI
下面我会介绍如何在自己的电脑上安装webui。
首先需要知道,在自己的电脑上跑webui玩AI绘画,对于电脑的性能,特别是显卡有着相当高的要求。综合生成时间和生成质量,请确保显卡最好是NVIDIA的卡,并且显存至少有8G,最好是16G或更高,这样就可以避免爆显存带来的血压。(如果显存太小,有可能会出现这样的情况,等了将近5分钟,进度条终于到95%了,预览图里已经可以看到这张图相当戳自己性癖,然后突然黑图了,提示爆显存了,别问我为什么知道)想要基本杜绝显卡性能不足带来的生成时间漫长,显存不足导致黑图等各种问题,最省力但不省钱的方法就是买一张4080或者4090。
其实在webui的github项目的wiki一栏里面是有讲过如何安装webui到自己电脑上的,(链接在这里:https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-NVidia-GPUs) 但是由于操作相当繁琐,对于没有一定编程基础和英语基础的小白来说相当不友好,我也就不推荐了。
现在安装webui,更多的是通过那些一键安装的整合包。这里我推荐秋葉aaaki制作的一键整合包,链接在这【AI绘画】Stable Diffusion整合包v4.2发布!全新加速 解压即用 防爆显存 三分钟入门AI绘画 ☆可更新 ☆训练 ☆汉化
安装教程在视频里面有讲,如果视频讲的太快或者是真小白没弄明白的话我在这里可以简单讲一下。
首先去到视频简介里面提供的百度网盘或者夸克网盘网址,然后输入相应的提取码(视频简介里面都有写),接着将右键点击整个文件夹 (sd-webui-aki) ,并选择下载,将整个文件夹下载下来。
下载完成后需要点开sd-webui-aki文件夹,进去之后看到有一个压缩包sd-webui-aki-v4.2.7z,你需要将他解压出来。

注意这里的压缩包格式为7z,如果电脑上没有安装过7-Zip的话,需要自己去安装一个7-Zip后才能解压。7-Zip官网地址在这里
https://www.7-zip.org/
进去之后看到页面左上角有这样一个表格

点击第一行的download下载后安装就行了。
安装完成后右键点击sd-webui-aki-v4.2.7z这个压缩包,点击打开方式,点击选择其他程序,然后去到刚才安装7zip的文件夹,默认是在C盘/Program Files/7-Zip,选择7zFM就行。使用7z打开之后点击上方的extract,然后选择一个自己觉得舒服的位置点OK就行。

解压完成之后别急着运行webui,先跑到最开始下载的整个sd-webui-aki文件夹里面,双击启动器运行依赖-dotnet-6.0.1.1.exe安装启动器的运行环境,按照提示走就行了。

注意:由于启动器使用了dotnet,可能会被windows自带的杀毒软件误报为病毒,选择将其忽略并恢复就行。至于controlnet1.1那个文件夹,先不用管,留着就行。
至此,秋叶整合包的安装就算完成了。

下一期我会介绍webui的界面以及基本功能。这个专栏会持续更新。我会把我这9个月的经验全部分享给大家。