【AI绘画】过拟合、欠拟合是什么意思?AI训练前置知识(二)
大家好,今天来给大家讲一下常说的概念——过拟合、欠拟合。为了dreambooth训练打下良好的理论基础。
在看这期专栏以前,可以先看看我的这个视频,理解一下AI训练实际是在干什么。

话不多说,直接开始。
一、AI的训练与测试
说到训练AI,那么就离不开这两个事情。和人学习也一样,AI同样需要 “训练”、“测试”。
或许可以理解为:学习了教材上的例题,需要考试来衡量学习效果。
以AI绘画为例,我们的训练集就是训练AI的时候喂给AI的那些图片。但是我们一直在玩的这个AI绘画的训练,却没有一个合适的测试集去衡量我们训练的效果如何。这里姑且模糊的定义为使用“文生图”、“图生图” 的图片生成效果。
这里就引出一个问题:需要一个定义,去阐述AI在训练数据上学习完以后,在测试数据集中实践的好坏。也就是常说的几个词:“过拟合”、“欠拟合”、 “泛化能力”。
二、不收敛、欠拟合、过拟合、泛化能力
不收敛就是根本没学会。
欠拟合是指模型不能在训练集上取得好的结果(获得足够低的loss)。学会了点,但是也没学会。模型在训练集、测试集上表现都很差。
过拟合是指在训练集上表现很好,但是测试集上表现很差。简单来说,就是学过头了。比如说,学半天1+1=2然后只会这个了,到了1+2就不会算了。模型对训练集"死记硬背",没有理解背后的规律。
泛化能力,也就是指的AI对未知样本的推理、适应能力。泛化能力差是过拟合的直接表现。
下面这张图,是一个图例,用一根线去模拟点的分布(可能有人发现这个是线性回归的图,一个意思)
我们训练AI,就是要模型达到“拟合”,不会过度拟合,也不会欠拟合。

光这么说可能很多人也一头雾水,这里举个小栗子。
给AI一堆猫猫图片让他学,学半天没学会怎么画猫,这个叫不收敛。会画了,但是画的不是很像猫或者哪里不对,这是欠拟合。学完了只会画白毛猫猫,怎么描述都不会画金猫,这个叫过拟合,只会画白猫了,直接看到的现象就是泛化能力差。
三、严重的问题
我常说,AI绘画根本不是抄袭。但这也不绝对。在训练某个特定画师的模型时候,常常会因为画师本身的图就很少,再加上训练的步数过多,非常非常容易过拟合!!!
上面也说了,过拟合可以理解为死记硬背。比如说你用十几张这个画师的图,跑了1w步训练了一个模型,那他有极其大的可能性过拟合了,死记硬背那真的是等于描图叠图抄袭了。
在dreambooth的训练中,当你用少量图训练的时候,非常非常可能发生这种情况。有更离谱的情况是什么呢:三五张图,学习了大量的步数。AI甚至可以直接把原图整张吐出来。
比如之前风波比较大的某个国内画师模型,其实有很明显的过拟合痕迹。更有某个高训练步数明显过拟合的白蛋模型,直接把原图吐出来了。
这些明显过拟合的模型——换言之训练失败的模型,为什么要发出来呢?