11 模型选择 + 过拟合和欠拟合【动手学深度学习v2】
2023-08-01 22:16 作者:_undefined- | 我要投稿

一般对训练数据集五五分,一半当训练集,另一半当验证集。
训练集来训练模型参数
验证集来调整模型的超参数
尽管说训练集、验证集还要一个测试集,但一般为了方便编码是没有测试集的,测试集有也只使用一次。若存在的话,测试集用来做泛化评估的。
偷懒时实,我们只有训练集和验证集时,我们用验证集来看泛化误差的时候,这值可能是虚高的。
为了严谨,不偷懒,我们可以将训练集、验证集以及测试集划分为6:2:2(当数据量不是很大的时候(万级别以下)),若是数据很大,可以将训练集、验证集、测试集比例调整为98:1:1;
但是当可用的数据很少的情况下也可以使用一些高级的方法,比如K折交叉验证等。