过拟合和正则化
公式啥的我就不放了,想认真研究的可以去看我链接的视频
省流:过拟合就是以偏概全
一个人去看LOL世界总决赛(过少的数据集),他非常认真的看,记录了职业选手的每一个细节(试图拟合所有数据),然后反复研究(训练),最后总结出来了一套方案(模型)。
结果他用这套方案去打排位,结果打得非常死板,出装只会一套,打法也只会一种(过拟合)。
以上我们得知,过拟合就是对少年数据的过度模仿,的导致得出的结论没办法灵活运用的情况。
那我们要怎么解决这种情况呢?
假设我们最终的目的是要上分,那我们该怎么学呢
1.搞清楚什么东西是没必要学的(减少特征)
有些东西对于上分是没帮助或者说帮助极小的,比如怎么做大笑动作嘲讽对手,亮狗牌嘲讽,这就不用学了。(某些特征对模型训练并不会有帮助,强行要拟合所有特征,会增加模型的复杂度)
2.多看比赛,而不只是只看一场(增大训练量)
看职业玩家在各种情况下。面对各种对手的操作(大量的数据集),最终研究出一个适用性广的打法。
3.不用整场比赛都看完(提前结束)
看到拿巴龙,四条或龙魂加上远古巨龙,就可以不用看后面的了(足够准确),因为后面的操作已经不会对战局有什么影响了,继续看的话,可能还会看到优势太大浪输了。
4.挑有用的来学(正则化)
学怎么控线,学大局意识的培养。丝血反杀,极限操作就不要花太多精力学了(降低部分特征的权重,L1正则最低可以降低到0)
参考视频资料
https://www.youtube.com/watch?v=88kU_HAmJUU
https://www.youtube.com/watch?v=TmzzQoO8mr4
https://www.youtube.com/watch?v=hVeuDfmPpJ0