简单推导了一下GB中负梯度和残差等价的原因,视频里讲错了,不是说残差等于负梯度,而是说降低残差这个目标可以转化为拟合负梯度,也就是如果你每一步里拟合了负梯度,那你就一定能在这一步里降低一点点残差。
笔记不支持latex,只能截图了: