欢迎光临散文网 会员登陆 & 注册

06 矩阵计算【动手学深度学习v2】

2021-11-13 20:50 作者:如果我是泡橘子  | 我要投稿

标量导数





亚导数

  • 将导数拓展到不可微的函数





梯度

  • 将导数拓展到向量
  • y 是一个标量,x是一个向量
  • 结果是一个行向量
  • 在等高线上某一点做切线,然后作正交线(梯度和等高线是正交的:梯度指向的是值变化最大的方向,通常是往大的值走)





样例


  • y 是一个向量,x是一个标量
  • 结果也是一个列向量
  • x,y 都是向量
  • 结果是一个矩阵
  • y 的每一个元素与向量x进行求导,最终得到一个矩阵







Q&A


14、导数的作用主要是进行梯度下降,但容易陷入局部最优解?请问可以使用李雅普诺夫函数或者其他方法(例如模拟退火算法)来使得下降得到全局最优解吗?


  • 如果是凸函数的话,可以达到最优,如果不是凸函数的话,其实很难拿到最优解,理论上,数学是可以拿到最优解的,但是数学上几乎是拿不到最优解的
  • 机器学习几乎是不会处理凸函数的,如果问题能够得到最优解的话,就是P的问题,机器学习不关心P的问题,只关心NP的问题



15、一个向量的单位向量对其自身求导是多少? d[x / |x| ] / d[ x ],分子是把它变单位向量,分母是其自身


没有白板,不进行展开计算



16、Pytorch和MXNet是采用的自动微分和计算图吧,不会再使用手动微分实现吧?


  • 马上会讲到自动微分和计算图,不会让我们手动求导,但是基础数学希望大家知道(导数大概的计算过程,不需要知道整个的计算过程,但至少能够清楚导数的形状和input的形状大概应该是一个什么样的关系)





----end----

06 矩阵计算【动手学深度学习v2】的评论 (共 条)

分享到微博请遵守国家法律