神经网络之矩阵
矩阵
大一的时候学习的吧,忘记了,感觉很久远了,我以为毕业之后再也用不到了,直到我了解了神经网络。
以下内容是百科的解释: 在数学中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。
如下是一个m*n的矩阵。 $$\begin{bmatrix} {a_{11}}&{a_{12}}&{\cdots}&{a_{1n}}\ {a_{21}}&{a_{22}}&{\cdots}&{a_{2n}}\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\ {a_{m1}}&{a_{m2}}&{\cdots}&{a_{mn}}\ \end{bmatrix}$$
矩阵转置
把m×n矩阵A的行换成同序数的列得到一个n×m矩阵,此矩阵叫做A的转置矩阵,记做 $$ A^T $$
运算规则
加减法
加减法很简单,就是他们相同位置的元素相加减。

注意:只有行数和列数都相等的矩阵,加减法才有意义。
乘法
矩阵第m行与第n列交叉位置的那个值,等于第一个矩阵第m行与第二个矩阵第n列,对应位置的每个值的乘积之和。

导图
基本线性代数里面的内容都涵盖了。当然了,如果做科研的话,这些还远远不够的。

追根溯源
矩阵的乘法规则很奇怪,他是怎么来的那?这就要从矩阵的源头说起了,矩阵来源于方程组,而这奇怪的规则正对应相应的方程组。
以下是线性方程组:

矩阵的最初目的是简化方程组的写法:

从这里就能看出矩阵的乘法规则。
下面来看一下严格的证明过程: 有3组未知数,x, y, t,其中x和y的关系如下:

t和x的关系:

有了这两组方程式,就可以求 y 和 t 的关系。从矩阵来看,很显然,只要把第二个矩阵代入第一个矩阵即可。

将第二个方程式代人第一个方程式中:

最后那个矩阵等式,与前面的矩阵等式一对照,就会得到下面的关系。

至此,乘法规则证明完毕,鼓掌。
写在最后
后续会持续更新学习过程中遇到的数学问题以及神经网络相关的知识。
公众号
更多内容,欢迎关注我的微信公众号:无情剑客。
