大结局:线性变换观点下的线性代数(2) 我能一条龙讲通线性代数你信不信……
续上一集,我们以克莱姆法则为切入口,初步建立了线性观、线性变换观、数形结合观,长驱直入了行列式理论。这一集我们需要巩固这些观念,并树立从线性方程组中来到线性方程组中去的观念。行列式长期为解线性方程组服务,解线性方程组是线性代数发展的原动力,我们所学知识很大一部分是从线性方程组中来到线性方程组中去。

本集内容结构示意图:


切入口:高斯消元法
对于二元一次线性方程组:

联立求解二元一次方程组的几何解释是:

如图,两个直线方程的交集即为解集。两个倾斜直线并不与坐标系网格对齐,这使得两个直线的交点很可能不是一目了然的。为此,我们对该二元一次线性方程组进行消元,有:

消元的几何解释是尽可能使直线“摆正方向”:

上图的系数矩阵是行阶梯形矩阵,它并不是消元彻底的系数矩阵:

消元彻底的系数矩阵是行最简形矩阵:

它的几何解释是直线方程完全与坐标网格对齐,那么解集是一目了然的:

我们在线性代数中接触的消元法是高斯消元法。

它最早出现在《九章算术》中,是我们解线性方程组惯用的方法。事实上高斯消元法也是较为优秀的线性方程组解法,它在几百万阶的线性方程组求解时仍然奏效。
高斯消元法包括三种初等变换,其几何解释是直线组的顺序、直线的法向量长短、直线系都不改变直线组的交点。因为系数矩阵的初等变换不改变解,所以我们称初等变换前后的矩阵为“等价关系”。
不过令线性代数初学者困惑的是:在求解线性方程组时,为什么只能对系数矩阵进行行变换而不能进行列变换。在线性变换的观点下,这个问题可以有很好的回答:

我们已经知道“行左列右”,解向量对系数矩阵进行了列变换。方程的解向量[x,y]^T,可视为在以系数矩阵的两个列向量[3,1]^T、[1,2]^T为基底中的坐标,而得数向量[8,6]是在默认的基底即标准正交基底下的坐标。

如图,系数矩阵的列向量组作为新的基底,如果对它进行列变换,那就是“搞基”,则(2,2)这个坐标也将随之改变,即算错了数。

在线性变换的观点下,基或基底这一概念迟早要浮出水面,并不以数学家的意志为转移。系数矩阵作为线性变换的一个描述,可视为这一线性变换是对标准正交基的“拉扯” ,将其变换为以系数矩阵列向量组为新的基。
基是线性空间中充当参考系的一个向量组。我们通常希望这个参考系能张满整个空间,否则如果欠缺了某些维度的方向,那它就丢失这个方向的描述信息。
对于系数矩阵而言,如果它的维度小于整个空间的维度数,那么变换后的新基将丢失相应方向上的描述信息——线性方程组有无穷多解,这会使求逆矩阵解线性方程组的方法失效。系数矩阵在线性变换的观点下可视为自变向量的函数或算子,矩阵乘法即复合函数,这也很好地解释了为什么没有矩阵除法——逆矩阵相当于反函数。

函数与反函数关于空间对角线对称,而表示空间对角线的一个向量组正是单位矩阵。

不过逆矩阵的定义仍可能令初学者感到困惑:

秩就是维度。
对于伴随矩阵:

我们已经知道代数余子式是“旗杆的有向地面积”,则以代数余子式为元素的伴随矩阵的一个几何解释是各方向均有分量的“分视图”,我们见过只有特征方向有分量的分视图,比如“三视图”。

我们从各个方向看去,都看到了其对应的底面。如果说三视图某一方向的信息缺失了,那我们就不能还原原来的物体信息,这样的亏秩矩阵描述的变换就是一个投影变换,而投影变换是不可逆的,还原的话有无穷多种可能,所以系数矩阵亏秩的线性方程组的解有无穷多个。
我们从线性方程组出发:

如图,对于标准正交基的过渡有P=EP,因为标准正交基通常缺省,所以线性方程组中的基的过渡可能不被初学者所察觉,而是认为同在标准正交基下,系数矩阵将解向量作为自变向量变换到因变向量。
而坐标过渡公式和基过渡公式虽然形式上简单,但其实大有玄机——我们将坐标过渡公式和基过渡公式相乘,我们得到一个向量组版本的内积:

这一件欧亨利式的结果为我们后续学习两种特殊的线性变换——相似变换和合同变换埋下了伏笔。
我们称描述同一个线性变换不同参考系下的坐标矩阵为“相似关系”,而相似的定义式往往令初学者困惑不已:
定义:设A,B都是n阶方阵,若有可逆矩阵P,使P^-1AP=B,则称A,B相似。
困惑点在于矩阵P该怎样解释。实际上这在线性变换的观点下十分好理解:

以至于如克莱因所述的C进程,相似定义式的出现是线性变换本身所要求的,不以数学家的意志为转移,这是学科自身规律的作用。
至此,你应该能非常信服我选取以线性变换为中心来展开线性代数教学的方案。它不仅具有C进程的优势,还具有B进程的优势,它能有效地将线性代数组织成一个有机整体,并且还具有A进程的优势——它作为学科观念,像公理一般发挥演绎的无穷力量——能让学习者长驱直入、高屋建瓴地自学许多知识。
在线性变换的观点下,“摆正方向”是深入人心的。
它启示我们和消元法中摆正直线方向以匹配参考系来凸显解的位置一样,我们可以摆正基的方向以适应向量组来凸显“几何体的边长”,比如我们让它在参考系中被视为“堆砌在墙角的箱子”——就是让其各个边长都分别与各个坐标轴对齐,能直接读数。这种它本身匹配的基底的基向量,我们称之为“本征向量”或者“特征向量”。之所以叫“墙角体”是因为特征向量之间是线性无关的,即垂直(线性相关即平行)。
一个矩阵变换它的某个特征向量后,在其他特征向量的坐标分量为0(墙角体),只在该特征向量上伸缩,而伸缩的尺度被称为特征值,特征值并不以参考系的选取为转移,它是本征参考系坐标轴的单位长度——该矩阵表示的有向几何体的边长,其体积即各个边长的乘积(行列式=所有特征值乘积)。相应地,如果是逆矩阵,那么特征值就是原矩阵的特征值的倒数。
如果说两个矩阵都是满秩或可对角化的,即线性描述是全方位的,并且表示的几何体在各个方向上的边长都相等,那么我们就认为这个两个几何体其实是同一个,而参考系不同,相应的坐标也不同。这启示我们有些矩阵实际上是描述的同一个线性变换,只不过是参考系选取的不同导致坐标不同,如果能选取本征基,则这些矩阵的都是同一个相似对角形。
本征基下的矩阵是“墙角体”,然而有一类矩阵它们本来就是“墙角体”——正交矩阵。从几何上看,正交变换可以保持图形的形状不变,这一性质使其是化简二次型最常用的方法。
至此,其实关于矩阵相似及特征值的相关内容学习者已经可以长驱直入地完成自学了。
让我们扑向最后的堡垒——二次型。
二次型即二次齐次函数,

只含有平方项的二次型被称为“二次型的的标准形”或“法式”。“法式”的含义为“摆正了方向”。而“标准形”就是我们中学学的圆锥曲线的“标准方程”,以椭圆为例,如果说一个二次曲线的方程含除了平方项外还有交叉项、一次项,那就是“没摆正”:

椭圆方程的二次型矩阵即二次齐次函数的系数矩阵是正定的,而双曲线方程中则是半正定的。
在线性变换的观点下,应当变换参考系,以使曲线方程在新参考系下为标准形式。我们非常希望参考系是标准正交基,这样我们只需要旋转(消掉交叉项)、平移(消去一次项)、伸缩(通常是方程两侧系数约分)即可,当然为了获得标准正交基还需要经历一系列程序操作。
还有一件令初学者困惑的事情:矩阵合同。“合同”的含义是相同:

矩阵合同的定义式与矩阵相似的定义式如出一辙,都是三明治式。首先我们希望这个P^T=P^-1,如此一来,逆矩阵就是转置矩阵,而PP^T=E的矩阵,则P这种实矩阵正是“正交矩阵”,由此我们可以看出用正交变换法写出二次型的标准形实际上是归结到矩阵相似。而用正交变换法写出标准形,会重演我们这门课的学习历程。

而有一些矩阵它并不正交,我们通常不考,因为它背后牵扯一个更复杂的事情:张量。
你现阶段可以理解中间有内积度量的过渡,因为坐标系的正交和斜交在内积度量上有差异。
至此,我其实已经带领你们攻下了所有战略要塞,知识的版图在我们面前已无险可守,我们完全可以长驱直入占领所有地盘。我认为,教学者最主要的工作是带领学习者顺利渡过思维势障,它们形如湍流险滩,为此要求教学者探索出一条道路来,或者自行修路。一旦这项工作完成后,学习者的主观能动性将得以发挥,由此真正革命填鸭式教学。
【附录:我提出学科观念化进程的理由】
“学科观念化进程”是我提出,以树立恰当的、久经时间、群众检验的学科观念为教学首要任务的进程。我认为,学科观念的树立标志着学习进程开始走向成熟。
人类学术历史上无数次例证了以新观念看待世界从而取得了重大突破,科学与技术的发展史充斥着各种观念的更迭。在更高观点下俯视会势如破竹地解决那些被低观点所局限的顽固困难。我相信在不显著提升学习者智力、知识储备的情况下,仅凭恰当的观念和方法完全可以显著提升学习效率,并且会解决旧教学方案所不能解决的顽固困难。
在头脑中,观念用来驾驭知识,观念最好是与学科规律、公理或定理相契合,这要求教学者为此精心设计一番,令学习者顺利地接受观念。这一方案是我做了很久的梦,梦中我能看到那些山河表里般的知识版图,比邻着更浩瀚的真理海洋。我尽可能地挖掘出清晰简明的水渠,让如水的思绪去灌溉更多干旱的知识田野。
我对这一种进程寄予厚望,它在我的梦境中是如此生动,奈何限制于我的时间和表达能力,它或许在我描摹在纸上时并不宜人。在此抛转引玉,我寄希望于后来人,我认为按这套进程走下去,会完善成未来10年线性代数最好的教学方案。