欢迎光临散文网 会员登陆 & 注册

神秘的“矩阵”

2022-05-11 22:07 作者:Berton9407  | 我要投稿

上一篇我们讲到了“1+1=2”的数学内含,也许在数的世界里,本身就蕴含着万物静态或动态的“规律”。基于“数集”和“运算”,行列式、矩阵成了现代科学问题的重要转化对象。换句话说,你似乎可以发现,矩阵运算在生活中无处不在,起初主要为解决线性方程组服务的,但随着研究的深入,发现其蕴含的“分支”有着丰富的数学应用价值,也成为了独立的学科——《线性代数》。

对于“鸡兔同笼”、“牛吃草、追及”、“盈虚有数”等等都是以“两元”为基础(元指代的是问题研究的对象),由此二元一次方程组的元素系数便构成了最简单的二阶矩阵。而推广到N阶矩阵的基础则是三阶矩阵(这似乎和古文中“三亦是多”的概念不谋而合),其中三阶方阵又是最为基本的。所以,熟悉三阶方阵的特点,往往就可以推广到更高阶的矩阵特征。

对于两个三阶方阵A和B来说,通常会考虑存在内在的联系,譬如:等价(存在可逆矩阵P和Q,使得PAQ=B)、合同(存在可逆矩阵P,使得P^TAP=B)、相似(存在可逆矩阵P,使得P^-1AP=B)、正交相似(相似的基础上,P为正交矩阵,即P^T= P^-1)等。由此,正交相似矩阵一定是相似且合同的,而且不论是相似矩阵还是合同矩阵,都是等价矩阵。

而一个三阶方阵需要用9个元素填充其内,而且还是以“面排列”形式的二维数据,当然,依据固定要求可存储为一行,但还可以压缩相关的数据。譬如:卫星上存在的坐标转换矩阵则通过四元数存储(即四个数表示一个矩阵)。而对于一个三阶可逆方阵,最重要的就是寻找它的“特征值”与各个特征值对应的“特征向量”,这也可以看成是三阶可逆方阵的压缩信息源。那么,可逆三阶方阵A的充要条件有什么呢?主要包括:A的行列式|A|≠0;A的秩r(A)=3;行向量和列向量均线性无关;Ax=0只有零解。

关于特征值和特征向量,一般用λ和α表示,则按照定义,其满足λα=Aα,转化即求(λE-A)α=0存在非零解,即特征方程|λE-A|=0(若只有零解,则|λE-A|≠0)。那么,有关可逆方阵A中特征值的一般特性有:A和AT有相同的特征值(这就表明了有相同特征值的方阵不一定相同);若A的每行元素或每列元素绝对值之和小于1,则|λ|也小于1;特征值之和等于方阵A对角线元素之和(也称之为“迹”),特征值之积等于|A|(这是最为重要的一条特征,可以表征出特征值与方阵元素和行列式之间的关系);若特征值互不相同,其对应的特征向量线性无关(需要注意的是:单个零向量线性相关,单个非零向量线性无关)。由此,可以推出:kλ是kA的特征值;λ^k是A^k的特征值;1是单位阵E的特征值;|A|/λ是A伴随矩阵A*的特征值。

对于A的特征方程得到一组线性无关的特征向量构成Q,则可使得Q^-1AQ=,得到的结果为对角矩阵,且对角线元素即为特征值。当然,当特征方程有重根时,就不一定有完备的线性无关的特征向量使得其对角化。但是,对于特殊的实对称矩阵来说,其必定能对角化,且不同特征值对应的特征向量必定是正交的,从而可以根据施密特正交化过程(过程如图1)得到正交向量组Q^T= Q^-1,其中Q的列和行均为单位向量,因此也称之为标准向量组。

图1. 施密特正交化过程

进而,若A是个实对称方阵,其存在二次型和标准形的转化,在统计和解析几何中应用颇为广泛。转化主要分为三种:配方法(注意区别平方项和交叉项)、初等行/列变换法(左乘初等行变换,同时右边作用初等列变换,如图2所示)和正交替换法(此法较为繁琐,一般不用)。

图2. 初等变换法

另外,对于对角矩阵进而可以化为规范形(即以0,-1和1构成的对角矩阵元方阵),如图3所示。

图3. 规范形

则它们的个数依次可以代表0指数、负惯性指数和正惯性指数。据此标准形或者规范形后,可以将其分为正定(全>0)、负定(全<0)、半正定(全≥0)、半负定(全≤0)和不定,除不定外,其余四种构成了方阵的有定性。方阵进过非退化线性变换后,原本的有定性不变。因此,正定方阵的充要条件如下:标准形中平方项系数均为正数;正惯性指数为方阵阶次;与单位阵E合同;其特征值均为正;各阶顺序主子式为正。而其行列式为正仅仅是必要条件。若A正定,则其逆矩阵、伴随矩阵、高次矩阵均正定,且主对角元素为正。正定矩阵的和矩阵也正定。

以上是有关矩阵的背景性质和属性,有些“好”的矩阵(如:正定、对称等)都有丰富的“特殊性”,那么正定对称阵就是“上乘”矩阵,越是“上乘”就越是“稀缺”,这个似乎是肯定的。而在实际问题的研究中,涉及矩阵的通常有:坐标系转换(旋转矩阵、波矢分析)、谱矩阵(一般是共轭对称阵)、三维曲面二次型矩阵(包括平方项和交叉项)、Hessian矩阵(对称阵,可用于极大似然函数法的参数估计)、协方差矩阵(对称阵)、▽算符等等。

图4. 协方差矩阵

无论是求解线性方程组的解还是求拟合方程的参数,均可以构造系数矩阵进行线性化处理。当然,实际上,观测样本往往会远远大于需求解的各单元或待拟合参数的个数,可认为其为“超定方程”,但其依然可以得到系数矩阵进行求解。随着计算机水平的飞速发展,这些问题基本上都可以转化成计算机语言进行运算处理,从而得出结果,并同时给出相关的误差范围。需要注意的是,这里考虑的样本认定是“同权”的,即每一个样本都是独立同分布,才往往适用,而当出现每个样本独立不同分布,却需要用同样的拟合函数进行拟合时,是需要考虑“加权”的(权重“重分配”),亦或是通过“蒙卡”的思想多次进行数据“重采样”,得到更加可靠的拟合结果。对于样本,还能通过聚类得到分类结果,也可以通过主成分分析得到各个成分(或者“元”)对结果的贡献程度等。

往往可以将实际问题抽象成数学表达——“矩阵”,基于矩阵的各种运算得到问题的解答,便是现代科学分支的重要基石之一,它串联起了函数、方程组、解析几何、概率与统计学等,将信息学和计算方法相联,搭建起观测与理论中的“桥梁”,引你“渡过”这片看似深沉的泥淖,探索桥下泥淖的“长度”、“深度”和“密度”,回头看看已是溪水汨汨,清澈见底,倒影着蓝天白云,彻底变成了一番模样。

神秘的“矩阵”的评论 (共 条)

分享到微博请遵守国家法律