【银蛇出品】数学漫谈12——通过极坐标变换进行的对坐标变换和梯度算子的考察

前置知识:向量与矩阵运算、线性空间、多元函数微分学
前言:坐标变换和基变换是线性代数中的一个基本问题.如果引入分析学的工具——微积分,就可以对坐标变换问题进行更深入地考察,从而建立适合于不同坐标系下的物理工程模型,进而解决之.问题是,十分重要的一个微分算子——梯度算子是怎样的?我们首先给出一个经典而便于理解的推导过程,然后再通过重新审视基这一概念,引出另一套更普遍的推导过程,而这个推导过程事实上将是适用于一切Riemann流形的.最后,引入度量张量(度量矩阵),以简要的介绍作为结束.
关键内容:坐标变换、梯度算子、度量张量

我们的讨论从大家再熟悉不过的极坐标变换开始.设下的向量
在直角坐标系下可表示为
,在极坐标系下可表示为
,于是有
代入极坐标和直角坐标的变换关系式得
由此知
记为式(1).但我们还不能确定的形式.过渡矩阵中的“?”处只要是有限量,则该式一定成立,我们需要考虑推导或定义
.

回忆在普通物理学中极坐标系下对速度的推导过程,我们定义了,于是有
记为式(2).这样定义的好处是,构成单位正交基,对定量计算来说是十分方便的.
问题1. 求此时极坐标系下的.
到这里,我们已经能够对极坐标系下的向量函数求导了.
继续考虑梯度算子.在直角坐标系下,我们定义
记为式(3),并认为它是一个向量.通过复杂的变量代换和偏导的链式法则,我们能够求出在极坐标系下
记为式(4).式(4)的结果比较简洁,并且可以观察到梯度算子的形式在极坐标系下发生了变化.虽然结果正确,但是求导过程繁琐,也体现不出背后的数学原理.如果要求球坐标系下梯度算子表达式,工作量还是很大的.
我们考虑对梯度算子进行推广,先给出一种推广定义:
定义1. 令梯度算子满足
.
可代入直角坐标的情形进行检验,进而说明该推广定义的合理性.
接下来我们可以考虑极坐标的情形,进一步检验定义1的合理性.
问题2. 从定义1出发,求极坐标系下的梯度算子的表达式.
分别考察,其中
是任意可微函数.
设.
利用问题1的结果,.
于是定义式左边为.
根据偏导的链式法则,.
两边对应得,即
.
这种算法的计算量已经比纯变量代换的小很多了.但是注意,这种推导方式依赖于的形式,如果不能给出
的准确表达式,这些计算就无从谈起.举一个很常见的例子:在球坐标系中,我们如何定义
及其导数?三维空间中的几何法还是不够直观,推导起来比较麻烦.如果费了很大力气推导出来然后记住也不是不可以,但该方法普适性不好,每遇到一个新的坐标系都要重新推导.就算是分析清楚了一切三维空间中的坐标系,那遇到高维空间怎么办?
于是我们再考虑其它推广梯度算子的方式:
定义2. 令梯度算子满足
,其中
为第
个基向量,
为相应的坐标,
.
这种推广定义更加自然,不依赖于基向量的微分.同样,代入直角坐标的情形可说明其合理性.
问题3. 从定义2出发,求极坐标系下的梯度算子的表达式.
仍设.
根据定义2容易推出.
很显然这个结果是错误的.
问题出在哪里呢?我们审视一下导致前边推导出现矛盾的假设:
i. ;
ii. .
我们始终默认假设i是正确的.现在打开脑洞,考虑一下承认假设ii,否决假设i的情形.

否定了假设i,就要重新考虑如何定义.
观察式(1),它可以改写为
记为式(1').如果我们令,就会得到一个非常有趣的结果
记为式(5).姑且不管这种变换的理由,我们能够发现一个事实,式(5)在形式上满足偏导的链式法则.根据这种思想,我们能够写出基向量的形式
记为式(6).这种定义方式与式(2)是不同的,式(2)相当于式(6)进行了归一化.另外可以检验,式(2)是不符合定义式(5)的.通过式(5),我们可以方便地对每一种坐标变换导出唯一一组基向量.
这种定义的思想的新颖之处在于,基向量描述了一部分关于度量的信息,而不必强制要求基向量是归一化的.
再次考察定义1和定义2两种梯度算子推广定义的合理性.
问题4. 分别用定义1和定义2验证极坐标系下的梯度算子的表达式.
计算结果显示,定义式(5)所定义的极坐标的基向量能够完美兼容这两种定义.更小的计算量和思考量以及更好的普适性显示出了定义2及的优越性.
问题5. 考察球坐标系下的梯度算子的表达式.
设球坐标系与直角坐标系的变换式为,容易推出
记,根据定义2容易推出
即.
问题6. 考察一般的维Euclidean空间
下,梯度算子
的通式.
设下的直角坐标为
,相应的单位基向量为
;选定的坐标为
,按
定义相应的基向量,其中
,有
.
引入记号,易知
.
记,两侧同时点乘
有
改写成矩阵形式为
记矩阵的逆为
,则有
,即
.
到这里,对于我们一般能遇到的坐标系来说已经够用了,至于散度、旋度、Laplacian都可以用梯度算子生成.

在问题6中,我们引入了一个矩阵,称之为度量矩阵,它描述了所研究空间的某种度量方式.并称映射
为度量张量,其中
为向量空间.度量张量可以用度量矩阵来表示.
问题7. 考察Euclidean空间在直角坐标系、柱坐标系、球坐标系下的度量矩阵.
一般情况下,我们通过内积定义长度,因而度量矩阵是对称矩阵(或Hermite矩阵).而对于Euclidean空间来说,度量矩阵还是正定的.
定义3. 称在适当基下度量矩阵为的空间为Minkowski空间,记为
.
Minkowski空间说明度量矩阵并不一定是正定的,而根据内积的正定性,容易知道Minkowski空间中的坐标变换需要引入复数.
Minkowski空间是描述狭义相对论的有力工具,我们以一个简单的坐标变换为例.
问题8. Lorentz变换是狭义相对论中两个作相对匀速运动的惯性参考系之间的坐标变换,试用线性变换描述Lorentz变换.
记.
根据光速不变原理,应有,这启示我们可以将问题放在Minkowski空间下加以研究.
作变换,将
映成
,这样就实现了将四维Euclidean空间中的问题转化成Minkowski空间中的问题.
稍加整理,变换可写为,写成矩阵形式即为
容易验证,Lorentz变换是酉变换.

本文从梯度算子起手,实际上将思考引导到了切向量、度量张量这些现代微分几何学中阐述的概念上,其重要应用之一便是狭义相对论和广义相对论.梯度算子部分偏重实用性,略去了大量的细节;度量张量部分以Minkowski空间为例,介绍了Lorentz变换这一重要概念.对这些内容感兴趣的同学可以参阅关于微分几何、狭义相对论方面的教材.

[1] 直观地说,总可以把向量平移到原点上.至于极角的信息则包含在$\be_r$中,在后续推导中可以看出.
[2] 请思考笔者这里使用“定义”而非“推导”的原因.
[3] 这定义来源于微分流形上的切向量,对详细推导有兴趣的同学可以参考现代微分几何教材.笔者在此推荐孙和军、赵培标所著《现代微分几何》.
[4] 这里的向量空间可以是实的,也可以是复的.