【科普】行列式为什么表示N维体积? 您所在的位置:网站首页 立体图形的体积是什么意思啊 【科普】行列式为什么表示N维体积?

【科普】行列式为什么表示N维体积?

2024-07-06 04:12| 来源: 网络整理| 查看: 265

行列式的定义,和它的几何意义之间的联系并不是很明显.本文将讲解说明,为什么把 N 维空间中由 N 个向量张成的图形的 N 维体积定义为行列式的值是合理的.传统线性代数课程是从行列式开始讲的, 而行列式这个定义就好似天上掉下来一般地莫名其妙. 如果去查为什么会有这样的定义, 网上各路科普就会拿出2维, 3维欧氏空间来证明, 行列式的绝对值为什么同体积相等, blahblahblah, ...可是这样的解释并不能令人满意, 问题有以下三点:(1) 证明行列式和体积相等的方法往往是硬算, 毫无启发性(2) 这样的解释都局限在低维空间中, 无法向高维推广(3) 这样的解释都局限在欧式空间中, 而行列式与内积无关我们可以循序渐进地先来考虑一下 (1)(2) 要如何解决, 暂时先不管 (3). 如果想要让行列式的定义和它在欧氏空间中的几何意义联结地更加清楚明暸, 应该怎样做?首先考虑二阶行列式. 设欧氏空间中有向量 \(\mathbf{v} = (a,b)\), \(\mathbf{w} = (c,d)\), 问 \(\mathbf{v}\) 和 \(\mathbf{w}\) 所张成的平行四边形的面积有多大? 是否等于行列式 \(\mathrm{det}(\mathbf{v},\mathbf{w})\) 的值?李尚志《线性代数》给出了这样一种做法:把 \(\mathbf{v}\) 和 \(\mathbf{w}\) 的起点都移到平面上某个点 \(A\) 上, 设它们的终点分别为 \(B, C\). 此时有 \(\overrightarrow{AB}=\mathbf{v}=(a,b)\), \(\overrightarrow{AC}=\mathbf{w}=(c,d)\).将 \(\overrightarrow{AB}\) 逆时针旋转 \(90^{\circ}\), 得到 \(\overrightarrow{AB'}=(-b,a)\).于是有\[              \begin{aligned}              & 两个向量所张平行四边形的面积 \\              =\; & 底AB \times 底AB上的高 \\              =\; & |AB| \times AC在AB'上的投影 \\              =\; & |AB'| \times AC在AB'上的投影 \\              =\; & |\overrightarrow{AB'} \cdot \overrightarrow{AC}| \\              =\; & |(-b,a) \cdot (c, d)| \\              =\; & |-bc+ad| \\              =\; & |ad-bc|              \end{aligned}\]可见, 所求面积与行列式的绝对值相等.上面这个做法给我们一个提示: 在欧氏空间中, 可利用内积来构建行列式.两个向量张成的一个平行四边形的体积, 可以通过最基本的体积公式 \(底 \times 高\) 来求出. 具体的操作是, 先取出一个向量作为(斜)高, 剩下的向量作为底. 构造出一个与底垂直的向量, 它的长正好与底边的长相等, 再用它去同斜高做内积, 就得到了面积.顺着这个思路继续思考, 假如维数要上升, 怎么办? 现在换成了三个向量张成的一个平行六面体, 要求它的体积, 怎么做?我们也先取一个向量做为斜高, 剩下的向量作为底. 类比一下就知道, 现在需要构造一个与底面垂直的向量, 并且它的长正好等于底面积. 拿这个向量同斜高做内积就可以得到体积. 于是很自然地想到, 这个需要构造的向量, 正是底边两个向量的外积(叉积). 这样算得的体积应该会等于这三个向量拼成的三阶行列式的绝对值. 计算过程这里就不细说了.三维的问题解决了. 顺着这个思路, 能不能把任意维数都解决呢? 假使现在有 \(N\) 个 \(N\) 维向量张成了一个平行???面体, 要求它的 \(N\) 维体积, 怎么做? 如果按照之前的思路, 取高再取底的话, 那么怎样构造一个向量, 使之垂直于给定的 \(N-1\) 个向量, 大小又要等于这 \(N-1\) 个向量张成的 \(N-1\) 维体积? 换句话说就是要怎样推广外积, 把外积的定义扩展到一般的 \(N\) 维欧氏空间中? 如果成功的话, 我们就能用 \(N-1\) 维体积定义 \(N\) 维体积, 即用 \(N-1\) 阶行列式定义 \(N\) 阶行列式. 如果你真的去这样尝试了, 就会发现这个定义其实和 Laplace 展开完全是一回事.然而, 推广外积并非那么容易, 即便费九牛二虎之力推广成功了, 得到的结果也只能局限在欧氏空间中, 所以并不是很划算.现在我们来转换一下思路, 从欧氏空间的小圈子里跳出来, 考虑一下一般的向量空间. 如果我们能在一般的空间中解决问题 (1), 问题 (2)(3) 也就被自然地解决了.那么要解决问题 (1), 另一个新问题马上迎面而来: 一般的向量空间中的体积到底是什么东西? 没有几何背景, 如何讨论体积?其实并不是非要有几何背景才能讨论体积. 如果某个抽象的东西能够满足体积应有的一切性质, 我们也可以把它称为体积. 于是我们接下来要做的就是, 找到体积应该满足的性质, 然后证明行列式满足这些性质, 并且满足这些性质的概念也只有行列式.我们把 \(N\) 维向量空间中的 \(N\) 个向量 \(\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n\) 所张成 \(N\) 维形体的 \(N\) 维有向体积记作 \(\mathrm{vol}(\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_N)\), 并把 \(\mathrm{vol}\) 这个函数称为体积函数. 如果这个函数名副其实的话, 它必须满足以下性质:(1) \(\mathrm{vol}(\cdots, k \mathbf{v}_i,\cdots) = k\;\cdot\mathrm{vol}(\cdots, \mathbf{v}_i,\cdots)\)(2) \(\mathrm{vol}(\cdots, \mathbf{v}_i+\mathbf{u}, \cdots) = \mathrm{vol}(\cdots, \mathbf{v}_i,\cdots) + \mathrm{vol}(\cdots, \mathbf{u},\cdots)\)(3) 若 \(i \neq j\), \(\mathbf{v}_i=\mathbf{v}_j\), 则必有 \(\mathrm{vol}(\cdots, \mathbf{v}_i, \cdots, \mathbf{v}_j,\cdots) = 0\)解释:(1) 在这 \(N\) 个向量中, 任何一个向量都可做斜高(同时让其余向量做底). 把斜高伸展 \(k\) 倍, 体积必伸展 \(k\) 倍, 否则就很难把这个函数称为体积函数. 此时 \(k\) 可以是任意标量, 它不一定是正数, 因为在一般的域中没办法定义什么是正数. 同理, 体积也不一定是正数, 于是在实数域上这里所定义的体积就变成了有向体积.(2) 在这 \(N\) 个向量中, 任何一个向量都可做斜高(同时让其余向量做底). 我们知道, 面积等于高乘以底, 其中高是斜高在某个方向的投影, 并且投影是可加的, 即两个向量之和的投影等于两个向量的投影之和. 设向量 \(\mathbf{x}\) 在高上的投影为 \(\mathrm{p}(\mathbf{x})\), 则有:\[                    \begin{aligned}                    & \mathrm{vol}(\cdots, \mathbf{v}_i+\mathbf{u}, \cdots) \\                    =\; & \mathrm{p}(\mathbf{v}_i+\mathbf{u}) \times 底 \\                    =\; & \left ( \mathrm{p}(\mathbf{v}_i) + \mathrm{p}(\mathbf{u}) \right ) \times 底 \\                    =\; & \mathrm{p}(\mathbf{v}_i) \times 底 + \mathrm{p}(\mathbf{u}) \times 底 \\                    =\; & \mathrm{vol}(\cdots, \mathbf{v}_i,\cdots) + \mathrm{vol}(\cdots, \mathbf{u}, \cdots)                    \end{aligned}\]简单地说就是「高相加则体积相加」. 如果这条性质不成立, 也是很难把这个函数称为体积函数的.(3) 如果这 \(N\) 个向量中有两个向量是相等的, 那么这 \(N\) 个向量就线性相关了, 它们最多张成一个 \(N-1\) 维形体, 而绝不可能张成一个 \(N\) 维形体. 因此, 它们所张成的形体的 \(N\) 维体积必然为零, 就好比点和线段都没有面积, 平面图形没有(3维)体积一样. 否则, 体积函数就名不副实了.此外, 从以上三条性质还可推出另一条关键性质:\[            \forall\;i,j,\; \mathrm{vol}(\cdots, \mathbf{v}_i, \cdots, \mathbf{v}_j, \cdots) + \mathrm{vol}(\cdots, \mathbf{v}_j, \cdots, \mathbf{v}_i, \cdots) = 0\]即: 交换两个向量的位置得到的新体积是原体积的相反数(加法负元). 这是不是跟行列式很接近了? 我们来看看这个性质为何会成立:\[            \begin{aligned}            & \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) \\            =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + 0 \\            & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) + 0 \\            =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) \\            & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) \\            =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}+{\color{{Red}}\mathbf{{v}}_i}, \cdots) \\            & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}+{\color{{Blue}}\mathbf{{v}}_j}, \cdots) \\            =\;& \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}+{\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}+{\color{{Red}}\mathbf{{v}}_i}, \cdots) \\            =\;& 0            \end{aligned}\]可以看出, 这条性质是性质 (2) 和性质 (3) 的一个推论. 现在我们就来证明, 行列式是唯一一个满足上述所有性质的函数. 怎么证明呢? 其实我们可以通过上述性质, 直接写出体积函数的具体表达式. 如此一来体积函数当然也就唯一确定了.简单起见我们先从2维向量空间入手. 设二维向量空间有一组基底 \((\mathbf{x}, \mathbf{y})\), 那么这个向量空间中的任何向量都可以写成 \(\mathbf{x}\) 和 \(\mathbf{y}\) 的线性组合. 因为讨论体积总要有个单位, 我们这里就假定 \(\mathrm{vol}(\mathbf{x}, \mathbf{y}) = 1\). 设\[            \begin{aligned}            \mathbf{v} &= (a,b) = a \mathbf{x} + b \mathbf{y} \\            \mathbf{w} &= (c,d) = c \mathbf{x} + d \mathbf{y}            \end{aligned}\]则有\[            \begin{aligned}            & \mathrm{vol}(\mathbf{v},\mathbf{w}) \\            =\;& \mathrm{vol}(a \mathbf{x} + b \mathbf{y}, c \mathbf{x} + d \mathbf{y}) \\            =\;& \mathrm{vol}(a \mathbf{x}, c \mathbf{x} + d \mathbf{y}) + \mathrm{vol}(b \mathbf{y}, c \mathbf{x} + d \mathbf{y}) \\            =\;& \mathrm{vol}(a \mathbf{x}, d \mathbf{y}) + \mathrm{vol}(b \mathbf{y}, c \mathbf{x}) \\            =\;& ad\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) + bc\cdot\mathrm{vol}(\mathbf{y}, \mathbf{x}) \\            =\;& ad\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) - bc\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) \\            =\;& (ad-bc)\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) \\            =\;& ad-bc            \end{aligned}\]即\[            \mathrm{vol}\left(            \begin{bmatrix}a\\b\end{bmatrix},            \begin{bmatrix}c\\d\end{bmatrix}            \right)            = \begin{vmatrix}            a & c\\             b & d            \end{vmatrix}\]其实无非就是把体积函数根据性质 (1)(2) 展开, 然后再根据交换变号的性质, 把逆序的 \(\mathrm{vol}(\mathbf{y}, \mathbf{x})\) 转换成了自然顺序的 \(\mathrm{vol}(\mathbf{x}, \mathbf{y})\)(已知), 从而求出结果.再看一般的3维向量空间. 设三维向量空间中有基底 \((\mathbf{x},\mathbf{y},\mathbf{z})\), 并且 \(\mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})=1\). 设有向量\[            \begin{aligned}            \mathbf{u} &= (a,b,c) = a \mathbf{x} + b \mathbf{y} + c \mathbf{z} \\            \mathbf{v} &= (d,e,f) = d \mathbf{x} + e \mathbf{y} + f \mathbf{z} \\            \mathbf{w} &= (g,h,i) = g \mathbf{x} + h \mathbf{y} + i \mathbf{z}            \end{aligned}\]则有\[            \begin{aligned}            & \mathrm{vol}(\mathbf{u},\mathbf{v},\mathbf{w}) \\            =\;& \mathrm{vol}(a\mathbf{x}+b\mathbf{y}+c\mathbf{z},d\mathbf{x}+e\mathbf{y}+f\mathbf{z},g\mathbf{x}+h\mathbf{y}+i\mathbf{z}) \\            =\;& + \mathrm{vol}(a\mathbf{x},e\mathbf{y}+f\mathbf{z},h\mathbf{y}+i\mathbf{z}) \\            & + \mathrm{vol}(b\mathbf{y},d\mathbf{x}+f\mathbf{z},g\mathbf{x}+i\mathbf{z}) \\            & + \mathrm{vol}(c\mathbf{z},d\mathbf{x}+e\mathbf{y},g\mathbf{x}+h\mathbf{y}) \\            =\;& + a\cdot\mathrm{vol}(\mathbf{x},e\mathbf{y}+f\mathbf{z},h\mathbf{y}+i\mathbf{z}) \\            & + b\cdot\mathrm{vol}(\mathbf{y},d\mathbf{x}+f\mathbf{z},g\mathbf{x}+i\mathbf{z}) \\            & + c\cdot\mathrm{vol}(\mathbf{z},d\mathbf{x}+e\mathbf{y},g\mathbf{x}+h\mathbf{y}) \\            =\;& + a \cdot (            \mathrm{vol}(\mathbf{x},e\mathbf{y},i\mathbf{z})            + \mathrm{vol}(\mathbf{x},f\mathbf{z},h\mathbf{y})            ) \\            & + b \cdot (            \mathrm{vol}(\mathbf{y},d\mathbf{x}+i\mathbf{z})            + \mathrm{vol}(\mathbf{y},f\mathbf{z},g\mathbf{x})            ) \\            & + c \cdot (            \mathrm{vol}(\mathbf{z},d\mathbf{x},h\mathbf{y})            + \mathrm{vol}(\mathbf{z},e\mathbf{y},g\mathbf{x})            ) \\            =\;& + a \cdot (            ei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            + fh \cdot \mathrm{vol}(\mathbf{x},\mathbf{z},\mathbf{y})            ) \\            & + b \cdot (            di \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})            + fg \cdot \mathrm{vol}(\mathbf{y},\mathbf{z},\mathbf{x})            ) \\            & + c \cdot (            dh \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})            + eg \cdot \mathrm{vol}(\mathbf{z},\mathbf{y},\mathbf{x})            ) \\            =\;& + a \cdot (            ei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            - fh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            ) \\            & + b \cdot (            di \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})            - fg \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})            ) \\            & + c \cdot (            dh \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})            - eg \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})            ) \\            =\;&            + aei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            - afh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            \\            &             - bdi \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            + bfg \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            \\            &            + cdh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            - ceg \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})            \\            =\;&            + aei - afh            \\            &             - bdi + bfg            \\            &            + cdh - ceg            \\            \end{aligned}\]即\[            \mathrm{vol}\left(            \begin{bmatrix} a\\b\\c \end{bmatrix},            \begin{bmatrix} d\\e\\f \end{bmatrix},            \begin{bmatrix} g\\h\\i \end{bmatrix}            \right)            =            \begin{vmatrix}            a & d & g \\             b & e & h \\             c & f & i            \end{vmatrix}\]三维的情况复杂了许多, 但规律是可以掌握的. 展开体积函数之后我们得到了 \(\mathrm{vol}(?,?,?)\) 的线性组合, 其中 \(?,?,?\) 是基向量 \(\mathbf{x},\mathbf{y},\mathbf{z}\) 的各种全排列. 自然顺序的 \(\mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})\) 是已知的, 所以要求值就只需要把每个排列通过一步一步的元素交换排回自然顺序就可以了. 如果所需的交换次数是奇数, 这一个排列所在那一项就会变号, 那一项最终的值是 \(-1\); 如果所需的交换次数是偶数次, 那么就不会变号, 那一项最终的值是 \(1\). 最终的结果就是这些 \(-1\) 和 \(1\) 的线性组合.有了2维和3维空间中的体积, \(n\) 维空间中体积的定义也就呼之欲出了:\[            \mathrm{vol}(\mathbf{v}_1,\cdots,\mathbf{v}_n)            =            \left (            \sum_{i=1}^{n!} \mathrm{sgn}(\sigma_i)\prod_{j=1}^{n} \left ( \mathbf{v}_{j} \right )_{\sigma_i(j)}            \right) \cdot            \mathrm{vol}(\mathbf{e}_1,\cdots,\mathbf{e}_n)\]其中(1) \(\sigma_i\) 是指 \(1,2,3,\cdots,n\) 的第 \(i\) 种排列(一共有 \(n!\) 种排列)(2) \(\mathrm{sgn}(\sigma_i)\) 取值 \(\pm 1\), 把 \(\sigma_i\) 调换回自然顺序时, 若需要奇数次元素交换, 则取值 \(-1\), 否则取值 \(+1\)(3) \(\sigma_i(j)\) 是指在第 \(i\) 个排列中处在第 \(j\) 个位置上的数(4) \((\mathbf{v}_j)_{\sigma_i(j)}\) 是指 \(\mathbf{v}_j\) 在基底 \((\mathbf{e}_1,\cdots,\mathbf{e}_n)\) 下的第 \(\sigma_i(j)\) 个座标如果设 \(\mathrm{vol}(\mathbf{e}_1,\cdots,\mathbf{e}_n)=1\), 那么就可以求出具体值\[            \mathrm{vol}(\mathbf{v}_1,\cdots,\mathbf{v}_n)            =            \sum_{i=1}^{n!} \mathrm{sgn}(\sigma_i)\prod_{j=1}^{n} \left ( \mathbf{v}_{j} \right )_{\sigma_i(j)}\]可以看到, 这个定义同教科书上对 \(n\) 阶行列式的定义是全完一致的, 只是有一个细节要说明一下. 教科书上一般会用逆序对的个数的奇偶性来定义排列 \(\sigma_i\) 的符号 \(\mathrm{sgn}(\sigma_i)\), 这个定义和本文中的定义是等价的, 详情可参考维基百科 Parity_of_a_permutation#Proof_4, 此处不再赘述. 总之, 排列的符号、系数的排列组合, 这些在行列式的定义中出现的东西并非空穴来风, 它们都可以从体积应该满足的几何性质中推导出来, 没什么好奇怪的.



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有