为了简便起见,这里的椭球指的是椭球面,如果还要包含椭球内部,则将等于号改为小于等于即可。
标准椭球方程的几何意义
考虑一个二维平面 上的椭球方程(此时就是一个椭圆方程)是 其在坐标轴 上的半轴分别是 。事实上,椭圆(椭球)可以被看作是一个单位圆(单位球)在坐标轴上进行伸缩后得到的几何图形:假设我们对坐标单位进行拉伸, 坐标轴上的单位长度从 分别改成 ,由此形成一个新的矩形坐标系,新坐标系的坐标 在原坐标系的坐标是 ,于是,上面的椭圆方程实际上就是新坐标系中的一个单位圆。
对于 空间中的一个标准直角坐标系的椭球 同样可以视作是一个新坐标系下的单位球,这个坐标系是将原标准直角坐标系的三个坐标轴的单位长度从 分别改成 而得到的。
现在我们给出一个 空间中在标准直角坐标系的一个标准椭球的方程,其在 坐标轴方向的半轴长是 : 若记对角矩阵 和坐标向量 分别是 则上面的标准椭球方程是 但是该椭球方程仅仅表示中心点在原点、伸缩方向沿标准直角坐标系的坐标轴的椭球,要表示一个任意的椭球,需要使用坐标系的变换 。
正交矩阵和坐标系旋转
考虑 的标准单位正交基 ,现在将这个坐标系按原点进行任意旋转,得到一个新的坐标系 。设原来的单位正交向量 经旋转变为 ,则可以得到新坐标系的单位标准正交基 。我们可以用 将 表示出来 或者使用矩阵形式写出 也即 设空间中任意一个点 ,它在 和 这两个坐标系中的坐标分别是 和 ,因为无论如何选取坐标系,点在空间的位置是不会发生变化的,于是就应该有 因为 且 是可逆矩阵,因此有 如果将矩阵 写成列向量形式 ,则有 。因为 彼此单位正交,这就意味着 则 即 是可逆矩阵,且 ,可见 是正交矩阵(同样 也是正交矩阵)。于是我们有 这个等式的意义是,将一个标准直角坐标系绕原点任意旋转后,坐标从 变为 ,两个坐标之间的关系。如果将标准直角坐标系任意旋转,得到两个坐标系,对应的正交矩阵是 ,则在标准直角坐标系下坐标为 的点在两个坐标系的下的坐标分别是 ,应当满足关系 消去 ,就有 易证明,两个正交矩阵的乘积仍然是正交矩阵,于是我们得出结论:空间中任意单位正交坐标系绕原点旋转后形成新的坐标系,同一个点在两个坐标系下的坐标可以使用一个正交矩阵来联系。
任意椭球的矩阵方程
我们讨论的椭球方程是以标准直角坐标系为参考系的。 维空间中的任意椭球可以通过如下步骤得到:
在标准直角坐标系中构造一个中心点在原点的 维单位超球
将该超球在各个坐标轴方向进行伸缩,得到一个正规的椭球
将该椭球绕原点进行旋转,使得它与给定的椭球方向一致
将该椭球平移至给定椭球的位置
正规椭球的矩阵方程已知是 现在将该椭球绕原点进行旋转,但是这等价于将坐标系绕原点旋转,然后在新坐标系中构造出一个正规椭球,设新坐标系中椭球的坐标为 ,于是该新坐标系中的正规椭球方程是 现在,根据上一节的结论,我们知道如果该旋转后的椭球在原坐标系下的坐标为 ,那么存在一个正交矩阵 使得 ,于是旋转后的椭球在原坐标系下的方程是 现在假设所求椭球的中心坐标是 ,我们只需要将椭球平移至该中心点即可,于是我们得到了任意椭球的方程 我们现在来关注核心的矩阵 其中 是正交矩阵,根据上一节和本节的推导,我们知道 的列向量代表了旋转后椭圆的各个伸缩方向的单位矢量,而 ,显然 是 的特征值,从而 就是对应方向的伸缩系数。
首先,易得 是一个对称矩阵: 。
此外,若 是正交矩阵 的第i个列向量, 是对角阵 的第 行 列元素(因此也是第 个特征值),我们断言: 是 关于特征向量 的特征值。为了证明这一点,我们有
因为 其中 是Kronecker符号。因此 此处 表示矩阵 的第 个列向量,但显然根据定义 的第 个列向量为 ,从而 ,由此可知 从而命题可证。
现在,我们已经知道对角矩阵 的对角线元素就是 的特征值,但是显然特征值都是正值,因此 是一个正定矩阵,又因为 还是对称是,因此 是一个对称正定矩阵。如果我们规定 是一个实对称正定矩阵,那么在线性代数中有如下定理:
实对称正定矩阵一定可以相似对角化。
换句话说,给定一个 阶实对称正定矩阵 ,方程 就对应 维欧几里得空间中的一个椭球。我们对 一定可以相似对角化,于是得到 个单位正交特征向量,向量代表了椭球伸缩的方向,而对应的特征值的平方根倒数就是该方向的伸缩系数。而给定一个椭球,我们也可以按照上面的构造方法构造出一个实对称正定矩阵 。因此我们得到了椭球方程的矩阵形式。
当 时,此时椭球退化为一个球。
考虑一个例子,我们希望求得一个椭圆,其中心位于 点,半长轴为 ,半短轴为 ,长轴沿 角的方向,从而短轴沿着 的方向,现在想求得该椭圆的方程。我们选取长轴和短轴方向的单位向量 以及 ,显然它们彼此正交;在这两个方向上的缩放系数分别是 ,于是可以构造矩阵 于是就有 所以该椭圆的方程是 拆解开就是![\begin{split}&\left(\frac{\cos^2\theta}{a^2}+\frac{\sin^2\theta}{b^2}\right)(x-x_c)^2+\left(\frac{\sin^2\theta}{a^2}+\frac{\cos^2\theta}{b^2}\right)(y-y_c)^2+\\\cdots&\;\;2\left(\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}\right)(x-x_c)(y-y_c)=1\end{split}](https://math.jianshu.com/math?formula=%5Cbegin%7Bsplit%7D%26%5Cleft(%5Cfrac%7B%5Ccos%5E2%5Ctheta%7D%7Ba%5E2%7D%2B%5Cfrac%7B%5Csin%5E2%5Ctheta%7D%7Bb%5E2%7D%5Cright)(x-x_c)%5E2%2B%5Cleft(%5Cfrac%7B%5Csin%5E2%5Ctheta%7D%7Ba%5E2%7D%2B%5Cfrac%7B%5Ccos%5E2%5Ctheta%7D%7Bb%5E2%7D%5Cright)(y-y_c)%5E2%2B%5C%5C%5Ccdots%26%5C%3B%5C%3B2%5Cleft(%5Cfrac%7B%5Csin%5Ctheta%5Ccos%5Ctheta%7D%7Ba%5E2%7D-%5Cfrac%7B%5Csin%5Ctheta%5Ccos%5Ctheta%7D%7Bb%5E2%7D%5Cright)(x-x_c)(y-y_c)%3D1%5Cend%7Bsplit%7D)
椭球是一个凸集
如果 是一个实对称正定矩阵,那么可以对角化分解为 ,其中 的正交矩阵( ),其列向量是 的特征向量,而 则是由对应特征值组成的对角矩阵 。因为是正定矩阵,因此对角阵的对角线元素必然是正值。于是我们可以定义 的开方为 其中 。这样的定义是合理的,因为
此外定义 其中 容易验证 我们已经知道 空间中的任意椭球的方程是 现在将其进行变换 其中 进一步得到 我们现在来看,集合 表示一个单位球,定义映射 我们有 因此,给定一个这样的映射 ,它可以将一个圆心在原点的单位球唯一映射为一个椭球。因为 是一个凸集,如果 是一个仿射映射,那么根据凸优化理论, 的象 也是一个凸集。
一个映射 是一个仿射映射,如果可以写为 ,其中 是一个常量,而 是一个线性函数(即 )。显然 是一个仿射函数,因此椭球 就是一个凸集。
椭球矩阵正定性和椭圆包含关系
椭球球心在原点的一个任意椭球的方程已知是 ,其中 ,表示 是一个 阶对称正定矩阵。设椭球 和椭球 ( ),我们断言:
其中 表示所有对称半正定矩阵的集合,它是一个半正定锥。
我们的证明通过如下过程
我们首先来看 :其中 是显然成立的。为了证明 ,也就证明:如果 能推出 ,那么就有 ,我们使用反证法,假设存在一个 ,满足 ,注意到 是对称正定矩阵,即二次型是一个正实数,即 ,于是我们就有 ,但是,因为 的逆否命题是 ,这就意味着 ,进而有 ,这显然是不可能的,所以这样的 是不存在的,命题可证。
我们接下来说明 。我们依次证明下面的命题:
如果 是对称可逆矩阵,那么 也是对称可逆矩阵: 从而
如果 是对称(半)正定/(半)负定矩阵,那么 也是对称(半)正定/(半)负定矩阵。这是因为 :
称 合同,如果存在可逆矩阵 使得 。我们说,合同变换不改变矩阵的(半)正定/(半)负定性。这是因为 :
两个(半)正定矩阵(或两个(半)负定矩阵)的和仍然是(半)正定矩阵(或(半)负定矩阵),其证明是显然的。
一般的,我们有 由于 都是对称正定矩阵,从而 也是对称正定矩阵, 是对称矩阵,于是 如果 是半正定矩阵,那么 两个矩阵合同,故而 是半正定矩阵;此外, 是可逆矩阵,因此 合同,从而 正定。于是可得 是半正定的。同理,如果 半正定,那么 也半正定。
|