内积空间上线性算子的分解 您所在的位置:网站首页 qr分解的唯一性 内积空间上线性算子的分解

内积空间上线性算子的分解

2023-04-10 07:18| 来源: 网络整理| 查看: 265

本文希望总结和回顾学习过程中遇到的各种算子的各种形式的分解,主要针对内积空间。

这里“分解”包含两层意思:

一是算子本身的分解。或者对应矩阵的分解。

二是算子在某组标准正交基下的规范形式。这可视为对应矩阵的分解,或者对空间本身的分解。

本文很多结果只是给出证明思路或关键,错误、疏漏,还请指出。

回忆:内积空间即欧氏空间和埃氏空间的合称。我们还将双线性型和半双线性型统一称为 \theta 线性型,并由内积给出线性算子 \mathcal A 和其的联系: f_{\mathcal A}:V\times V \to \mathfrak R(\mathbb {R、C}),(x,y)\to(\mathcal Ax|y) 有时也记 f 对应的算子\mathcal A 为 \mathcal A_f 算子在某组标准正交基下的矩阵一般算子

实内积空间上,

T\in\mathcal L(V)\iff V 中有标准正交基,使得 T 关于此基有形式 \begin{pmatrix} A_1&&*\\ &\ddots\\ &&A_n \end{pmatrix}

其中每个 A_i 都是 1\times1 或者 2\times2 的矩阵。

复内积空间上,

T\in\mathcal L(V)\iff (关于某组标准正交基有)分块对角矩阵 \begin{pmatrix} A_1\\ &\ddots\\ &&A_m \end{pmatrix}

其中 A_j=\begin{pmatrix} \lambda_j&&*\\ &\ddots\\ &&\lambda_j \end{pmatrix} , \lambda_j 为 T 特征值。

(在不引起歧义的情况下,这样的写法更简洁)

\blacktriangle 舒尔定理(1909年): T 是有限维复空间上的线性算子,则它关于 V 的某个规范正交基有上三角矩阵。令 A(\lambda,T)=\ker(T-\lambda I)^{\dim V} ,若 \lambda_1,\cdots,\lambda_m 是复向量空间上算子 T 的所有不同特征值,则: V=A(\lambda_1,T)\oplus\cdots\oplus A(\lambda_m,T)=\displaystyle\bigoplus_{i=1}^mA(\lambda_i,T) 每个 A(\lambda_i,T) 都是 T 下的不变子空间, T 限制在其上都是幂零的。我们也把 \dim A(\lambda,T) 称为 \lambda 的代数重数(algebraic multiplicity),而 \dim \ker(T-\lambda I) 称为其几何重数(geometric multiplicity)正规算子

实内积空间上,

T\in\mathcal L(V) 正规 \iff 分块对角矩阵:对角块为 (a) 或者 \begin{pmatrix} a&-b\\ b&a \end{pmatrix} ( b>0 )

复内积空间上,

T\in\mathcal L(V) 正规 \iff 对角矩阵

(1) T 正规 \iff T^*T=TT^* \iff||Tv||=||T^*v|| 注意到 TT^*-T^*T 是自伴的,我们能做什么?(2)若 T 正规,则若 v_{\lambda} 是 T 的特征向量,则它也是 T^* 的特征向量 v_{\bar \lambda} 考虑利用(1)。由此也可说明正规算子 T 关于不同特征值的特征向量正交。

注意下文提到的保距算子、自伴算子都是正规算子。

自伴算子(埃尔米特算子)

实内积空间上,

T\in\mathcal L(V) 自伴(对称线性算子) \iff 对角矩阵

还可得到是正交相似,参考笔记(学习丘维声《高等代数上》时所写):

复内积空间上,

T\in\mathcal L(V) 自伴(Herimitian算子) \iff 实对角矩阵

可统一写为:

内积空间上,自伴算子 \iff 实对角矩阵

\blacktriangle 自伴算子的每个特征值都是实的。考虑 \lambda||v_{\lambda}||^2===\overline\lambda ||v_{\lambda}||^2 \blacktriangle 复内积空间上 T 自伴 \iff对于任意 v\in V,\in\mathbb R 利用一般的结果: -\overline{}= \blacktriangle 若 T 自伴且对任意 v\in V,=0 ,则 T=0 考虑利用一般的等式: 4=- 在复内积空间上,这一结果对一般的算子都成立。保距算子

实内积空间(欧氏空间)上,

T\in\mathcal L(V) 保距(正交算子) \iff \small\begin{pmatrix} \cos \varphi_1&\sin \varphi_1\\ -\sin\varphi_1&\cos\varphi_1\\ &&\cos \varphi_2&\sin \varphi_2\\ &&-\sin\varphi_2&\cos\varphi_2\\ &&&&\ddots\\ &&&&&-I_k\\ &&&&&&I_l \end{pmatrix}

复内积空间(埃氏空间)上,

T\in\mathcal L(V) 保距(酉算子) \iff \small\begin{pmatrix} {\rm e}^{{\rm i}\varphi_1}\\ &\ddots\\ &&{\rm e}^{{\rm i}\varphi_n} \end{pmatrix}

经典结论——谱定理

关于 V 上的某个规范正交基具有对角矩阵的算子是 V 上性质最好的算子。而我们也看到,这恰好是 T\in \mathcal L(V) : V 有由 T 的特征向量构成的规范正交基。

谱分解定理(Spectral Theorem)研究了在实、复内积空间上的具有上述性质的算子,并得到如下很好的结果。作为补充,还介绍了可对角化算子的谱定理。

复谱定理

设 V 为复内积空间, T\in \mathcal L(V) ,则 V 有一个由 T 的本征向量构成的规范正交基 \iff T 是正规的。

利用舒尔定理知其有上三角矩阵,再结合 ||Te_i||=||T^*e_i|| 看看能得到什么?实谱定理

设 V 为实内积空间, T\in \mathcal L(V) ,则 V 有一个由 T 的本征向量构成的规范正交基 \iff T 是自伴的。

证明主要依照两个引理(对实、复内积空间都成立): \blacktriangle 若 T 自伴,则 T 有特征值。考虑(实内积空间) \dim V=n , v\in V , v,Tv,\cdots,T^nv 一定线性相关,则可分解为:0=\sum_{i=0}^na_iT^iv\\ \,\,\,=c(T^2+b_1T+c_1)\cdots(T^2+b_MT+c_M)(T-\lambda_1I)\cdots(T-\lambda_mI)v 注意其中系数都是实数,再根据 T^2+b_iT+c_i 可逆(为什么?),则可得其中必定有个 T-\lambda_jI=0 \blacktriangle 若 T 正规, U 是 T 在 V 中的不变子空间,则:(a) U^{\bot} 在 T 下不变(b) U 在 T^* 下不变(c) (T|_U)^*=T^*|_U (d) T|_U、T|_{U^{\bot}} 都是正规的可对角化算子的谱定理

设 T\in\mathcal L(V,\mathbb K) 上的线性算子,有互不相同的特征值 \lambda_1,\cdots,\lambda_r ,则存在相互正交的投影算子 \mathcal {P_1,\cdots,P_r} 使得:

(1) \displaystyle \sum_i\mathcal P_i=\mathcal E

(2) \displaystyle \sum_i \lambda_i\mathcal P_i=T 是其谱分解式,具有唯一性。

(3)存在 \mathbb K 上的多项式 f_1,\cdots,f_r 使得: f_i(\lambda_j)=\delta_{ij},f_i(T)=\mathcal P_i

\blacktriangle 证明:考虑 V=V^{\lambda_1}\oplus \cdots\oplus V^{\lambda_r} ,做投影算子,其中 V^{\lambda}=\{x\in V | Ax=\lambda x\} 。(3)中的多项式可以清晰地给出:f_i(t)=\displaystyle\prod_{j\ne i}\frac {t-\lambda_i}{\lambda_i-\lambda_j}\\很显然的是,诸 \mathcal P_i 满足 \mathcal P_i^2=\mathcal P_i 且 \mathcal {P_iP_j}=0 其实,算子 \mathcal P 为投影算子 \iff \mathcal P^2=\mathcal P \blacktriangle 下面给一个可对角化算子的充要条件: \varphi 可对角化 \iff 其极小多项式 \chi_{\varphi}(x) 没有重根半正算子回忆:正定算子——内积空间上的自伴算子 \mathcal A ,满足 f_{\mathcal A} 正定。

T\in\mathcal L(V) 是半正算子

\iff T 是自伴的且所有特征值非负

\iff T 有半正的平方根

\iff T 有自伴的平方根

\iff 有 R\in\mathcal L(V) 使得 T=R^*R

类比“非负数”,每一个半正算子都有唯一的半正平方根。尽管本身可能有无数个平方根。 \blacktriangle 另注:每个复数都是有平方根的,但每个复向量空间上的算子不一定,比如 T(z_1,z_2,z_3)=(z_2,z_3,0) .哪些算子具备这一性质?我们给出两个充分条件:(1)若 N\in\mathcal L(\mathfrak R) 是幂零的,则 (I+N) 有平方根。tips:猜测其具有 I+a_1N+\cdots+a_{m-1}N^{m-1} 形式的平方根,然后选取系数即可。(2) \mathbb C 上的可逆算子都有平方根。tips:利用上述结果, T|_{A(\lambda_i,T)}=\lambda_i(I+\frac {N_i}{\lambda_i}) 有平方根,再利用其无关性和可分解性,就可得到 T 的平方根。极化分解(Polar Decomposition)

若T\in \mathcal L(V),则有保距算子 S\in \mathcal L(V) 使得:

T=S\sqrt{T^*T}

这就是说: V 上的所有算子都可分解为一个保距算子和一个半正算子的乘积,这和 z=|z|\rm{e}^{i\varphi} 有异曲同工之妙。另外,只有 T 为非退化时, S 才是唯一的。奇异值分解(Singular Value Decomposition

T 的奇异值就是指 \sqrt{T^*T} 的特征值。

这也可得出:T 的奇异值就是 T^*T 的特征值的非负平方根,且每个特征值 \lambda 重复 \dim A(\lambda,T^*T) 次

奇异值分解:

(1) T\in \mathcal L(V) 有奇异值 s_1,\cdots,s_n ,则有 V 的两组规范正交基 \{e_i\}、\{f_i\} 使得对于 \forall v\in V :

Tv=\displaystyle\sum_{i=1}^ns_if_i

考虑利用极化分解,有: Tv=\displaystyle\sum_{i=1}^ns_i\mathcal Se_i

(2)矩阵 A 是 m\times n 阶矩阵,则有酉矩阵 U_m、V_n 使得: A=U\Sigma V^* ,其中 \Sigma 为 m\times n 阶矩阵,主对角线上元素为其奇异值,其余元素为0。

注意到 \ A^*A=V\Sigma ^2V^*

奇异值分解定理让我们可以考虑同一算子在两组规范正交基形式。也说明,只要允许我们使用两组基来处理算子,则每一个算子都有对角矩阵的形式。

它也显然是特征值的推广,类似方阵逆到矩阵广义逆的推广。

下面是值得一看的文章:

gwave:奇异值与特征值辨析

漫漫成长:奇异值分解(SVD)

Iterator:奇异值分解(SVD)的定义、证明、求法(矩阵分解——3. 奇异值分解(SVD))

Jordan标准型基本概念

约当块: \small J_n(\lambda)=\begin{pmatrix} \lambda&1&0&\cdots&0\\ &\lambda&1&\cdots&0\\ &&\ddots&\ddots&\vdots\\ &&&\lambda&1\\ &&&&\lambda \end{pmatrix}

若 \mathcal X _{\varphi}(x) =(x-\lambda)^n ,则 v,(\varphi-\lambda)v,\cdots,(\varphi-\lambda)^{n-1}v 线性无关, v 保证 (\varphi-\lambda)^{n-1}v\ne0 即可(为什么?),则 \varphi 在该基下的矩阵即为 J_n(\lambda)

约当矩阵: \small \begin{pmatrix} J_{m_1}(\lambda_1)&&&&\\ &J_{m_2}(\lambda_2)&&&\\ &&\ddots&&\\ &&&&J_{m_s}(\lambda_s) \end{pmatrix}

每个 (T-\lambda_jI)|_{A(\lambda_j,T)} 都给出一个幂零算子,在限制下,都有某基使得其具有分块对角矩阵,对角线上每个元都是 \tiny\begin{pmatrix} 0&1&&&\\ &0&1&&\\ &&\ddots&\ddots&\\ &&&0&1\\ &&&&0 \end{pmatrix} 形式。

从而有(Camille Jordan,1870):若 T\in\mathcal L_{\mathbb C}( V) ,则存在 T 的一个Jordan基。

有两个在计算中有用的式子:(1) J(T) 中以 \lambda 为特征值的约当块个数为 N(\lambda)=\dim \ker (T-\lambda I) ,即其几何重数。 \lambda 的代数重数为所有以 \lambda 为特征值的约当块的阶数之和。(2) J_k(\lambda) 出现的次数为 N(\lambda,k)=\dim (T-\lambda I )^{k-1}V-2\dim (T-\lambda I )^{k}V+\dim (T-\lambda I )^{k+1}V 诱导出的两个自然分解

1、复数域上的方阵可以分解为两个对称阵的乘积,且可指定其中一个是非退化的。

注意到以下事实即可

2、Jordan—Chevalley分解

若 T\in\mathcal L_{\mathbb C}( V) ,则存在唯一的可对角化算子(也称半单算子) \mathcal S 和幂零算子 \mathcal N 使得:

(1) T=\mathcal {S+N}

(2) \mathcal {SN=NS}

(3) \mathcal {S,N} 都可表示为 T 的多项式

\blacktriangle (1)(2)采用与1相同的思路,分解每个Jordan块: J_n(\lambda)=\lambda I_n+(J_n(\lambda)-\lambda I_n)=S_{\lambda}+N_{\lambda} 则易证: J(T)=S+N,SN=NS \blacktriangle (3)而我们知道如果 \lambda_i 的代数重数 \dim A(\lambda_i,T)=m_i ,则有 (J_i-\lambda_iI)^{m_i}=N_{\lambda_i}^{m_i}=0 ,而 (\lambda-\lambda_1)^{m_1},\cdots,(\lambda-\lambda_s)^{m_s} 两两互素,故由中国剩余定理知有多项式 g(\lambda) 满足: g(\lambda)=h_i(\lambda)(\lambda-\lambda_i)^{m_i}+\lambda_i 则 g(J_i)=S_i \Rightarrow g(J(T))=S,N=J(T)-M 此即(3)对一般的,无非是考虑 P^{-1}TP=J(T) ,对 N,S 同样考虑即可。番外两个可交换的算子

罗列一些结论:

1、 \mathbb C 上可交换的两个算子有共同的特征向量。

2、两个可对角化算子 \mathcal {T、P} ,它们交换 \iff 这两个可对角化算子可同时对角化

归纳法,找到 V 关于 \mathcal T 的特征子空间分解,证明每一个也是 \mathcal P 的不变子空间。这一结果在 \mathbb C 上也可表述为:埃氏空间上的正规算子可被同时对角化 \iff 它们交换

3、 \varphi 在 V 中有不变子空间 U \iff 存在从 V 到 U 的投影算子 \mathcal P 使得 \mathcal {P\varphi=\varphi P}

\Rightarrow 是显然的,另一方向考虑 W=( \mathcal {E- P})V

4、埃氏空间上的正规算子 \mathcal A 若与 \mathcal B 交换,则它也与 \mathcal B^* 交换

由谱定理知: \mathcal A=\sum_{i=1}^n\lambda_i\mathcal P_i、\mathcal A^*=\sum_{i=1}^n\bar\lambda_i\mathcal P_i 再由Lagrange插值式得到多项式 f(\bar\lambda_i)=\lambda_i ,知 f(\mathcal A^*)=\mathcal A ,而 \mathcal A^* 可与 \mathcal B^* 交换,故 \mathcal A 与 \mathcal B^* 交换。

5、两个自伴算子的乘积自伴 \iff 它们交换

一般来说,自伴算子对结合乘法并不封闭。若尔当引入了若尔当代数,规定 \mathcal {A\circ B}=\cfrac 12(\mathcal {AB+BA}) ,它满足结合律,也满足若尔当恒等式: \mathcal {(A^2\circ B)\circ A=A^2\circ (B\circ A)}

6、算子极化分解中的因子 \mathcal {P、Q} 交换 \iff T 正规

7、和 n 阶复方阵 A 可交换的方阵必为 A 的多项式

参考许以超《线性代数与矩阵论》第七章Jordan标准型的应用,定理7.2.8

这篇文章也值得一读:

矩阵的可交换性有什么几何意义吗?

“同时可对角化”

部分结果已在上给出,这里再提一个:

\mathbb C (或 \mathbb R )上两个Hermitian型(对称双线性型) q(x)、r(x) ,若其中有一个正定,则可同时对角化。

不妨设 q(x) 正定, V 被 f_q(x,y)=(x|y) 赋为内积空间。则 r(x) 在 V 的某组标准正交基下有典范形式 r(x)=\sum_{i=1}^n\mu_i|x_i|^2 ,而此时 q(x)=f_q(x,x)=\sum_{i=1}^n|x_i|^2 。正交三角(QR)分解、满秩分解、上下三角(LU)分解

QR分解

设 A_{m \times n} 的秩为 n ,则 A 可以唯一地分解为:

A_{m \times n} =Q_{m \times n}R_{n \times n}

其中, Q_{m \times n} 是标准正交向量组矩阵, R_{n \times n} 是正上三角阵。

想想Schmidt正交化的过程,这结果几乎是显然的。

满秩分解

设 A_{m \times n} 的秩为 r ,则存在秩为 r 的矩阵 B_{m \times r} ,秩为 r 的矩阵 C_{r \times n} ,使得:

A_{m \times n} = B_{m \times r} C_{r \times n}

值得注意的是,这样的分解不是唯一的。

注意到若 {\rm rank}A=r ,则 A=P\begin{pmatrix} E_r&0\\ 0&0 \end{pmatrix} Q 而 P、Q 满秩

LU分解

对于一个可逆方阵 A ,如果它的所有顺序主子式都不为零时,则有:

A=LU

其中 L、U 分别是下三角矩阵(Lower Triangle Matrix)和上三角矩阵(Uppder Triangle Matrix)。

操作过程就是对 A 作不包括行交换的初等行变换。复化与实化

在考虑算子 T 的矩阵按类别化成规范型时,基础域 \Re 是关键的(比如我们看到,同类别 \mathbb C 上的算子总是比 \mathbb R 上的性质好)。所以考虑“复化和实化”是自然而有必要的。

概念回顾

下面陈列概念和结论,后者几乎是显然的。

\mathcal J :V\to V,\mathcal J^2=-\mathcal E ,称为复结构

\widetilde V=(V,\mathcal J) 称为与实空间 V 相关的复化向量空间, 2\dim _{\mathbb C}\widetilde V=\dim_{\mathbb R}V

U_{\mathbb R} 是 U 的实化空间,例如 \widetilde V_{\mathbb R}=V

\mathcal A_{\mathbb R}:U_{\mathbb R}\to U_{\mathbb R} 称为 \mathcal {A=A_1+iA_2} 的实化算子,其对应矩阵为 \begin{pmatrix} A_1&-A_2\\ A_2&A_1 \end{pmatrix}

\det \mathcal A_{\mathbb R}=|\det\mathcal A|^2 , \dim \mathcal L(U)_{\mathbb R} =2n^2=\cfrac 12\dim\mathcal L(U_{\mathbb R})

结果1:(对复结构 \mathcal J 而言)所有实化算子的子代数 \mathcal L(U)_{\mathbb R} \subset\mathcal L(U_{\mathbb R}) 恰好由所有与 \mathcal J 交换的算子组成

这也回答了一个问题, V_{\mathbb R,2n} 上的算子 \mathcal A 什么时候与其一个复结构相容?答案是 \mathcal A 在某基下要具有 \begin{pmatrix} A_1&-A_2\\ A_2&A_1 \end{pmatrix} 的形式,但找到相应的 \mathcal J 却是不容易的。

结果2:在 V_{\mathbb R,2} 上, \mathcal A 若无特征向量,则其与某个复结构 \mathcal J 相容

设 \chi_{\mathcal A}(t)=(t-a)^2+b^2 ,令 \mathcal J=b^{-1}(\mathcal A-a\mathcal E) 即为所求。

复化

设 V=V_{\mathbb R,n} ,在外直和 V\oplus V 上定义 \mathcal J:(u,v)\to(-v,u) ,称为其上规范的复结构。相应的复化空间

\widetilde{V\oplus V}=:V^{\mathbb C}=V\otimes_{\mathbb R}\mathbb C

后一个等号是从向量空间的张量积的角度看“复化”,这也称为基域扩张。

自然地,有 \dim _{\mathbb C} V^{\mathbb C}=\dim_{\mathbb R}V

在其上的 \mathbb C- 线性算子 \mathcal A^{\mathbb C}:(u+iv)=\mathcal Au+i\mathcal Av 称为 \mathbb R- 线性算子 \mathcal A 的复化算子

A^{\mathbb C}=A ,还可得到 (\mathcal {A+B})^{\mathbb C}=\mathcal {A^{\mathbb C}+B^{\mathbb C}}、(\mathcal {AB})^{\mathbb C}=\mathcal {A^{\mathbb C}B^{\mathbb C}}

若 V 是带有纯量乘积 (*|*) 的实向量空间,可定义 V^{\mathbb C} 上的纯量乘积为 (x+iy|u+iv):=(x|u)+(y|v)-i((x|v)-(u|y))

若有一个欧氏空间 (V,(*|*)) ,则有一个自然的埃氏空间 (V^{\mathbb C},(*|*)^{\mathbb C})

值得注意的是, \mathbb C 上的每一个 n 维空间 U 都同构于一个复包络 V^{\mathbb C}

复实交替

理解其含义时,不妨选取我们最熟悉的 \Re

W:=(V^{\mathbb C})_{\mathbb R}=V\oplus iV

W 上有共轭算子 \mathcal S:u+iv\to u-iv=\overline{u+iv} ,进而定义 V^{\mathbb C} 上算子 \mathcal A 的复共轭算子为\bar {\mathcal A}:u+iv\to \overline{\mathcal A(u+iv)} 自然有 (\bar{\mathcal A})_{\mathbb R}=\mathcal S \cdot \mathcal A_{\mathbb R} ,而且有 \bar{\mathcal A}=\mathcal A\iff \mathcal A=(\mathcal A\vert_{V})^{\mathbb C} , {\rm tr}\mathcal A_{\mathbb R}={\rm tr}\mathcal A+{\rm tr}\bar{\mathcal A}

(V_{\mathbb R})^{\mathbb C}=V\oplus \overline V

复共轭向量空间 \bar V 的加法群与 V 一致,但 \lambda\odot x=\bar \lambda x 。其实, V_{-\mathcal J}=\overline{V_{\mathcal J}} 令 (V_{\mathbb R})^{\mathbb C}=(V_{\mathbb R}\oplus V_{\mathbb R})_{\mathcal J} ,请证明:\begin{align*} V^{1,0}&=\{(x,y)\in(V_{\mathbb R})^{\mathbb C}\vert\mathcal J(x,y)=i(x,y)\}\\ &=\{(x,-ix)\vert x\in V_{\mathbb R}\} &\cong V\\ V^{0,1}&=\{(x,y)\in(V_{\mathbb R})^{\mathbb C}\vert\mathcal J(x,y)=-i(x,y)\}&\oplus \\&=\{(x,ix)\vert x\in V_{\mathbb R}\}&\cong \bar V\\ &&||\\ &&V \end{align*} 回顾

这篇文章是对自己笔记[1]的总结和再回顾,常看常新,再看再新。我们看到,算子提供了另外一种看待线性空间的方式,其内容甚为丰富。

参考^主要参考书籍:Sheldon Axler《线性代数应该这样学》、席南华《基础代数(第二卷)》。部分丘维声《高等代数》、许以超《线性代数和矩阵论》、柯斯特利金《代数学引论(第二卷)》。还有很多知乎优秀的文章。


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有