一、什么样的n阶矩阵才能对角化?
先说结论
{ a . 特征值无重根✅ b . 有重根 { b .1. 厄米特矩阵 ( H e r m i t i a n ) , 特别的对称实数矩阵✅ b .2. 非厄矩阵 { b .2.1. 几何重数 = 代数重数✅ b .2.2. 几何重数 ≠ 代数重数❌ \left\{
\begin{aligned}
a. & 特征值无重根 ✅\\
b. & 有重根 \left\{
\begin{aligned}
b.1. & 厄米特矩阵(Hermitian),\\ &特别的对称实数矩阵 ✅ \\
b.2. & 非厄矩阵 \left\{
\begin{aligned}
b.2.1. & 几何重数=代数重数 ✅ \\
b.2.2. & 几何重数 \neq 代数重数 ❌
\end{aligned}
\right.
\end{aligned}
\right.
\end{aligned}
\right. ⎩ ⎨ ⎧ a . b . 特征值无重根 ✅ 有重根 ⎩ ⎨ ⎧ b .1. b .2. 厄米特矩阵 ( Her mi t ian ) , 特别的对称实数矩阵 ✅ 非厄矩阵 { b .2.1. b .2.2. 几何重数 = 代数重数 ✅ 几何重数 = 代数重数 ❌
定理1:
设 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ 1 , λ 2 , … , λ m 是方阵 A A A 的m个特征值, p 1 , p 2 , … , p m p_1,p_2,\dots,p_m p 1 , p 2 , … , p m 依次是与之对应的特征向量,如果 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ 1 , λ 2 , … , λ m 各不相等,则 p 1 , p 2 , … , p m p_1,p_2,\dots,p_m p 1 , p 2 , … , p m 线性无关。
定理2:
n阶矩阵 A A A 与对角矩阵相似(即 A A A 能对角化)的充分必要条件是 A A A 有 n n n 个线性无关的特征向量。
推论:
如果n阶矩阵 A A A 的 n n n 个特征值互不相等,则 A A A 与对角矩阵相似。
二、根据以上定理和推理特征值无重根的a和b.2.1情况一定可以对角化。
三、有重根情况b.1情况
3.1 厄米特矩阵
厄米特矩阵是满足 A H = A A^H=A A H = A 的矩阵,即 A H A^H A H 是 A A A 的共轭转置矩阵。
3.2 酉矩阵
满足 A H A = I A^HA=I A H A = I 的矩阵。酉矩阵,其列向量是规范正交的,其秩必为n。
A − 1 = A H A^{-1}=A^H A − 1 = A H
n阶n维线性无关向量必可以通过施密特正交化得到标准正交基矩阵,即是酉矩阵。
3.3 舒尔化矩阵
设n阶矩阵 A A A 的特征值 λ k \lambda_k λ k 有 k k k 重根,对应 m m m 个特征值, p 1 , p 2 , … , p m p_1,p_2,\dots,p_m p 1 , p 2 , … , p m 依次是与之对应的特征向量,组成一组基,把 { p 1 , p 2 , … , p m } \{p_1,p_2,\dots,p_m\} { p 1 , p 2 , … , p m } 扩充至n个(n维的最大线性无关组是n个),并施密特正交化,得到 P = ( p 1 , p 2 , … , p m , p m + 1 , … , p n ) P=(p_1,p_2,\dots,p_m,p_{m+1},\dots,p_n) P = ( p 1 , p 2 , … , p m , p m + 1 , … , p n )
A P = ( λ k p 1 , λ k p 2 , … , λ k p m , A p m + 1 , A p m + 2 , … , A p n ) AP=(\lambda_kp_1,\lambda_kp_2,\dots,\lambda_kp_m,Ap_{m+1},Ap_{m+2},\dots,Ap_n) A P = ( λ k p 1 , λ k p 2 , … , λ k p m , A p m + 1 , A p m + 2 , … , A p n )
P H A P = ( p 1 H p 2 H p 3 H ⋮ p m H p m + 1 H ⋮ p n ) ( λ k p 1 , λ k p 2 , … , λ k p m , A p m + 1 , A p m + 2 , … , A p n ) \begin{aligned}
P^HAP=
\begin{pmatrix}
p_1^H \\
p_2^H\\
p_3^H\\
\vdots\\
p_m^H\\
p_{m+1}^H\\
\vdots\\
p_{n}
\end{pmatrix}(\lambda_kp_1,\lambda_kp_2,\dots,\lambda_kp_m,Ap_{m+1},Ap_{m+2},\dots,Ap_n)
\end{aligned} P H A P = p 1 H p 2 H p 3 H ⋮ p m H p m + 1 H ⋮ p n ( λ k p 1 , λ k p 2 , … , λ k p m , A p m + 1 , A p m + 2 , … , A p n )
若 A = ( a i j ) , p j = ( q i j ) A=(a_{ij}), p_j=(q_{ij}) A = ( a ij ) , p j = ( q ij )
因为 P H P^H P H 的正交性,所以,
P H A P = ( λ k p 1 H A p m + 1 ⋯ p 1 H A p n λ k p 2 H A p m + 1 ⋯ p 2 H A p n ⋱ ⋮ ⋮ λ k p m H A p m + 1 ⋯ p m H A p n 0 0 ⋯ 0 p m + 1 H A p m + 1 ⋯ p m + 1 H A p n ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 p n H A p m + 1 ⋯ p n H A p n ) \begin{aligned}
P^HAP &=\begin{pmatrix} \lambda_{k}& & & & p^H_1Ap_{m+1}&\cdots&p^H_1Ap_{n} \\ & \lambda_{k} & & & p^H_2Ap_{m+1}&\cdots&p^H_2Ap_{n}\\ & & \ddots & & \vdots& &\vdots \\ & & & \lambda_{k} & p^H_mAp_{m+1}&\cdots&p^H_mAp_{n}\\ 0 & 0 & \cdots & 0 & p^H_{m+1}Ap_{m+1}&\cdots&p^H_{m+1}Ap_{n} \\\vdots& \vdots& & \vdots& \vdots& &\vdots \\0&0& \cdots & 0&p^H_nAp_{m+1}&\cdots&p^H_nAp_{n}\\ \end{pmatrix}
\end{aligned} P H A P = λ k 0 ⋮ 0 λ k 0 ⋮ 0 ⋱ ⋯ ⋯ λ k 0 ⋮ 0 p 1 H A p m + 1 p 2 H A p m + 1 ⋮ p m H A p m + 1 p m + 1 H A p m + 1 ⋮ p n H A p m + 1 ⋯ ⋯ ⋯ ⋯ ⋯ p 1 H A p n p 2 H A p n ⋮ p m H A p n p m + 1 H A p n ⋮ p n H A p n
P为我们构造的酉矩阵,于是 ⇒ \Rightarrow ⇒ ,
P − 1 A P = P H A P = ( λ k p 1 H A p m + 1 ⋯ p 1 H A p n λ k p 2 H A p m + 1 ⋯ p 2 H A p n ⋱ ⋮ ⋮ λ k p m H A p m + 1 ⋯ p m H A p n 0 0 ⋯ 0 p m + 1 H A p m + 1 ⋯ p m + 1 H A p n ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 p n H A p m + 1 ⋯ p n H A p n ) = B \begin{equation}
\begin{aligned}
P^{-1}AP&=P^HAP
&=\begin{pmatrix} \lambda_{k}& & & & p^H_1Ap_{m+1}&\cdots&p^H_1Ap_{n} \\ & \lambda_{k} & & & p^H_2Ap_{m+1}&\cdots&p^H_2Ap_{n}\\ & & \ddots & & \vdots& &\vdots \\ & & & \lambda_{k} & p^H_mAp_{m+1}&\cdots&p^H_mAp_{n}\\ 0 & 0 & \cdots & 0 & p^H_{m+1}Ap_{m+1}&\cdots&p^H_{m+1}Ap_{n} \\\vdots& \vdots& & \vdots& \vdots& &\vdots \\0&0& \cdots & 0&p^H_nAp_{m+1}&\cdots&p^H_nAp_{n}\\ \end{pmatrix}
\\
&=B
\end{aligned}
\end{equation} P − 1 A P = P H A P = B = λ k 0 ⋮ 0 λ k 0 ⋮ 0 ⋱ ⋯ ⋯ λ k 0 ⋮ 0 p 1 H A p m + 1 p 2 H A p m + 1 ⋮ p m H A p m + 1 p m + 1 H A p m + 1 ⋮ p n H A p m + 1 ⋯ ⋯ ⋯ ⋯ ⋯ p 1 H A p n p 2 H A p n ⋮ p m H A p n p m + 1 H A p n ⋮ p n H A p n
为书写方便,将(1)式 B B B 简写为块矩阵:
B B B
B = ( λ k ∗ ⋯ ∗ λ k ∗ ⋯ ∗ ⋱ ⋮ ⋮ λ k ∗ ⋯ ∗ 0 0 ⋯ 0 ∗ ⋯ ∗ ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 ∗ ⋯ ∗ ) = ( λ k ⋱ W λ k O M ) \begin{aligned}
B & =\left(\begin{array} {cccc:ccc}
\lambda_{k} & & & & * & \cdots & * \\
& \lambda_{k} & & & * & \cdots & * \\
& & \ddots & & \vdots & & \vdots \\
& & & \lambda_{k} & * & \cdots & * \\
\hdashline 0 & 0 & \cdots & 0 & * & \cdots & * \\
\vdots & \vdots & & \vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 0 & * & \cdots & * \\
\end{array} \right)\\
& =\left(\begin{array} {ccc:c}\\
\lambda_{k} & \\
& \ddots & & W \\
& & \lambda_{k} & \\
\hdashline & O & & M \\
\end{array} \right)\\
\end{aligned} B = λ k 0 ⋮ 0 λ k 0 ⋮ 0 ⋱ ⋯ ⋯ λ k 0 ⋮ 0 ∗ ∗ ⋮ ∗ ∗ ⋮ ∗ ⋯ ⋯ ⋯ ⋯ ⋯ ∗ ∗ ⋮ ∗ ∗ ⋮ ∗ = λ k ⋱ O λ k W M
其中 M M M 矩阵可以重复上面的步骤,最终得到上三角矩阵。
A A A 与 B B B 相似,根据有关定理,它们具有相同的特征值。
∣ A − λ E ∣ = ∣ B − λ E ∣ |A-\lambda E|=|B-\lambda E| ∣ A − λ E ∣ = ∣ B − λ E ∣
∣ B − λ E ∣ = ( λ k − λ ⋱ W λ k − λ O M − λ E ) = ( λ k − λ ) m g ( λ ) \begin{aligned}
|B-\lambda E| & =\left(\begin{array} {ccc:c}
\lambda_{k}-\lambda & \\
& \ddots & & W \\
& & \lambda_{k}-\lambda & \\
\hdashline & O & & M-\lambda E \\
\end{array}\right)\\
& =(\lambda_{k}-\lambda)^mg(\lambda)
\end{aligned} ∣ B − λ E ∣ = λ k − λ ⋱ O λ k − λ W M − λ E = ( λ k − λ ) m g ( λ )
又因为 λ k \lambda_{k} λ k 是 k k k 重根,所以 ∣ A − λ E ∣ = ( λ k − λ ) k f ( λ ) |A-\lambda E|=(\lambda_{k}-\lambda)^kf(\lambda) ∣ A − λ E ∣ = ( λ k − λ ) k f ( λ )
,所以,几何重数 m m m 必小于代数重数 k k k , 即 m ≤ k m\leq k m ≤ k 。
又因为 P P P 为酉矩阵,所以
B H = ( P H A P ) H = ( P H ( A P ) ) H = ( A P ) H ( P H ) H = ( A P ) H P = P H A H P \begin{aligned}
B^H&=(P^HAP)^H \\
&=(P^H(AP))^H \\
&=(AP)^H(P^H)^H \\
&=(AP)^HP \\
&=P^HA^HP \\
\end{aligned} B H = ( P H A P ) H = ( P H ( A P ) ) H = ( A P ) H ( P H ) H = ( A P ) H P = P H A H P
如果 A A A 为厄米特矩阵,则 B H = B B^H=B B H = B ,所以 B B B 也为厄米特矩阵。所以 B B B 必为对角矩阵。
所以,b.1情况一定可以对角化。
参考:
厄米特矩阵
舒尔定理
几何重数小于等于代数重数