第8 产
希帕蒂娅,公元五世纪埃及数学家和哲学家,1900 年前后阿尔弗雷德 • 塞弗特根据想象所绘。
复向量空间上的算子
本章将更深入地研究复向量空间上算子的结构,这里用不到内积,因此我们又回到了一般的有限维向量空间的情形。为了避免某些平凡性,我们将假设
V
≠
{
0
}
V
≠
{
0
}
V!={0} V \neq\{0\} V ≠ { 0 } 。于是本章作如下假设:
8.1 记号 F、V
F
F
F \mathbf{F} F 表示
R
R
R \mathbf{R} R 或
C
C
C \mathbf{C} C 。
V
V
V V V 是
F
F
F \mathbf{F} F 上的有限维的非零向量空间。
本章的学习目标
广义本征向量和广义本征空间
特征多项式和凯莱-哈密顿定理
算子的分解
极小多项式
若尔当形
8.A 广义本征向量和幂零算子
算子幂的零空间
本章先来讨论算子幂的零空间.
8.2 递增的零空间序列
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则
{
0
}
=
null
T
0
⊂
null
T
1
⊂
⋯
⊂
null
T
k
⊂
null
T
k
+
1
⊂
⋯
{
0
}
=
null
T
0
⊂
null
T
1
⊂
⋯
⊂
null
T
k
⊂
null
T
k
+
1
⊂
⋯
{0}=nullT^(0)sub nullT^(1)sub cdots sub nullT^(k)sub" null "T^(k+1)sub cdots \{0\}=\operatorname{null} T^{0} \subset \operatorname{null} T^{1} \subset \cdots \subset \operatorname{null} T^{k} \subset \text { null } T^{k+1} \subset \cdots { 0 } = null T 0 ⊂ null T 1 ⊂ ⋯ ⊂ null T k ⊂ null T k + 1 ⊂ ⋯
证明 设
k
k
k k k 是非负整数,
v
∈
null
T
k
v
∈
null
T
k
v in nullT^(k) v \in \operatorname{null} T^{k} v ∈ null T k . 则
T
k
v
=
0
T
k
v
=
0
T^(k)v=0 T^{k} v=0 T k v = 0 , 因此
T
k
+
1
v
=
T
(
T
k
v
)
=
T
(
0
)
=
0
T
k
+
1
v
=
T
T
k
v
=
T
(
0
)
=
0
T^(k+1)v=T(T^(k)v)=T(0)=0 T^{k+1} v=T\left(T^{k} v\right)=T(0)=0 T k + 1 v = T ( T k v ) = T ( 0 ) = 0 .于是
v
∈
null
T
k
+
1
v
∈
null
T
k
+
1
v in nullT^(k+1) v \in \operatorname{null} T^{k+1} v ∈ null T k + 1 。因此 null
T
k
⊂
null
T
k
+
1
T
k
⊂
null
T
k
+
1
T^(k)sub nullT^(k+1) T^{k} \subset \operatorname{null} T^{k+1} T k ⊂ null T k + 1 。
下面的命题是说, 如果在这个子空间序列中有相邻的两项相等, 那么此后的所有项都相等。
8.3 零空间序列中的等式
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 设
m
m
m m m 是非负整数使得 null
T
m
=
null
T
m
+
1
T
m
=
null
T
m
+
1
T^(m)=nullT^(m+1) T^{m}=\operatorname{null} T^{m+1} T m = null T m + 1 . 则
null
T
m
=
null
T
m
+
1
=
null
T
m
+
2
=
null
T
m
+
3
=
⋯
.
null
T
m
=
null
T
m
+
1
=
null
T
m
+
2
=
null
T
m
+
3
=
⋯
.
nullT^(m)=nullT^(m+1)=nullT^(m+2)=nullT^(m+3)=cdots. \operatorname{null} T^{m}=\operatorname{null} T^{m+1}=\operatorname{null} T^{m+2}=\operatorname{null} T^{m+3}=\cdots . null T m = null T m + 1 = null T m + 2 = null T m + 3 = ⋯ .
null
T
m
+
k
=
null
T
m
+
k
+
1
null
T
m
+
k
=
null
T
m
+
k
+
1
nullT^(m+k)=nullT^(m+k+1) \operatorname{null} T^{m+k}=\operatorname{null} T^{m+k+1} null T m + k = null T m + k + 1
由 8.2 我们已经知道 null
T
m
+
k
⊂
null
T
m
+
k
+
1
T
m
+
k
⊂
null
T
m
+
k
+
1
T^(m+k)sub nullT^(m+k+1) T^{m+k} \subset \operatorname{null} T^{m+k+1} T m + k ⊂ null T m + k + 1 。
要证明另一个方向的包含关系,设
v
∈
null
T
m
+
k
+
1
v
∈
null
T
m
+
k
+
1
v in nullT^(m+k+1) v \in \operatorname{null} T^{m+k+1} v ∈ null T m + k + 1 ,则
T
m
+
1
(
T
k
v
)
=
T
m
+
k
+
1
v
=
0
T
m
+
1
T
k
v
=
T
m
+
k
+
1
v
=
0
T^(m+1)(T^(k)v)=T^(m+k+1)v=0 T^{m+1}\left(T^{k} v\right)=T^{m+k+1} v=0 T m + 1 ( T k v ) = T m + k + 1 v = 0
因此
T
k
v
∈
null
T
m
+
1
=
null
T
m
T
k
v
∈
null
T
m
+
1
=
null
T
m
T^(k)v in nullT^(m+1)=nullT^(m) T^{k} v \in \operatorname{null} T^{m+1}=\operatorname{null} T^{m} T k v ∈ null T m + 1 = null T m
于是
T
m
+
k
v
=
T
m
(
T
k
v
)
=
0
T
m
+
k
v
=
T
m
T
k
v
=
0
T^(m+k)v=T^(m)(T^(k)v)=0 T^{m+k} v=T^{m}\left(T^{k} v\right)=0 T m + k v = T m ( T k v ) = 0 , 从而
v
∈
null
T
m
+
k
v
∈
null
T
m
+
k
v in nullT^(m+k) v \in \operatorname{null} T^{m+k} v ∈ null T m + k 。 这意味着 null
T
m
+
k
+
1
⊂
T
m
+
k
+
1
⊂
T^(m+k+1)sub T^{m+k+1} \subset T m + k + 1 ⊂
null
T
m
+
k
null
T
m
+
k
nullT^(m+k) \operatorname{null} T^{m+k} null T m + k 。
上面的命题引出一个问题:是否有非负整数
m
m
m m m 使得 null
T
m
=
null
T
m
+
1
T
m
=
null
T
m
+
1
T^(m)=nullT^(m+1) T^{m}=\operatorname{null} T^{m+1} T m = null T m + 1 ?以下命题表明, 这个等式至少在
m
m
m m m 等于
T
T
T T T 的定义域的维数时成立.
8.4 零空间停止增长
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 则
null
T
n
=
null
T
n
+
1
=
null
T
n
+
2
=
⋯
null
T
n
=
null
T
n
+
1
=
null
T
n
+
2
=
⋯
nullT^(n)=nullT^(n+1)=nullT^(n+2)=cdots \operatorname{null} T^{n}=\operatorname{null} T^{n+1}=\operatorname{null} T^{n+2}=\cdots null T n = null T n + 1 = null T n + 2 = ⋯
证明 因为 8.3 , 我们只需证明
null
T
n
=
null
T
n
+
1
null
T
n
=
null
T
n
+
1
nullT^(n)=nullT^(n+1) \operatorname{null} T^{n}=\operatorname{null} T^{n+1} null T n = null T n + 1 。假设不然, 则由 8.2 和 8.3 得
{
0
}
=
null
T
0
⊊
null
T
1
⊊
⋯
⊊
null
T
n
⊊
null
T
n
+
1
{
0
}
=
null
T
0
⊊
null
T
1
⊊
⋯
⊊
null
T
n
⊊
null
T
n
+
1
{0}=nullT^(0)⊊nullT^(1)⊊cdots⊊" null "T^(n)⊊nullT^(n+1) \{0\}=\operatorname{null} T^{0} \subsetneq \operatorname{null} T^{1} \subsetneq \cdots \subsetneq \text { null } T^{n} \subsetneq \operatorname{null} T^{n+1} { 0 } = null T 0 ⊊ null T 1 ⊊ ⋯ ⊊ null T n ⊊ null T n + 1
其中符号
⊊
⊊
⊊ \subsetneq ⊊ 的意思是 "包含于但不等于"。在上述链的每个严格包含关系处维数至少增加 1. 因此
dim
dim
dim \operatorname{dim} dim null
T
n
+
1
≥
n
+
1
T
n
+
1
≥
n
+
1
T^(n+1) >= n+1 T^{n+1} \geq n+1 T n + 1 ≥ n + 1 ,矛盾,因为
V
V
V V V 的子空间的维数不可能大于
n
n
n n n 。
遗憾的是,
V
=
null
T
⊕
range
T
V
=
null
T
⊕
range
T
V=null T o+range T V=\operatorname{null} T \oplus \operatorname{range} T V = null T ⊕ range T 并不是对每个
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 都成立. 然而,以下命题是一个有用的替补。
8.5
V
V
V V V 等于 null
T
dim
V
T
dim
V
T^(dim V) T^{\operatorname{dim} V} T dim V 和 range
T
dim
V
T
dim
V
T^(dim V) T^{\operatorname{dim} V} T dim V 的直和
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 则
V
=
null
T
n
⊕
range
T
n
V
=
null
T
n
⊕
range
T
n
V=nullT^(n)o+rangeT^(n) V=\operatorname{null} T^{n} \oplus \operatorname{range} T^{n} V = null T n ⊕ range T n .
证明 先证
8.6
(
(:} \left(\right. ( null
T
n
)
∩
(
range
T
n
)
=
{
0
}
T
n
∩
range
T
n
=
{
0
}
{:T^(n))nn(rangeT^(n))={0} \left.T^{n}\right) \cap\left(\operatorname{range} T^{n}\right)=\{0\} T n ) ∩ ( range T n ) = { 0 } .
设
v
∈
(
null
T
n
)
∩
(
range
T
n
)
v
∈
null
T
n
∩
range
T
n
v in(nullT^(n))nn(rangeT^(n)) v \in\left(\operatorname{null} T^{n}\right) \cap\left(\operatorname{range} T^{n}\right) v ∈ ( null T n ) ∩ ( range T n ) 。则
T
n
v
=
0
T
n
v
=
0
T^(n)v=0 T^{n} v=0 T n v = 0 ,存在
u
∈
V
u
∈
V
u in V u \in V u ∈ V 使得
v
=
T
n
u
v
=
T
n
u
v=T^(n)u v=T^{n} u v = T n u 。将
T
n
T
n
T^(n) T^{n} T n 作用于前式两端得
T
n
v
=
T
2
n
u
T
n
v
=
T
2
n
u
T^(n)v=T^(2n)u T^{n} v=T^{2 n} u T n v = T 2 n u 。因此
T
2
n
u
=
0
T
2
n
u
=
0
T^(2n)u=0 T^{2 n} u=0 T 2 n u = 0 ,从而
T
n
u
=
0
T
n
u
=
0
T^(n)u=0 T^{n} u=0 T n u = 0 (由于 8.4)。是
v
=
T
n
u
=
0
v
=
T
n
u
=
0
v=T^(n)u=0 v=T^{n} u=0 v = T n u = 0 , 完成了 8.6 的证明。
现在由 8.6 可知 null
T
n
+
range
T
n
T
n
+
range
T
n
T^(n)+rangeT^(n) T^{n}+\operatorname{range} T^{n} T n + range T n 是一个直和(由于 1.45)。此外
dim
(
null
T
n
⊕
range
T
n
)
=
dim
null
T
n
+
dim
range
T
n
=
dim
V
,
dim
null
T
n
⊕
range
T
n
=
dim
null
T
n
+
dim
range
T
n
=
dim
V
,
dim(nullT^(n)o+rangeT^(n))=dim nullT^(n)+dim rangeT^(n)=dim V, \operatorname{dim}\left(\operatorname{null} T^{n} \oplus \operatorname{range} T^{n}\right)=\operatorname{dim} \operatorname{null} T^{n}+\operatorname{dim} \operatorname{range} T^{n}=\operatorname{dim} V, dim ( null T n ⊕ range T n ) = dim null T n + dim range T n = dim V ,
上述第一个等式由 3.78 得到,第二个等式由线性映射基本定理 3.22 得到。由上式可得 null
T
n
⊕
range
T
n
=
V
T
n
⊕
range
T
n
=
V
T^(n)o+rangeT^(n)=V T^{n} \oplus \operatorname{range} T^{n}=V T n ⊕ range T n = V 。
8.7 例 设
T
∈
L
(
F
3
)
T
∈
L
F
3
T inL(F^(3)) T \in \mathcal{L}\left(\mathbf{F}^{3}\right) T ∈ L ( F 3 ) 定义为
T
(
z
1
,
z
2
,
z
3
)
=
(
4
z
2
,
0
,
5
z
3
)
T
z
1
,
z
2
,
z
3
=
4
z
2
,
0
,
5
z
3
T(z_(1),z_(2),z_(3))=(4z_(2),0,5z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(4 z_{2}, 0,5 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 4 z 2 , 0 , 5 z 3 )
对于这个算子,null
T
+
range
T
T
+
range
T
T+range T T+\operatorname{range} T T + range T 不是子空间的直和。因为 null
T
=
{
(
z
1
,
0
,
0
)
T
=
z
1
,
0
,
0
T={(z_(1),0,0):} T=\left\{\left(z_{1}, 0,0\right)\right. T = { ( z 1 , 0 , 0 ) :
z
1
∈
F
}
z
1
∈
F
{:z_(1)inF} \left.z_{1} \in \mathbf{F}\right\} z 1 ∈ F } 且 range
T
=
{
(
z
1
,
0
,
z
3
)
:
z
1
,
z
3
∈
F
}
T
=
z
1
,
0
,
z
3
:
z
1
,
z
3
∈
F
T={(z_(1),0,z_(3)):z_(1),z_(3)inF} T=\left\{\left(z_{1}, 0, z_{3}\right): z_{1}, z_{3} \in \mathbf{F}\right\} T = { ( z 1 , 0 , z 3 ) : z 1 , z 3 ∈ F } ,所以 null
T
∩
range
T
≠
{
0
}
T
∩
range
T
≠
{
0
}
T nn range T!={0} T \cap \operatorname{range} T \neq\{0\} T ∩ range T ≠ { 0 } ,因此 null
T
+
range
T
T
+
range
T
T+range T T+\operatorname{range} T T + range T 不是直和。 也请注意 null
T
+
range
T
≠
F
3
T
+
range
T
≠
F
3
T+range T!=F^(3) T+\operatorname{range} T \neq \mathbf{F}^{3} T + range T ≠ F 3 。
然而我们有
T
3
(
z
1
,
z
2
,
z
3
)
=
(
0
,
0
,
125
z
3
)
T
3
z
1
,
z
2
,
z
3
=
0
,
0
,
125
z
3
T^(3)(z_(1),z_(2),z_(3))=(0,0,125z_(3)) T^{3}\left(z_{1}, z_{2}, z_{3}\right)=\left(0,0,125 z_{3}\right) T 3 ( z 1 , z 2 , z 3 ) = ( 0 , 0 , 125 z 3 ) . 于是 null
T
3
=
{
(
z
1
,
z
2
,
0
)
:
z
1
,
z
2
∈
F
}
T
3
=
z
1
,
z
2
,
0
:
z
1
,
z
2
∈
F
T^(3)={(z_(1),z_(2),0):z_(1),z_(2)inF} T^{3}=\left\{\left(z_{1}, z_{2}, 0\right): z_{1}, z_{2} \in \mathbf{F}\right\} T 3 = { ( z 1 , z 2 , 0 ) : z 1 , z 2 ∈ F } 且 range
T
3
=
{
(
0
,
0
,
z
3
)
:
z
3
∈
F
}
T
3
=
0
,
0
,
z
3
:
z
3
∈
F
T^(3)={(0,0,z_(3)):z_(3)inF} T^{3}=\left\{\left(0,0, z_{3}\right): z_{3} \in \mathbf{F}\right\} T 3 = { ( 0 , 0 , z 3 ) : z 3 ∈ F } 。因此
F
3
=
null
T
3
⊕
range
T
3
F
3
=
null
T
3
⊕
range
T
3
F^(3)=nullT^(3)o+rangeT^(3) \mathbf{F}^{3}=\operatorname{null} T^{3} \oplus \operatorname{range} T^{3} F 3 = null T 3 ⊕ range T 3 。
广义本征向量
有些算子因为没有足够多的本征向量而没有一个好的描述。因此,本节将引入广义本征向量的概念,这一概念对算子结构的描述起着重要作用。
为了理解为什么需要更多的本征向量,我们来考察如何通过算子定义域的不变子空间分解来描述这个算子。取定
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。为了描述
T
T
T T T ,我们想要找到一个 "好的"直和分解
V
=
U
1
⊕
⋯
⊕
U
m
V
=
U
1
⊕
⋯
⊕
U
m
V=U_(1)o+cdots o+U_(m) V=U_{1} \oplus \cdots \oplus U_{m} V = U 1 ⊕ ⋯ ⊕ U m
其中每个
U
j
U
j
U_(j) U_{j} U j 都是
V
V
V V V 在
T
T
T T T 下的不变子空间。可能存在的、最简单的非零不变子空间是一维的。上面分解中的每个
U
j
U
j
U_(j) U_{j} U j 都是在
T
T
T T T 下不变的
V
V
V V V 的一维子空间,当且仅当
V
V
V V V 有一个由
T
T
T T T 的本征向量组成的基(参见 5.41 ),当且仅当
V
V
V V V 有如下本征空间分解
V
=
E
(
λ
1
,
T
)
⊕
⋯
⊕
E
(
λ
m
,
T
)
V
=
E
λ
1
,
T
⊕
⋯
⊕
E
λ
m
,
T
V=E(lambda_(1),T)o+cdots o+E(lambda_(m),T) V=E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right) V = E ( λ 1 , T ) ⊕ ⋯ ⊕ E ( λ m , T )
其中
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的所有互不相同的本征值(参见5.41)。
上一章的谱定理证明了, 若
V
V
V V V 是内积空间, 则形如 8.8 的分解在
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C 时对每个正规算子都成立, 而在
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 时对每个自伴算子都成立, 这是因为这些形式的算子有足够的本征向量来构成
V
V
V V V 的一个基(参见 7.24 和 7.29)。
可惜的是,即使在复向量空间上,形如 8.8 的分解对更一般的算子也可能不成立. 5.43 给出的算子就是一个例子, 它没有足够多的本征向量使得 8.8 成立. 我们现在要引入的广义本征向量和广义本征空间将会改善这种局面.
8.9 定义 广义本征向量(generalized eigenvector)
设
T
∈
L
(
V
)
,
λ
T
∈
L
(
V
)
,
λ
T inL(V),lambda T \in \mathcal{L}(V), \lambda T ∈ L ( V ) , λ 是
T
T
T T T 的本征值. 向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V 称为
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的广义本征向量,如果
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 且存在正整数
j
j
j j j 使得
(
T
−
λ
I
)
j
v
=
0
(
T
−
λ
I
)
j
v
=
0
(T-lambda I)^(j)v=0 (T-\lambda I)^{j} v=0 ( T − λ I ) j v = 0 。
虽然在广义本征向量定义中等式
(
T
−
λ
I
)
j
v
=
0
(
T
−
λ
I
)
j
v
=
0
(T-lambda I)^(j)v=0 (T-\lambda I)^{j} v=0 ( T − λ I ) j v = 0
中的
j
j
j j j 可以是任意正整数,但我们马上就要证明,当
j
=
dim
V
j
=
dim
V
j=dim V j=\operatorname{dim} V j = dim V 时每个广义本征向量都满足这个等式。
注意,我们没有定义广义本征值的概念,因为这样不会得到任何新东西. 理由是:如果对某个正整数
j
j
j j j ,
(
T
−
λ
I
)
j
(
T
−
λ
I
)
j
(T-lambda I)^(j) (T-\lambda I)^{j} ( T − λ I ) j 不是单的, 则
(
T
−
λ
I
)
(
T
−
λ
I
)
(T-lambda I) (T-\lambda I) ( T − λ I ) 也不是单的,因此
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值。
8.10 定义 广义本征空间(generalized eigenspace),
G
(
λ
,
T
)
G
(
λ
,
T
)
G(lambda,T) G(\lambda, T) G ( λ , T )
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 。则
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的广义本征空间(记作
G
(
λ
,
T
)
G
(
λ
,
T
)
G(lambda,T) G(\lambda, T) G ( λ , T ) )定义为
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的所有广义本征向量的集合,包括 0 向量。
因为
T
T
T T T 的每个本征向量是
T
T
T T T 的广义本征向量(在广义本征向量的定义中取
j
=
1
j
=
1
j=1 j=1 j = 1 ),所以每个本征空间都包含在相应的广义本征空间中。也就是说,如果
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F ,则
E
(
λ
,
T
)
⊂
G
(
λ
,
T
)
E
(
λ
,
T
)
⊂
G
(
λ
,
T
)
E(lambda,T)sub G(lambda,T) E(\lambda, T) \subset G(\lambda, T) E ( λ , T ) ⊂ G ( λ , T )
以下命题表明,如果
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F ,则
G
(
λ
,
T
)
G
(
λ
,
T
)
G(lambda,T) G(\lambda, T) G ( λ , T ) 是
V
V
V V V 的子空间(因为
V
V
V V V 上每个线性映射的零空间都是
V
V
V V V 的子空间)。
8.11 广义本征空间的刻画
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F . 则
G
(
λ
,
T
)
=
null
(
T
−
λ
I
)
dim
V
G
(
λ
,
T
)
=
null
(
T
−
λ
I
)
dim
V
G(lambda,T)=null(T-lambda I)^(dim V) G(\lambda, T)=\operatorname{null}(T-\lambda I)^{\operatorname{dim} V} G ( λ , T ) = null ( T − λ I ) dim V .
证明 设
v
∈
null
(
T
−
λ
I
)
dim
V
v
∈
null
(
T
−
λ
I
)
dim
V
v in null(T-lambda I)^(dim V) v \in \operatorname{null}(T-\lambda I)^{\operatorname{dim} V} v ∈ null ( T − λ I ) dim V . 由定义可知
v
∈
G
(
λ
,
T
)
v
∈
G
(
λ
,
T
)
v in G(lambda,T) v \in G(\lambda, T) v ∈ G ( λ , T ) . 因此我们有
G
(
λ
,
T
)
⊃
G
(
λ
,
T
)
⊃
G(lambda,T)sup G(\lambda, T) \supset G ( λ , T ) ⊃
null
(
T
−
λ
I
)
dim
V
null
(
T
−
λ
I
)
dim
V
null(T-lambda I)^(dim V) \operatorname{null}(T-\lambda I)^{\operatorname{dim} V} null ( T − λ I ) dim V 。
反过来,设
v
∈
G
(
λ
,
T
)
v
∈
G
(
λ
,
T
)
v in G(lambda,T) v \in G(\lambda, T) v ∈ G ( λ , T ) . 则存在正整数
j
j
j j j 使得
v
∈
null
(
T
−
λ
I
)
j
v
∈
null
(
T
−
λ
I
)
j
v in null(T-lambda I)^(j) v \in \operatorname{null}(T-\lambda I)^{j} v ∈ null ( T − λ I ) j
由 8.2 和 8.4 (用
(
T
−
λ
I
)
(
T
−
λ
I
)
(T-lambda I) (T-\lambda I) ( T − λ I ) 代替
T
T
T T T )得到
v
∈
null
(
T
−
λ
I
)
dim
V
v
∈
null
(
T
−
λ
I
)
dim
V
v in null(T-lambda I)^(dim V) v \in \operatorname{null}(T-\lambda I)^{\operatorname{dim} V} v ∈ null ( T − λ I ) dim V 。因此
G
(
λ
,
T
)
⊂
G
(
λ
,
T
)
⊂
G(lambda,T)sub G(\lambda, T) \subset G ( λ , T ) ⊂
null
(
T
−
λ
I
)
dim
V
null
(
T
−
λ
I
)
dim
V
null(T-lambda I)^(dim V) \operatorname{null}(T-\lambda I)^{\operatorname{dim} V} null ( T − λ I ) dim V 。
8.12 例 定义
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 为
T
(
z
1
,
z
2
,
z
3
)
=
(
4
z
2
,
0
,
5
z
3
)
T
z
1
,
z
2
,
z
3
=
4
z
2
,
0
,
5
z
3
T(z_(1),z_(2),z_(3))=(4z_(2),0,5z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(4 z_{2}, 0,5 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 4 z 2 , 0 , 5 z 3 )
(a) 求
T
T
T T T 的所有本征值及相应的本征空间和相应的广义本征空间.
(b) 证明
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 等于
T
T
T T T 的相应于不同本征值的广义本征空间的直和。
解
(a) 由本征值的定义可知,
T
T
T T T 的本征值是 0 和 5 . 容易看到, 相应的本征空间是
E
(
0
,
T
)
=
{
(
z
1
,
0
,
0
)
:
z
1
∈
C
}
E
(
0
,
T
)
=
z
1
,
0
,
0
:
z
1
∈
C
E(0,T)={(z_(1),0,0):z_(1)inC} E(0, T)=\left\{\left(z_{1}, 0,0\right): z_{1} \in \mathbf{C}\right\} E ( 0 , T ) = { ( z 1 , 0 , 0 ) : z 1 ∈ C } 和
E
(
5
,
T
)
=
{
(
0
,
0
,
z
3
)
:
z
3
∈
C
}
E
(
5
,
T
)
=
0
,
0
,
z
3
:
z
3
∈
C
E(5,T)={(0,0,z_(3)):z_(3)inC} E(5, T)=\left\{\left(0,0, z_{3}\right): z_{3} \in \mathbf{C}\right\} E ( 5 , T ) = { ( 0 , 0 , z 3 ) : z 3 ∈ C } .
注意到,这个算子
T
T
T T T 没有足够的本征向量来张成它的定义域
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 .
对于所有的
z
1
,
z
2
,
z
3
∈
C
z
1
,
z
2
,
z
3
∈
C
z_(1),z_(2),z_(3)inC z_{1}, z_{2}, z_{3} \in \mathbf{C} z 1 , z 2 , z 3 ∈ C 都有
T
3
(
z
1
,
z
2
,
z
3
)
=
(
0
,
0
,
125
z
3
)
T
3
z
1
,
z
2
,
z
3
=
0
,
0
,
125
z
3
T^(3)(z_(1),z_(2),z_(3))=(0,0,125z_(3)) T^{3}\left(z_{1}, z_{2}, z_{3}\right)=\left(0,0,125 z_{3}\right) T 3 ( z 1 , z 2 , z 3 ) = ( 0 , 0 , 125 z 3 ) 。于是由 8.11 可得
G
(
0
,
T
)
=
{
(
z
1
,
z
2
,
0
)
:
z
1
,
z
2
∈
C
}
G
(
0
,
T
)
=
z
1
,
z
2
,
0
:
z
1
,
z
2
∈
C
G(0,T)={(z_(1),z_(2),0):z_(1),z_(2)inC} G(0, T)=\left\{\left(z_{1}, z_{2}, 0\right): z_{1}, z_{2} \in \mathbf{C}\right\} G ( 0 , T ) = { ( z 1 , z 2 , 0 ) : z 1 , z 2 ∈ C } .
我们有
(
T
−
5
I
)
3
(
z
1
,
z
2
,
z
3
)
=
(
−
125
z
1
+
300
z
2
,
−
125
z
2
,
0
)
(
T
−
5
I
)
3
z
1
,
z
2
,
z
3
=
−
125
z
1
+
300
z
2
,
−
125
z
2
,
0
(T-5I)^(3)(z_(1),z_(2),z_(3))=(-125z_(1)+300z_(2),-125z_(2),0) (T-5 I)^{3}\left(z_{1}, z_{2}, z_{3}\right)=\left(-125 z_{1}+300 z_{2},-125 z_{2}, 0\right) ( T − 5 I ) 3 ( z 1 , z 2 , z 3 ) = ( − 125 z 1 + 300 z 2 , − 125 z 2 , 0 ) . 于是由 8.11 可得
G
(
5
,
T
)
=
{
(
0
,
0
,
z
3
)
:
z
3
∈
C
}
G
(
5
,
T
)
=
0
,
0
,
z
3
:
z
3
∈
C
G(5,T)={(0,0,z_(3)):z_(3)inC} G(5, T)=\left\{\left(0,0, z_{3}\right): z_{3} \in \mathbf{C}\right\} G ( 5 , T ) = { ( 0 , 0 , z 3 ) : z 3 ∈ C } .
(b) (a) 的结果表明
C
3
=
G
(
0
,
T
)
⊕
G
(
5
,
T
)
C
3
=
G
(
0
,
T
)
⊕
G
(
5
,
T
)
C^(3)=G(0,T)o+G(5,T) \mathbf{C}^{3}=G(0, T) \oplus G(5, T) C 3 = G ( 0 , T ) ⊕ G ( 5 , T ) .
本章的主要目标之一是证明上面例子中 (b) 的结果对有限维复向量空间上的算子总是成立的。我们将在 8.21 中给出证明。
我们以前在 5.10 中看到相应于不同本征值的本征向量线性无关。现在我们对广义本征向量证明类似的结果。
8.13 线性无关的广义本征向量
设
T
∈
L
(
V
)
,
λ
1
,
…
,
λ
m
T
∈
L
(
V
)
,
λ
1
,
…
,
λ
m
T inL(V),lambda_(1),dots,lambda_(m) T \in \mathcal{L}(V), \lambda_{1}, \ldots, \lambda_{m} T ∈ L ( V ) , λ 1 , … , λ m 是
T
T
T T T 的所有不同的本征值,
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 分别为相应的广义本征向量. 则
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 线性无关。
证明 设
a
1
,
…
,
a
m
a
1
,
…
,
a
m
a_(1),dots,a_(m) a_{1}, \ldots, a_{m} a 1 , … , a m 是复数,且满足
8.14
0
=
a
1
v
1
+
⋯
+
a
m
v
m
0
=
a
1
v
1
+
⋯
+
a
m
v
m
0=a_(1)v_(1)+cdots+a_(m)v_(m) 0=a_{1} v_{1}+\cdots+a_{m} v_{m} 0 = a 1 v 1 + ⋯ + a m v m
令
k
k
k k k 是使得
(
T
−
λ
1
I
)
k
v
1
≠
0
T
−
λ
1
I
k
v
1
≠
0
(T-lambda_(1)I)^(k)v_(1)!=0 \left(T-\lambda_{1} I\right)^{k} v_{1} \neq 0 ( T − λ 1 I ) k v 1 ≠ 0 成立的最大非负整数. 令
w
=
(
T
−
λ
1
I
)
k
v
1
w
=
T
−
λ
1
I
k
v
1
w=(T-lambda_(1)I)^(k)v_(1) w=\left(T-\lambda_{1} I\right)^{k} v_{1} w = ( T − λ 1 I ) k v 1
于是
(
T
−
λ
1
I
)
w
=
(
T
−
λ
1
I
)
k
+
1
v
1
=
0
T
−
λ
1
I
w
=
T
−
λ
1
I
k
+
1
v
1
=
0
(T-lambda_(1)I)w=(T-lambda_(1)I)^(k+1)v_(1)=0 \left(T-\lambda_{1} I\right) w=\left(T-\lambda_{1} I\right)^{k+1} v_{1}=0 ( T − λ 1 I ) w = ( T − λ 1 I ) k + 1 v 1 = 0
因此
T
w
=
λ
1
w
T
w
=
λ
1
w
Tw=lambda_(1)w T w=\lambda_{1} w T w = λ 1 w . 于是对每个
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 都有
(
T
−
λ
I
)
w
=
(
λ
1
−
λ
)
w
(
T
−
λ
I
)
w
=
λ
1
−
λ
w
(T-lambda I)w=(lambda_(1)-lambda)w (T-\lambda I) w=\left(\lambda_{1}-\lambda\right) w ( T − λ I ) w = ( λ 1 − λ ) w . 因此对每个
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 都有
8.15
(
T
−
λ
I
)
n
w
=
(
λ
1
−
λ
)
n
w
(
T
−
λ
I
)
n
w
=
λ
1
−
λ
n
w
(T-lambda I)^(n)w=(lambda_(1)-lambda)^(n)w (T-\lambda I)^{n} w=\left(\lambda_{1}-\lambda\right)^{n} w ( T − λ I ) n w = ( λ 1 − λ ) n w
其中
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V .
将算子
(
T
−
λ
1
I
)
k
(
T
−
λ
2
I
)
n
⋯
(
T
−
λ
m
I
)
n
T
−
λ
1
I
k
T
−
λ
2
I
n
⋯
T
−
λ
m
I
n
(T-lambda_(1)I)^(k)(T-lambda_(2)I)^(n)cdots(T-lambda_(m)I)^(n) \left(T-\lambda_{1} I\right)^{k}\left(T-\lambda_{2} I\right)^{n} \cdots\left(T-\lambda_{m} I\right)^{n} ( T − λ 1 I ) k ( T − λ 2 I ) n ⋯ ( T − λ m I ) n
作用于 8.14 的两边, 得到
0
=
a
1
(
T
−
λ
1
I
)
k
(
T
−
λ
2
I
)
n
⋯
(
T
−
λ
m
I
)
n
v
1
=
a
1
(
T
−
λ
2
I
)
n
⋯
(
T
−
λ
m
I
)
n
w
=
a
1
(
λ
1
−
λ
2
)
n
⋯
(
λ
1
−
λ
m
)
n
w
0
=
a
1
T
−
λ
1
I
k
T
−
λ
2
I
n
⋯
T
−
λ
m
I
n
v
1
=
a
1
T
−
λ
2
I
n
⋯
T
−
λ
m
I
n
w
=
a
1
λ
1
−
λ
2
n
⋯
λ
1
−
λ
m
n
w
{:[0=a_(1)(T-lambda_(1)I)^(k)(T-lambda_(2)I)^(n)cdots(T-lambda_(m)I)^(n)v_(1)],[=a_(1)(T-lambda_(2)I)^(n)cdots(T-lambda_(m)I)^(n)w],[=a_(1)(lambda_(1)-lambda_(2))^(n)cdots(lambda_(1)-lambda_(m))^(n)w]:} \begin{aligned}
0 & =a_{1}\left(T-\lambda_{1} I\right)^{k}\left(T-\lambda_{2} I\right)^{n} \cdots\left(T-\lambda_{m} I\right)^{n} v_{1} \\
& =a_{1}\left(T-\lambda_{2} I\right)^{n} \cdots\left(T-\lambda_{m} I\right)^{n} w \\
& =a_{1}\left(\lambda_{1}-\lambda_{2}\right)^{n} \cdots\left(\lambda_{1}-\lambda_{m}\right)^{n} w
\end{aligned} 0 = a 1 ( T − λ 1 I ) k ( T − λ 2 I ) n ⋯ ( T − λ m I ) n v 1 = a 1 ( T − λ 2 I ) n ⋯ ( T − λ m I ) n w = a 1 ( λ 1 − λ 2 ) n ⋯ ( λ 1 − λ m ) n w
其中我们利用 8.11 得到上面第一个等式, 利用 8.15 得到上面最后一个等式.
由上面的等式可得
a
1
=
0
a
1
=
0
a_(1)=0 a_{1}=0 a 1 = 0 . 通过类似的方式可得, 对每个
j
j
j j j 都有
a
j
=
0
a
j
=
0
a_(j)=0 a_{j}=0 a j = 0 . 于是
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 线性无关。
幂零算子
8.16 定义 幕零的(nilpotent)
一个算子称为幂零的,如果它的某个幂等于 0 .
8.17 例 懪零算子
(a) 定义为
N
(
z
1
,
z
2
,
z
3
,
z
4
)
=
(
z
3
,
z
4
,
0
,
0
)
N
z
1
,
z
2
,
z
3
,
z
4
=
z
3
,
z
4
,
0
,
0
N(z_(1),z_(2),z_(3),z_(4))=(z_(3),z_(4),0,0) N\left(z_{1}, z_{2}, z_{3}, z_{4}\right)=\left(z_{3}, z_{4}, 0,0\right) N ( z 1 , z 2 , z 3 , z 4 ) = ( z 3 , z 4 , 0 , 0 ) 的算子
N
∈
L
(
F
4
)
N
∈
L
F
4
N inL(F^(4)) N \in \mathcal{L}\left(\mathbf{F}^{4}\right) N ∈ L ( F 4 ) 是幂零的,因为
N
2
=
0
N
2
=
0
N^(2)=0 N^{2}=0 N 2 = 0 。
(b)
P
m
(
R
)
P
m
(
R
)
P_(m)(R) \mathcal{P}_{m}(\mathbf{R}) P m ( R ) 上的微分算子是幂零的,因为每个次数不超过
m
m
m m m 的多项式的
m
+
1
m
+
1
m+1 m+1 m + 1 阶导数都等于 0 . 注意, 在这个
m
+
1
m
+
1
m+1 m+1 m + 1 维空间上, 我们需要把幂零算子自乘到
m
+
1
m
+
1
m+1 m+1 m + 1 次幂才能得到 0 算子。
以下命题表明,不用考虑比空间的维数更高的幂.
拉丁词 nil 的意思是无或者零,拉丁词 potent 的意思是幂。于是 nilpotent 的字面意思是䛜零。
8.18
n
8.18
n
8.18 n 8.18 n 8.18 n 维空间上幂零算子的
n
n
n n n 次幂等于 0
设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的,则
N
dim
V
=
0
N
dim
V
=
0
N^(dim V)=0 N^{\operatorname{dim} V}=0 N dim V = 0 .
证明 因为
N
N
N N N 是幂零的, 所以
G
(
0
,
N
)
=
V
G
(
0
,
N
)
=
V
G(0,N)=V G(0, N)=V G ( 0 , N ) = V . 利用 8.11 即得 null
N
dim
V
=
V
N
dim
V
=
V
N^(dim V)=V N^{\operatorname{dim} V}=V N dim V = V .
如果
V
V
V V V 是复向量空间,则以下命题的证明易由习题7、定理5.27和定理 5.32 得到. 但这里的证明思想要比定理 5.27 的证明思想简单,并且对实向量空间实和复向量空间都适用。
给定
V
V
V V V 上的算子
T
T
T T T ,我们想要找到
V
V
V V V 的一个基,使得
T
T
T T T 关于这个基的矩阵尽可能简单,即这个矩阵包含很多 0 。
以下命题表明,如果
N
N
N N N 是幂零的,那么可以取
V
V
V V V 的一个基使得
N
N
N N N 关于这个基的矩阵有一半以上的元素都等于 0 。在本章的后面将会有
更好的结果。
8.19 幂零算子的矩阵
设
N
N
N N N 是
V
V
V V V 上的幕零算子, 那么
V
V
V V V 有一个基使得
N
N
N N N 关于这个基的矩阵形如
(
0
∗
⋱
0
0
)
,
0
∗
⋱
0
0
,
([0,,**],[,ddots,],[0,,0]), \left(\begin{array}{ccc}
0 & & * \\
& \ddots & \\
0 & & 0
\end{array}\right), ( 0 ∗ ⋱ 0 0 ) ,
其中对角线和对角线下方的元素都是 0 .
证明 首先取
null
N
null
N
null N \operatorname{null} N null N 的一个基, 将它扩充成
null
N
2
null
N
2
nullN^(2) \operatorname{null} N^{2} null N 2 的基, 再扩充成 null
N
3
N
3
N^(3) N^{3} N 3 的基. 如此下去,最终得到
V
V
V V V 的一个基(因为 8.18 表明
null
N
dim
V
=
V
null
N
dim
V
=
V
nullN^(dim V)=V \operatorname{null} N^{\operatorname{dim} V}=V null N dim V = V )。
现在我们来考虑
N
N
N N N 关于这个基的矩阵。第一列(或许前几列)全部由 0 组成,因为相应的基向量包含于 null
N
N
N N N . 下一组列来自 null
N
2
N
2
N^(2) N^{2} N 2 中的基向量. 任意这样的向量被
N
N
N N N 作用后都是
null
N
null
N
null N \operatorname{null} N null N 中的向量, 也就是说, 得到的向量是前面的基向量的线性组合. 因此这些列中所有的非零元素一定都出现在对角线的上方. 再下一组列来自
null
N
3
null
N
3
nullN^(3) \operatorname{null} N^{3} null N 3 的基向量. 任意这样的向量被
N
N
N N N 作用都是 null
N
2
N
2
N^(2) N^{2} N 2 中的向量, 也就是说, 得到的向量是前面的基向量的线性组合. 于是, 这又表明这些列中的非零元素都出现在对角线上方. 如此继续下去即可完成证明。
习题 8.A
1 定义
T
∈
L
(
C
2
)
T
∈
L
C
2
T inL(C^(2)) T \in \mathcal{L}\left(\mathbf{C}^{2}\right) T ∈ L ( C 2 ) 为
T
(
w
,
z
)
=
(
z
,
0
)
T
(
w
,
z
)
=
(
z
,
0
)
T(w,z)=(z,0) T(w, z)=(z, 0) T ( w , z ) = ( z , 0 ) . 求
T
T
T T T 的所有广义本征向量.
2 定义
T
∈
L
(
C
2
)
T
∈
L
C
2
T inL(C^(2)) T \in \mathcal{L}\left(\mathbf{C}^{2}\right) T ∈ L ( C 2 ) 为
T
(
w
,
z
)
=
(
−
z
,
w
)
T
(
w
,
z
)
=
(
−
z
,
w
)
T(w,z)=(-z,w) T(w, z)=(-z, w) T ( w , z ) = ( − z , w ) . 求
T
T
T T T 的相应于不同本征值的广义本征空间.
3 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的. 证明对每个非零的
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 有
G
(
λ
,
T
)
=
G
(
1
λ
,
T
−
1
)
G
(
λ
,
T
)
=
G
1
λ
,
T
−
1
G(lambda,T)=G((1)/(lambda),T^(-1)) G(\lambda, T)=G\left(\frac{1}{\lambda}, T^{-1}\right) G ( λ , T ) = G ( 1 λ , T − 1 ) .
4 设
T
∈
L
(
V
)
,
α
,
β
∈
F
T
∈
L
(
V
)
,
α
,
β
∈
F
T inL(V),alpha,beta inF T \in \mathcal{L}(V), \alpha, \beta \in \mathbf{F} T ∈ L ( V ) , α , β ∈ F 满足
α
≠
β
α
≠
β
alpha!=beta \alpha \neq \beta α ≠ β 。证明
G
(
α
,
T
)
∩
G
(
β
,
T
)
=
{
0
}
G
(
α
,
T
)
∩
G
(
β
,
T
)
=
{
0
}
G(alpha,T)nn G(beta,T)={0} G(\alpha, T) \cap G(\beta, T)=\{0\} G ( α , T ) ∩ G ( β , T ) = { 0 } .
5 设
T
∈
L
(
V
)
,
m
T
∈
L
(
V
)
,
m
T inL(V),m T \in \mathcal{L}(V), m T ∈ L ( V ) , m 是正整数,
v
∈
V
v
∈
V
v in V v \in V v ∈ V 使得
T
m
−
1
v
≠
0
T
m
−
1
v
≠
0
T^(m-1)v!=0 T^{m-1} v \neq 0 T m − 1 v ≠ 0 但
T
m
v
=
0
T
m
v
=
0
T^(m)v=0 T^{m} v=0 T m v = 0 . 证明:
v
,
T
v
,
T
2
v
,
…
,
T
m
−
1
v
v
,
T
v
,
T
2
v
,
…
,
T
m
−
1
v
v,Tv,T^(2)v,dots,T^(m-1)v v, T v, T^{2} v, \ldots, T^{m-1} v v , T v , T 2 v , … , T m − 1 v 是线性无关的。
6 定义
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 为
T
(
z
1
,
z
2
,
z
3
)
=
(
z
2
,
z
3
,
0
)
T
z
1
,
z
2
,
z
3
=
z
2
,
z
3
,
0
T(z_(1),z_(2),z_(3))=(z_(2),z_(3),0) T\left(z_{1}, z_{2}, z_{3}\right)=\left(z_{2}, z_{3}, 0\right) T ( z 1 , z 2 , z 3 ) = ( z 2 , z 3 , 0 ) . 证明
T
T
T T T 没有平方根. 更确切地说,证明不存在
S
∈
L
(
C
3
)
S
∈
L
C
3
S inL(C^(3)) S \in \mathcal{L}\left(\mathbf{C}^{3}\right) S ∈ L ( C 3 ) 使得
S
2
=
T
S
2
=
T
S^(2)=T S^{2}=T S 2 = T 。
7 设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的. 证明 0 是
N
N
N N N 仅有的本征值.
8 证明或给出反例:
V
V
V V V 上的幂零算子的集合是
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) 子空间。
9 设
S
,
T
∈
L
(
V
)
S
,
T
∈
L
(
V
)
S,T inL(V) S, T \in \mathcal{L}(V) S , T ∈ L ( V ) 且
S
T
S
T
ST S T S T 是幂零的。证明
T
S
T
S
TS T S T S 是幂零的。
10 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 不是幂零的。令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V 。证明
V
=
null
T
n
−
1
⊕
range
T
n
−
1
V
=
null
T
n
−
1
⊕
range
T
n
−
1
V=nullT^(n-1)o+rangeT^(n-1) V=\operatorname{null} T^{n-1} \oplus \operatorname{range} T^{n-1} V = null T n − 1 ⊕ range T n − 1 .
11 证明或给出反例: 若
V
V
V V V 是复向量空间,
dim
V
=
n
,
T
∈
L
(
V
)
dim
V
=
n
,
T
∈
L
(
V
)
dim V=n,T inL(V) \operatorname{dim} V=n, T \in \mathcal{L}(V) dim V = n , T ∈ L ( V ) , 则
T
n
T
n
T^(n) T^{n} T n 是可对角化的.
12 设
N
∈
L
(
V
)
,
V
N
∈
L
(
V
)
,
V
N inL(V),V N \in \mathcal{L}(V), V N ∈ L ( V ) , V 有一个基使得
N
N
N N N 关于这个基有上三角矩阵,其对角线上元素均为 0 。证明
N
N
N N N 是幂零的。
13 设
V
V
V V V 是内积空间,
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是正规的并且是幂零的. 证明
N
=
0
N
=
0
N=0 N=0 N = 0 .
14 设
V
V
V V V 是内积空间,
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的。证明:
V
V
V V V 有一个规范正交基使得
N
N
N N N 关于这个基有上三角矩阵。
若
F
=
C
F
=
C
F=C F=\mathbf{C} F = C ,则无需假设
N
N
N N N 是幕零的,这个结果即可由舒尔定理 6.38 得出。 于是本题只需对
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 的情况证明即可。
15 设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 使得 null
N
dim
V
−
1
≠
null
N
dim
V
N
dim
V
−
1
≠
null
N
dim
V
N^(dim V-1)!=nullN^(dim V) N^{\operatorname{dim} V-1} \neq \operatorname{null} N^{\operatorname{dim} V} N dim V − 1 ≠ null N dim V 。证明:
N
N
N N N 是幂零的,并且对每个满足
0
≤
j
≤
dim
V
0
≤
j
≤
dim
V
0 <= j <= dim V 0 \leq j \leq \operatorname{dim} V 0 ≤ j ≤ dim V 的整数
j
j
j j j 都有
dim
dim
dim \operatorname{dim} dim null
N
j
=
j
N
j
=
j
N^(j)=j N^{j}=j N j = j 。
16 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明:
V
=
range
T
0
⊃
range
T
1
⊃
⋯
⊃
range
T
k
⊃
range
T
k
+
1
⊃
⋯
.
V
=
range
T
0
⊃
range
T
1
⊃
⋯
⊃
range
T
k
⊃
range
T
k
+
1
⊃
⋯
.
V=rangeT^(0)sup rangeT^(1)sup cdots sup rangeT^(k)sup rangeT^(k+1)sup cdots. V=\operatorname{range} T^{0} \supset \operatorname{range} T^{1} \supset \cdots \supset \operatorname{range} T^{k} \supset \operatorname{range} T^{k+1} \supset \cdots . V = range T 0 ⊃ range T 1 ⊃ ⋯ ⊃ range T k ⊃ range T k + 1 ⊃ ⋯ .
17 设
T
∈
L
(
V
)
,
m
T
∈
L
(
V
)
,
m
T inL(V),m T \in \mathcal{L}(V), m T ∈ L ( V ) , m 是使得 range
T
m
=
range
T
m
+
1
T
m
=
range
T
m
+
1
T^(m)=rangeT^(m+1) T^{m}=\operatorname{range} T^{m+1} T m = range T m + 1 的非负整数. 证明:对每个
k
>
m
k
>
m
k > m k>m k > m 都有 range
T
k
=
range
T
m
T
k
=
range
T
m
T^(k)=rangeT^(m) T^{k}=\operatorname{range} T^{m} T k = range T m 。
18 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 证明:
range
T
n
=
range
T
n
+
1
=
range
T
n
+
2
=
⋯
range
T
n
=
range
T
n
+
1
=
range
T
n
+
2
=
⋯
rangeT^(n)=rangeT^(n+1)=rangeT^(n+2)=cdots \operatorname{range} T^{n}=\operatorname{range} T^{n+1}=\operatorname{range} T^{n+2}=\cdots range T n = range T n + 1 = range T n + 2 = ⋯
19 设
T
∈
L
(
V
)
,
m
T
∈
L
(
V
)
,
m
T inL(V),m T \in \mathcal{L}(V), m T ∈ L ( V ) , m 是非负整数. 证明:
null
T
m
=
null
T
m
+
1
当且仅当
range
T
m
=
range
T
m
+
1
.
null
T
m
=
null
T
m
+
1
当且仅当
range
T
m
=
range
T
m
+
1
.
nullT^(m)=nullT^(m+1)quad" 当且仅当 "rangeT^(m)=rangeT^(m+1)". " \operatorname{null} T^{m}=\operatorname{null} T^{m+1} \quad \text { 当且仅当 } \operatorname{range} T^{m}=\operatorname{range} T^{m+1} \text {. } 当 且 仅 当 null T m = null T m + 1 当且仅当 range T m = range T m + 1 .
20 设
T
∈
L
(
C
5
)
T
∈
L
C
5
T inL(C^(5)) T \in \mathcal{L}\left(\mathbf{C}^{5}\right) T ∈ L ( C 5 ) 使得
range
T
4
≠
range
T
5
range
T
4
≠
range
T
5
rangeT^(4)!=rangeT^(5) \operatorname{range} T^{4} \neq \operatorname{range} T^{5} range T 4 ≠ range T 5 。证明
T
T
T T T 是幂零的。
21 找出一个向量空间
W
W
W W W 和
T
∈
L
(
W
)
T
∈
L
(
W
)
T inL(W) T \in \mathcal{L}(W) T ∈ L ( W ) ,使得对每个正整数
k
k
k k k 都有
null
T
k
⊊
null
T
k
⊊
nullT^(k)⊊ \operatorname{null} T^{k} \subsetneq null T k ⊊ null
T
k
+
1
T
k
+
1
T^(k+1) T^{k+1} T k + 1 且 range
T
k
⊋
range
T
k
+
1
T
k
⊋
range
T
k
+
1
T^(k)⊋rangeT^(k+1) T^{k} \supsetneq \operatorname{range} T^{k+1} T k ⊋ range T k + 1 。
8.B 算子的分解
复向量空间上算子的刻画
前面我们看到,即使在有限维的复向量空间上,算子的定义域也未必能分解成本征空间的直和。本节我们将会看到,有限维的复向量空间上的每个算子都有足够多的广义本征向量来给出一个分解。
前面我们观察到,若
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,则 null
T
T
T T T 和 range
T
T
T T T 都在
T
T
T T T 下不变(参见 5.3 的 (c) 和 (d))。现在我们要证明,
T
T
T T T 的每个多项式的零空间和像空间也在
T
T
T T T 下不变.
8.20
p
(
T
)
8.20
p
(
T
)
8.20 p(T) 8.20 p(T) 8.20 p ( T ) 的零空间和像空间在
T
T
T T T 下是不变的
如果
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) ,则 null
p
(
T
)
p
(
T
)
p(T) p(T) p ( T ) 和
range
p
(
T
)
range
p
(
T
)
range p(T) \operatorname{range} p(T) range p ( T ) 在
T
T
T T T 下不变。
证明 如果
v
∈
null
p
(
T
)
v
∈
null
p
(
T
)
v in null p(T) v \in \operatorname{null} p(T) v ∈ null p ( T ) , 则
p
(
T
)
v
=
0
p
(
T
)
v
=
0
p(T)v=0 p(T) v=0 p ( T ) v = 0 . 因此
(
(
p
(
T
)
)
(
T
v
)
=
T
(
p
(
T
)
v
)
=
T
(
0
)
=
0
(
(
p
(
T
)
)
(
T
v
)
=
T
(
p
(
T
)
v
)
=
T
(
0
)
=
0
((p(T))(Tv)=T(p(T)v)=T(0)=0 ((p(T))(T v)=T(p(T) v)=T(0)=0 ( ( p ( T ) ) ( T v ) = T ( p ( T ) v ) = T ( 0 ) = 0
从而
T
v
∈
null
p
(
T
)
T
v
∈
null
p
(
T
)
Tv in null p(T) T v \in \operatorname{null} p(T) T v ∈ null p ( T ) 。于是 null
p
(
T
)
p
(
T
)
p(T) p(T) p ( T ) 在
T
T
T T T 下不变.
如果
v
∈
range
p
(
T
)
v
∈
range
p
(
T
)
v in range p(T) v \in \operatorname{range} p(T) v ∈ range p ( T ) , 则存在
u
∈
V
u
∈
V
u in V u \in V u ∈ V 使得
v
=
p
(
T
)
u
v
=
p
(
T
)
u
v=p(T)u v=p(T) u v = p ( T ) u . 因此
T
v
=
T
(
p
(
T
)
u
)
=
p
(
T
)
(
T
u
)
T
v
=
T
(
p
(
T
)
u
)
=
p
(
T
)
(
T
u
)
Tv=T(p(T)u)=p(T)(Tu) T v=T(p(T) u)=p(T)(T u) T v = T ( p ( T ) u ) = p ( T ) ( T u )
从而
T
v
∈
range
p
(
T
)
T
v
∈
range
p
(
T
)
Tv in range p(T) T v \in \operatorname{range} p(T) T v ∈ range p ( T ) 。于是
range
p
(
T
)
range
p
(
T
)
range p(T) \operatorname{range} p(T) range p ( T ) 在
T
T
T T T 下不变.
下面的主要结构定理说明,复向量空间上的每个算子都可以看成是由几部分组成的,其中每一部分都是恒等算子的标量倍加上一个幂零算子。事实上,在广义本征空间
G
(
λ
,
T
)
G
(
λ
,
T
)
G(lambda,T) G(\lambda, T) G ( λ , T ) 的讨论中已经完成所有困难的工作,所以现在的证明就简单了。
8.21 复向量空间上算子的刻画
假设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的不同本征值,则
(a)
V
=
G
(
λ
1
,
T
)
⊕
⋯
⊕
G
(
λ
m
,
T
)
V
=
G
λ
1
,
T
⊕
⋯
⊕
G
λ
m
,
T
V=G(lambda_(1),T)o+cdots o+G(lambda_(m),T) V=G\left(\lambda_{1}, T\right) \oplus \cdots \oplus G\left(\lambda_{m}, T\right) V = G ( λ 1 , T ) ⊕ ⋯ ⊕ G ( λ m , T ) ;
(b) 每个
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 在
T
T
T T T 下都是不变的;
(c) 每个
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 都是幂零的.
证明 令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V 。回想一下,对每个
j
j
j j j 有
G
(
λ
j
,
T
)
=
null
(
T
−
λ
j
I
)
n
G
λ
j
,
T
=
null
T
−
λ
j
I
n
G(lambda_(j),T)=null(T-lambda_(j)I)^(n) G\left(\lambda_{j}, T\right)=\operatorname{null}\left(T-\lambda_{j} I\right)^{n} G ( λ j , T ) = null ( T − λ j I ) n (由于 8.11).由 8.20 (取
p
(
z
)
=
(
z
−
λ
j
)
n
p
(
z
)
=
z
−
λ
j
n
p(z)=(z-lambda_(j))^(n) p(z)=\left(z-\lambda_{j}\right)^{n} p ( z ) = ( z − λ j ) n ) 可得 (b). 显然, 由定义可得 (c).
我们将通过对
n
n
n n n 用归纳法来证明(a)。首先,注意到结果对
n
=
1
n
=
1
n=1 n=1 n = 1 成立。因此假设
n
>
1
n
>
1
n > 1 n>1 n > 1 且结果对所有更小维数的向量空间都成立。
因为
V
V
V V V 是复向量空间,所以
T
T
T T T 有一个本征值(参见5.21),于是
m
≥
1
m
≥
1
m >= 1 m \geq 1 m ≥ 1 。将8.5应用到
(
T
−
λ
1
I
)
T
−
λ
1
I
(T-lambda_(1)I) \left(T-\lambda_{1} I\right) ( T − λ 1 I ) 上得到
8.22
V
=
G
(
λ
1
,
T
)
⊕
U
V
=
G
λ
1
,
T
⊕
U
V=G(lambda_(1),T)o+U V=G\left(\lambda_{1}, T\right) \oplus U V = G ( λ 1 , T ) ⊕ U
其中
U
=
range
(
T
−
λ
1
I
)
n
U
=
range
T
−
λ
1
I
n
U=range(T-lambda_(1)I)^(n) U=\operatorname{range}\left(T-\lambda_{1} I\right)^{n} U = range ( T − λ 1 I ) n 。利用 8.20 (取
p
(
z
)
=
(
z
−
λ
1
)
n
p
(
z
)
=
z
−
λ
1
n
p(z)=(z-lambda_(1))^(n) p(z)=\left(z-\lambda_{1}\right)^{n} p ( z ) = ( z − λ 1 ) n ), 我们看到
U
U
U U U 在
T
T
T T T 下不变. 由于
G
(
λ
1
,
T
)
≠
{
0
}
G
λ
1
,
T
≠
{
0
}
G(lambda_(1),T)!={0} G\left(\lambda_{1}, T\right) \neq\{0\} G ( λ 1 , T ) ≠ { 0 } ,我们有
dim
U
<
n
dim
U
<
n
dim U < n \operatorname{dim} U<n dim U < n 。于是可以对
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 应用归纳假设.
因为
T
T
T T T 的所有相应于
λ
1
λ
1
lambda_(1) \lambda_{1} λ 1 的广义本征向量都在
G
(
λ
1
,
T
)
G
λ
1
,
T
G(lambda_(1),T) G\left(\lambda_{1}, T\right) G ( λ 1 , T ) 中, 所以
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 没有相应于本征值
λ
1
λ
1
lambda_(1) \lambda_{1} λ 1 的广义本征向量. 于是
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 的每个本征值都在
{
λ
2
,
…
,
λ
m
}
λ
2
,
…
,
λ
m
{lambda_(2),dots,lambda_(m)} \left\{\lambda_{2}, \ldots, \lambda_{m}\right\} { λ 2 , … , λ m } 中.
由归纳假设,
U
=
G
(
λ
2
,
T
|
U
)
⊕
⋯
⊕
G
(
λ
m
,
T
|
U
)
U
=
G
λ
2
,
T
U
⊕
⋯
⊕
G
λ
m
,
T
U
U=G(lambda_(2),T|_(U))o+cdots o+G(lambda_(m),T|_(U)) U=G\left(\lambda_{2},\left.T\right|_{U}\right) \oplus \cdots \oplus G\left(\lambda_{m},\left.T\right|_{U}\right) U = G ( λ 2 , T | U ) ⊕ ⋯ ⊕ G ( λ m , T | U ) 。把它与 8.22 结合起来可知,要完成证明,只需证明对
k
=
2
,
…
,
m
k
=
2
,
…
,
m
k=2,dots,m k=2, \ldots, m k = 2 , … , m 均有
G
(
λ
k
,
T
|
U
)
=
G
(
λ
k
,
T
)
G
λ
k
,
T
U
=
G
λ
k
,
T
G(lambda_(k),T|_(U))=G(lambda_(k),T) G\left(\lambda_{k},\left.T\right|_{U}\right)=G\left(\lambda_{k}, T\right) G ( λ k , T | U ) = G ( λ k , T ) 。
于是,取定
k
∈
{
2
,
…
,
m
}
k
∈
{
2
,
…
,
m
}
k in{2,dots,m} k \in\{2, \ldots, m\} k ∈ { 2 , … , m } 。包含关系
G
(
λ
k
,
T
|
U
)
⊂
G
(
λ
k
,
T
)
G
λ
k
,
T
U
⊂
G
λ
k
,
T
G(lambda_(k),T|_(U))sub G(lambda_(k),T) G\left(\lambda_{k},\left.T\right|_{U}\right) \subset G\left(\lambda_{k}, T\right) G ( λ k , T | U ) ⊂ G ( λ k , T ) 是显然的.
要证明另一个方向的包含关系,设
v
∈
G
(
λ
k
,
T
)
v
∈
G
λ
k
,
T
v in G(lambda_(k),T) v \in G\left(\lambda_{k}, T\right) v ∈ G ( λ k , T ) 。由 8.22 有
v
=
v
1
+
u
v
=
v
1
+
u
v=v_(1)+u v=v_{1}+u v = v 1 + u , 其中
v
1
∈
G
(
λ
1
,
T
)
v
1
∈
G
λ
1
,
T
v_(1)in G(lambda_(1),T) v_{1} \in G\left(\lambda_{1}, T\right) v 1 ∈ G ( λ 1 , T ) 且
u
∈
U
u
∈
U
u in U u \in U u ∈ U 。由归纳假设有
u
=
v
2
+
⋯
+
v
m
u
=
v
2
+
⋯
+
v
m
u=v_(2)+cdots+v_(m) u=v_{2}+\cdots+v_{m} u = v 2 + ⋯ + v m
其中每个
v
j
v
j
v_(j) v_{j} v j 都在
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 的子集
G
(
λ
j
,
T
|
U
)
G
λ
j
,
T
U
G(lambda_(j),T|_(U)) G\left(\lambda_{j},\left.T\right|_{U}\right) G ( λ j , T | U ) 中. 于是
v
=
v
1
+
v
2
+
⋯
+
v
m
v
=
v
1
+
v
2
+
⋯
+
v
m
v=v_(1)+v_(2)+cdots+v_(m) v=v_{1}+v_{2}+\cdots+v_{m} v = v 1 + v 2 + ⋯ + v m
因为相应于不同本征值的广义本征向量线性无关(参见 8.13),所以由上式可知,除
j
=
k
j
=
k
j=k j=k j = k 外每个
v
j
v
j
v_(j) v_{j} v j 都等于 0 . 特别地,
v
1
=
0
v
1
=
0
v_(1)=0 v_{1}=0 v 1 = 0 , 于是
v
=
u
∈
U
v
=
u
∈
U
v=u in U v=u \in U v = u ∈ U . 因为
v
∈
U
v
∈
U
v in U v \in U v ∈ U , 所以有
v
∈
G
(
λ
k
,
T
|
U
)
v
∈
G
λ
k
,
T
U
v in G(lambda_(k),T|_(U)) v \in G\left(\lambda_{k},\left.T\right|_{U}\right) v ∈ G ( λ k , T | U ) .
我们知道,复向量空间上的算子可能没有足够多的本征向量来组成定义域的基.以下命题表明复向量空间上的算子有足够多的广义本征向量来组成定义域的基.
8.23 广义本征向量的基
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。则
V
V
V V V 有一个由
T
T
T T T 的广义本征向量组成的基.
证明 给 8.21 中的每个
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 取一个基. 将所有这些基放在一起就得到
V
V
V V V 的一个由
T
T
T T T 的广义本征向量组成基。
本征值的重数
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,则由 8.21 给出的
V
V
V V V 的分解是一个强大的工具.包含在这个分解中的子空间的维数非常重要,应有一个名字。
8.24 定义 重数(multiplicity)
设
T
∈
L
(
V
)
.
T
T
∈
L
(
V
)
.
T
T inL(V).T T \in \mathcal{L}(V) . T T ∈ L ( V ) . T 的本征值
λ
λ
lambda \lambda λ 的重数定义为相应的广义本征空间
G
(
λ
,
T
)
G
(
λ
,
T
)
G(lambda,T) G(\lambda, T) G ( λ , T ) 的维数。
也就是说,
T
T
T T T 的本征值
λ
λ
lambda \lambda λ 的重数等于
dim
null
(
T
−
λ
I
)
dim
V
dim
null
(
T
−
λ
I
)
dim
V
dim null(T-lambda I)^(dim V) \operatorname{dim} \operatorname{null}(T-\lambda I)^{\operatorname{dim} V} dim null ( T − λ I ) dim V 。
由 8.11 可知, 上面的第二条是合理的.
8.25 例 定义
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 为
T
(
z
1
,
z
2
,
z
3
)
=
(
6
z
1
+
3
z
2
+
4
z
3
,
6
z
2
+
2
z
3
,
7
z
3
)
T
z
1
,
z
2
,
z
3
=
6
z
1
+
3
z
2
+
4
z
3
,
6
z
2
+
2
z
3
,
7
z
3
T(z_(1),z_(2),z_(3))=(6z_(1)+3z_(2)+4z_(3),6z_(2)+2z_(3),7z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(6 z_{1}+3 z_{2}+4 z_{3}, 6 z_{2}+2 z_{3}, 7 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 6 z 1 + 3 z 2 + 4 z 3 , 6 z 2 + 2 z 3 , 7 z 3 )
(
6
3
4
0
6
2
0
0
7
)
6
3
4
0
6
2
0
0
7
([6,3,4],[0,6,2],[0,0,7]) \left(\begin{array}{lll}
6 & 3 & 4 \\
0 & 6 & 2 \\
0 & 0 & 7
\end{array}\right) ( 6 3 4 0 6 2 0 0 7 )
由 5.32 可知,
T
T
T T T 的本征值是 6 和 7. 请自行验证,
T
T
T T T 的广义本征空间是
G
(
6
,
T
)
=
span
(
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
)
和
G
(
7
,
T
)
=
span
(
(
10
,
2
,
1
)
)
.
G
(
6
,
T
)
=
span
(
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
)
和
G
(
7
,
T
)
=
span
(
(
10
,
2
,
1
)
)
.
G(6,T)=span((1,0,0),(0,1,0))quad" 和 "quad G(7,T)=span((10,2,1)). G(6, T)=\operatorname{span}((1,0,0),(0,1,0)) \quad \text { 和 } \quad G(7, T)=\operatorname{span}((10,2,1)) . 和 G ( 6 , T ) = span ( ( 1 , 0 , 0 ) , ( 0 , 1 , 0 ) ) 和 G ( 7 , T ) = span ( ( 10 , 2 , 1 ) ) .
于是, 本征值 6 的重数为 2 , 本征值 7 的重数为 1 .
由 8.21 , 有直和分解
C
3
=
G
(
6
,
T
)
⊕
G
(
7
,
T
)
C
3
=
G
(
6
,
T
)
⊕
G
(
7
,
T
)
C^(3)=G(6,T)o+G(7,T) \mathbf{C}^{3}=G(6, T) \oplus G(7, T) C 3 = G ( 6 , T ) ⊕ G ( 7 , T ) 。如 8.23 提到的那样,
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 有一个由
T
T
T T T 的广义本征向量组成的的基
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
,
(
10
,
2
,
1
)
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
,
(
10
,
2
,
1
)
(1,0,0),(0,1,0),(10,2,1) (1,0,0),(0,1,0),(10,2,1) ( 1 , 0 , 0 ) , ( 0 , 1 , 0 ) , ( 10 , 2 , 1 ) .
上例中
T
T
T T T 的本征值的重数之和等于 3 , 即
T
T
T T T 的定义域的维数。 以下定理表明这在复向量空间上总成立。
8.26 重数之和等于
dim
V
dim
V
dim V \operatorname{dim} V dim V
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则
T
T
T T T 的所有本征值的重数之和等于
dim
V
dim
V
dim V \operatorname{dim} V dim V .
证明 由 8.21 与直和维数的那个明显的公式(参见 3.78 或 2.C 节的习题 16),即可证得想要的结果。
在某些书中,使用代数重数和几何重数这两个术语。如果遇到这些术语,要知道,代数重数与这里定义的重数是一样的,几何重数是相应的本征空间的维数。 也就是说,若
T
∈
L
(
V
)
,
λ
T
∈
L
(
V
)
,
λ
T inL(V),lambda T \in \mathcal{L}(V), \lambda T ∈ L ( V ) , λ 是
T
T
T T T 的本征值,则
λ
的代数重数
=
dim
null
(
T
−
λ
I
)
dim
V
=
dim
G
(
λ
,
T
)
,
λ
的几何重数
=
dim
null
(
T
−
λ
I
)
=
dim
E
(
λ
,
T
)
.
λ
的代数重数
=
dim
null
(
T
−
λ
I
)
dim
V
=
dim
G
(
λ
,
T
)
,
λ
的几何重数
=
dim
null
(
T
−
λ
I
)
=
dim
E
(
λ
,
T
)
.
{:[lambda" 的代数重数 "=dim null(T-lambda I)^(dim V)=dim G(lambda","T)","],[lambda" 的几何重数 "=dim null(T-lambda I)=dim E(lambda","T).]:} \begin{aligned}
& \lambda \text { 的代数重数 }=\operatorname{dim} \operatorname{null}(T-\lambda I)^{\operatorname{dim} V}=\operatorname{dim} G(\lambda, T), \\
& \lambda \text { 的几何重数 }=\operatorname{dim} \operatorname{null}(T-\lambda I)=\operatorname{dim} E(\lambda, T) .
\end{aligned} 的 代 数 重 数 的 几 何 重 数 λ 的代数重数 = dim null ( T − λ I ) dim V = dim G ( λ , T ) , λ 的几何重数 = dim null ( T − λ I ) = dim E ( λ , T ) .
注意,按照以上定义,代数重数作为某个零空间的维数也有几何意义. 这里给出的重数的定义比涉及行列式的传统定义更整洁。由 10.25 可知这些定义是等价的。
分块对角矩阵
将矩阵看作由更小的矩阵组成的矩阵,我们就可以更好地理解矩阵。
为了用矩阵形式来解释我们的结果,我们提出以下定义,它推广了对角矩阵的概念。
若下面定义中的每个矩阵
A
j
A
j
A_(j) A_{j} A j 是
1
×
1
1
×
1
1xx1 1 \times 1 1 × 1 矩
阵, 则实际上得到一个对角矩阵.
8.27 定义 分块对角矩阵(block diagonal matrix)
分块对角矩阵是形如
(
A
1
0
⋱
0
A
m
)
A
1
0
⋱
0
A
m
([A_(1),,0],[,ddots,],[0,,A_(m)]) \left(\begin{array}{ccc}
A_{1} & & 0 \\
& \ddots & \\
0 & & A_{m}
\end{array}\right) ( A 1 0 ⋱ 0 A m )
的方阵,其中
A
1
,
…
,
A
m
A
1
,
…
,
A
m
A_(1),dots,A_(m) A_{1}, \ldots, A_{m} A 1 , … , A m 位于对角线上且为方阵,矩阵的所有其他元素都等于 0.
8.28 例
5
×
5
5
×
5
5xx5 5 \times 5 5 × 5 矩阵
A
=
(
(
4
)
0
0
0
0
0
0
0
0
2
−
3
0
2
)
[
0
0
0
0
0
0
(
1
7
0
1
)
.
A
=
(
4
)
0
0
0
0
0
0
0
0
2
−
3
0
2
0
0
0
0
0
0
1
7
0
1
.
A=([(4),0],[0],[0],[0],[0],[0]quad[0,0],[2,-3],[0,2])[[0,0],[0,0],[0,0]quad([1,7],[0,1]).:} A=\left(\begin{array}{cc}
(4) & 0 \\
0 \\
0 \\
0 \\
0 \\
0
\end{array} \quad \begin{array}{cc}
0 & 0 \\
2 & -3 \\
0 & 2
\end{array}\right) ~\left[\begin{array}{ll}
0 & 0 \\
0 & 0 \\
0 & 0
\end{array} \quad\left(\begin{array}{ll}
1 & 7 \\
0 & 1
\end{array}\right) .\right. A = ( ( 4 ) 0 0 0 0 0 0 0 0 2 − 3 0 2 ) [ 0 0 0 0 0 0 ( 1 7 0 1 ) .
是分块对角矩阵
A
=
(
A
1
0
A
2
0
A
3
)
A
=
A
1
0
A
2
0
A
3
A=([A_(1),,0],[,A_(2),],[0,,A_(3)]) A=\left(\begin{array}{lll}
A_{1} & & 0 \\
& A_{2} & \\
0 & & A_{3}
\end{array}\right) A = ( A 1 0 A 2 0 A 3 )
其中
A
1
=
(
4
)
,
A
2
=
(
2
−
3
0
2
)
,
A
3
=
(
1
7
0
1
)
.
A
1
=
(
4
)
,
A
2
=
2
−
3
0
2
,
A
3
=
1
7
0
1
.
A_(1)=(4),quadA_(2)=([2,-3],[0,2]),quadA_(3)=([1,7],[0,1]). A_{1}=(4), \quad A_{2}=\left(\begin{array}{cc}
2 & -3 \\
0 & 2
\end{array}\right), \quad A_{3}=\left(\begin{array}{ll}
1 & 7 \\
0 & 1
\end{array}\right) . A 1 = ( 4 ) , A 2 = ( 2 − 3 0 2 ) , A 3 = ( 1 7 0 1 ) .
这里, 我们将
5
×
5
5
×
5
5xx5 5 \times 5 5 × 5 矩阵分解成一块一块的的内部矩阵, 以便说明它如何看作一个分块对角矩阵。
注意,在以下命题中,
T
T
T T T 的矩阵比上三角矩阵有更多的零。
8.29 具有上三角块的分块对角矩阵
假设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的所有互不相同的本征值,重数分别为
d
1
,
…
,
d
m
d
1
,
…
,
d
m
d_(1),dots,d_(m) d_{1}, \ldots, d_{m} d 1 , … , d m 。则
V
V
V V V 有一个基使得
T
T
T T T 关于这个基有分块对角矩阵
(
A
1
0
⋱
0
A
m
)
A
1
0
⋱
0
A
m
([A_(1),,0],[,ddots,],[0,,A_(m)]) \left(\begin{array}{ccc}
A_{1} & & 0 \\
& \ddots & \\
0 & & A_{m}
\end{array}\right) ( A 1 0 ⋱ 0 A m )
其中每个
A
j
A
j
A_(j) A_{j} A j 都是如下所示的
d
j
×
d
j
d
j
×
d
j
d_(j)xxd_(j) d_{j} \times d_{j} d j × d j 上三角矩阵:
A
j
=
(
λ
j
∗
⋱
0
λ
j
)
A
j
=
λ
j
∗
⋱
0
λ
j
A_(j)=([lambda_(j),,**],[,ddots,],[0,,lambda_(j)]) A_{j}=\left(\begin{array}{ccc}
\lambda_{j} & & * \\
& \ddots & \\
0 & & \lambda_{j}
\end{array}\right) A j = ( λ j ∗ ⋱ 0 λ j )
证明 每个
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 都是幂零的(参见
8.21
(
c
)
8.21
(
c
)
8.21(c) 8.21(\mathrm{c}) 8.21 ( c ) )。对每个
j
,
G
(
λ
j
,
T
)
j
,
G
λ
j
,
T
j,G(lambda_(j),T) j, G\left(\lambda_{j}, T\right) j , G ( λ j , T ) 是
d
j
d
j
d_(j) d_{j} d j 维向量空间,取
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 的一个基,使得
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 关于这个基的矩阵形如 8.19. 于是,
T
|
G
(
λ
j
,
T
)
T
G
λ
j
,
T
T|_(G(lambda_(j),T)) \left.T\right|_{G\left(\lambda_{j}, T\right)} T | G ( λ j , T ) [等于
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
+
λ
j
I
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
+
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T))+lambda_(j)I|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)}+\left.\lambda_{j} I\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) + λ j I | G ( λ j , T ) ] 关于这个基的矩阵就是上面给出的
A
j
A
j
A_(j) A_{j} A j 的形式。
将这些
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 的基放在一起就组成
V
V
V V V 的一个基(根据 8.21 (a)).
T
T
T T T 关于这个基的矩阵就具有想要的形式。
8.28 中的
5
×
5
5
×
5
5xx5 5 \times 5 5 × 5 矩阵就是 8.29 中提到的形式,其中每个块都是对角线元素相同的上三角矩阵。若
T
T
T T T 是 5 维向量空间上的一个算子, 其矩阵如 8.28 中的形式, 则
T
T
T T T 的本征值是
4
,
2
,
1
4
,
2
,
1
4,2,1 4,2,1 4 , 2 , 1 (由 5.32 即可得), 重数分别为
1
,
2
,
2
1
,
2
,
2
1,2,2 1,2,2 1 , 2 , 2 .
8.30 例 设
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 定义为
T
(
z
1
,
z
2
,
z
3
)
=
(
6
z
1
+
3
z
2
+
4
z
3
,
6
z
2
+
2
z
3
,
7
z
3
)
T
z
1
,
z
2
,
z
3
=
6
z
1
+
3
z
2
+
4
z
3
,
6
z
2
+
2
z
3
,
7
z
3
T(z_(1),z_(2),z_(3))=(6z_(1)+3z_(2)+4z_(3),6z_(2)+2z_(3),7z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(6 z_{1}+3 z_{2}+4 z_{3}, 6 z_{2}+2 z_{3}, 7 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 6 z 1 + 3 z 2 + 4 z 3 , 6 z 2 + 2 z 3 , 7 z 3 )
(
6
3
4
0
6
2
0
0
7
)
6
3
4
0
6
2
0
0
7
([6,3,4],[0,6,2],[0,0,7]) \left(\begin{array}{lll}
6 & 3 & 4 \\
0 & 6 & 2 \\
0 & 0 & 7
\end{array}\right) ( 6 3 4 0 6 2 0 0 7 )
这是一个上三角矩阵,然而它并不是 8.29 给出的形式。
如 8.25 中所见,
T
T
T T T 的本征值为 6 和 7 ,相应的广义本征空间是
G
(
6
,
T
)
=
span
(
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
)
和
G
(
7
,
T
)
=
span
(
(
10
,
2
,
1
)
)
G
(
6
,
T
)
=
span
(
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
)
和
G
(
7
,
T
)
=
span
(
(
10
,
2
,
1
)
)
G(6,T)=span((1,0,0),(0,1,0))quad" 和 "quad G(7,T)=span((10,2,1)) G(6, T)=\operatorname{span}((1,0,0),(0,1,0)) \quad \text { 和 } \quad G(7, T)=\operatorname{span}((10,2,1)) 和 G ( 6 , T ) = span ( ( 1 , 0 , 0 ) , ( 0 , 1 , 0 ) ) 和 G ( 7 , T ) = span ( ( 10 , 2 , 1 ) )
我们也看到
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 的由
T
T
T T T 的广义本征向量组成的基是
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
,
(
10
,
2
,
1
)
(
1
,
0
,
0
)
,
(
0
,
1
,
0
)
,
(
10
,
2
,
1
)
(1,0,0),(0,1,0),(10,2,1) (1,0,0),(0,1,0),(10,2,1) ( 1 , 0 , 0 ) , ( 0 , 1 , 0 ) , ( 10 , 2 , 1 )
(
(
6
3
0
6
)
0
0
0
0
6
3
0
6
0
0
0
0
([([6,3],[0,6]),{:[0],[0],[0]:}0]:} \left(\begin{array}{cc}
\left(\begin{array}{ll}
6 & 3 \\
0 & 6
\end{array}\right) & \begin{array}{l}
0 \\
0 \\
0
\end{array} 0
\end{array}\right. ( ( 6 3 0 6 ) 0 0 0 0
这是由 8.29 给出的具有上三角块的分块对角矩阵。
在 8.D 节讨论若尔当形时将看到,可以找到一个基使得算子
T
T
T T T 关于这个基有一个矩阵, 它比 8.29 给出的矩阵有更多的 0 . 然而, 8.29 与其等价命题 8.21 已经非常有用. 例如, 下一小节将利用 8.21 证明复向量空间上每个可逆算子都有平方根.
平方根
回想一下,算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 的平方根是满足
R
2
=
T
R
2
=
T
R^(2)=T R^{2}=T R 2 = T 的算子
R
∈
L
(
V
)
R
∈
L
(
V
)
R inL(V) R \in \mathcal{L}(V) R ∈ L ( V ) (参见 7.33)。每个复数都有平方根,但复向量空间上的算子并不都有平方根。例如,在 8.A节的习题 6 中,
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 上的那个算子就没有平方根。我们很快就会看到,这个算子的不可逆性并不是偶然的. 我们首先证明, 恒等算子加上一个幂零算子总有平方根.
8.31 恒等加幂零有平方根
设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的, 则
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) 有平方根.
证明 考虑函数
1
+
x
1
+
x
sqrt(1+x) \sqrt{1+x} 1 + x 的泰勒级数
8.32
1
+
x
=
1
+
a
1
x
+
a
2
x
2
+
⋯
1
+
x
=
1
+
a
1
x
+
a
2
x
2
+
⋯
sqrt(1+x)=1+a_(1)x+a_(2)x^(2)+cdots \sqrt{1+x}=1+a_{1} x+a_{2} x^{2}+\cdots 1 + x = 1 + a 1 x + a 2 x 2 + ⋯
我们无需找出系数的显式公式,也不用担心这个无限和是否收敛,因为我们只想从中受些启发。
因为
N
N
N N N 是幂零的,所以存在正整数
m
m
m m m 使得
N
m
=
0
N
m
=
0
N^(m)=0 N^{m}=0 N m = 0 . 在 8.32 中, 如果用
N
N
N N N 替换
x
x
x x x , 用
I
I
I I I 替换 1 , 则右端的无限和就成为一个有限和(因为对所有的
j
≥
m
j
≥
m
j >= m j \geq m j ≥ m 都有
N
j
=
0
N
j
=
0
N^(j)=0 N^{j}=0 N j = 0 )。也就是说,可以猜测
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) 有形如
I
+
a
1
N
+
a
2
N
2
+
⋯
+
a
m
−
1
N
m
−
1
I
+
a
1
N
+
a
2
N
2
+
⋯
+
a
m
−
1
N
m
−
1
I+a_(1)N+a_(2)N^(2)+cdots+a_(m-1)N^(m-1) I+a_{1} N+a_{2} N^{2}+\cdots+a_{m-1} N^{m-1} I + a 1 N + a 2 N 2 + ⋯ + a m − 1 N m − 1
的平方根. 根据这个猜测,试取
a
1
,
a
2
,
…
,
a
m
−
1
a
1
,
a
2
,
…
,
a
m
−
1
a_(1),a_(2),dots,a_(m-1) a_{1}, a_{2}, \ldots, a_{m-1} a 1 , a 2 , … , a m − 1 使得上面算子的平方等于
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) .现在
(
I
+
a
1
N
+
a
2
N
2
+
a
3
N
3
+
⋯
+
a
m
−
1
N
m
−
1
)
2
=
I
+
2
a
1
N
+
(
2
a
2
+
a
1
2
)
N
2
+
(
2
a
3
+
2
a
1
a
2
)
N
3
+
⋯
+
(
2
a
m
−
1
+
包含
a
1
,
…
,
a
m
−
2
的项
)
N
m
−
1
.
I
+
a
1
N
+
a
2
N
2
+
a
3
N
3
+
⋯
+
a
m
−
1
N
m
−
1
2
=
I
+
2
a
1
N
+
2
a
2
+
a
1
2
N
2
+
2
a
3
+
2
a
1
a
2
N
3
+
⋯
+
2
a
m
−
1
+
包含
a
1
,
…
,
a
m
−
2
的项
N
m
−
1
.
{:[(I+a_(1)N+a_(2)N^(2)+a_(3)N^(3)+cdots+a_(m-1)N^(m-1))^(2)],[quad=I+2a_(1)N+(2a_(2)+a_(1)^(2))N^(2)+(2a_(3)+2a_(1)a_(2))N^(3)+cdots],[quad+(2a_(m-1)+" 包含 "a_(1),dots,a_(m-2)" 的项 ")N^(m-1).]:} \begin{aligned}
& \left(I+a_{1} N+a_{2} N^{2}+a_{3} N^{3}+\cdots+a_{m-1} N^{m-1}\right)^{2} \\
& \quad=I+2 a_{1} N+\left(2 a_{2}+a_{1}^{2}\right) N^{2}+\left(2 a_{3}+2 a_{1} a_{2}\right) N^{3}+\cdots \\
& \quad+\left(2 a_{m-1}+\text { 包含 } a_{1}, \ldots, a_{m-2} \text { 的项 }\right) N^{m-1} .
\end{aligned} 包 含 的 项 ( I + a 1 N + a 2 N 2 + a 3 N 3 + ⋯ + a m − 1 N m − 1 ) 2 = I + 2 a 1 N + ( 2 a 2 + a 1 2 ) N 2 + ( 2 a 3 + 2 a 1 a 2 ) N 3 + ⋯ + ( 2 a m − 1 + 包含 a 1 , … , a m − 2 的项 ) N m − 1 .
我们希望上式的右端等于
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) . 于是, 取
a
1
a
1
a_(1) a_{1} a 1 使得
2
a
1
=
1
2
a
1
=
1
2a_(1)=1 2 a_{1}=1 2 a 1 = 1 (从而
a
1
=
1
/
2
a
1
=
1
/
2
a_(1)=1//2 a_{1}=1 / 2 a 1 = 1 / 2 )。再取
a
2
a
2
a_(2) a_{2} a 2 使得
2
a
2
+
a
1
2
=
0
2
a
2
+
a
1
2
=
0
2a_(2)+a_(1)^(2)=0 2 a_{2}+a_{1}{ }^{2}=0 2 a 2 + a 1 2 = 0 (从而
a
2
=
−
1
/
8
a
2
=
−
1
/
8
a_(2)=-1//8 a_{2}=-1 / 8 a 2 = − 1 / 8 ). 然后再取
a
3
a
3
a_(3) a_{3} a 3 使得上式右端
N
3
N
3
N^(3) N^{3} N 3 的系数等于 0 (从而
a
3
=
1
/
16
a
3
=
1
/
16
a_(3)=1//16 a_{3}=1 / 16 a 3 = 1 / 16 )。对
j
=
4
,
…
,
m
−
1
j
=
4
,
…
,
m
−
1
j=4,dots,m-1 j=4, \ldots, m-1 j = 4 , … , m − 1 如此进行下去,每一步都解出一个
a
j
a
j
a_(j) a_{j} a j 使得上式右端
N
j
N
j
N^(j) N^{j} N j 的系数等于 0 。事实上, 我们并不关心这些
a
j
a
j
a_(j) a_{j} a j 的显式公式, 只需知道这些
a
j
a
j
a_(j) a_{j} a j 的选取给出
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) 的一个平方根。
以上引理对实向量空间和复向量空间都成立,但以下命题却只对复向量空间成立. 例如,一维实向量空间
R
R
R \mathbf{R} R 上乘以 -1 的算子没有平方根。
8.33 C 上的可逆算子有平方根
设
V
V
V V V 是复向量空间. 如果
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的, 则
T
T
T T T 有平方根.
证明 设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的所有互不相同的本征值。对每个
j
j
j j j 都存在一个幂零算子
N
j
∈
L
(
G
(
λ
j
,
T
)
)
N
j
∈
L
G
λ
j
,
T
N_(j)inL(G(lambda_(j),T)) N_{j} \in \mathcal{L}\left(G\left(\lambda_{j}, T\right)\right) N j ∈ L ( G ( λ j , T ) ) 使得
T
|
G
(
λ
j
,
T
)
=
λ
j
I
+
N
j
T
G
λ
j
,
T
=
λ
j
I
+
N
j
T|_(G(lambda_(j),T))=lambda_(j)I+N_(j) \left.T\right|_{G\left(\lambda_{j}, T\right)}=\lambda_{j} I+N_{j} T | G ( λ j , T ) = λ j I + N j (参见 8.21(c))。因为
T
T
T T T 是可逆的,所以每个
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 都不等于 0 ,于是对每个
j
j
j j j 都有
T
|
G
(
λ
j
,
T
)
=
λ
j
(
I
+
N
j
λ
j
)
T
G
λ
j
,
T
=
λ
j
I
+
N
j
λ
j
T|_(G(lambda_(j),T))=lambda_(j)(I+(N_(j))/(lambda_(j))) \left.T\right|_{G\left(\lambda_{j}, T\right)}=\lambda_{j}\left(I+\frac{N_{j}}{\lambda_{j}}\right) T | G ( λ j , T ) = λ j ( I + N j λ j )
显然
N
j
/
λ
j
N
j
/
λ
j
N_(j)//lambda_(j) N_{j} / \lambda_{j} N j / λ j 是幂零的, 于是
(
I
+
N
j
/
λ
j
)
I
+
N
j
/
λ
j
(I+N_(j)//lambda_(j)) \left(I+N_{j} / \lambda_{j}\right) ( I + N j / λ j ) 有平方根(由于 8.31 )。用复数
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 的一个平方根乘以
(
I
+
N
j
/
λ
j
)
I
+
N
j
/
λ
j
(I+N_(j)//lambda_(j)) \left(I+N_{j} / \lambda_{j}\right) ( I + N j / λ j ) 的一个平方根就得到
T
|
G
(
λ
j
,
T
)
T
G
λ
j
,
T
T|_(G(lambda_(j),T)) \left.T\right|_{G\left(\lambda_{j}, T\right)} T | G ( λ j , T ) 的一个平方根
R
j
R
j
R_(j) R_{j} R j 。
向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V 可以唯一地写成
v
=
u
1
+
⋯
+
u
m
v
=
u
1
+
⋯
+
u
m
v=u_(1)+cdots+u_(m) v=u_{1}+\cdots+u_{m} v = u 1 + ⋯ + u m
其中每个
u
j
u
j
u_(j) u_{j} u j 都属于
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) (参见 8.21 )。利用这个分解,定义算子
R
∈
L
(
V
)
R
∈
L
(
V
)
R inL(V) R \in \mathcal{L}(V) R ∈ L ( V ) 为
R
v
=
R
1
u
1
+
⋯
+
R
m
u
m
R
v
=
R
1
u
1
+
⋯
+
R
m
u
m
Rv=R_(1)u_(1)+cdots+R_(m)u_(m) R v=R_{1} u_{1}+\cdots+R_{m} u_{m} R v = R 1 u 1 + ⋯ + R m u m
请自行验证,这个算子
R
R
R R R 是
T
T
T T T 的平方根。
仿照本节的方法能够证明:如果
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的,那么对每个正整数
k
,
T
k
,
T
k,T k, T k , T 都有
k
k
k k k 次方根。
习题 8.B
1 设
V
V
V V V 是复向量空间,
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 且 0 是
N
N
N N N 仅有的本征值. 证明
N
N
N N N 是幂零的.
2 找出有限维实向量空间上的一个算子
T
T
T T T ,使得 0 是
T
T
T T T 仅有的本征值,但
T
T
T T T 不是幂零的。
3 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 是可逆的。证明
T
T
T T T 和
S
−
1
T
S
S
−
1
T
S
S^(-1)TS S^{-1} T S S − 1 T S 有相同的本征值, 且它们的重数也相同。
4 设
V
V
V V V 是
n
n
n n n 维复向量空间,
T
T
T T T 是
V
V
V V V 上的算子使得
null
T
n
−
2
≠
null
T
n
−
1
null
T
n
−
2
≠
null
T
n
−
1
nullT^(n-2)!=nullT^(n-1) \operatorname{null} T^{n-2} \neq \operatorname{null} T^{n-1} null T n − 2 ≠ null T n − 1 。证明
T
T
T T T 最多有两个不同的本征值。
5 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。证明:
V
V
V V V 有一个由
T
T
T T T 的本征向量组成的基当且仅当
T
T
T T T 的每个广义本征向量都是
T
T
T T T 的本征向量。
对于
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C ,本题给 5.41 的等价条件列表添加了一个等价条件。
6 定义
N
∈
L
(
F
5
)
N
∈
L
F
5
N inL(F^(5)) N \in \mathcal{L}\left(\mathbf{F}^{5}\right) N ∈ L ( F 5 ) 为
N
(
x
1
,
x
2
,
x
3
,
x
4
,
x
5
)
=
(
2
x
2
,
3
x
3
,
−
x
4
,
4
x
5
,
0
)
.
N
x
1
,
x
2
,
x
3
,
x
4
,
x
5
=
2
x
2
,
3
x
3
,
−
x
4
,
4
x
5
,
0
.
N(x_(1),x_(2),x_(3),x_(4),x_(5))=(2x_(2),3x_(3),-x_(4),4x_(5),0). N\left(x_{1}, x_{2}, x_{3}, x_{4}, x_{5}\right)=\left(2 x_{2}, 3 x_{3},-x_{4}, 4 x_{5}, 0\right) . N ( x 1 , x 2 , x 3 , x 4 , x 5 ) = ( 2 x 2 , 3 x 3 , − x 4 , 4 x 5 , 0 ) .
求
(
I
+
N
)
(
I
+
N
)
(I+N) (I+N) ( I + N ) 的一个平方根。
7 设
V
V
V V V 是复向量空间。证明
V
V
V V V 上的每个可逆算子都有三次方根.
8 设
T
∈
L
(
V
)
,
3
T
∈
L
(
V
)
,
3
T inL(V),3 T \in \mathcal{L}(V), 3 T ∈ L ( V ) , 3 和 8 都是
T
T
T T T 的本征值. 令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 证明:
V
=
(
null
T
n
−
2
)
⊕
(
range
T
n
−
2
)
V
=
null
T
n
−
2
⊕
range
T
n
−
2
V=(nullT^(n-2))o+(rangeT^(n-2)) V=\left(\operatorname{null} T^{n-2}\right) \oplus\left(\operatorname{range} T^{n-2}\right) V = ( null T n − 2 ) ⊕ ( range T n − 2 )
9 设
A
A
A A A 和
B
B
B B B 是形如
A
=
(
A
1
0
⋱
0
A
m
)
,
B
=
(
B
1
0
⋱
0
B
m
)
A
=
A
1
0
⋱
0
A
m
,
B
=
B
1
0
⋱
0
B
m
A=([A_(1),,0],[,ddots,],[0,,A_(m)]),quad B=([B_(1),,0],[,ddots,],[0,,B_(m)]) A=\left(\begin{array}{ccc}
A_{1} & & 0 \\
& \ddots & \\
0 & & A_{m}
\end{array}\right), \quad B=\left(\begin{array}{ccc}
B_{1} & & 0 \\
& \ddots & \\
0 & & B_{m}
\end{array}\right) A = ( A 1 0 ⋱ 0 A m ) , B = ( B 1 0 ⋱ 0 B m )
的分块对角矩阵,对于
j
=
1
,
…
,
m
,
A
j
j
=
1
,
…
,
m
,
A
j
j=1,dots,m,A_(j) j=1, \ldots, m, A_{j} j = 1 , … , m , A j 与
B
j
B
j
B_(j) B_{j} B j 大小相同. 证明:
A
B
A
B
AB A B A B 是分块对角矩阵
A
B
=
(
A
1
B
1
0
⋱
0
A
m
B
m
)
A
B
=
A
1
B
1
0
⋱
0
A
m
B
m
AB=([A_(1)B_(1),,0],[,ddots,],[0,,A_(m)B_(m)]) A B=\left(\begin{array}{ccc}
A_{1} B_{1} & & 0 \\
& \ddots & \\
0 & & A_{m} B_{m}
\end{array}\right) A B = ( A 1 B 1 0 ⋱ 0 A m B m )
10 设
F
=
C
,
T
∈
L
(
V
)
F
=
C
,
T
∈
L
(
V
)
F=C,T inL(V) \mathbf{F}=\mathbf{C}, T \in \mathcal{L}(V) F = C , T ∈ L ( V ) 。证明:存在
D
,
N
∈
L
(
V
)
D
,
N
∈
L
(
V
)
D,N inL(V) D, N \in \mathcal{L}(V) D , N ∈ L ( V ) 使得
T
=
D
+
N
T
=
D
+
N
T=D+N T=D+N T = D + N ,算子
D
D
D D D 是可对角化的,
N
N
N N N 是幂零的,
D
N
=
N
D
D
N
=
N
D
DN=ND D N=N D D N = N D 。
11 设
T
∈
L
(
V
)
,
λ
∈
F
T
∈
L
(
V
)
,
λ
∈
F
T inL(V),lambda inF T \in \mathcal{L}(V), \lambda \in \mathbf{F} T ∈ L ( V ) , λ ∈ F 。证明:对
V
V
V V V 的每个使得
T
T
T T T 有上三角矩阵的基,
λ
λ
lambda \lambda λ 出现在
T
T
T T T 的矩阵的对角线上的次数等于
λ
λ
lambda \lambda λ 作为
T
T
T T T 的本征值的重数。
8.C 特征多项式和极小多项式
凯莱-哈密顿定理
如果
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C ,以下定义把
V
V
V V V 上的每个算子和一个多项式联系在一起。对于
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R ,相应的定义将会在下一章给出。
8.34 定义 特征多项式(characteristic polynomial)
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。令
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 表示
T
T
T T T 的所有互不相同的本征值,重数分别为
d
1
,
…
,
d
m
d
1
,
…
,
d
m
d_(1),dots,d_(m) d_{1}, \ldots, d_{m} d 1 , … , d m 。多项式
(
z
−
λ
1
)
d
1
⋯
(
z
−
λ
m
)
d
m
z
−
λ
1
d
1
⋯
z
−
λ
m
d
m
(z-lambda_(1))^(d_(1))cdots(z-lambda_(m))^(d_(m)) \left(z-\lambda_{1}\right)^{d_{1}} \cdots\left(z-\lambda_{m}\right)^{d_{m}} ( z − λ 1 ) d 1 ⋯ ( z − λ m ) d m
称为
T
T
T T T 的特征多项式。
8.35 例 设
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 是例 8.25 中定义的算子。由于
T
T
T T T 的本征值为 6 和 7 ,重数是 2 和1, 于是
T
T
T T T 的特征多项式是
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) .
8.36 特征多项式的次数和零点
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。则
(a)
T
T
T T T 的特征多项式的次数等于
dim
V
dim
V
dim V \operatorname{dim} V dim V ;
(b)
T
T
T T T 的特征多项式的零点恰好是
T
T
T T T 的本征值.
证明 显然(a)由 8.26 可得,而(b)由特征多项式的定义可得。
大部分教材利用行列式来定义特征多项式(由 10.25 可知, 这两个定义是等价的)。这里采用的方法更简单,并且由此得到凯莱-哈密顿定理的一个简单证明. 在下一章,我们将看到这个定理对于实向量空间也成立(参见 9.24)。
8.37 凯莱-哈密顿定理
设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。令
q
q
q q q 表示
T
T
T T T 的特征多项式. 则
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 .
证明 设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是算子
T
T
T T T 的所有不同的本征值,设
d
1
,
…
,
d
m
d
1
,
…
,
d
m
d_(1),dots,d_(m) d_{1}, \ldots, d_{m} d 1 , … , d m 是相应的广义本征空间
G
(
λ
1
,
T
)
,
…
,
G
(
λ
m
,
T
)
G
λ
1
,
T
,
…
,
G
λ
m
,
T
G(lambda_(1),T),dots,G(lambda_(m),T) G\left(\lambda_{1}, T\right), \ldots, G\left(\lambda_{m}, T\right) G ( λ 1 , T ) , … , G ( λ m , T ) 的维数. 对于每个
j
∈
{
1
,
…
,
m
}
j
∈
{
1
,
…
,
m
}
j in{1,dots,m} j \in\{1, \ldots, m\} j ∈ { 1 , … , m } ,我们知道
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 是幂零的。由于
8.18
,
(
T
−
λ
j
I
)
d
j
|
G
(
λ
j
,
T
)
=
0
8.18
,
T
−
λ
j
I
d
j
G
λ
j
,
T
=
0
8.18,(T-lambda_(j)I)^(d_(j))|_(G(lambda_(j),T))=0 8.18,\left.\left(T-\lambda_{j} I\right)^{d_{j}}\right|_{G\left(\lambda_{j}, T\right)}=0 8.18 , ( T − λ j I ) d j | G ( λ j , T ) = 0 .
根据
8.21
,
V
8.21
,
V
8.21,V 8.21, V 8.21 , V 中每个向量都是
G
(
λ
1
,
T
)
,
…
G
λ
1
,
T
,
…
G(lambda_(1),T),dots G\left(\lambda_{1}, T\right), \ldots G ( λ 1 , T ) , … ,
G
(
λ
m
,
T
)
G
λ
m
,
T
G(lambda_(m),T) G\left(\lambda_{m}, T\right) G ( λ m , T ) 中的向量之和。因此要证明
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 ,
1842 年英国数学家阿瑟 • 凯莱 (1821-1895)完成了他的学士学位,此前他已经发表了三篇数学论文. 1827 年爱尔兰数学家威廉 • 罗恩 • 哈密顿(1805-1865)成为教授,当时他 22 岁,还是一名本科生!
只需说明对每个
j
j
j j j 都有
q
(
T
)
|
G
(
λ
j
,
T
)
=
0
q
(
T
)
G
λ
j
,
T
=
0
q(T)|_(G(lambda_(j),T))=0 \left.q(T)\right|_{G\left(\lambda_{j}, T\right)}=0 q ( T ) | G ( λ j , T ) = 0 。
取定
j
∈
{
1
,
…
,
m
}
j
∈
{
1
,
…
,
m
}
j in{1,dots,m} j \in\{1, \ldots, m\} j ∈ { 1 , … , m } . 我们有
q
(
T
)
=
(
T
−
λ
1
I
)
d
1
⋯
(
T
−
λ
m
I
)
d
m
q
(
T
)
=
T
−
λ
1
I
d
1
⋯
T
−
λ
m
I
d
m
q(T)=(T-lambda_(1)I)^(d_(1))cdots(T-lambda_(m)I)^(d_(m)) q(T)=\left(T-\lambda_{1} I\right)^{d_{1}} \cdots\left(T-\lambda_{m} I\right)^{d_{m}} q ( T ) = ( T − λ 1 I ) d 1 ⋯ ( T − λ m I ) d m
上面等式右边的算子是交换的, 因此可以把因子
(
T
−
λ
j
I
)
d
j
T
−
λ
j
I
d
j
(T-lambda_(j)I)^(d_(j)) \left(T-\lambda_{j} I\right)^{d_{j}} ( T − λ j I ) d j 移到右边表达式的最后一项. 由于
(
T
−
λ
j
I
)
d
j
|
G
(
λ
j
,
T
)
=
0
T
−
λ
j
I
d
j
G
λ
j
,
T
=
0
(T-lambda_(j)I)^(d_(j))|_(G(lambda_(j),T))=0 \left.\left(T-\lambda_{j} I\right)^{d_{j}}\right|_{G\left(\lambda_{j}, T\right)}=0 ( T − λ j I ) d j | G ( λ j , T ) = 0 , 所以
q
(
T
)
|
G
(
λ
j
,
T
)
=
0
q
(
T
)
G
λ
j
,
T
=
0
q(T)|_(G(lambda_(j),T))=0 \left.q(T)\right|_{G\left(\lambda_{j}, T\right)}=0 q ( T ) | G ( λ j , T ) = 0 .
极小多项式
本小节引入与每个算子相联系的另一个重要的多项式. 先从以下定义开始.
8.38 定义 首一多项式(monic polynomial)
首一多项式是指最高次数的项的系数为 1 的多项式.
8.39 例 多项式
2
+
9
z
2
+
z
7
2
+
9
z
2
+
z
7
2+9z^(2)+z^(7) 2+9 z^{2}+z^{7} 2 + 9 z 2 + z 7 是 7 次首一多项式。
8.40 极小多项式
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则存在唯一一个次数最小的首一多项式
p
p
p p p 使得
p
(
T
)
=
0
p
(
T
)
=
0
p(T)=0 p(T)=0 p ( T ) = 0 .
证明 设
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 则组
I
,
T
,
T
2
,
…
,
T
n
2
I
,
T
,
T
2
,
…
,
T
n
2
I,T,T^(2),dots,T^(n^(2)) I, T, T^{2}, \ldots, T^{n^{2}} I , T , T 2 , … , T n 2
在
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) 中不可能是线性无关的, 因为向量空间
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) 的维数是
n
2
n
2
n^(2) n^{2} n 2 (参见3.61),而这个组的长度是
n
2
+
1
n
2
+
1
n^(2)+1 n^{2}+1 n 2 + 1 . 设
m
m
m m m 是使得组
8.41
I
,
T
,
T
2
,
…
,
T
m
I
,
T
,
T
2
,
…
,
T
m
I,T,T^(2),dots,T^(m) I, T, T^{2}, \ldots, T^{m} I , T , T 2 , … , T m
线性相关的最小的正整数. 线性相关性引理 2.21 表明在上述组中有一个算子是它前面的那些算子的线性组合. 因为
m
m
m m m 是使得上述组线性相关的最小正整数, 所以
T
m
T
m
T^(m) T^{m} T m 是
I
,
T
,
T
2
,
…
,
T
m
−
1
I
,
T
,
T
2
,
…
,
T
m
−
1
I,T,T^(2),dots,T^(m-1) I, T, T^{2}, \ldots, T^{m-1} I , T , T 2 , … , T m − 1 的线性组合. 于是有标量
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
∈
F
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
∈
F
a_(0),a_(1),a_(2),dots,a_(m-1)inF a_{0}, a_{1}, a_{2}, \ldots, a_{m-1} \in \mathbf{F} a 0 , a 1 , a 2 , … , a m − 1 ∈ F 使得
8.42
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
−
1
T
m
−
1
+
T
m
=
0
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
−
1
T
m
−
1
+
T
m
=
0
a_(0)I+a_(1)T+a_(2)T^(2)+cdots+a_(m-1)T^(m-1)+T^(m)=0 a_{0} I+a_{1} T+a_{2} T^{2}+\cdots+a_{m-1} T^{m-1}+T^{m}=0 a 0 I + a 1 T + a 2 T 2 + ⋯ + a m − 1 T m − 1 + T m = 0
定义首一多项式
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) 为
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
.
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
.
p(z)=a_(0)+a_(1)z+a_(2)z^(2)+cdots+a_(m-1)z^(m-1)+z^(m). p(z)=a_{0}+a_{1} z+a_{2} z^{2}+\cdots+a_{m-1} z^{m-1}+z^{m} . p ( z ) = a 0 + a 1 z + a 2 z 2 + ⋯ + a m − 1 z m − 1 + z m .
则 8.42 表明
p
(
T
)
=
0
p
(
T
)
=
0
p(T)=0 p(T)=0 p ( T ) = 0 。
要证明上述结果的唯一性, 注意到
m
m
m m m 的选取表明没有次数小于
m
m
m m m 的首一多项式
q
∈
P
(
F
)
q
∈
P
(
F
)
q inP(F) q \in \mathcal{P}(\mathbf{F}) q ∈ P ( F ) 满足
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 . 假设
q
∈
P
(
F
)
q
∈
P
(
F
)
q inP(F) q \in \mathcal{P}(\mathbf{F}) q ∈ P ( F ) 是次数为
m
m
m m m 的首一多项式, 而且
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 .那么
(
p
−
q
)
(
T
)
=
0
(
p
−
q
)
(
T
)
=
0
(p-q)(T)=0 (p-q)(T)=0 ( p − q ) ( T ) = 0 且
deg
(
p
−
q
)
<
m
deg
(
p
−
q
)
<
m
deg(p-q) < m \operatorname{deg}(p-q)<m deg ( p − q ) < m . 现在
m
m
m m m 的最小性表明
q
=
p
q
=
p
q=p q=p q = p .
上述命题保证了下面定义的合理性。
8.43 定义 极小多项式(minimal polynomial)
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则
T
T
T T T 的极小多项式是唯一一个使得
p
(
T
)
=
0
p
(
T
)
=
0
p(T)=0 p(T)=0 p ( T ) = 0 的次数最小的首一多项式
p
p
p p p 。
上述命题的证明表明,
V
V
V V V 上每个算子的极小多项式的次数最多为
(
dim
V
)
2
(
dim
V
)
2
(dim V)^(2) (\operatorname{dim} V)^{2} ( dim V ) 2 。凯莱-哈密顿定理 8.37 告诉我们,如果
V
V
V V V 是复向量空间,则
V
V
V V V 上每个算子的极小多项式的次数最多为
dim
V
dim
V
dim V \operatorname{dim} V dim V 。下一章将会看到这一显著的改进对实向量空间也成立。
假设已知某个算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) (关于某个基)的矩阵。可以通过计算机程序求
T
T
T T T 的极小多项式:对
m
=
1
,
2
,
…
m
=
1
,
2
,
…
m=1,2,dots m=1,2, \ldots m = 1 , 2 , … ,相继地考虑线性方程组
8.44
a
0
M
(
I
)
+
a
1
M
(
T
)
+
⋯
+
a
m
−
1
M
(
T
)
m
−
1
=
−
M
(
T
)
m
a
0
M
(
I
)
+
a
1
M
(
T
)
+
⋯
+
a
m
−
1
M
(
T
)
m
−
1
=
−
M
(
T
)
m
a_(0)M(I)+a_(1)M(T)+cdots+a_(m-1)M(T)^(m-1)=-M(T)^(m) a_{0} \mathcal{M}(I)+a_{1} \mathcal{M}(T)+\cdots+a_{m-1} \mathcal{M}(T)^{m-1}=-\mathcal{M}(T)^{m} a 0 M ( I ) + a 1 M ( T ) + ⋯ + a m − 1 M ( T ) m − 1 = − M ( T ) m
直到这个方程组有一个解
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
a_(0),a_(1),a_(2),dots,a_(m-1) a_{0}, a_{1}, a_{2}, \ldots, a_{m-1} a 0 , a 1 , a 2 , … , a m − 1 .于是标量
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
,
1
a
0
,
a
1
,
a
2
,
…
,
a
m
−
1
,
1
a_(0),a_(1),a_(2),dots,a_(m-1),1 a_{0}, a_{1}, a_{2}, \ldots, a_{m-1}, 1 a 0 , a 1 , a 2 , … , a m − 1 , 1 就是
T
T
T T T 的极小多项式的系数。所有这些都可以利用像高斯消
可以把 8.44 看作是关于
m
m
m m m 个变量
a
0
,
a
1
,
…
,
a
m
−
1
a
0
,
a
1
,
…
,
a
m
−
1
a_(0),a_(1),dots,a_(m-1) a_{0}, a_{1}, \ldots, a_{m-1} a 0 , a 1 , … , a m − 1 的
(
dim
V
)
2
(
dim
V
)
2
(dim V)^(2) (\operatorname{dim} V)^{2} ( dim V ) 2 个线性方程组成的方程组。
元法这种熟悉且(对计算机而言)快速的方法来计算.
8.45 例 设
T
T
T T T 是
C
5
C
5
C^(5) \mathbf{C}^{5} C 5 上的算子,它(关于标准基)的矩阵是
(
0
0
0
0
−
3
1
0
0
0
6
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
)
0
0
0
0
−
3
1
0
0
0
6
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
([0,0,0,0,-3],[1,0,0,0,6],[0,1,0,0,0],[0,0,1,0,0],[0,0,0,1,0]) \left(\begin{array}{ccccc}
0 & 0 & 0 & 0 & -3 \\
1 & 0 & 0 & 0 & 6 \\
0 & 1 & 0 & 0 & 0 \\
0 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & 1 & 0
\end{array}\right) ( 0 0 0 0 − 3 1 0 0 0 6 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 )
求
T
T
T T T 的极小多项式。
解 因为这个矩阵有大量的 0 ,所以这里不需要高斯消元法。只需简单地计算
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T ) 的各次幂, 并注意到, 直到
m
=
5
m
=
5
m=5 m=5 m = 5 时 8.44 才有解. 通过计算可知,
T
T
T T T 的极小多项式等于
z
5
−
6
z
+
3
z
5
−
6
z
+
3
z^(5)-6z+3 z^{5}-6 z+3 z 5 − 6 z + 3 .
以下命题完全刻画了作用在一个算子上等于 0 的多项式。
8.46
q
(
T
)
=
0
8.46
q
(
T
)
=
0
8.46 q(T)=0 8.46 q(T)=0 8.46 q ( T ) = 0 表明
q
q
q q q 是极小多项式的一个倍式
设
T
∈
L
(
V
)
,
q
∈
P
(
F
)
T
∈
L
(
V
)
,
q
∈
P
(
F
)
T inL(V),q inP(F) T \in \mathcal{L}(V), q \in \mathcal{P}(\mathbf{F}) T ∈ L ( V ) , q ∈ P ( F ) . 则
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 当且仅当
q
q
q q q 是
T
T
T T T 的极小多项式的多项式倍。
证明 设
p
p
p p p 是
T
T
T T T 的极小多项式。
首先证明容易的一方面. 设
q
q
q q q 是
p
p
p p p 的多项式倍. 则存在一个多项式
s
∈
P
(
F
)
s
∈
P
(
F
)
s inP(F) s \in \mathcal{P}(\mathbf{F}) s ∈ P ( F ) 使得
q
=
p
s
q
=
p
s
q=ps q=p s q = p s 。于是
q
(
T
)
=
p
(
T
)
s
(
T
)
=
0
s
(
T
)
=
0
q
(
T
)
=
p
(
T
)
s
(
T
)
=
0
s
(
T
)
=
0
q(T)=p(T)s(T)=0s(T)=0 q(T)=p(T) s(T)=0 s(T)=0 q ( T ) = p ( T ) s ( T ) = 0 s ( T ) = 0
要证明另一个方面, 设
q
(
T
)
=
0
q
(
T
)
=
0
q(T)=0 q(T)=0 q ( T ) = 0 . 根据多项式的带余除法 4.8 , 存在多项式
s
,
r
∈
P
(
F
)
s
,
r
∈
P
(
F
)
s,r inP(F) s, r \in \mathcal{P}(\mathbf{F}) s , r ∈ P ( F ) 使得
8.47
q
=
p
s
+
r
q
=
p
s
+
r
q=ps+r q=p s+r q = p s + r
且
deg
r
<
deg
p
deg
r
<
deg
p
deg r < deg p \operatorname{deg} r<\operatorname{deg} p deg r < deg p 。于是
0
=
q
(
T
)
=
p
(
T
)
s
(
T
)
+
r
(
T
)
=
r
(
T
)
0
=
q
(
T
)
=
p
(
T
)
s
(
T
)
+
r
(
T
)
=
r
(
T
)
0=q(T)=p(T)s(T)+r(T)=r(T) 0=q(T)=p(T) s(T)+r(T)=r(T) 0 = q ( T ) = p ( T ) s ( T ) + r ( T ) = r ( T )
由上式可得
r
=
0
r
=
0
r=0 r=0 r = 0 (若不然,令
r
r
r r r 除以它的最高次项系数将得到一个首一多项式,作用到
T
T
T T T 上为 0 。这个多项式将有比极小多项式更低的次数,矛盾)。因此 8.47 成为
q
=
p
s
q
=
p
s
q=ps q=p s q = p s ,即
q
q
q q q 是
p
p
p p p 的多项式倍。
以下命题只对复向量空间陈述,因为我们尚未对
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 的情况定义特征多项式。然而,在下一章将会看到这个结果对实向量空间也成立.
8.48 特征多项式是极小多项式的多项式倍
设
F
=
C
,
T
∈
L
(
V
)
F
=
C
,
T
∈
L
(
V
)
F=C,T inL(V) \mathbf{F}=\mathbf{C}, T \in \mathcal{L}(V) F = C , T ∈ L ( V ) . 则
T
T
T T T 的特征多项式是
T
T
T T T 的极小多项式的多项式倍.
证明 由 8.46 和凯莱-哈密顿定理 8.37 立即可得.
我们知道(至少当
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C 时)
T
T
T T T 的特征多项式的零点恰好是
T
T
T T T 的本征值(参见 8.36). 现在我们要证明极小多项式有同样的零点(尽管这些零点的重数可能不同)。
8.49 本征值是极小多项式的零点
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则
T
T
T T T 的极小多项式的零点恰好是
T
T
T T T 的本征值.
证明 设
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
p(z)=a_(0)+a_(1)z+a_(2)z^(2)+cdots+a_(m-1)z^(m-1)+z^(m) p(z)=a_{0}+a_{1} z+a_{2} z^{2}+\cdots+a_{m-1} z^{m-1}+z^{m} p ( z ) = a 0 + a 1 z + a 2 z 2 + ⋯ + a m − 1 z m − 1 + z m
是
T
T
T T T 的极小多项式。
首先,设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 是
p
p
p p p 的一个零点. 则
p
p
p p p 可以写成
p
(
z
)
=
(
z
−
λ
)
q
(
z
)
p
(
z
)
=
(
z
−
λ
)
q
(
z
)
p(z)=(z-lambda)q(z) p(z)=(z-\lambda) q(z) p ( z ) = ( z − λ ) q ( z )
其中
q
q
q q q 是系数在
F
F
F \mathbf{F} F 中的首一多项式(参见 4.11)。因为
p
(
T
)
=
0
p
(
T
)
=
0
p(T)=0 p(T)=0 p ( T ) = 0 ,所以对所有
v
∈
V
v
∈
V
v in V v \in V v ∈ V 都有
0
=
(
T
−
λ
I
)
(
q
(
T
)
v
)
0
=
(
T
−
λ
I
)
(
q
(
T
)
v
)
0=(T-lambda I)(q(T)v) 0=(T-\lambda I)(q(T) v) 0 = ( T − λ I ) ( q ( T ) v )
又因为
q
q
q q q 的次数小于极小多项式
p
p
p p p 的次数, 所以至少存在一个向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V 使得
q
(
T
)
v
≠
0
q
(
T
)
v
≠
0
q(T)v!=0 q(T) v \neq 0 q ( T ) v ≠ 0 . 于是由上面的等式可知,
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值.
要证明另一个方面,假设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 是
T
T
T T T 的本征值。 于是存在
v
∈
V
v
∈
V
v in V v \in V v ∈ V 且
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 使得
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 。用
T
T
T T T 反复作用等式两端可知, 对每个非负整数
j
j
j j j 都有
T
j
v
=
λ
j
v
T
j
v
=
λ
j
v
T^(j)v=lambda^(j)v T^{j} v=\lambda^{j} v T j v = λ j v 。因此
0
=
p
(
T
)
v
=
(
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
−
1
T
m
−
1
+
T
m
)
v
=
(
a
0
+
a
1
λ
+
a
2
λ
2
+
⋯
+
a
m
−
1
λ
m
−
1
+
λ
m
)
v
=
p
(
λ
)
v
0
=
p
(
T
)
v
=
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
−
1
T
m
−
1
+
T
m
v
=
a
0
+
a
1
λ
+
a
2
λ
2
+
⋯
+
a
m
−
1
λ
m
−
1
+
λ
m
v
=
p
(
λ
)
v
{:[0=p(T)v=(a_(0)I+a_(1)T+a_(2)T^(2)+cdots+a_(m-1)T^(m-1)+T^(m))v],[=(a_(0)+a_(1)lambda+a_(2)lambda^(2)+cdots+a_(m-1)lambda^(m-1)+lambda^(m))v],[=p(lambda)v]:} \begin{aligned}
0=p(T) v & =\left(a_{0} I+a_{1} T+a_{2} T^{2}+\cdots+a_{m-1} T^{m-1}+T^{m}\right) v \\
& =\left(a_{0}+a_{1} \lambda+a_{2} \lambda^{2}+\cdots+a_{m-1} \lambda^{m-1}+\lambda^{m}\right) v \\
& =p(\lambda) v
\end{aligned} 0 = p ( T ) v = ( a 0 I + a 1 T + a 2 T 2 + ⋯ + a m − 1 T m − 1 + T m ) v = ( a 0 + a 1 λ + a 2 λ 2 + ⋯ + a m − 1 λ m − 1 + λ m ) v = p ( λ ) v
因为
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 ,所以由上面的等式得
p
(
λ
)
=
0
p
(
λ
)
=
0
p(lambda)=0 p(\lambda)=0 p ( λ ) = 0 。
下面三个例子说明我们的结果如何用于求极小多项式,以及用于了解某些算子的本征值为什么不能精确地计算。
8.50 例 求例 8.30 中算子
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 的极小多项式.
解 在例 8.30 中注意到
T
T
T T T 的本征值是 6 和 7. 于是由
8.49
,
T
8.49
,
T
8.49,T 8.49, T 8.49 , T 的极小多项式是
(
z
−
6
)
(
z
−
7
)
(
z
−
6
)
(
z
−
7
)
(z-6)(z-7) (z-6)(z-7) ( z − 6 ) ( z − 7 ) 的多项式倍。
在例 8.35 中,我们看到
T
T
T T T 的特征多项式是
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) 。于是由 8.48 和上一段,
T
T
T T T 的极小多项式是
(
z
−
6
)
(
z
−
7
)
(
z
−
6
)
(
z
−
7
)
(z-6)(z-7) (z-6)(z-7) ( z − 6 ) ( z − 7 ) 或者
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) . 简单的计算表明
(
T
−
6
I
)
(
T
−
7
I
)
≠
0
(
T
−
6
I
)
(
T
−
7
I
)
≠
0
(T-6I)(T-7I)!=0 (T-6 I)(T-7 I) \neq 0 ( T − 6 I ) ( T − 7 I ) ≠ 0
因此
T
T
T T T 的极小多项式是
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) .
8.51 例 定义
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 为
T
(
z
1
,
z
2
,
z
3
)
=
(
6
z
1
,
6
z
2
,
7
z
3
)
T
z
1
,
z
2
,
z
3
=
6
z
1
,
6
z
2
,
7
z
3
T(z_(1),z_(2),z_(3))=(6z_(1),6z_(2),7z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(6 z_{1}, 6 z_{2}, 7 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 6 z 1 , 6 z 2 , 7 z 3 ) , 求
T
T
T T T 的极小多项式.
解 容易看出算子
T
T
T T T 的本征值是 6 和 7 , 特征多项式是
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) .
于是, 和上例一样,
T
T
T T T 的极小多项式是
(
z
−
6
)
(
z
−
7
)
(
z
−
6
)
(
z
−
7
)
(z-6)(z-7) (z-6)(z-7) ( z − 6 ) ( z − 7 ) 或者
(
z
−
6
)
2
(
z
−
7
)
(
z
−
6
)
2
(
z
−
7
)
(z-6)^(2)(z-7) (z-6)^{2}(z-7) ( z − 6 ) 2 ( z − 7 ) . 简单的计算表明
(
T
−
6
I
)
(
T
−
7
I
)
=
0
(
T
−
6
I
)
(
T
−
7
I
)
=
0
(T-6I)(T-7I)=0 (T-6 I)(T-7 I)=0 ( T − 6 I ) ( T − 7 I ) = 0
因此
T
T
T T T 的极小多项式是
(
z
−
6
)
(
z
−
7
)
(
z
−
6
)
(
z
−
7
)
(z-6)(z-7) (z-6)(z-7) ( z − 6 ) ( z − 7 ) .
8.52 例 例 8.45 中的算子的本征值是什么?
解 由 8.49 和例 8.45 的解可知,
T
T
T T T 的本征值与方程
z
5
−
6
z
+
3
=
0
z
5
−
6
z
+
3
=
0
z^(5)-6z+3=0 z^{5}-6 z+3=0 z 5 − 6 z + 3 = 0
的解是一样的。可惜这个方程的解不能用有理数、有理数的根以及通常的算术运算表示(其证明远远超出了线性代数的范围)。因此无法用我们所熟悉的形式给出
T
T
T T T 的任何本征值的准确表达。 数值方法可以给出
T
T
T T T 的很好的近似本征值:
−
1.67
,
0.51
,
1.40
,
−
0.12
+
1.59
i
,
−
0.12
−
1.59
i
−
1.67
,
0.51
,
1.40
,
−
0.12
+
1.59
i
,
−
0.12
−
1.59
i
-1.67,quad0.51,quad1.40,quad-0.12+1.59i,quad-0.12-1.59i -1.67, \quad 0.51, \quad 1.40, \quad-0.12+1.59 \mathrm{i}, \quad-0.12-1.59 \mathrm{i} − 1.67 , 0.51 , 1.40 , − 0.12 + 1.59 i , − 0.12 − 1.59 i
但我们在这里不讨论数值方法. 就像实系数多项式一样(参见 4.15),非实数本征值与其复共轭是成对出现的。
习题 8.C
1 设
T
∈
L
(
C
4
)
T
∈
L
C
4
T inL(C^(4)) T \in \mathcal{L}\left(\mathbf{C}^{4}\right) T ∈ L ( C 4 ) 的本征值是
3
,
5
,
8
3
,
5
,
8
3,5,8 3,5,8 3 , 5 , 8 . 证明
(
T
−
3
I
)
2
(
T
−
5
I
)
2
(
T
−
8
I
)
2
=
0
(
T
−
3
I
)
2
(
T
−
5
I
)
2
(
T
−
8
I
)
2
=
0
(T-3I)^(2)(T-5I)^(2)(T-8I)^(2)=0 (T-3 I)^{2}(T-5 I)^{2}(T-8 I)^{2}=0 ( T − 3 I ) 2 ( T − 5 I ) 2 ( T − 8 I ) 2 = 0 .
2 设
V
V
V V V 是复向量空间,5和6是
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 仅有的本征值。令
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V . 证明
(
T
−
5
I
)
n
−
1
(
T
−
6
I
)
n
−
1
=
0
(
T
−
5
I
)
n
−
1
(
T
−
6
I
)
n
−
1
=
0
(T-5I)^(n-1)(T-6I)^(n-1)=0 (T-5 I)^{n-1}(T-6 I)^{n-1}=0 ( T − 5 I ) n − 1 ( T − 6 I ) n − 1 = 0 .
3 找出一个
C
4
C
4
C^(4) \mathbf{C}^{4} C 4 上的算子, 其特征多项式是
(
z
−
7
)
2
(
z
−
8
)
2
(
z
−
7
)
2
(
z
−
8
)
2
(z-7)^(2)(z-8)^(2) (z-7)^{2}(z-8)^{2} ( z − 7 ) 2 ( z − 8 ) 2 .
4 找出一个
C
4
C
4
C^(4) \mathbf{C}^{4} C 4 上的算子, 其特征多项式是
(
z
−
1
)
(
z
−
5
)
3
(
z
−
1
)
(
z
−
5
)
3
(z-1)(z-5)^(3) (z-1)(z-5)^{3} ( z − 1 ) ( z − 5 ) 3 , 极小多项式是
(
z
−
1
)
(
z
−
1
)
(z-1) (z-1) ( z − 1 )
(
z
−
5
)
2
(
z
−
5
)
2
(z-5)^(2) (z-5)^{2} ( z − 5 ) 2 .
5 找出一个
C
4
C
4
C^(4) \mathbf{C}^{4} C 4 上的算子, 其特征多项式和极小多项式都是
z
(
z
−
1
)
2
(
z
−
3
)
z
(
z
−
1
)
2
(
z
−
3
)
z(z-1)^(2)(z-3) z(z-1)^{2}(z-3) z ( z − 1 ) 2 ( z − 3 ) .
6 找出一个
C
4
C
4
C^(4) \mathbf{C}^{4} C 4 上的算子, 其特征多项式是
z
(
z
−
1
)
2
(
z
−
3
)
z
(
z
−
1
)
2
(
z
−
3
)
z(z-1)^(2)(z-3) z(z-1)^{2}(z-3) z ( z − 1 ) 2 ( z − 3 ) , 极小多项式是
z
(
z
−
1
)
z
(
z
−
1
)
z(z-1) z(z-1) z ( z − 1 )
(
z
−
3
)
(
z
−
3
)
(z-3) (z-3) ( z − 3 ) .
7 设
V
V
V V V 是复向量空间,
P
∈
L
(
V
)
P
∈
L
(
V
)
P inL(V) P \in \mathcal{L}(V) P ∈ L ( V ) 使得
P
2
=
P
P
2
=
P
P^(2)=P P^{2}=P P 2 = P . 令
m
=
dimnull
P
,
n
=
m
=
dimnull
P
,
n
=
m=dimnull P,n= m=\operatorname{dimnull} P, n= m = dimnull P , n = dim range
P
P
P P P . 证明
P
P
P P P 的特征多项式是
z
m
(
z
−
1
)
n
z
m
(
z
−
1
)
n
z^(m)(z-1)^(n) z^{m}(z-1)^{n} z m ( z − 1 ) n .
8 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明:
T
T
T T T 是可逆的当且仅当
T
T
T T T 的极小多项式的常数项非零.
9 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 有极小多项式
4
+
5
z
−
6
z
2
−
7
z
3
+
2
z
4
+
z
5
4
+
5
z
−
6
z
2
−
7
z
3
+
2
z
4
+
z
5
4+5z-6z^(2)-7z^(3)+2z^(4)+z^(5) 4+5 z-6 z^{2}-7 z^{3}+2 z^{4}+z^{5} 4 + 5 z − 6 z 2 − 7 z 3 + 2 z 4 + z 5 . 求
T
−
1
T
−
1
T^(-1) T^{-1} T − 1 的极小多项式.
10 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的。令
p
p
p p p 表示
T
T
T T T 的特征多项式,
q
q
q q q 表示
T
−
1
T
−
1
T^(-1) T^{-1} T − 1 的特征多项式。证明:对所有非零的
z
∈
C
z
∈
C
z inC z \in \mathbf{C} z ∈ C 都有
q
(
z
)
=
1
p
(
0
)
z
dim
V
p
(
1
z
)
.
q
(
z
)
=
1
p
(
0
)
z
dim
V
p
1
z
.
q(z)=(1)/(p(0))z^(dim V)p((1)/(z)). q(z)=\frac{1}{p(0)} z^{\operatorname{dim} V} p\left(\frac{1}{z}\right) . q ( z ) = 1 p ( 0 ) z dim V p ( 1 z ) .
11 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的. 证明存在多项式
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) 使得
T
−
1
=
p
(
T
)
T
−
1
=
p
(
T
)
T^(-1)=p(T) T^{-1}=p(T) T − 1 = p ( T ) .
12 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。证明:
V
V
V V V 有一个由
T
T
T T T 的本征向量组成的基当且仅当
T
T
T T T 的极小多项式没有重复的零点。
对于复向量空间,本题给 5.41 的等价条件列表添加了一个等价条件。
13 设
V
V
V V V 是内积空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是正规的. 证明
T
T
T T T 的极小多项式没有重复的零点.
14 设
V
V
V V V 是复内积空间,
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 是等距同构。证明
S
S
S S S 的特征多项式的常数项绝对值为 1 。
15 设
T
∈
L
(
V
)
,
v
∈
V
T
∈
L
(
V
)
,
v
∈
V
T inL(V),v in V T \in \mathcal{L}(V), v \in V T ∈ L ( V ) , v ∈ V 。
(a) 证明:存在唯一一个具有最小次数的首一多项式
p
p
p p p 使得
p
(
T
)
v
=
0
p
(
T
)
v
=
0
p(T)v=0 p(T) v=0 p ( T ) v = 0 .
(b) 证明:
p
p
p p p 整除
T
T
T T T 的极小多项式.
16 设
V
V
V V V 是内积空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 设
T
T
T T T 的极小多项式是
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
−
1
z
m
−
1
+
z
m
a_(0)+a_(1)z+a_(2)z^(2)+cdots+a_(m-1)z^(m-1)+z^(m) a_{0}+a_{1} z+a_{2} z^{2}+\cdots+a_{m-1} z^{m-1}+z^{m} a 0 + a 1 z + a 2 z 2 + ⋯ + a m − 1 z m − 1 + z m
证明:
T
∗
T
∗
T^(**) T^{*} T ∗ 的极小多项式是
a
0
―
+
a
1
―
z
+
a
2
―
z
2
+
⋯
+
a
m
−
1
―
z
m
−
1
+
z
m
a
0
¯
+
a
1
¯
z
+
a
2
¯
z
2
+
⋯
+
a
m
−
1
¯
z
m
−
1
+
z
m
bar(a_(0))+ bar(a_(1))z+ bar(a_(2))z^(2)+cdots+ bar(a_(m-1))z^(m-1)+z^(m) \overline{a_{0}}+\overline{a_{1}} z+\overline{a_{2}} z^{2}+\cdots+\overline{a_{m-1}} z^{m-1}+z^{m} a 0 ― + a 1 ― z + a 2 ― z 2 + ⋯ + a m − 1 ― z m − 1 + z m
17 设
F
=
C
,
T
∈
L
(
V
)
F
=
C
,
T
∈
L
(
V
)
F=C,T inL(V) \mathbf{F}=\mathbf{C}, T \in \mathcal{L}(V) F = C , T ∈ L ( V ) . 设
T
T
T T T 的极小多项式的次数是
dim
V
dim
V
dim V \operatorname{dim} V dim V . 证明
T
T
T T T 的特征多项式等于
T
T
T T T 的极小多项式。
18 设
a
0
,
…
,
a
n
−
1
∈
C
a
0
,
…
,
a
n
−
1
∈
C
a_(0),dots,a_(n-1)inC a_{0}, \ldots, a_{n-1} \in \mathbf{C} a 0 , … , a n − 1 ∈ C . 设
T
∈
L
(
C
n
)
T
∈
L
C
n
T inL(C^(n)) T \in \mathcal{L}\left(\mathbf{C}^{n}\right) T ∈ L ( C n ) (关于标准基) 的矩阵是
(
0
−
a
0
1
0
−
a
1
1
⋱
−
a
2
⋱
⋮
0
−
a
n
−
2
1
−
a
n
−
1
)
.
0
−
a
0
1
0
−
a
1
1
⋱
−
a
2
⋱
⋮
0
−
a
n
−
2
1
−
a
n
−
1
.
([0,,,,-a_(0)],[1,0,,,-a_(1)],[,1,ddots,,-a_(2)],[,,ddots,,vdots],[,,,0,-a_(n-2)],[,,,1,-a_(n-1)]). \left(\begin{array}{ccccc}
0 & & & & -a_{0} \\
1 & 0 & & & -a_{1} \\
& 1 & \ddots & & -a_{2} \\
& & \ddots & & \vdots \\
& & & 0 & -a_{n-2} \\
& & & 1 & -a_{n-1}
\end{array}\right) . ( 0 − a 0 1 0 − a 1 1 ⋱ − a 2 ⋱ ⋮ 0 − a n − 2 1 − a n − 1 ) .
求
T
T
T T T 的极小多项式和特征多项式。
本题表明每个首一多项式都是某个算子的特征多项式。
19 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
T
T
T T T 关于
V
V
V V V 的某个基的矩阵是上三角的,这个矩阵的对角线元素是
λ
1
,
…
,
λ
n
λ
1
,
…
,
λ
n
lambda_(1),dots,lambda_(n) \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 。证明
T
T
T T T 的特征多项式是
(
z
−
λ
1
)
⋯
(
z
−
λ
n
)
z
−
λ
1
⋯
z
−
λ
n
(z-lambda_(1))cdots(z-lambda_(n)) \left(z-\lambda_{1}\right) \cdots\left(z-\lambda_{n}\right) ( z − λ 1 ) ⋯ ( z − λ n ) .
20 设
V
V
V V V 是复向量空间,
V
1
,
…
,
V
m
V
1
,
…
,
V
m
V_(1),dots,V_(m) V_{1}, \ldots, V_{m} V 1 , … , V m 都是
V
V
V V V 的非零子空间使得
V
=
V
1
⊕
⋯
⊕
V
m
V
=
V
1
⊕
⋯
⊕
V
m
V=V_(1)o+cdots o+V_(m) V=V_{1} \oplus \cdots \oplus V_{m} V = V 1 ⊕ ⋯ ⊕ V m 。设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,每个
V
j
V
j
V_(j) V_{j} V j 在
T
T
T T T 下不变。对每个
j
j
j j j ,令
p
j
p
j
p_(j) p_{j} p j 表示
T
|
V
j
T
V
j
T|_(V_(j)) \left.T\right|_{V_{j}} T | V j 的特征多项式。证明
T
T
T T T 的特征多项式是
p
1
⋯
p
m
p
1
⋯
p
m
p_(1)cdotsp_(m) p_{1} \cdots p_{m} p 1 ⋯ p m 。
8.D 若尔当形
我们知道,如果
V
V
V V V 是复向量空间,那么对于每个
T
∈
L
(
V
)
,
V
T
∈
L
(
V
)
,
V
T inL(V),V T \in \mathcal{L}(V), V T ∈ L ( V ) , V 都有一个基使得
T
T
T T T 关于这个基有较好形式的上三角矩阵(参见 8.29)。本节将会得到更好的结论:
V
V
V V V 有一个基,使得
T
T
T T T 关于这个基的矩阵,除了对角线以及紧位于对角线上方的元素之外,其余元素都为 0 。
首先来看幂零算子的两个例子。
8.53 例 设
N
∈
L
(
F
4
)
N
∈
L
F
4
N inL(F^(4)) N \in \mathcal{L}\left(\mathbf{F}^{4}\right) N ∈ L ( F 4 ) 是定义为
N
(
z
1
,
z
2
,
z
3
,
z
4
)
=
(
0
,
z
1
,
z
2
,
z
3
)
N
z
1
,
z
2
,
z
3
,
z
4
=
0
,
z
1
,
z
2
,
z
3
N(z_(1),z_(2),z_(3),z_(4))=(0,z_(1),z_(2),z_(3)) N\left(z_{1}, z_{2}, z_{3}, z_{4}\right)=\left(0, z_{1}, z_{2}, z_{3}\right) N ( z 1 , z 2 , z 3 , z 4 ) = ( 0 , z 1 , z 2 , z 3 )
的幂零算子. 如果
v
=
(
1
,
0
,
0
,
0
)
v
=
(
1
,
0
,
0
,
0
)
v=(1,0,0,0) v=(1,0,0,0) v = ( 1 , 0 , 0 , 0 ) , 则
N
3
v
,
N
2
v
,
N
v
,
v
N
3
v
,
N
2
v
,
N
v
,
v
N^(3)v,N^(2)v,Nv,v N^{3} v, N^{2} v, N v, v N 3 v , N 2 v , N v , v 是
F
4
F
4
F^(4) \mathbf{F}^{4} F 4 的基.
N
N
N N N 关于这个基的矩阵是
(
0
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
)
0
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
([0,1,0,0],[0,0,1,0],[0,0,0,1],[0,0,0,0]) \left(\begin{array}{llll}
0 & 1 & 0 & 0 \\
0 & 0 & 1 & 0 \\
0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0
\end{array}\right) ( 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 )
幂零算子的下一个例子更复杂.
8.54 例 设
N
∈
L
(
F
6
)
N
∈
L
F
6
N inL(F^(6)) N \in \mathcal{L}\left(\mathbf{F}^{6}\right) N ∈ L ( F 6 ) 是定义为
N
(
z
1
,
z
2
,
z
3
,
z
4
,
z
5
,
z
6
)
=
(
0
,
z
1
,
z
2
,
0
,
z
4
,
0
)
N
z
1
,
z
2
,
z
3
,
z
4
,
z
5
,
z
6
=
0
,
z
1
,
z
2
,
0
,
z
4
,
0
N(z_(1),z_(2),z_(3),z_(4),z_(5),z_(6))=(0,z_(1),z_(2),0,z_(4),0) N\left(z_{1}, z_{2}, z_{3}, z_{4}, z_{5}, z_{6}\right)=\left(0, z_{1}, z_{2}, 0, z_{4}, 0\right) N ( z 1 , z 2 , z 3 , z 4 , z 5 , z 6 ) = ( 0 , z 1 , z 2 , 0 , z 4 , 0 )
的幕零算子。不像上例中的幕零算子有好的性质,这个幂零算子没有向量
v
∈
F
6
v
∈
F
6
v inF^(6) v \in \mathbf{F}^{6} v ∈ F 6 使得
N
5
v
,
N
4
v
,
N
3
v
,
N
2
v
,
N
v
,
v
N
5
v
,
N
4
v
,
N
3
v
,
N
2
v
,
N
v
,
v
N^(5)v,N^(4)v,N^(3)v,N^(2)v,Nv,v N^{5} v, N^{4} v, N^{3} v, N^{2} v, N v, v N 5 v , N 4 v , N 3 v , N 2 v , N v , v 是
F
6
F
6
F^(6) \mathbf{F}^{6} F 6 的基。但是,如果取
v
1
=
(
1
,
0
,
0
,
0
,
0
,
0
)
,
v
2
=
v
1
=
(
1
,
0
,
0
,
0
,
0
,
0
)
,
v
2
=
v_(1)=(1,0,0,0,0,0),v_(2)= v_{1}=(1,0,0,0,0,0), v_{2}= v 1 = ( 1 , 0 , 0 , 0 , 0 , 0 ) , v 2 =
(
0
,
0
,
0
,
1
,
0
,
0
)
,
v
3
=
(
0
,
0
,
0
,
0
,
0
,
1
)
(
0
,
0
,
0
,
1
,
0
,
0
)
,
v
3
=
(
0
,
0
,
0
,
0
,
0
,
1
)
(0,0,0,1,0,0),v_(3)=(0,0,0,0,0,1) (0,0,0,1,0,0), v_{3}=(0,0,0,0,0,1) ( 0 , 0 , 0 , 1 , 0 , 0 ) , v 3 = ( 0 , 0 , 0 , 0 , 0 , 1 ) ,则
N
2
v
1
,
N
v
1
,
v
1
,
N
v
2
,
v
2
,
v
3
N
2
v
1
,
N
v
1
,
v
1
,
N
v
2
,
v
2
,
v
3
N^(2)v_(1),Nv_(1),v_(1),Nv_(2),v_(2),v_(3) N^{2} v_{1}, N v_{1}, v_{1}, N v_{2}, v_{2}, v_{3} N 2 v 1 , N v 1 , v 1 , N v 2 , v 2 , v 3 是
F
6
F
6
F^(6) \mathbf{F}^{6} F 6 的基.
N
N
N N N 关于这个基的矩阵是
(
(
0
1
0
0
0
1
0
0
0
)
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
(
0
1
0
0
)
:
0
0
0
)
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
:
0
0
0
([([0,1,0],[0,0,1],[0,0,0]),{:[0,0],[0,0],[0,0]:},{:[0],[0],[0]:}0],[0,0,0],[0,0,0]quad([0,1],[0,0]):[0],[0],[0]) \left(\begin{array}{ccc}
\left(\begin{array}{lll}
0 & 1 & 0 \\
0 & 0 & 1 \\
0 & 0 & 0
\end{array}\right) & \begin{array}{ll}
0 & 0 \\
0 & 0 \\
0 & 0
\end{array} & \begin{array}{l}
0 \\
0 \\
0
\end{array} 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{array} \quad\left(\begin{array}{ll}
0 & 1 \\
0 & 0
\end{array}\right): \begin{array}{l}
0 \\
0 \\
0
\end{array}\right) ( ( 0 1 0 0 0 1 0 0 0 ) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ( 0 1 0 0 ) : 0 0 0 )
这里, 矩阵内部被分成一块一块的, 旨在说明可以将上面的
6
×
6
6
×
6
6xx6 6 \times 6 6 × 6 矩阵看作一个分块对角矩阵:它包含一个
3
×
3
3
×
3
3xx3 3 \times 3 3 × 3 块,此块对角线上方的元素为 1 ,其余元素为
0
;
0
;
0; 0 ; 0 ; 一个
2
×
2
2
×
2
2xx2 2 \times 2 2 × 2 块, 此块对角线上方的元素为 1 , 其余元素为
0
;
一
0
;
一
0;一 0 ; 一 一 0 ; 一 一个
1
×
1
1
×
1
1xx1 1 \times 1 1 × 1 块, 元素为 0 。
以下命题表明,每个幂零算子
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 都与上例性质相似。具体来说,存在有限个向量
v
1
,
…
,
v
n
∈
V
v
1
,
…
,
v
n
∈
V
v_(1),dots,v_(n)in V v_{1}, \ldots, v_{n} \in V v 1 , … , v n ∈ V ,使得
V
V
V V V 有一个由形如
N
k
v
j
N
k
v
j
N^(k)v_(j) N^{k} v_{j} N k v j 的向量组成的基,其中
j
j
j j j 从 1取到
n
,
k
n
,
k
n,k n, k n , k (以相反的顺序)从 0 取到使得
N
m
j
v
j
≠
0
N
m
j
v
j
≠
0
N^(m_(j))v_(j)!=0 N^{m_{j}} v_{j} \neq 0 N m j v j ≠ 0 的最大的非负整数
m
j
m
j
m_(j) m_{j} m j 。 以下命题的矩阵解释,参见 8.60 的证明的第一部分。
8.55 对应于幂零算子的基
设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的. 则存在向量
v
1
,
…
,
v
n
∈
V
v
1
,
…
,
v
n
∈
V
v_(1),dots,v_(n)in V v_{1}, \ldots, v_{n} \in V v 1 , … , v n ∈ V 和非负整数
m
1
,
…
,
m
n
m
1
,
…
,
m
n
m_(1),dots,m_(n) m_{1}, \ldots, m_{n} m 1 , … , m n 使得
(a)
N
m
1
v
1
,
…
,
N
v
1
,
v
1
,
…
,
N
m
n
v
n
,
…
,
N
v
n
,
v
n
N
m
1
v
1
,
…
,
N
v
1
,
v
1
,
…
,
N
m
n
v
n
,
…
,
N
v
n
,
v
n
N^(m_(1))v_(1),dots,Nv_(1),v_(1),dots,N^(m_(n))v_(n),dots,Nv_(n),v_(n) N^{m_{1}} v_{1}, \ldots, N v_{1}, v_{1}, \ldots, N^{m_{n}} v_{n}, \ldots, N v_{n}, v_{n} N m 1 v 1 , … , N v 1 , v 1 , … , N m n v n , … , N v n , v n 是
V
V
V V V 的基;
(b)
N
m
1
+
1
v
1
=
⋯
=
N
m
n
+
1
v
n
=
0
N
m
1
+
1
v
1
=
⋯
=
N
m
n
+
1
v
n
=
0
N^(m_(1)+1)v_(1)=cdots=N^(m_(n)+1)v_(n)=0 N^{m_{1}+1} v_{1}=\cdots=N^{m_{n}+1} v_{n}=0 N m 1 + 1 v 1 = ⋯ = N m n + 1 v n = 0 .
证明 对
dim
V
dim
V
dim V \operatorname{dim} V dim V 用归纳法。首先注意到,若
dim
V
=
1
dim
V
=
1
dim V=1 \operatorname{dim} V=1 dim V = 1 则结论显然成立(在这种情况下,仅有的幂零算子是 0 算子,于是可以将
v
1
v
1
v_(1) v_{1} v 1 取为任意非零向量,令
m
1
=
0
m
1
=
0
m_(1)=0 m_{1}=0 m 1 = 0 )。现在假设
dim
V
>
1
dim
V
>
1
dim V > 1 \operatorname{dim} V>1 dim V > 1 且结论对所有维数更小的向量空间都成立。
因为
N
N
N N N 是幂零的, 所以
N
N
N N N 不是单的。由于 3.69,
N
N
N N N 不是满的, 因此 range
N
N
N N N 是
V
V
V V V 的维数比
V
V
V V V 小的子空间。于是我们可以对限制算子
N
|
range
N
∈
L
(
N
range
N
∈
L
(
N|_("range "N)inL( \left.N\right|_{\text {range } N} \in \mathcal{L}( N | range N ∈ L ( range
N
)
N
)
N) N) N ) 应用归纳法假设。(可以忽略 range
N
=
{
0
}
N
=
{
0
}
N={0} N=\{0\} N = { 0 } 这种平凡情况,因为在这种情况下,
N
N
N N N 是 0 算子, 将
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 取为
V
V
V V V 的任意基, 令
m
1
=
⋯
=
m
n
=
0
m
1
=
⋯
=
m
n
=
0
m_(1)=cdots=m_(n)=0 m_{1}=\cdots=m_{n}=0 m 1 = ⋯ = m n = 0 , 即得所求.)
将我们的归纳法假设应用到
N
|
range
N
N
range
N
N|_("range "N) \left.N\right|_{\text {range } N} N | range N 可知,存在向量
v
1
,
…
,
v
n
∈
v
1
,
…
,
v
n
∈
v_(1),dots,v_(n)in v_{1}, \ldots, v_{n} \in v 1 , … , v n ∈ range
N
N
N N N 和非负整数
m
1
,
…
,
m
n
m
1
,
…
,
m
n
m_(1),dots,m_(n) m_{1}, \ldots, m_{n} m 1 , … , m n 使得
N
m
1
v
1
,
…
,
N
v
1
,
v
1
,
…
,
N
m
n
v
n
,
…
,
N
v
n
,
v
n
N
m
1
v
1
,
…
,
N
v
1
,
v
1
,
…
,
N
m
n
v
n
,
…
,
N
v
n
,
v
n
N^(m_(1))v_(1),dots,Nv_(1),v_(1),dots,N^(m_(n))v_(n),dots,Nv_(n),v_(n) N^{m_{1}} v_{1}, \ldots, N v_{1}, v_{1}, \ldots, N^{m_{n}} v_{n}, \ldots, N v_{n}, v_{n} N m 1 v 1 , … , N v 1 , v 1 , … , N m n v n , … , N v n , v n
N
m
1
+
1
v
1
=
⋯
=
N
m
n
+
1
v
n
=
0
N
m
1
+
1
v
1
=
⋯
=
N
m
n
+
1
v
n
=
0
N^(m_(1)+1)v_(1)=cdots=N^(m_(n)+1)v_(n)=0 N^{m_{1}+1} v_{1}=\cdots=N^{m_{n}+1} v_{n}=0 N m 1 + 1 v 1 = ⋯ = N m n + 1 v n = 0
因为每个
v
j
v
j
v_(j) v_{j} v j 都属于 range
N
N
N N N ,所以对每个
j
j
j j j 都存在
u
j
∈
V
u
j
∈
V
u_(j)in V u_{j} \in V u j ∈ V 使得
v
j
=
N
u
j
v
j
=
N
u
j
v_(j)=Nu_(j) v_{j}=N u_{j} v j = N u j 。于是对每个
j
j
j j j 和每个非负整数
k
k
k k k 都有
N
k
+
1
u
j
=
N
k
v
j
N
k
+
1
u
j
=
N
k
v
j
N^(k+1)u_(j)=N^(k)v_(j) N^{k+1} u_{j}=N^{k} v_{j} N k + 1 u j = N k v j . 现在我们断言
8.57
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
N^(m_(1)+1)u_(1),dots,Nu_(1),u_(1),dots,N^(m_(n)+1)u_(n),dots,Nu_(n),u_(n) N^{m_{1}+1} u_{1}, \ldots, N u_{1}, u_{1}, \ldots, N^{m_{n}+1} u_{n}, \ldots, N u_{n}, u_{n} N m 1 + 1 u 1 , … , N u 1 , u 1 , … , N m n + 1 u n , … , N u n , u n
是
V
V
V V V 中的线性无关向量组。要证明这个断言,假设 8.57 的某个线性组合等于 0 . 把
N
N
N N N 应用到这个线性组合上,即得 8.56 的一个线性组合等于 0 。然而组 8.56 是线性无关的,因此在 8.57 原来的线性组合中,除了向量
N
m
1
+
1
u
1
,
…
,
N
m
n
+
1
u
n
N
m
1
+
1
u
1
,
…
,
N
m
n
+
1
u
n
N^(m_(1)+1)u_(1),dots,N^(m_(n)+1)u_(n) N^{m_{1}+1} u_{1}, \ldots, N^{m_{n}+1} u_{n} N m 1 + 1 u 1 , … , N m n + 1 u n
的系数之外,其他系数都等于 0 。上面这个向量组等于
N
m
1
v
1
,
…
,
N
m
n
v
n
N
m
1
v
1
,
…
,
N
m
n
v
n
N^(m_(1))v_(1),dots,N^(m_(n))v_(n) N^{m_{1}} v_{1}, \ldots, N^{m_{n}} v_{n} N m 1 v 1 , … , N m n v n
再次利用组 8.56 的线性组合,即可得到这些向量系数也等于 0 . 这就完成了组 8.57的线性无关性的证明。
现在将 8.57 扩充成
V
V
V V V 的基
8.58
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
,
w
1
,
…
,
w
p
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
,
w
1
,
…
,
w
p
N^(m_(1)+1)u_(1),dots,Nu_(1),u_(1),dots,N^(m_(n)+1)u_(n),dots,Nu_(n),u_(n),w_(1),dots,w_(p) N^{m_{1}+1} u_{1}, \ldots, N u_{1}, u_{1}, \ldots, N^{m_{n}+1} u_{n}, \ldots, N u_{n}, u_{n}, w_{1}, \ldots, w_{p} N m 1 + 1 u 1 , … , N u 1 , u 1 , … , N m n + 1 u n , … , N u n , u n , w 1 , … , w p
(由于 2.33 ,这是可行的)。每个
N
w
j
N
w
j
Nw_(j) N w_{j} N w j 都属于 range
N
N
N N N ,因此属于 8.56 张成的子空间。组8.56中每个向量都等于
N
N
N N N 在组 8.57 的某个向量上的作用。于是组 8.57 中有一个向量
x
j
x
j
x_(j) x_{j} x j 使得
N
w
j
=
N
x
j
N
w
j
=
N
x
j
Nw_(j)=Nx_(j) N w_{j}=N x_{j} N w j = N x j 。现在设
u
n
+
j
=
w
j
−
x
j
u
n
+
j
=
w
j
−
x
j
u_(n+j)=w_(j)-x_(j) u_{n+j}=w_{j}-x_{j} u n + j = w j − x j
则
N
u
n
+
j
=
0
N
u
n
+
j
=
0
Nu_(n+j)=0 N u_{n+j}=0 N u n + j = 0 . 此外,
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
,
u
n
+
1
,
…
,
u
n
+
p
N
m
1
+
1
u
1
,
…
,
N
u
1
,
u
1
,
…
,
N
m
n
+
1
u
n
,
…
,
N
u
n
,
u
n
,
u
n
+
1
,
…
,
u
n
+
p
N^(m_(1)+1)u_(1),dots,Nu_(1),u_(1),dots,N^(m_(n)+1)u_(n),dots,Nu_(n),u_(n),u_(n+1),dots,u_(n+p) N^{m_{1}+1} u_{1}, \ldots, N u_{1}, u_{1}, \ldots, N^{m_{n}+1} u_{n}, \ldots, N u_{n}, u_{n}, u_{n+1}, \ldots, u_{n+p} N m 1 + 1 u 1 , … , N u 1 , u 1 , … , N m n + 1 u n , … , N u n , u n , u n + 1 , … , u n + p
张成
V
V
V V V ,因为它张成的子空间包含每个
x
j
x
j
x_(j) x_{j} x j 和每个
u
n
+
j
u
n
+
j
u_(n+j) u_{n+j} u n + j ,因此包含每个
w
j
w
j
w_(j) w_{j} w j (因为 8.58张成
V
V
V V V )。
上面的张成组是
V
V
V V V 的基,因为它与基 8.58 长度相同(这里我们经使用了 2.42)。这个基具有所要求的形式。
在以下定义中,每个
A
j
A
j
A_(j) A_{j} A j 的对角线上都是
T
T
T T T 的一些本征值
λ
j
λ
j
lambda_(j) \lambda_{j} λ j ,而紧位于
A
j
A
j
A_(j) A_{j} A j 对角线上方的元素都是1,
A
j
A
j
A_(j) A_{j} A j 的所有其他元素都是 0 (为
1870 年法国数学家卡米耶 • 若尔当 (1838-1922)首先发表了 8.60 的证明.
了理解为什么每个
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 都是
T
T
T T T 的本征值,参见 5.32)。这些
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 不需要是不同的。
A
j
A
j
A_(j) A_{j} A j 也可以是只包含
T
T
T T T 的一个本征值的
1
×
1
1
×
1
1xx1 1 \times 1 1 × 1 矩阵
(
λ
j
)
λ
j
(lambda_(j)) \left(\lambda_{j}\right) ( λ j ) .
8.59 定义 若尔当基(Jordan basis)
设
T
∈
L
(
V
)
.
V
T
∈
L
(
V
)
.
V
T inL(V).V T \in \mathcal{L}(V) . V T ∈ L ( V ) . V 的基称为
T
T
T T T 的若尔当基,如果
T
T
T T T 关于这个基具有分块对角矩阵
(
A
1
0
⋱
0
A
p
)
A
1
0
⋱
0
A
p
([A_(1),,0],[,ddots,],[0,,A_(p)]) \left(\begin{array}{ccc}
A_{1} & & 0 \\
& \ddots & \\
0 & & A_{p}
\end{array}\right) ( A 1 0 ⋱ 0 A p )
其中每个
A
j
A
j
A_(j) A_{j} A j 都是形如
A
j
=
(
λ
j
1
0
⋱
⋱
⋱
1
0
λ
j
)
A
j
=
λ
j
1
0
⋱
⋱
⋱
1
0
λ
j
A_(j)=([lambda_(j),1,,0],[,ddots,ddots,],[,,ddots,1],[0,,,lambda_(j)]) A_{j}=\left(\begin{array}{cccc}
\lambda_{j} & 1 & & 0 \\
& \ddots & \ddots & \\
& & \ddots & 1 \\
0 & & & \lambda_{j}
\end{array}\right) A j = ( λ j 1 0 ⋱ ⋱ ⋱ 1 0 λ j )
的上三角矩阵。
8.60 若尔当形
设
V
V
V V V 是复向量空间. 如果
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) , 则
V
V
V V V 有一个基是
T
T
T T T 的若尔当基.
证明 首先考虑幂零算子
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 和 8.55 给出的向量
v
1
,
…
,
v
n
∈
V
v
1
,
…
,
v
n
∈
V
v_(1),dots,v_(n)in V v_{1}, \ldots, v_{n} \in V v 1 , … , v n ∈ V . 注意到,对于每个
j
,
N
j
,
N
j,N j, N j , N 都将组
N
m
j
v
j
,
…
,
N
v
j
,
v
j
N
m
j
v
j
,
…
,
N
v
j
,
v
j
N^(m_(j))v_(j),dots,Nv_(j),v_(j) N^{m_{j}} v_{j}, \ldots, N v_{j}, v_{j} N m j v j , … , N v j , v j 中的第一个向量映成 0 , 并且
N
N
N N N 将这个组中除第一个向量之外的其余向量映成了它的前一个向量. 也就是说, 8.55 给出了
V
V
V V V 的一个基, 关于这个基,
N
N
N N N 具有分块对角矩阵, 其中对角线上的每个矩阵都形如
(
0
1
0
⋱
⋱
⋱
1
0
0
)
0
1
0
⋱
⋱
⋱
1
0
0
([0,1,,0],[,ddots,ddots,],[,,ddots,1],[0,,,0]) \left(\begin{array}{cccc}
0 & 1 & & 0 \\
& \ddots & \ddots & \\
& & \ddots & 1 \\
0 & & & 0
\end{array}\right) ( 0 1 0 ⋱ ⋱ ⋱ 1 0 0 )
因此结论对幂零算子成立.
现在设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的所有不同的本征值. 于是有广义本征空间分解
V
=
G
(
λ
1
,
T
)
⊕
⋯
⊕
G
(
λ
m
,
T
)
V
=
G
λ
1
,
T
⊕
⋯
⊕
G
λ
m
,
T
V=G(lambda_(1),T)o+cdots o+G(lambda_(m),T) V=G\left(\lambda_{1}, T\right) \oplus \cdots \oplus G\left(\lambda_{m}, T\right) V = G ( λ 1 , T ) ⊕ ⋯ ⊕ G ( λ m , T )
其中每个
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 都是幂零的(参见 8.21 )。于是每个
G
(
λ
j
,
T
)
G
λ
j
,
T
G(lambda_(j),T) G\left(\lambda_{j}, T\right) G ( λ j , T ) 的某个基是
(
T
−
λ
j
I
)
|
G
(
λ
j
,
T
)
T
−
λ
j
I
G
λ
j
,
T
(T-lambda_(j)I)|_(G(lambda_(j),T)) \left.\left(T-\lambda_{j} I\right)\right|_{G\left(\lambda_{j}, T\right)} ( T − λ j I ) | G ( λ j , T ) 的若尔当基(参见上一段)。将这些基组合起来就得到了
V
V
V V V 的一个基,并且是
T
T
T T T 的若尔当基。
习题 8.D
1 求例 8.53 中算子
N
N
N N N 的特征多项式和极小多项式.
2 求例 8.54 中算子
N
N
N N N 的特征多项式和极小多项式.
3 设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的。证明:
N
N
N N N 的极小多项式是
z
m
+
1
z
m
+
1
z^(m+1) z^{m+1} z m + 1 ,其中
m
m
m m m 是
N
N
N N N 关于任意若尔当基的矩阵中紧位于对角线上方的直线上连续出现的 1 的最大个数.
4 设
T
∈
L
(
V
)
,
v
1
,
…
,
v
n
T
∈
L
(
V
)
,
v
1
,
…
,
v
n
T inL(V),v_(1),dots,v_(n) T \in \mathcal{L}(V), v_{1}, \ldots, v_{n} T ∈ L ( V ) , v 1 , … , v n 是
V
V
V V V 的基,且为
T
T
T T T 的若尔当基。试描述
T
T
T T T 关于基
v
n
,
…
v
n
,
…
v_(n),dots v_{n}, \ldots v n , … ,,
v
1
v
1
v_(1) v_{1} v 1 的矩阵。
5 设
T
∈
L
(
V
)
,
v
1
,
…
,
v
n
T
∈
L
(
V
)
,
v
1
,
…
,
v
n
T inL(V),v_(1),dots,v_(n) T \in \mathcal{L}(V), v_{1}, \ldots, v_{n} T ∈ L ( V ) , v 1 , … , v n 是
V
V
V V V 的基,且为
T
T
T T T 的若尔当基. 试描述
T
2
T
2
T^(2) T^{2} T 2 关于这个基的矩阵。
6 设
N
∈
L
(
V
)
N
∈
L
(
V
)
N inL(V) N \in \mathcal{L}(V) N ∈ L ( V ) 是幂零的,
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 和
m
1
,
…
,
m
n
m
1
,
…
,
m
n
m_(1),dots,m_(n) m_{1}, \ldots, m_{n} m 1 , … , m n 如 8.55 中所示。证明
N
m
1
v
1
,
…
N
m
1
v
1
,
…
N^(m_(1))v_(1),dots N^{m_{1}} v_{1}, \ldots N m 1 v 1 , … ,
N
m
n
v
n
N
m
n
v
n
N^(m_(n))v_(n) N^{m_{n}} v_{n} N m n v n 是 null
N
N
N N N 的基.
由本题可知,
n
n
n n n 等于
dimnull
N
dimnull
N
dimnull N \operatorname{dimnull} N dimnull N , 只依赖于
N
N
N N N , 不依赖于为
N
N
N N N 选取的那个特殊的若尔当基.
7 设
p
,
q
∈
P
(
C
)
p
,
q
∈
P
(
C
)
p,q inP(C) p, q \in \mathcal{P}(\mathbf{C}) p , q ∈ P ( C ) 是具有相同零点的首一多项式,
q
q
q q q 是
p
p
p p p 的多项式倍. 证明:存在
T
∈
L
(
C
deg
q
)
T
∈
L
C
deg
q
T inL(C^(deg q)) T \in \mathcal{L}\left(\mathbf{C}^{\operatorname{deg} q}\right) T ∈ L ( C deg q ) 使得
T
T
T T T 的特征多项式是
q
q
q q q 且
T
T
T T T 的极小多项式是
p
p
p p p .
8 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。证明:
V
V
V V V 不能分解成
V
V
V V V 的两个在
T
T
T T T 下不变的真子空间的直和当且仅当
T
T
T T T 的极小多项式形如
(
z
−
λ
)
dim
V
(
z
−
λ
)
dim
V
(z-lambda)^(dim V) (z-\lambda)^{\operatorname{dim} V} ( z − λ ) dim V ,其中
λ
∈
C
λ
∈
C
lambda inC \lambda \in \mathbf{C} λ ∈ C 。