意大利数学家比萨的列奥纳多(又称斐波那契,约
1170
−
1250
)
1170
−
1250
)
1170-1250) 1170-1250) 1170 − 1250 ) 的塑像。第5.C 节的习题 16 说明如何利用线性代数找出斐波那契序列的显式公式。
本征值、本征向量、不变子空间
第3章研究的是一个向量空间到另一个向量空间的线性映射。现在开始研究有限维向量空间到其自身的线性映射. 对这种线性映射的研究构成了线性代数最重要的部分.
我们总采用如下假定:
5.1 记号
F
、
V
F
、
V
F、V \mathbf{F} 、 V 、 F 、 V
F 表示
R
R
R \mathbf{R} R 或
C
C
C \mathbf{C} C 。
V
V
V V V 表示
F
F
F \mathbf{F} F 上的向量空间.
本章的学习目标
不变子空间
本征值、本征向量、本征空间
有限维复向量空间上的每个算子均有本征值, 并且关于某个基有上三角矩阵
5.A 不变子空间
本章我们要引进一些工具,这将有助于我们理解算子的结构。回想一下,算子是从一个向量空间到其自身的线性映射,
V
V
V V V 上算子的集合记为
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) , 即
L
(
V
)
=
L
(
V
)
=
L(V)= \mathcal{L}(V)= L ( V ) =
L
(
V
,
V
)
L
(
V
,
V
)
L(V,V) \mathcal{L}(V, V) L ( V , V ) 。
我们来看看如何能更好地理解算子。设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 如果
V
V
V V V 有直和分解
V
=
U
1
⊕
⋯
⊕
U
m
V
=
U
1
⊕
⋯
⊕
U
m
V=U_(1)o+cdots o+U_(m) V=U_{1} \oplus \cdots \oplus U_{m} V = U 1 ⊕ ⋯ ⊕ U m
其中每个
U
j
U
j
U_(j) U_{j} U j 都是
V
V
V V V 的真子空间,那么,要想了解
T
T
T T T 的特性,我们只需了解每个
T
|
U
j
T
U
j
T|_(U_(j)) \left.T\right|_{U_{j}} T | U j 的特性,这里
T
|
U
j
T
U
j
T|_(U_(j)) \left.T\right|_{U_{j}} T | U j 表示把
T
T
T T T 限制到更小的定义域
U
j
U
j
U_(j) U_{j} U j 上。因为
U
j
U
j
U_(j) U_{j} U j 是比
V
V
V V V 更小的向量空间,所以处理
T
|
U
j
T
U
j
T|_(U_(j)) \left.T\right|_{U_{j}} T | U j 应该比处理
T
T
T T T 更容易。
但是,如果想要使用算子研究中的一些有效工具(比如取幂),那么就会有一个问题:
T
|
U
j
T
U
j
T|_(U_(j)) \left.T\right|_{U_{j}} T | U j 可能不把
U
j
U
j
U_(j) U_{j} U j 映到自身;也就是说
T
|
U
j
T
U
j
T|_(U_(j)) \left.T\right|_{U_{j}} T | U j 可能不是
U
j
U
j
U_(j) U_{j} U j 上的算子. 因此我们只考虑具有以下性质的
V
V
V V V 的直和分解:
T
T
T T T 把其中的每个
U
j
U
j
U_(j) U_{j} U j 都映到自身。
被算子映到自身的子空间十分重要,应当有个名字。
5.2 定义 不变子空间(invariant subspace)
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 称
V
V
V V V 的子空间
U
U
U U U 在
T
T
T T T 下不变, 如果对每个
u
∈
U
u
∈
U
u in U u \in U u ∈ U 都有
T
u
∈
U
T
u
∈
U
Tu in U T u \in U T u ∈ U .
也就是说,
U
U
U U U 在
T
T
T T T 下不变当且仅当
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 是
U
U
U U U 上的算子.
5.3 例 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明
V
V
V V V 的下列子空间在
T
T
T T T 下不变:
(a)
{
0
}
{
0
}
{0} \{0\} { 0 } ;
(b)
V
V
V V V ;
(c)
null
T
null
T
null T \operatorname{null} T null T ;
(d) range
T
T
T T T .
在泛函分析中,最著名的尚未解决的问题叫作不变子空间问题。它研究无限维向量空间上算子的不变子空间。
证明
(a)若
u
∈
{
0
}
u
∈
{
0
}
u in{0} u \in\{0\} u ∈ { 0 } , 则
u
=
0
u
=
0
u=0 u=0 u = 0 , 所以
T
u
=
0
∈
{
0
}
T
u
=
0
∈
{
0
}
Tu=0in{0} T u=0 \in\{0\} T u = 0 ∈ { 0 } . 于是
{
0
}
{
0
}
{0} \{0\} { 0 } 在
T
T
T T T 下不变.
(b) 若
u
∈
V
u
∈
V
u in V u \in V u ∈ V , 则
T
u
∈
V
T
u
∈
V
Tu in V T u \in V T u ∈ V . 于是
V
V
V V V 在
T
T
T T T 下不变.
(c) 若
u
∈
null
T
u
∈
null
T
u in null T u \in \operatorname{null} T u ∈ null T , 则
T
u
=
0
T
u
=
0
Tu=0 T u=0 T u = 0 , 所以
T
u
∈
null
T
T
u
∈
null
T
Tu in null T T u \in \operatorname{null} T T u ∈ null T . 于是 null
T
T
T T T 在
T
T
T T T 下不变.
(d) 若
u
∈
range
T
u
∈
range
T
u in range T u \in \operatorname{range} T u ∈ range T ,则
T
u
∈
range
T
T
u
∈
range
T
Tu in range T T u \in \operatorname{range} T T u ∈ range T 。于是 range
T
T
T T T 在
T
T
T T T 下不变.
一个算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是不是一定有不同于
{
0
}
{
0
}
{0} \{0\} { 0 } 和
V
V
V V V 的不变子空间呢?我们以后会看到,如果
V
V
V V V 是有限维的,且
dim
V
>
1
dim
V
>
1
dim V > 1 \operatorname{dim} V>1 dim V > 1 (对于
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C )或
dim
V
>
2
dim
V
>
2
dim V > 2 \operatorname{dim} V>2 dim V > 2 (对于
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R ),这个问题有肯定的答案。见5.21和9.8.
虽然 null
T
T
T T T 和 range
T
T
T T T 都在
T
T
T T T 下不变,但是这并未为是否存在异于
{
0
}
{
0
}
{0} \{0\} { 0 } 和
V
V
V V V 的不变子空间这一问题提供简单答案,这是因为,null
T
T
T T T 可能等于
{
0
}
{
0
}
{0} \{0\} { 0 } ,而 range
T
T
T T T 可能等于
V
V
V V V (当
T
T
T T T 可逆时,就是这样)。
5.4 例 设
T
∈
L
(
P
(
R
)
)
T
∈
L
(
P
(
R
)
)
T inL(P(R)) T \in \mathcal{L}(\mathcal{P}(\mathbf{R})) T ∈ L ( P ( R ) ) 定义为
T
p
=
p
′
T
p
=
p
′
Tp=p^(') T p=p^{\prime} T p = p ′ 。则
P
(
R
)
P
(
R
)
P(R) \mathcal{P}(\mathbf{R}) P ( R ) 的子空间
P
4
(
R
)
P
4
(
R
)
P_(4)(R) \mathcal{P}_{4}(\mathbf{R}) P 4 ( R ) 在
T
T
T T T 下不变, 因为若
p
∈
P
(
R
)
p
∈
P
(
R
)
p inP(R) p \in \mathcal{P}(\mathbf{R}) p ∈ P ( R ) 的次数不超过 4 则
p
′
p
′
p^(') p^{\prime} p ′ 的次数也不超过 4 .
本征值与本征向量
我们以后还会回过头来更深入地研究不变子空间. 现在先来研究最简单的非平凡不变子空间———维不变子空间。
任取
v
∈
V
,
v
≠
0
v
∈
V
,
v
≠
0
v in V,v!=0 v \in V, v \neq 0 v ∈ V , v ≠ 0 ,并设
U
U
U U U 是
v
v
v v v 的标量倍构成的集合:
U
=
{
λ
v
:
λ
∈
F
}
=
span
(
v
)
U
=
{
λ
v
:
λ
∈
F
}
=
span
(
v
)
U={lambda v:lambda inF}=span(v) U=\{\lambda v: \lambda \in \mathbf{F}\}=\operatorname{span}(v) U = { λ v : λ ∈ F } = span ( v )
则
U
U
U U U 是
V
V
V V V 的一维子空间(而且
V
V
V V V 的每个一维子空间都具有这种形式)。若
U
U
U U U 在算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 下不变,则
T
v
∈
U
T
v
∈
U
Tv in U T v \in U T v ∈ U ,因此必有标量
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 使得
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 。
反之,若有某个
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 使得
T
v
=
λ
ν
T
v
=
λ
ν
Tv=lambda nu T v=\lambda \nu T v = λ ν ,则
span
(
v
)
span
(
v
)
span(v) \operatorname{span}(v) span ( v ) 是
V
V
V V V 的在
T
T
T T T 下不变的一维子空间。
我们刚才见过的那个方程
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v
与一维不变子空间密切相关,十分重要。满足此方程的向量
v
v
v v v 和标量
λ
λ
lambda \lambda λ 都有一个特殊的名字。
5.5 定义 本征值(eigenvalue)
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 称数
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 为
T
T
T T T 的本征值,若存在
v
∈
V
v
∈
V
v in V v \in V v ∈ V 使得
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 且
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 。
上面这些解释表明,
T
T
T T T 有一维不变子空间当且仅当
T
T
T T T 有本征值.
在上面的定义中,我们要求
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 ,这是因为每个标量
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 都满足
T
0
=
λ
0
T
0
=
λ
0
T0=lambda0 T 0=\lambda 0 T 0 = λ 0 。
eigenvalue 这个词一半是德文,一半是英文。德文形容词 eigen 的意思是"特有的"。有些数学家使用术语特征值而不是本征值。
5.6 本征值的等价条件
设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda in F \lambda \in F λ ∈ F . 则以下条件等价:
(a)
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值;
(b)
T
−
λ
I
T
−
λ
I
T-lambda I T-\lambda I T − λ I 不是单的;
(c)
T
−
λ
I
T
−
λ
I
T-lambda I T-\lambda I T − λ I 不是满的;
(d)
T
−
λ
I
T
−
λ
I
T-lambda I T-\lambda I T − λ I 不是可逆的.
回想一下
I
∈
L
(
V
)
I
∈
L
(
V
)
I inL(V) I \in \mathcal{L}(V) I ∈ L ( V ) 是恒等算子,即对所有
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
I
v
=
v
I
v
=
v
Iv=v I v=v I v = v 。
证明 条件 (a) 和 (b) 等价,因为等式
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 等价于等式
(
T
−
λ
I
)
v
=
0
(
T
−
λ
I
)
v
=
0
(T-lambda I)v=0 (T-\lambda I) v=0 ( T − λ I ) v = 0 。由 3.69 可知条件 (b)、(c)、(d) 等价.
5.7 定义 本征向量(eigenvector)
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) , 并设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 是
T
T
T T T 的本征值. 称向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V 为
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的本征向量, 如果
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 且
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 。
因为
T
v
=
λ
v
T
v
=
λ
v
Tv=lambda v T v=\lambda v T v = λ v 当且仅当
(
T
−
λ
I
)
v
=
0
(
T
−
λ
I
)
v
=
0
(T-lambda I)v=0 (T-\lambda I) v=0 ( T − λ I ) v = 0 , 所以非零向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V 是
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的本征向量当且仅当
v
∈
null
(
T
−
λ
I
)
v
∈
null
(
T
−
λ
I
)
v in null(T-lambda I) v \in \operatorname{null}(T-\lambda I) v ∈ null ( T − λ I ) .
5.8 例 设
T
∈
L
(
F
2
)
T
∈
L
F
2
T inL(F^(2)) T \in \mathcal{L}\left(\mathbf{F}^{2}\right) T ∈ L ( F 2 ) 定义为
T
(
w
,
z
)
=
(
−
z
,
w
)
T
(
w
,
z
)
=
(
−
z
,
w
)
T(w,z)=(-z,w) T(w, z)=(-z, w) T ( w , z ) = ( − z , w ) .
(a) 当
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 时,求
T
T
T T T 的本征值和本征向量。
(b) 当
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C 时, 求
T
T
T T T 的本征值和本征向量.
解
(a) 若
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R , 则
T
T
T T T 是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 中绕原点的逆时针
90
∘
90
∘
90^(@) 90^{\circ} 90 ∘ 旋转。一个算子有本征值当且仅当在定义域中存在非零向量能被该算子映成此向量的标量倍.
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 中非零向量的逆时针
90
∘
90
∘
90^(@) 90^{\circ} 90 ∘ 旋转显然不能等于此向量的标量倍. 结论: 若
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R , 则
T
T
T T T 没有本征值 (因此也没有本征向量)。
(b) 为了求
T
T
T T T 的本征值,我们必须求标量
λ
λ
lambda \lambda λ 使得
T
(
w
,
z
)
=
λ
(
w
,
z
)
T
(
w
,
z
)
=
λ
(
w
,
z
)
T(w,z)=lambda(w,z) T(w, z)=\lambda(w, z) T ( w , z ) = λ ( w , z )
除
w
=
z
=
0
w
=
z
=
0
w=z=0 w=z=0 w = z = 0 外还有其他解. 上面的方程等价于联立方程
5.9
−
z
=
λ
w
,
w
=
λ
z
5.9
−
z
=
λ
w
,
w
=
λ
z
" 5.9 "-z=lambda w,quad w=lambda z \text { 5.9 }-z=\lambda w, \quad w=\lambda z 5.9 − z = λ w , w = λ z
把第二个方程中
w
w
w w w 的表达式代入第一个方程可得
−
z
=
λ
2
z
−
z
=
λ
2
z
-z=lambda^(2)z -z=\lambda^{2} z − z = λ 2 z
现在
z
z
z z z 不能等于 0 (否则,由 5.9 可知
w
=
0
w
=
0
w=0 w=0 w = 0 ,而我们要找的 5.9 的解应使
(
w
,
z
)
(
w
,
z
)
(w,z) (w, z) ( w , z ) 不是零向量),故由上面的方程可得
−
1
=
λ
2
.
−
1
=
λ
2
.
-1=lambda^(2). -1=\lambda^{2} . − 1 = λ 2 .
这个方程的解是
λ
=
i
λ
=
i
lambda=i \lambda=\mathrm{i} λ = i 和
λ
=
−
i
λ
=
−
i
lambda=-i \lambda=-\mathrm{i} λ = − i 。容易验证 i 和 -i 都是
T
T
T T T 的本征值。的确,相应于本征值 i 的本征向量是形如
(
w
,
−
w
i
)
(
w
,
−
w
i
)
(w,-wi) (w,-w \mathrm{i}) ( w , − w i ) 的向量, 而相应于本征值 -i 的本征向量是形如
(
w
,
w
i
)
(
w
,
w
i
)
(w,wi) (w, w \mathrm{i}) ( w , w i ) 的向量,其中
w
∈
C
w
∈
C
w inC w \in \mathbf{C} w ∈ C 且
w
≠
0
w
≠
0
w!=0 w \neq 0 w ≠ 0 。
现在我们来证明:相应于不同本征值的本征向量是线性无关的.
5.10 线性无关的本征向量
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的互不相同的本征值,并设
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是相应的本征向量,则
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是线性无关的。
证明 设
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是线性相关的. 设
k
k
k k k 是使得
5.11
v
k
∈
span
(
v
1
,
…
,
v
k
−
1
)
v
k
∈
span
v
1
,
…
,
v
k
−
1
v_(k)in span(v_(1),dots,v_(k-1)) v_{k} \in \operatorname{span}\left(v_{1}, \ldots, v_{k-1}\right) v k ∈ span ( v 1 , … , v k − 1 )
成立的最小正整数. 由线性相关性引理 2.21 可知具有这种性质的
k
k
k k k 一定存在. 于是有
a
1
,
…
,
a
k
−
1
∈
F
a
1
,
…
,
a
k
−
1
∈
F
a_(1),dots,a_(k-1)inF a_{1}, \ldots, a_{k-1} \in \mathbf{F} a 1 , … , a k − 1 ∈ F 使得
5.12
v
k
=
a
1
v
1
+
⋯
+
a
k
−
1
v
k
−
1
v
k
=
a
1
v
1
+
⋯
+
a
k
−
1
v
k
−
1
v_(k)=a_(1)v_(1)+cdots+a_(k-1)v_(k-1) v_{k}=a_{1} v_{1}+\cdots+a_{k-1} v_{k-1} v k = a 1 v 1 + ⋯ + a k − 1 v k − 1
λ
k
v
k
=
a
1
λ
1
v
1
+
⋯
+
a
k
−
1
λ
k
−
1
v
k
−
1
λ
k
v
k
=
a
1
λ
1
v
1
+
⋯
+
a
k
−
1
λ
k
−
1
v
k
−
1
lambda_(k)v_(k)=a_(1)lambda_(1)v_(1)+cdots+a_(k-1)lambda_(k-1)v_(k-1) \lambda_{k} v_{k}=a_{1} \lambda_{1} v_{1}+\cdots+a_{k-1} \lambda_{k-1} v_{k-1} λ k v k = a 1 λ 1 v 1 + ⋯ + a k − 1 λ k − 1 v k − 1
在 5.12 的两端乘以
λ
k
λ
k
lambda_(k) \lambda_{k} λ k , 然后减去上式, 得
0
=
a
1
(
λ
k
−
λ
1
)
v
1
+
⋯
+
a
k
−
1
(
λ
k
−
λ
k
−
1
)
v
k
−
1
0
=
a
1
λ
k
−
λ
1
v
1
+
⋯
+
a
k
−
1
λ
k
−
λ
k
−
1
v
k
−
1
0=a_(1)(lambda_(k)-lambda_(1))v_(1)+cdots+a_(k-1)(lambda_(k)-lambda_(k-1))v_(k-1) 0=a_{1}\left(\lambda_{k}-\lambda_{1}\right) v_{1}+\cdots+a_{k-1}\left(\lambda_{k}-\lambda_{k-1}\right) v_{k-1} 0 = a 1 ( λ k − λ 1 ) v 1 + ⋯ + a k − 1 ( λ k − λ k − 1 ) v k − 1
因为我们选取的
k
k
k k k 是满足 5.11 的最小正整数,所以
v
1
,
…
,
v
k
−
1
v
1
,
…
,
v
k
−
1
v_(1),dots,v_(k-1) v_{1}, \ldots, v_{k-1} v 1 , … , v k − 1 是线性无关的。于是,由上面的等式可知,这些
a
a
a a a 都是 0 (回忆一下,
λ
k
λ
k
lambda_(k) \lambda_{k} λ k 不等于
λ
1
,
…
,
λ
k
−
1
λ
1
,
…
,
λ
k
−
1
lambda_(1),dots,lambda_(k-1) \lambda_{1}, \ldots, \lambda_{k-1} λ 1 , … , λ k − 1 中的任何一个)。但是,这意味着
v
k
v
k
v_(k) v_{k} v k 等于 0 (参见 5.12),这与
v
k
v
k
v_(k) v_{k} v k 是本征向量的假设相矛盾。所以
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 线性相关的假设不成立。
下面的推论表明,算子的互异本征值的个数不超过向量空间的维数.
5.13 本征值的个数
设
V
V
V V V 是有限维的,则
V
V
V V V 上的每个算子最多有
dim
V
dim
V
dim V \operatorname{dim} V dim V 个互不相同的本征值.
证明 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的互不相同的本征值,
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是相应的本征向量。定理5.10表明组
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 线性无关。因此
m
≤
dim
V
m
≤
dim
V
m <= dim V m \leq \operatorname{dim} V m ≤ dim V (参见 2.23)。
限制算子与商算子
若
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
U
U
U U U 是
V
V
V V V 的在
T
T
T T T 下不变的子空间,则
U
U
U U U 以自然的方式确定了另外两个算子
T
|
U
∈
L
(
U
)
T
U
∈
L
(
U
)
T|_(U)inL(U) \left.T\right|_{U} \in \mathcal{L}(U) T | U ∈ L ( U ) 和
T
/
U
∈
L
(
V
/
U
)
T
/
U
∈
L
(
V
/
U
)
T//U inL(V//U) T / U \in \mathcal{L}(V / U) T / U ∈ L ( V / U ) ,其定义如下。
5.14 定义 限制算子(restriction operator),
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 商算子(quotient operator),
T
/
U
T
/
U
T//U T / U T / U
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
U
U
U U U 是
V
V
V V V 的在
T
T
T T T 下不变的子空间.
限制算子
T
|
U
∈
L
(
U
)
T
U
∈
L
(
U
)
T|_(U)inL(U) \left.T\right|_{U} \in \mathcal{L}(U) T | U ∈ L ( U ) 定义为
T
|
U
(
u
)
=
T
u
T
U
(
u
)
=
T
u
T|_(U)(u)=Tu \left.T\right|_{U}(u)=T u T | U ( u ) = T u
其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U .
商算子
T
/
U
∈
L
(
V
/
U
)
T
/
U
∈
L
(
V
/
U
)
T//U inL(V//U) T / U \in \mathcal{L}(V / U) T / U ∈ L ( V / U ) 定义为
(
T
/
U
)
(
v
+
U
)
=
T
v
+
U
(
T
/
U
)
(
v
+
U
)
=
T
v
+
U
(T//U)(v+U)=Tv+U (T / U)(v+U)=T v+U ( T / U ) ( v + U ) = T v + U
其中
v
∈
V
v
∈
V
v in V v \in V v ∈ V .
对于上面定义的两个算子,应该关注一下它们的定义域,并花点时间思考一下为什么这两个算子在它们的定义域上是定义合理的。首先考虑限制算子
T
|
U
∈
L
(
U
)
T
U
∈
L
(
U
)
T|_(U)inL(U) \left.T\right|_{U} \in \mathcal{L}(U) T | U ∈ L ( U ) ,它就是将
T
T
T T T 的定义域限定为
U
U
U U U ,并认为
T
T
T T T 是映到
U
U
U U U 的而不是映到
V
V
V V V 的。
U
U
U U U 在
T
T
T T T 下不变这一条件, 使得我们可以将
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 视为
U
U
U U U 上的算子, 即从定义域到同一空间的线性映射,而不仅仅是从一个向量空间到另一个向量空间的线性映射。
要证明上面的商算子的定义是有意义的, 我们需要验证: 若
v
+
U
=
w
+
U
v
+
U
=
w
+
U
v+U=w+U v+U=w+U v + U = w + U , 则
T
v
+
U
=
T
w
+
U
T
v
+
U
=
T
w
+
U
Tv+U=Tw+U T v+U=T w+U T v + U = T w + U 。现在设
v
+
U
=
w
+
U
v
+
U
=
w
+
U
v+U=w+U v+U=w+U v + U = w + U . 则
v
−
w
∈
U
v
−
w
∈
U
v-w in U v-w \in U v − w ∈ U (见 3.85)。由于
U
U
U U U 在
T
T
T T T 下不变,我们有
T
(
v
−
w
)
∈
U
T
(
v
−
w
)
∈
U
T(v-w)in U T(v-w) \in U T ( v − w ) ∈ U ,这表明
T
v
−
T
w
∈
U
T
v
−
T
w
∈
U
Tv-Tw in U T v-T w \in U T v − T w ∈ U ,于是
T
v
+
U
=
T
w
+
U
T
v
+
U
=
T
w
+
U
Tv+U=Tw+U T v+U=T w+U T v + U = T w + U 。
设
T
T
T T T 有限维向量空间
V
V
V V V 上的算子,且
U
U
U U U 是
V
V
V V V 的在
T
T
T T T 下不变的子空间使得
U
≠
{
0
}
U
≠
{
0
}
U!={0} U \neq\{0\} U ≠ { 0 } 且
U
≠
V
U
≠
V
U!=V U \neq V U ≠ V . 在某种意义下, 可以通过研究算子
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 和
T
/
U
T
/
U
T//U T / U T / U 来了解算子
T
T
T T T ,而
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 和
T
/
U
T
/
U
T//U T / U T / U 都是维数小于
V
V
V V V 的维数的向量空间上的算子. 例如, 5.27 的第二个证明就很好地使用了
T
/
U
T
/
U
T//U T / U T / U 。
然而,有时候
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 和
T
/
U
T
/
U
T//U T / U T / U 并没有给出关于
T
T
T T T 的足够信息。在下面的例子中,
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 和
T
/
U
T
/
U
T//U T / U T / U 都是 0 , 即便
T
T
T T T 不是 0 算子。
5.15 例 定义算子
T
∈
L
(
F
2
)
T
∈
L
F
2
T inL(F^(2)) T \in \mathcal{L}\left(\mathbf{F}^{2}\right) T ∈ L ( F 2 ) 为
T
(
x
,
y
)
=
(
y
,
0
)
T
(
x
,
y
)
=
(
y
,
0
)
T(x,y)=(y,0) T(x, y)=(y, 0) T ( x , y ) = ( y , 0 ) . 设
U
=
{
(
x
,
0
)
:
x
∈
F
}
U
=
{
(
x
,
0
)
:
x
∈
F
}
U={(x,0):x inF} U=\{(x, 0): x \in \mathbf{F}\} U = { ( x , 0 ) : x ∈ F } 。证明
(a)
U
U
U U U 在
T
T
T T T 下不变,且
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 是
U
U
U U U 上的 0 算子;
(b) 不存在
F
2
F
2
F^(2) \mathbf{F}^{2} F 2 的在
T
T
T T T 下不变的子空间
W
W
W W W 使得
F
2
=
U
⊕
W
F
2
=
U
⊕
W
F^(2)=U o+W \mathbf{F}^{2}=U \oplus W F 2 = U ⊕ W ;
(c)
T
/
U
T
/
U
T//U T / U T / U 是
F
2
/
U
F
2
/
U
F^(2)//U \mathbf{F}^{2} / U F 2 / U 上的 0 算子.
证明
(a) 对于
(
x
,
0
)
∈
U
(
x
,
0
)
∈
U
(x,0)in U (x, 0) \in U ( x , 0 ) ∈ U , 我们有
T
(
x
,
0
)
=
(
0
,
0
)
∈
U
T
(
x
,
0
)
=
(
0
,
0
)
∈
U
T(x,0)=(0,0)in U T(x, 0)=(0,0) \in U T ( x , 0 ) = ( 0 , 0 ) ∈ U . 于是
U
U
U U U 在
T
T
T T T 下不变, 且
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 是
U
U
U U U 上的 0 算子.
(b) 设
W
W
W W W 是
V
V
V V V 的子空间使得
F
2
=
U
⊕
W
F
2
=
U
⊕
W
F^(2)=U o+W \mathbf{F}^{2}=U \oplus W F 2 = U ⊕ W 。由于
dim
F
2
=
2
dim
F
2
=
2
dimF^(2)=2 \operatorname{dim} \mathbf{F}^{2}=2 dim F 2 = 2 且
dim
U
=
1
dim
U
=
1
dim U=1 \operatorname{dim} U=1 dim U = 1 ,我们有
dim
W
=
1
dim
W
=
1
dim W=1 \operatorname{dim} W=1 dim W = 1 . 若
W
W
W W W 在
T
T
T T T 下不变, 则
W
W
W W W 的每个非零向量都是
T
T
T T T 的本征向量. 然
而, 很容易看出 0 是
T
T
T T T 的唯一本征值, 且
T
T
T T T 的所有本征向量都在
U
U
U U U 中. 于是
W
W
W W W 并非在
T
T
T T T 下不变。
(c) 对于
(
x
,
y
)
∈
F
2
(
x
,
y
)
∈
F
2
(x,y)inF^(2) (x, y) \in \mathbf{F}^{2} ( x , y ) ∈ F 2 ,我们有
(
T
/
U
)
(
(
x
,
y
)
+
U
)
=
T
(
x
,
y
)
+
U
=
(
y
,
0
)
+
U
=
0
+
U
(
T
/
U
)
(
(
x
,
y
)
+
U
)
=
T
(
x
,
y
)
+
U
=
(
y
,
0
)
+
U
=
0
+
U
(T//U)((x,y)+U)=T(x,y)+U=(y,0)+U=0+U (T / U)((x, y)+U)=T(x, y)+U=(y, 0)+U=0+U ( T / U ) ( ( x , y ) + U ) = T ( x , y ) + U = ( y , 0 ) + U = 0 + U
这里最后一个等号成立是因为
(
y
,
0
)
∈
U
(
y
,
0
)
∈
U
(y,0)in U (y, 0) \in U ( y , 0 ) ∈ U . 上面的等式表明
T
/
U
T
/
U
T//U T / U T / U 是 0 算子.
习题 5.A
1 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) , 并设
U
U
U U U 是
V
V
V V V 的子空间.
(a) 证明:若
U
⊂
null
T
U
⊂
null
T
U sub null T U \subset \operatorname{null} T U ⊂ null T 则
U
U
U U U 在
T
T
T T T 下不变.
(b) 证明:若 range
T
⊂
U
T
⊂
U
T sub U T \subset U T ⊂ U 则
U
U
U U U 在
T
T
T T T 下不变.
2 设
S
,
T
∈
L
(
V
)
S
,
T
∈
L
(
V
)
S,T inL(V) S, T \in \mathcal{L}(V) S , T ∈ L ( V ) 使得
S
T
=
T
S
S
T
=
T
S
ST=TS S T=T S S T = T S . 证明 null
S
S
S S S 在
T
T
T T T 下不变。
3 设
S
,
T
∈
L
(
V
)
S
,
T
∈
L
(
V
)
S,T inL(V) S, T \in \mathcal{L}(V) S , T ∈ L ( V ) 使得
S
T
=
T
S
S
T
=
T
S
ST=TS S T=T S S T = T S . 证明 range
S
S
S S S 在
T
T
T T T 下不变。
4 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
U
1
,
…
,
U
m
U
1
,
…
,
U
m
U_(1),dots,U_(m) U_{1}, \ldots, U_{m} U 1 , … , U m 是
V
V
V V V 的在
T
T
T T T 下不变的子空间。证明
U
1
+
⋯
+
U
m
U
1
+
⋯
+
U
m
U_(1)+cdots+U_(m) U_{1}+\cdots+U_{m} U 1 + ⋯ + U m 在
T
T
T T T 下不变。
5 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明
V
V
V V V 的任意一组在
T
T
T T T 下不变的子空间的交仍在
T
T
T T T 下不变.
6 证明或给出反例:若
V
V
V V V 是有限维的,
U
U
U U U 是
V
V
V V V 的子空间且在
V
V
V V V 的每个算子下不变,则
U
=
{
0
}
U
=
{
0
}
U={0} U=\{0\} U = { 0 } 或
U
=
V
U
=
V
U=V U=V U = V .
7 定义
T
∈
L
(
R
2
)
T
∈
L
R
2
T inL(R^(2)) T \in \mathcal{L}\left(\mathbf{R}^{2}\right) T ∈ L ( R 2 ) 为
T
(
x
,
y
)
=
(
−
3
y
,
x
)
T
(
x
,
y
)
=
(
−
3
y
,
x
)
T(x,y)=(-3y,x) T(x, y)=(-3 y, x) T ( x , y ) = ( − 3 y , x ) . 求
T
T
T T T 的本征值.
8 定义
T
∈
L
(
F
2
)
T
∈
L
F
2
T inL(F^(2)) T \in \mathcal{L}\left(\mathbf{F}^{2}\right) T ∈ L ( F 2 ) 为
T
(
w
,
z
)
=
(
z
,
w
)
T
(
w
,
z
)
=
(
z
,
w
)
T(w,z)=(z,w) T(w, z)=(z, w) T ( w , z ) = ( z , w ) . 求
T
T
T T T 的所有本征值和本征向量.
9 定义
T
∈
L
(
F
3
)
T
∈
L
F
3
T inL(F^(3)) T \in \mathcal{L}\left(\mathbf{F}^{3}\right) T ∈ L ( F 3 ) 为
T
(
z
1
,
z
2
,
z
3
)
=
(
2
z
2
,
0
,
5
z
3
)
T
z
1
,
z
2
,
z
3
=
2
z
2
,
0
,
5
z
3
T(z_(1),z_(2),z_(3))=(2z_(2),0,5z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(2 z_{2}, 0,5 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 2 z 2 , 0 , 5 z 3 ) . 求
T
T
T T T 的所有本征值和本征向量.
10 定义
T
∈
L
(
F
n
)
T
∈
L
F
n
T inL(F^(n)) T \in \mathcal{L}\left(\mathbf{F}^{n}\right) T ∈ L ( F n ) 为
T
(
x
1
,
x
2
,
x
3
,
…
,
x
n
)
=
(
x
1
,
2
x
2
,
3
x
3
,
…
,
n
x
n
)
T
x
1
,
x
2
,
x
3
,
…
,
x
n
=
x
1
,
2
x
2
,
3
x
3
,
…
,
n
x
n
T(x_(1),x_(2),x_(3),dots,x_(n))=(x_(1),2x_(2),3x_(3),dots,nx_(n)) T\left(x_{1}, x_{2}, x_{3}, \ldots, x_{n}\right)=\left(x_{1}, 2 x_{2}, 3 x_{3}, \ldots, n x_{n}\right) T ( x 1 , x 2 , x 3 , … , x n ) = ( x 1 , 2 x 2 , 3 x 3 , … , n x n ) 。
(a) 求
T
T
T T T 的所有本征值和本征向量.
(b) 求
T
T
T T T 的所有不变子空间.
11 定义
T
:
P
(
R
)
→
P
(
R
)
T
:
P
(
R
)
→
P
(
R
)
T:P(R)rarrP(R) T: \mathcal{P}(\mathbf{R}) \rightarrow \mathcal{P}(\mathbf{R}) T : P ( R ) → P ( R ) 为
T
p
=
p
′
T
p
=
p
′
Tp=p^(') T p=p^{\prime} T p = p ′ . 求
T
T
T T T 的所有本征值和本征向量.
12 定义
T
∈
L
(
P
4
(
R
)
)
T
∈
L
P
4
(
R
)
T inL(P_(4)(R)) T \in \mathcal{L}\left(\mathcal{P}_{4}(\mathbf{R})\right) T ∈ L ( P 4 ( R ) ) 如下: 对所有
x
∈
R
x
∈
R
x inR x \in \mathbf{R} x ∈ R 有
(
T
p
)
(
x
)
=
x
p
′
(
x
)
(
T
p
)
(
x
)
=
x
p
′
(
x
)
(Tp)(x)=xp^(')(x) (T p)(x)=x p^{\prime}(x) ( T p ) ( x ) = x p ′ ( x ) . 求
T
T
T T T 的所有本征值和本征向量.
13 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 。证明存在
α
∈
F
α
∈
F
alpha inF \alpha \in \mathbf{F} α ∈ F 使得
|
α
−
λ
|
<
1
1000
|
α
−
λ
|
<
1
1000
|alpha-lambda| < (1)/(1000) |\alpha-\lambda|<\frac{1}{1000} | α − λ | < 1 1000 且
(
T
−
α
I
)
(
T
−
α
I
)
(T-alpha I) (T-\alpha I) ( T − α I ) 是可逆的。
14 设
V
=
U
⊕
W
V
=
U
⊕
W
V=U o+W V=U \oplus W V = U ⊕ W ,其中
U
U
U U U 和
W
W
W W W 均为
V
V
V V V 的非零子空间。定义
P
∈
L
(
V
)
P
∈
L
(
V
)
P inL(V) P \in \mathcal{L}(V) P ∈ L ( V ) 如下:对
u
∈
U
u
∈
U
u in U u \in U u ∈ U 和
w
∈
W
w
∈
W
w in W w \in W w ∈ W 有
P
(
u
+
w
)
=
u
P
(
u
+
w
)
=
u
P(u+w)=u P(u+w)=u P ( u + w ) = u . 求
P
P
P P P 的所有本征值和本征向量.
15 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 设
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 是可逆的.
(a) 证明
T
T
T T T 和
S
−
1
T
S
S
−
1
T
S
S^(-1)TS S^{-1} T S S − 1 T S 有相同的本征值.
(b)
T
T
T T T 的本征向量与
S
−
1
T
S
S
−
1
T
S
S^(-1)TS S^{-1} T S S − 1 T S 的本征向量之间有什么关系?
16 设
V
V
V V V 是复向量空间,
T
∈
L
(
V
)
,
T
T
∈
L
(
V
)
,
T
T inL(V),T T \in \mathcal{L}(V), T T ∈ L ( V ) , T 关于
V
V
V V V 的某个基的矩阵的元素均为实数。证明:若
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值,则
λ
¯
λ
¯
bar(lambda) \bar{\lambda} λ ¯ 也是
T
T
T T T 的本征值。
17 给出一个没有(实)本征值的算子
T
∈
L
(
R
4
)
T
∈
L
R
4
T inL(R^(4)) T \in \mathcal{L}\left(\mathbf{R}^{4}\right) T ∈ L ( R 4 ) 。
18 定义
T
∈
L
(
C
∞
)
T
∈
L
C
∞
T inL(C^(oo)) T \in \mathcal{L}\left(\mathbf{C}^{\infty}\right) T ∈ L ( C ∞ ) 为
T
(
z
1
,
z
2
,
…
)
=
(
0
,
z
1
,
z
2
,
…
)
T
z
1
,
z
2
,
…
=
0
,
z
1
,
z
2
,
…
T(z_(1),z_(2),dots)=(0,z_(1),z_(2),dots) T\left(z_{1}, z_{2}, \ldots\right)=\left(0, z_{1}, z_{2}, \ldots\right) T ( z 1 , z 2 , … ) = ( 0 , z 1 , z 2 , … ) . 证明
T
T
T T T 没有本征值。
19 设
n
n
n n n 是正整数,定义
T
∈
L
(
F
n
)
T
∈
L
F
n
T inL(F^(n)) T \in \mathcal{L}\left(\mathbf{F}^{n}\right) T ∈ L ( F n ) 为
T
(
x
1
,
…
,
x
n
)
=
(
x
1
+
⋯
+
x
n
,
…
,
x
1
+
⋯
+
x
n
)
T
x
1
,
…
,
x
n
=
x
1
+
⋯
+
x
n
,
…
,
x
1
+
⋯
+
x
n
T(x_(1),dots,x_(n))=(x_(1)+cdots+x_(n),dots,x_(1)+cdots+x_(n)) T\left(x_{1}, \ldots, x_{n}\right)=\left(x_{1}+\cdots+x_{n}, \ldots, x_{1}+\cdots+x_{n}\right) T ( x 1 , … , x n ) = ( x 1 + ⋯ + x n , … , x 1 + ⋯ + x n ) ,也就是说算子
T
T
T T T (对于标准基)的矩阵的元素全是1. 求
T
T
T T T 的所有本征值和本征向量。
20 定义向后移位算子
T
∈
L
(
F
∞
)
T
∈
L
F
∞
T inL(F^(oo)) T \in \mathcal{L}\left(\mathbf{F}^{\infty}\right) T ∈ L ( F ∞ ) 为
T
(
z
1
,
z
2
,
z
3
,
…
)
=
(
z
2
,
z
3
,
…
)
T
z
1
,
z
2
,
z
3
,
…
=
z
2
,
z
3
,
…
T(z_(1),z_(2),z_(3),dots)=(z_(2),z_(3),dots) T\left(z_{1}, z_{2}, z_{3}, \ldots\right)=\left(z_{2}, z_{3}, \ldots\right) T ( z 1 , z 2 , z 3 , … ) = ( z 2 , z 3 , … ) . 求
T
T
T T T 的所有本征值和本征向量。
21 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的。
(a) 设
λ
∈
F
,
λ
≠
0
λ
∈
F
,
λ
≠
0
lambda inF,lambda!=0 \lambda \in \mathbf{F}, \lambda \neq 0 λ ∈ F , λ ≠ 0 . 证明
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值当且仅当
1
λ
1
λ
(1)/(lambda) \frac{1}{\lambda} 1 λ 是
T
−
1
T
−
1
T^(-1) T^{-1} T − 1 的本征值.
(b) 证明
T
T
T T T 和
T
−
1
T
−
1
T^(-1) T^{-1} T − 1 有相同的本征向量.
22 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且存在
V
V
V V V 中的非零向量
v
v
v v v 和
w
w
w w w 使得
T
v
=
3
w
T
v
=
3
w
Tv=3w T v=3 w T v = 3 w 且
T
w
=
3
v
T
w
=
3
v
Tw=3v T w=3 v T w = 3 v . 证明 3 或者 -3 是
T
T
T T T 的本征值。
23 设
V
V
V V V 是有限维的且
S
,
T
∈
L
(
V
)
S
,
T
∈
L
(
V
)
S,T inL(V) S, T \in \mathcal{L}(V) S , T ∈ L ( V ) . 证明
S
T
S
T
ST S T S T 和
T
S
T
S
TS T S T S 有相同的本征值.
24 设
A
A
A A A 是元素属于
F
F
F \mathbf{F} F 的
n
×
n
n
×
n
n xx n n \times n n × n 矩阵。定义
T
∈
L
(
F
n
)
T
∈
L
F
n
T inL(F^(n)) T \in \mathcal{L}\left(\mathbf{F}^{n}\right) T ∈ L ( F n ) 为
T
x
=
A
x
T
x
=
A
x
Tx=Ax T x=A x T x = A x ,这里
F
n
F
n
F^(n) \mathbf{F}^{n} F n 中的元素视为
n
×
1
n
×
1
n xx1 n \times 1 n × 1 的列向量。
(a) 设
A
A
A A A 的每行的元素之和都等于1. 证明 1 是
T
T
T T T 的本征值.
(b) 设
A
A
A A A 的每列的元素之和都等于 1 . 证明 1 是
T
T
T T T 的本征值.
25 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
u
u
u u u 和
v
v
v v v 均为
T
T
T T T 的本征向量使得
u
+
v
u
+
v
u+v u+v u + v 也是
T
T
T T T 的本征向量. 证明
u
u
u u u 和
v
v
v v v 是
T
T
T T T 的相应于同一本征值的本征向量。
26 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 使得
V
V
V V V 中的每个非零向量都是
T
T
T T T 的本征向量. 证明
T
T
T T T 是恒等算子的标量倍。
27 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 使得
V
V
V V V 的每个
dim
V
−
1
dim
V
−
1
dim V-1 \operatorname{dim} V-1 dim V − 1 维子空间都在
T
T
T T T 下不变。证明
T
T
T T T 是恒等算子的标量倍。
28 设
V
V
V V V 是有限维的,
dim
V
≥
3
dim
V
≥
3
dim V >= 3 \operatorname{dim} V \geq 3 dim V ≥ 3 且
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 使得
V
V
V V V 的每个二维子空间在
T
T
T T T 下不变. 证明
T
T
T T T 是恒等算子的标量倍。
29 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
dim
range
T
=
k
dim
range
T
=
k
dim range T=k \operatorname{dim} \operatorname{range} T=k dim range T = k . 证明
T
T
T T T 至多有
k
+
1
k
+
1
k+1 k+1 k + 1 个不同的本征值.
30 设
T
∈
L
(
R
3
)
T
∈
L
R
3
T inL(R^(3)) T \in \mathcal{L}\left(\mathbf{R}^{3}\right) T ∈ L ( R 3 ) 且
−
4
,
5
,
7
−
4
,
5
,
7
-4,5,sqrt7 -4,5, \sqrt{7} − 4 , 5 , 7 均为
T
T
T T T 的本征值. 证明存在
x
∈
R
3
x
∈
R
3
x inR^(3) x \in \mathbf{R}^{3} x ∈ R 3 使得
T
x
−
9
x
=
T
x
−
9
x
=
Tx-9x= T x-9 x= T x − 9 x =
(
−
4
,
5
,
7
)
(
−
4
,
5
,
7
)
(-4,5,sqrt7) (-4,5, \sqrt{7}) ( − 4 , 5 , 7 ) .
31 设
V
V
V V V 是有限维的且
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是
V
V
V V V 中的一组向量。证明
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 线性无关当且仅当存在
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 使得
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是
T
T
T T T 的相应于不同本征值的本征向量。
32 设
λ
1
,
…
,
λ
n
λ
1
,
…
,
λ
n
lambda_(1),dots,lambda_(n) \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 是一组互异实数。证明在由
R
R
R \mathbf{R} R 上的实值函数构成的向量空间中,组
e
λ
1
x
,
…
,
e
λ
n
x
e
λ
1
x
,
…
,
e
λ
n
x
e^(lambda_(1)x),dots,e^(lambda_(n)x) e^{\lambda_{1} x}, \ldots, e^{\lambda_{n} x} e λ 1 x , … , e λ n x 线性无关。
提示: 设
V
=
span
(
e
λ
1
x
,
…
,
e
λ
n
x
)
V
=
span
e
λ
1
x
,
…
,
e
λ
n
x
V=span(e^(lambda_(1)x),dots,e^(lambda_(n)x)) V=\operatorname{span}\left(e^{\lambda_{1} x}, \ldots, e^{\lambda_{n} x}\right) V = span ( e λ 1 x , … , e λ n x ) ,定义算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 为
T
f
=
f
′
T
f
=
f
′
Tf=f^(') T f=f^{\prime} T f = f ′ 。求
T
T
T T T 的本征值和本征向量。
33 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。证明
T
/
(
T
/
(
T//( T /( T / ( range
T
)
=
0
T
)
=
0
T)=0 T)=0 T ) = 0 。
34 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明
T
/
(
null
T
)
T
/
(
null
T
)
T//(null T) T /(\operatorname{null} T) T / ( null T ) 是单的当且仅当
(
null
T
)
∩
(
range
T
)
=
{
0
}
(
null
T
)
∩
(
range
T
)
=
{
0
}
(null T)nn(range T)={0} (\operatorname{null} T) \cap(\operatorname{range} T)=\{0\} ( null T ) ∩ ( range T ) = { 0 } .
35 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
,
U
T
∈
L
(
V
)
,
U
T inL(V),U T \in \mathcal{L}(V), U T ∈ L ( V ) , U 在
T
T
T T T 下不变。证明
T
/
U
T
/
U
T//U T / U T / U 的每个本征值均为
T
T
T T T 的本征值。
下题是让你验证本习题中 "
V
V
V V V 是有限维的" 这一假设是必需的.
36 找出一个向量空间
V
V
V V V 和一个算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,以及
V
V
V V V 的在
T
T
T T T 下不变的子空间
U
U
U U U ,使得
T
/
U
T
/
U
T//U T / U T / U 的某个本征值不是
T
T
T T T 的本征值。
5.B 本征向量与上三角矩阵
多项式作用于算子
算子(它把一个向量空间映到自身)理论要比线性映射理论更丰富,主要原因是算子能自乘为幂。我们从算子的幂以及多项式作用于算子这一关键概念的定义开始。
若
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) , 则
T
T
T
T
TT T T T T 有意义, 并且也含于
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) . 通常用
T
2
T
2
T^(2) T^{2} T 2 代替
T
T
T
T
TT T T T T . 更一般地,我们有下面的定义。
5.16 定义
T
m
T
m
T^(m) T^{m} T m
设
T
∈
L
(
V
)
,
m
T
∈
L
(
V
)
,
m
T inL(V),m T \in \mathcal{L}(V), m T ∈ L ( V ) , m 是正整数.
定义
T
m
T
m
T^(m) T^{m} T m 为
T
m
=
T
⋯
T
⏟
m
个
T
m
=
T
⋯
T
⏟
m
个
T^(m)=ubrace(T cdots Tubrace)_(m" 个 ") T^{m}=\underbrace{T \cdots T}_{m \text { 个 }} 个 T m = T ⋯ T ⏟ m 个 。
定义
T
0
T
0
T^(0) T^{0} T 0 为
V
V
V V V 上的恒等算子
I
I
I I I .
若
T
T
T T T 是可逆的且其逆为
T
−
1
T
−
1
T^(-1) T^{-1} T − 1 , 则定义
T
−
m
T
−
m
T^(-m) T^{-m} T − m 为
T
−
m
=
(
T
−
1
)
m
T
−
m
=
T
−
1
m
T^(-m)=(T^(-1))^(m) T^{-m}=\left(T^{-1}\right)^{m} T − m = ( T − 1 ) m .
T
m
T
n
=
T
m
+
n
和
(
T
m
)
n
=
T
m
n
,
T
m
T
n
=
T
m
+
n
和
T
m
n
=
T
m
n
,
T^(m)T^(n)=T^(m+n)quad" 和 "quad(T^(m))^(n)=T^(mn)", " T^{m} T^{n}=T^{m+n} \quad \text { 和 } \quad\left(T^{m}\right)^{n}=T^{m n} \text {, } 和 T m T n = T m + n 和 ( T m ) n = T m n ,
当
T
T
T T T 可逆时
m
m
m m m 和
n
n
n n n 是任意整数, 当
T
T
T T T 不可逆时
m
m
m m m 和
n
n
n n n 是非负整数.
5.17 定义
p
(
T
)
p
(
T
)
p(T) p(T) p ( T )
设
T
∈
L
(
V
)
,
p
∈
P
(
F
)
T
∈
L
(
V
)
,
p
∈
P
(
F
)
T inL(V),p inP(F) T \in \mathcal{L}(V), p \in \mathcal{P}(\mathbf{F}) T ∈ L ( V ) , p ∈ P ( F ) ,对
z
∈
F
z
∈
F
z inF z \in \mathbf{F} z ∈ F 有
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
z
m
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
⋯
+
a
m
z
m
p(z)=a_(0)+a_(1)z+a_(2)z^(2)+cdots+a_(m)z^(m) p(z)=a_{0}+a_{1} z+a_{2} z^{2}+\cdots+a_{m} z^{m} p ( z ) = a 0 + a 1 z + a 2 z 2 + ⋯ + a m z m 。则
p
(
T
)
p
(
T
)
p(T) p(T) p ( T ) 是定义为
p
(
T
)
=
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
T
m
p
(
T
)
=
a
0
I
+
a
1
T
+
a
2
T
2
+
⋯
+
a
m
T
m
p(T)=a_(0)I+a_(1)T+a_(2)T^(2)+cdots+a_(m)T^(m) p(T)=a_{0} I+a_{1} T+a_{2} T^{2}+\cdots+a_{m} T^{m} p ( T ) = a 0 I + a 1 T + a 2 T 2 + ⋯ + a m T m 的算子.
这是符号
p
p
p p p 的新用法,因为我们把它作用于算子,而不仅仅作用于
F
F
F \mathbf{F} F 的元素.
5.18 例 设
D
∈
L
(
P
(
R
)
)
D
∈
L
(
P
(
R
)
)
D inL(P(R)) D \in \mathcal{L}(\mathcal{P}(\mathbf{R})) D ∈ L ( P ( R ) ) 是由
D
q
=
q
′
D
q
=
q
′
Dq=q^(') D q=q^{\prime} D q = q ′ 定义的微分算子,
p
p
p p p 是多项式
p
(
x
)
=
p
(
x
)
=
p(x)= p(x)= p ( x ) =
7
−
3
x
+
5
x
2
7
−
3
x
+
5
x
2
7-3x+5x^(2) 7-3 x+5 x^{2} 7 − 3 x + 5 x 2 。则
p
(
D
)
=
7
I
−
3
D
+
5
D
2
p
(
D
)
=
7
I
−
3
D
+
5
D
2
p(D)=7I-3D+5D^(2) p(D)=7 I-3 D+5 D^{2} p ( D ) = 7 I − 3 D + 5 D 2 。于是对每个
q
∈
P
(
R
)
q
∈
P
(
R
)
q inP(R) q \in \mathcal{P}(\mathbf{R}) q ∈ P ( R ) 有
(
p
(
D
)
)
q
=
(
p
(
D
)
)
q
=
(p(D))q= (p(D)) q= ( p ( D ) ) q =
7
q
−
3
q
′
+
5
q
′
′
7
q
−
3
q
′
+
5
q
′
′
7q-3q^(')+5q^('') 7 q-3 q^{\prime}+5 q^{\prime \prime} 7 q − 3 q ′ + 5 q ′ ′ .
请自行验证,如果固定一个算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,则由
p
↦
p
(
T
)
p
↦
p
(
T
)
p|->p(T) p \mapsto p(T) p ↦ p ( T ) 所定义的从
P
(
F
)
P
(
F
)
P(F) \mathcal{P}(\mathbf{F}) P ( F ) 到
L
(
V
)
L
(
V
)
L(V) \mathcal{L}(V) L ( V ) 的函数是线性的.
5.19 定义 多项式的积 (product of polynomials)
若
p
,
q
∈
P
(
F
)
p
,
q
∈
P
(
F
)
p,q inP(F) p, q \in \mathcal{P}(\mathbf{F}) p , q ∈ P ( F ) , 则
p
q
∈
P
(
F
)
p
q
∈
P
(
F
)
pq inP(F) p q \in \mathcal{P}(\mathbf{F}) p q ∈ P ( F ) 是如下定义的多项式: 对
z
∈
F
z
∈
F
z inF z \in \mathbf{F} z ∈ F 有
(
p
q
)
(
z
)
=
(
p
q
)
(
z
)
=
(pq)(z)= (p q)(z)= ( p q ) ( z ) =
p
(
z
)
q
(
z
)
p
(
z
)
q
(
z
)
p(z)q(z) p(z) q(z) p ( z ) q ( z ) .
下面我们将要证明:一个算子的任意两个多项式是交换的。
5.20 乘积性质
设
p
,
q
∈
P
(
F
)
,
T
∈
L
(
V
)
p
,
q
∈
P
(
F
)
,
T
∈
L
(
V
)
p,q inP(F),T inL(V) p, q \in \mathcal{P}(\mathbf{F}), T \in \mathcal{L}(V) p , q ∈ P ( F ) , T ∈ L ( V ) . 则
(a)
(
p
q
)
(
T
)
=
p
(
T
)
q
(
T
)
(
p
q
)
(
T
)
=
p
(
T
)
q
(
T
)
(pq)(T)=p(T)q(T) (p q)(T)=p(T) q(T) ( p q ) ( T ) = p ( T ) q ( T ) ;
(b)
p
(
T
)
q
(
T
)
=
q
(
T
)
p
(
T
)
p
(
T
)
q
(
T
)
=
q
(
T
)
p
(
T
)
p(T)q(T)=q(T)p(T) p(T) q(T)=q(T) p(T) p ( T ) q ( T ) = q ( T ) p ( T ) .
(a) 成立是因为在用分配性质把多项式的乘积展开时,其中的符号是
z
z
z z z 还是
T
T
T T T 没有什么影响。
证明
(a) 设
p
(
z
)
=
∑
j
=
0
m
a
j
z
j
,
q
(
z
)
=
∑
k
=
0
n
b
k
z
k
p
(
z
)
=
∑
j
=
0
m
a
j
z
j
,
q
(
z
)
=
∑
k
=
0
n
b
k
z
k
p(z)=sum_(j=0)^(m)a_(j)z^(j),q(z)=sum_(k=0)^(n)b_(k)z^(k) p(z)=\sum_{j=0}^{m} a_{j} z^{j}, q(z)=\sum_{k=0}^{n} b_{k} z^{k} p ( z ) = ∑ j = 0 m a j z j , q ( z ) = ∑ k = 0 n b k z k , 其中
z
∈
F
z
∈
F
z inF z \in \mathbf{F} z ∈ F . 则
(
p
q
)
(
z
)
=
∑
j
=
0
m
∑
k
=
0
n
a
j
b
k
z
j
+
k
(
p
q
)
(
z
)
=
∑
j
=
0
m
∑
k
=
0
n
a
j
b
k
z
j
+
k
(pq)(z)=sum_(j=0)^(m)sum_(k=0)^(n)a_(j)b_(k)z^(j+k) (p q)(z)=\sum_{j=0}^{m} \sum_{k=0}^{n} a_{j} b_{k} z^{j+k} ( p q ) ( z ) = ∑ j = 0 m ∑ k = 0 n a j b k z j + k
于是
(
p
q
)
(
T
)
=
∑
j
=
0
m
∑
k
=
0
n
a
j
b
k
T
j
+
k
=
(
∑
j
=
0
m
a
j
T
j
)
(
∑
k
=
0
n
b
k
T
k
)
=
p
(
T
)
q
(
T
)
(
p
q
)
(
T
)
=
∑
j
=
0
m
∑
k
=
0
n
a
j
b
k
T
j
+
k
=
∑
j
=
0
m
a
j
T
j
∑
k
=
0
n
b
k
T
k
=
p
(
T
)
q
(
T
)
(pq)(T)=sum_(j=0)^(m)sum_(k=0)^(n)a_(j)b_(k)T^(j+k)=(sum_(j=0)^(m)a_(j)T^(j))(sum_(k=0)^(n)b_(k)T^(k))=p(T)q(T) (p q)(T)=\sum_{j=0}^{m} \sum_{k=0}^{n} a_{j} b_{k} T^{j+k}=\left(\sum_{j=0}^{m} a_{j} T^{j}\right)\left(\sum_{k=0}^{n} b_{k} T^{k}\right)=p(T) q(T) ( p q ) ( T ) = ∑ j = 0 m ∑ k = 0 n a j b k T j + k = ( ∑ j = 0 m a j T j ) ( ∑ k = 0 n b k T k ) = p ( T ) q ( T )
(b) 因为 (a), 我们有
p
(
T
)
q
(
T
)
=
(
p
q
)
(
T
)
=
(
q
p
)
(
T
)
=
q
(
T
)
p
(
T
)
p
(
T
)
q
(
T
)
=
(
p
q
)
(
T
)
=
(
q
p
)
(
T
)
=
q
(
T
)
p
(
T
)
p(T)q(T)=(pq)(T)=(qp)(T)=q(T)p(T) p(T) q(T)=(p q)(T)=(q p)(T)=q(T) p(T) p ( T ) q ( T ) = ( p q ) ( T ) = ( q p ) ( T ) = q ( T ) p ( T ) .
本征值的存在性
现在给出复向量空间上算子的中心结果之一.
5.21 复向量空间上的算子都有本征值
有限维非零复向量空间上的每个算子都有本征值.
证明 设
V
V
V V V 是
n
n
n n n 维复向量空间,
n
>
0
n
>
0
n > 0 n>0 n > 0 ,并设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 取
v
∈
V
v
∈
V
v in V v \in V v ∈ V 且
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 . 因为
V
V
V V V 是
n
n
n n n 维的,所以
n
+
1
n
+
1
n+1 n+1 n + 1 个向量
v
,
T
v
,
T
2
v
,
…
,
T
n
v
v
,
T
v
,
T
2
v
,
…
,
T
n
v
v,Tv,T^(2)v,dots,T^(n)v v, T v, T^{2} v, \ldots, T^{n} v v , T v , T 2 v , … , T n v
线性相关. 于是有不全为 0 的复数
a
0
,
…
,
a
n
a
0
,
…
,
a
n
a_(0),dots,a_(n) a_{0}, \ldots, a_{n} a 0 , … , a n 使得
0
=
a
0
v
+
a
1
T
v
+
⋯
+
a
n
T
n
v
0
=
a
0
v
+
a
1
T
v
+
⋯
+
a
n
T
n
v
0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v 0=a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v 0 = a 0 v + a 1 T v + ⋯ + a n T n v
注意
a
1
,
…
,
a
n
a
1
,
…
,
a
n
a_(1),dots,a_(n) a_{1}, \ldots, a_{n} a 1 , … , a n 不全为 0 , 否则上面等式将变成
0
=
a
0
v
0
=
a
0
v
0=a_(0)v 0=a_{0} v 0 = a 0 v , 这将使
a
0
a
0
a_(0) a_{0} a 0 也必须是 0.
以这些
a
j
a
j
a_(j) a_{j} a j 为系数作一个多项式,利用代数学基本定理 4.14 可将此多项式分解成
a
0
+
a
1
z
+
⋯
+
a
n
z
n
=
c
(
z
−
λ
1
)
⋯
(
z
−
λ
m
)
a
0
+
a
1
z
+
⋯
+
a
n
z
n
=
c
z
−
λ
1
⋯
z
−
λ
m
a_(0)+a_(1)z+cdots+a_(n)z^(n)=c(z-lambda_(1))cdots(z-lambda_(m)) a_{0}+a_{1} z+\cdots+a_{n} z^{n}=c\left(z-\lambda_{1}\right) \cdots\left(z-\lambda_{m}\right) a 0 + a 1 z + ⋯ + a n z n = c ( z − λ 1 ) ⋯ ( z − λ m )
其中
c
c
c c c 是非零复数,每个
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 属于
C
C
C \mathbf{C} C ,且上面等式对所有
z
∈
C
z
∈
C
z inC z \in \mathbf{C} z ∈ C 均成立(这里
m
m
m m m 未必等于
n
n
n n n , 因为
a
n
a
n
a_(n) a_{n} a n 可能等于 0 ). 则
0
=
a
0
v
+
a
1
T
v
+
⋯
+
a
n
T
n
v
=
(
a
0
I
+
a
1
T
+
⋯
+
a
n
T
n
)
v
=
c
(
T
−
λ
1
I
)
⋯
(
T
−
λ
m
I
)
v
0
=
a
0
v
+
a
1
T
v
+
⋯
+
a
n
T
n
v
=
a
0
I
+
a
1
T
+
⋯
+
a
n
T
n
v
=
c
T
−
λ
1
I
⋯
T
−
λ
m
I
v
{:[0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v],[=(a_(0)I+a_(1)T+cdots+a_(n)T^(n))v],[=c(T-lambda_(1)I)cdots(T-lambda_(m)I)v]:} \begin{aligned}
0 & =a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v \\
& =\left(a_{0} I+a_{1} T+\cdots+a_{n} T^{n}\right) v \\
& =c\left(T-\lambda_{1} I\right) \cdots\left(T-\lambda_{m} I\right) v
\end{aligned} 0 = a 0 v + a 1 T v + ⋯ + a n T n v = ( a 0 I + a 1 T + ⋯ + a n T n ) v = c ( T − λ 1 I ) ⋯ ( T − λ m I ) v
于是至少有一个
j
j
j j j 使得
(
T
−
λ
j
I
)
T
−
λ
j
I
(T-lambda_(j)I) \left(T-\lambda_{j} I\right) ( T − λ j I ) 不是单的. 也就是说,
T
T
T T T 有本征值.
上面的证明依赖于代数学基本定理, 这是该结果一个典型的证明. 此结果的其他证明见习题 16 和习题 17,思路与上面的证明稍有不同.
上三角矩阵
在第3章我们讨论了从一个向量空间到另一个向量空间的线性映射的矩阵. 该矩阵依赖于这两个向量空间的基的选取。既然我们要研究将向量空间映到其自身的算子,要强调的就是现在只使用一个基。
5.22 定义 算子的矩阵(matrix of an operator),
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T )
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,并设
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基.
T
T
T T T 关于该基的矩阵定义为
n
×
n
n
×
n
n xx n n \times n n × n 矩阵
M
(
T
)
=
(
A
1
,
1
…
A
1
,
n
⋮
⋮
A
n
,
1
…
A
n
,
n
)
M
(
T
)
=
A
1
,
1
…
A
1
,
n
⋮
⋮
A
n
,
1
…
A
n
,
n
M(T)=([A_(1,1),dots,A_(1,n)],[vdots,,vdots],[A_(n,1),dots,A_(n,n)]) \mathcal{M}(T)=\left(\begin{array}{ccc}
A_{1,1} & \ldots & A_{1, n} \\
\vdots & & \vdots \\
A_{n, 1} & \ldots & A_{n, n}
\end{array}\right) M ( T ) = ( A 1 , 1 … A 1 , n ⋮ ⋮ A n , 1 … A n , n )
其元素
A
j
,
k
A
j
,
k
A_(j,k) A_{j, k} A j , k 定义为
T
v
k
=
A
1
,
k
v
1
+
⋯
+
A
n
,
k
v
n
T
v
k
=
A
1
,
k
v
1
+
⋯
+
A
n
,
k
v
n
Tv_(k)=A_(1,k)v_(1)+cdots+A_(n,k)v_(n) T v_{k}=A_{1, k} v_{1}+\cdots+A_{n, k} v_{n} T v k = A 1 , k v 1 + ⋯ + A n , k v n
如果基在上下文中不是自明的,则使用记号
M
(
T
,
(
v
1
,
…
,
v
n
)
)
M
T
,
v
1
,
…
,
v
n
M(T,(v_(1),dots,v_(n))) \mathcal{M}\left(T,\left(v_{1}, \ldots, v_{n}\right)\right) M ( T , ( v 1 , … , v n ) ) 。
注意算子的矩阵是正方形阵列,而早先考虑的线性映射的矩阵是更一般的长方形阵列。
将
T
v
k
T
v
k
Tv_(k) T v_{k} T v k 写成
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 的线性组合时使用的那些系数构成了矩阵
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T ) 的第
k
k
k k k 列。
若
T
T
T T T 是
F
n
F
n
F^(n) \mathbf{F}^{n} F n 的算子,且没有指定基,则假定为标准基(第
j
j
j j j 个基向量的第
j
j
j j j 个位置是 1 ,其余位置均为 0 )。此时可以认为
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T ) 的第
j
j
j j j 列是
T
T
T T T 作用到第
j
j
j j j 个标准基上得到的向量。
5.23 例 定义
T
∈
L
(
F
3
)
T
∈
L
F
3
T inL(F^(3)) T \in \mathcal{L}\left(\mathbf{F}^{3}\right) T ∈ L ( F 3 ) 为
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T(x,y,z)=(2x+y,5y+3z,8z) T(x, y, z)=(2 x+y, 5 y+3 z, 8 z) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) . 则
M
(
T
)
=
(
2
1
0
0
5
3
0
0
8
)
M
(
T
)
=
2
1
0
0
5
3
0
0
8
M(T)=([2,1,0],[0,5,3],[0,0,8]) \mathcal{M}(T)=\left(\begin{array}{lll}
2 & 1 & 0 \\
0 & 5 & 3 \\
0 & 0 & 8
\end{array}\right) M ( T ) = ( 2 1 0 0 5 3 0 0 8 )
线性代数的一个中心目标就是要证明,对于给定的算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) ,必定存在
V
V
V V V 的一个基使得
T
T
T T T 关于该基有一个相当简单的矩阵。这种表述比较含糊,说得更具体一点,就是我们要选择
V
V
V V V 的基以使
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T ) 有很多的 0 。
若
V
V
V V V 是有限维的复向量空间,那么我们已经知道很多,足以证明
V
V
V V V 有一个基使得
T
T
T T T 关于这个基的矩阵的第一列除第一个元素之外全是 0 , 也就是说,
V
V
V V V 有一个基使得
T
T
T T T 关于这个基的矩阵形如
(
λ
0
∗
⋮
0
)
λ
0
∗
⋮
0
([lambda,,],[0,**],[vdots,],[0,]) \left(\begin{array}{ccc}
\lambda & & \\
0 & * \\
\vdots & \\
0 &
\end{array}\right) ( λ 0 ∗ ⋮ 0 )
这里 * 表示第一列之外的所有其他元素。为了证明这个事实, 设
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值 (由 5.21 知一定存在),并且
v
v
v v v 是相应的本征向量。把
v
v
v v v 扩充成
V
V
V V V 的基,则
T
T
T T T 关于这个基的矩阵就有上述形式。
马上就会看到, 可以选取
V
V
V V V 的一个基使得
T
T
T T T 关于这个基的矩阵有更多的 0.
5.24 定义 矩阵的对角线(diagonal of a matrix)
方阵的对角线由位于从左上角到右下角的直线上的元素组成.
例如, 5.23 中矩阵的对角线由元素
2
,
5
,
8
2
,
5
,
8
2,5,8 2,5,8 2 , 5 , 8 组成.
5.25 定义 上三角矩阵(upper-triangular matrix)
一个矩阵称为上三角的,如果位于对角线下方的元素全为 0 。
例如, 5.23 中的矩阵是上三角的.
上三角矩阵具有如下的典型形式
(
λ
1
∗
⋱
0
λ
n
)
λ
1
∗
⋱
0
λ
n
([lambda_(1),,**],[,ddots,],[0,,lambda_(n)]) \left(\begin{array}{ccc}
\lambda_{1} & & * \\
& \ddots & \\
0 & & \lambda_{n}
\end{array}\right) ( λ 1 ∗ ⋱ 0 λ n )
上面矩阵中的那个 0 表示在这个
n
×
n
n
×
n
n xx n n \times n n × n 矩阵中位于对角线下方的元素全等于 0 。可以认为上三角矩阵是相当简单的——因为当
n
n
n n n 比较大时,
我们经常用
∗
∗
** * ∗ 表示矩阵的末知元素或其取值对所讨论的问题无关紧要的元素。
n
×
n
n
×
n
n xx n n \times n n × n 上三角矩阵有几乎一半的元素等于 0 。
下面的命题揭示了上三角矩阵与不变子空间之间的一个很有用的联系.
5.26 上三角矩阵的条件
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) , 且
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基. 则以下条件等价:
(a)
T
T
T T T 关于
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 的矩阵是上三角的;
(b) 对每个
j
=
1
,
…
,
n
j
=
1
,
…
,
n
j=1,dots,n j=1, \ldots, n j = 1 , … , n 有
T
v
j
∈
span
(
v
1
,
…
,
v
j
)
T
v
j
∈
span
v
1
,
…
,
v
j
Tv_(j)in span(v_(1),dots,v_(j)) T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) T v j ∈ span ( v 1 , … , v j ) ;
(c) 对每个
j
=
1
,
…
,
n
j
=
1
,
…
,
n
j=1,dots,n j=1, \ldots, n j = 1 , … , n 有
span
(
v
1
,
…
,
v
j
)
span
v
1
,
…
,
v
j
span(v_(1),dots,v_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( v 1 , … , v j ) 在
T
T
T T T 下不变.
证明 根据定义,稍加思考即可得(a)和(b)的等价性。显然(c)蕴涵(b)。因此,为了完成证明,只需证明(b)蕴涵(c)。
假设(b)成立。取定
j
∈
{
1
,
…
,
n
}
j
∈
{
1
,
…
,
n
}
j in{1,dots,n} j \in\{1, \ldots, n\} j ∈ { 1 , … , n } 。由 (b) 可知
T
v
1
∈
span
(
v
1
)
⊂
span
(
v
1
,
…
,
v
j
)
,
T
v
2
∈
span
(
v
1
,
v
2
)
⊂
span
(
v
1
,
…
,
v
j
)
T
v
1
∈
span
v
1
⊂
span
v
1
,
…
,
v
j
,
T
v
2
∈
span
v
1
,
v
2
⊂
span
v
1
,
…
,
v
j
{:[Tv_(1)in span(v_(1))sub span(v_(1),dots,v_(j))","],[Tv_(2)in span(v_(1),v_(2))sub span(v_(1),dots,v_(j))]:} \begin{aligned}
& T v_{1} \in \operatorname{span}\left(v_{1}\right) \subset \operatorname{span}\left(v_{1}, \ldots, v_{j}\right), \\
& T v_{2} \in \operatorname{span}\left(v_{1}, v_{2}\right) \subset \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)
\end{aligned} T v 1 ∈ span ( v 1 ) ⊂ span ( v 1 , … , v j ) , T v 2 ∈ span ( v 1 , v 2 ) ⊂ span ( v 1 , … , v j )
T
v
j
∈
span
(
v
1
,
…
,
v
j
)
T
v
j
∈
span
v
1
,
…
,
v
j
Tv_(j)in span(v_(1),dots,v_(j)) T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) T v j ∈ span ( v 1 , … , v j )
因此,若
v
v
v v v 是
v
1
,
…
,
v
j
v
1
,
…
,
v
j
v_(1),dots,v_(j) v_{1}, \ldots, v_{j} v 1 , … , v j 的线性组合,则
T
v
∈
span
(
v
1
,
…
,
v
j
)
T
v
∈
span
v
1
,
…
,
v
j
Tv in span(v_(1),dots,v_(j)) T v \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) T v ∈ span ( v 1 , … , v j )
也就是说
span
(
v
1
,
…
,
v
j
)
span
v
1
,
…
,
v
j
span(v_(1),dots,v_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( v 1 , … , v j ) 在
T
T
T T T 下不变。
现在我们可以证明:对于复向量空间上的每个算子,都有一个基使得该算子关于这个基的矩阵的对角线下方只有 0 . 在第 8 章我们将改进这个结果。
深刻的见解往往源于一个定理的多种证明。因此我们对下面的定理给出两个证明。你可以采用其中更合你心意的那一个。
下面的定理对实向量空间不成立,这是因为, 若算子关于一个基有上三角矩阵, 则这个基的第一个向量必定是该算子的本征向量。因此,若实向量空间上的一个算子没有本征值(例如,见5.8(a)),则该算子关于任何基都不会有上三角矩阵。
5.27 在 C 上, 每个算子均有上三角矩阵
设
V
V
V V V 是有限维复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。则
T
T
T T T 关于
V
V
V V V 的某个基有上三角矩阵.
证明 1 对
V
V
V V V 的维数用归纳法. 若
dim
V
=
1
dim
V
=
1
dim V=1 \operatorname{dim} V=1 dim V = 1 , 则结论显然成立.
现在假设
dim
V
>
1
dim
V
>
1
dim V > 1 \operatorname{dim} V>1 dim V > 1 , 并设对于所有维数比
V
V
V V V 小的复向量空间结论都成立. 设
λ
λ
lambda \lambda λ 是
T
T
T T T 的任意本征值( 5.21 保证了
T
T
T T T 有本征值)。设
U
=
range
(
T
−
λ
I
)
U
=
range
(
T
−
λ
I
)
U=range(T-lambda I) U=\operatorname{range}(T-\lambda I) U = range ( T − λ I )
因为
(
T
−
λ
I
)
(
T
−
λ
I
)
(T-lambda I) (T-\lambda I) ( T − λ I ) 不是满的(参见 3.69),所以
dim
U
<
dim
V
dim
U
<
dim
V
dim U < dim V \operatorname{dim} U<\operatorname{dim} V dim U < dim V 。进一步,
U
U
U U U 在
T
T
T T T 下不变。为了证明这点, 设
u
∈
U
u
∈
U
u in U u \in U u ∈ U . 则
T
u
=
(
T
−
λ
I
)
u
+
λ
u
T
u
=
(
T
−
λ
I
)
u
+
λ
u
Tu=(T-lambda I)u+lambda u T u=(T-\lambda I) u+\lambda u T u = ( T − λ I ) u + λ u
显然,
(
T
−
λ
I
)
u
∈
U
(
T
−
λ
I
)
u
∈
U
(T-lambda I)u in U (T-\lambda I) u \in U ( T − λ I ) u ∈ U (因为
U
U
U U U 等于
(
T
−
λ
I
)
(
T
−
λ
I
)
(T-lambda I) (T-\lambda I) ( T − λ I ) 的值域),并且
λ
u
∈
U
λ
u
∈
U
lambda u in U \lambda u \in U λ u ∈ U 。因此上式表明
T
u
∈
U
T
u
∈
U
Tu in U T u \in U T u ∈ U 。所以
U
U
U U U 在
T
T
T T T 下不变。
因此
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 是
U
U
U U U 上的算子。由归纳法假设,
U
U
U U U 有基
u
1
,
…
,
u
m
u
1
,
…
,
u
m
u_(1),dots,u_(m) u_{1}, \ldots, u_{m} u 1 , … , u m 使得
T
|
U
T
U
T|_(U) \left.T\right|_{U} T | U 关于这个基有上三角矩阵. 因此, 对每个
j
j
j j j 都有(利用 5.26)
5.28
T
u
j
=
(
T
|
U
)
(
u
j
)
∈
span
(
u
1
,
…
,
u
j
)
T
u
j
=
T
U
u
j
∈
span
u
1
,
…
,
u
j
Tu_(j)=(T|_(U))(u_(j))in span(u_(1),dots,u_(j)) T u_{j}=\left(\left.T\right|_{U}\right)\left(u_{j}\right) \in \operatorname{span}\left(u_{1}, \ldots, u_{j}\right) T u j = ( T | U ) ( u j ) ∈ span ( u 1 , … , u j )
把
u
1
,
…
,
u
m
u
1
,
…
,
u
m
u_(1),dots,u_(m) u_{1}, \ldots, u_{m} u 1 , … , u m 扩充成
V
V
V V V 的基
u
1
,
…
,
u
m
,
v
1
,
…
,
v
n
u
1
,
…
,
u
m
,
v
1
,
…
,
v
n
u_(1),dots,u_(m),v_(1),dots,v_(n) u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{n} u 1 , … , u m , v 1 , … , v n 。对每个
k
k
k k k 都有
T
v
k
=
(
T
−
λ
I
)
v
k
+
λ
v
k
T
v
k
=
(
T
−
λ
I
)
v
k
+
λ
v
k
Tv_(k)=(T-lambda I)v_(k)+lambdav_(k) T v_{k}=(T-\lambda I) v_{k}+\lambda v_{k} T v k = ( T − λ I ) v k + λ v k
U
U
U U U 的定义表明
(
T
−
λ
I
)
v
k
∈
U
=
span
(
u
1
,
…
,
u
m
)
(
T
−
λ
I
)
v
k
∈
U
=
span
u
1
,
…
,
u
m
(T-lambda I)v_(k)in U=span(u_(1),dots,u_(m)) (T-\lambda I) v_{k} \in U=\operatorname{span}\left(u_{1}, \ldots, u_{m}\right) ( T − λ I ) v k ∈ U = span ( u 1 , … , u m ) . 因此由上式可得
5.29
T
v
k
∈
span
(
u
1
,
…
,
u
m
,
v
1
,
…
,
v
k
)
T
v
k
∈
span
u
1
,
…
,
u
m
,
v
1
,
…
,
v
k
Tv_(k)in span(u_(1),dots,u_(m),v_(1),dots,v_(k)) T v_{k} \in \operatorname{span}\left(u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{k}\right) T v k ∈ span ( u 1 , … , u m , v 1 , … , v k )
利用 5.26,由 5.28 和 5.29 可知
T
T
T T T 关于基
u
1
,
…
,
u
m
,
v
1
,
…
,
v
n
u
1
,
…
,
u
m
,
v
1
,
…
,
v
n
u_(1),dots,u_(m),v_(1),dots,v_(n) u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{n} u 1 , … , u m , v 1 , … , v n 有上三角矩阵.证明 2 对
V
V
V V V 的维数用归纳法. 若
dim
V
=
1
dim
V
=
1
dim V=1 \operatorname{dim} V=1 dim V = 1 , 则结论显然成立.
现在假设
dim
V
=
n
>
1
dim
V
=
n
>
1
dim V=n > 1 \operatorname{dim} V=n>1 dim V = n > 1 , 并设对于所有
n
−
1
n
−
1
n-1 n-1 n − 1 维的复向量空间结果均成立. 设
v
1
v
1
v_(1) v_{1} v 1 是
T
T
T T T 的任意一个本征向量(5.21 保证了
T
T
T T T 有本征向量)。设
U
=
span
(
v
1
)
U
=
span
v
1
U=span(v_(1)) U=\operatorname{span}\left(v_{1}\right) U = span ( v 1 ) 。则
U
U
U U U 是
T
T
T T T 的不变子空间且
dim
U
=
1
dim
U
=
1
dim U=1 \operatorname{dim} U=1 dim U = 1 。
由于
dim
V
/
U
=
n
−
1
dim
V
/
U
=
n
−
1
dim V//U=n-1 \operatorname{dim} V / U=n-1 dim V / U = n − 1 (见 3.89),我们可以对
T
/
U
∈
L
(
V
/
U
)
T
/
U
∈
L
(
V
/
U
)
T//U inL(V//U) T / U \in \mathcal{L}(V / U) T / U ∈ L ( V / U ) 用归纳法假设。于是
V
/
U
V
/
U
V//U V / U V / U 有一个基
v
2
+
U
,
…
,
v
n
+
U
v
2
+
U
,
…
,
v
n
+
U
v_(2)+U,dots,v_(n)+U v_{2}+U, \ldots, v_{n}+U v 2 + U , … , v n + U 使得
T
/
U
T
/
U
T//U T / U T / U 关于该基有上三角矩阵。由 5.26 , 对每个
j
=
2
,
…
,
n
j
=
2
,
…
,
n
j=2,dots,n j=2, \ldots, n j = 2 , … , n 有
(
T
/
U
)
(
v
j
+
U
)
∈
span
(
v
2
+
U
,
…
,
v
j
+
U
)
(
T
/
U
)
v
j
+
U
∈
span
v
2
+
U
,
…
,
v
j
+
U
(T//U)(v_(j)+U)in span(v_(2)+U,dots,v_(j)+U) (T / U)\left(v_{j}+U\right) \in \operatorname{span}\left(v_{2}+U, \ldots, v_{j}+U\right) ( T / U ) ( v j + U ) ∈ span ( v 2 + U , … , v j + U )
通过解释上面这个包含关系的含义可知,对每个
j
=
1
,
…
,
n
j
=
1
,
…
,
n
j=1,dots,n j=1, \ldots, n j = 1 , … , n 有
T
v
j
∈
span
(
v
1
,
…
,
v
j
)
T
v
j
∈
span
v
1
,
…
,
v
j
Tv_(j)in span(v_(1),dots,v_(j)) T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) T v j ∈ span ( v 1 , … , v j )
于是由
5.26
,
T
5.26
,
T
5.26,T 5.26, T 5.26 , T 关于
V
V
V V V 的基
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 具有上三角矩阵(容易验证
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基. 更一般的结论,请参见 3.E 节的习题 13)。
如何通过观察一个算子的矩阵来确定该算子是否可逆呢?如果我们很幸运地有一个基使得该算子关于这个基的矩阵是上三角的,那么问题就会变得很简单,如下面的命题所示。
5.30 由上三角矩阵确定可逆性
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 关于
V
V
V V V 的某个基有上三角矩阵. 则
T
T
T T T 是可逆的当且仅当这个上三角矩阵对角线上的元素都不是 0 。
证明 设
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基使得
T
T
T T T 关于这个基具有上三角矩阵
5.31
M
(
T
)
=
(
λ
1
∗
λ
2
⋱
0
λ
n
)
M
(
T
)
=
λ
1
∗
λ
2
⋱
0
λ
n
M(T)=([lambda_(1),,,**],[,lambda_(2),,],[,,ddots,],[0,,,lambda_(n)]) \mathcal{M}(T)=\left(\begin{array}{cccc}
\lambda_{1} & & & * \\
& \lambda_{2} & & \\
& & \ddots & \\
0 & & & \lambda_{n}
\end{array}\right) M ( T ) = ( λ 1 ∗ λ 2 ⋱ 0 λ n )
我们需要证明:
T
T
T T T 是可逆的当且仅当所有
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 均不为 0 .
首先设对角线元素
λ
1
,
…
,
λ
n
λ
1
,
…
,
λ
n
lambda_(1),dots,lambda_(n) \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 均不为 0.5 .31 中的上三角阵表明
T
v
1
=
λ
1
v
1
T
v
1
=
λ
1
v
1
Tv_(1)=lambda_(1)v_(1) T v_{1}=\lambda_{1} v_{1} T v 1 = λ 1 v 1 。因为
λ
1
≠
0
λ
1
≠
0
lambda_(1)!=0 \lambda_{1} \neq 0 λ 1 ≠ 0 ,所以
T
(
v
1
/
λ
1
)
=
v
1
T
v
1
/
λ
1
=
v
1
T(v_(1)//lambda_(1))=v_(1) T\left(v_{1} / \lambda_{1}\right)=v_{1} T ( v 1 / λ 1 ) = v 1 。于是
v
1
∈
range
T
v
1
∈
range
T
v_(1)in range T v_{1} \in \operatorname{range} T v 1 ∈ range T 。
现在对某个
a
∈
F
a
∈
F
a inF a \in \mathbf{F} a ∈ F 有
T
(
v
2
/
λ
2
)
=
a
v
1
+
v
2
T
v
2
/
λ
2
=
a
v
1
+
v
2
T(v_(2)//lambda_(2))=av_(1)+v_(2) T\left(v_{2} / \lambda_{2}\right)=a v_{1}+v_{2} T ( v 2 / λ 2 ) = a v 1 + v 2
上式左端以及
a
ν
1
a
ν
1
anu_(1) a \nu_{1} a ν 1 均含于 range
T
T
T T T 。于是
v
2
∈
range
T
v
2
∈
range
T
v_(2)in range T v_{2} \in \operatorname{range} T v 2 ∈ range T 。
类似地,对某个
b
,
c
∈
F
b
,
c
∈
F
b,c inF b, c \in \mathbf{F} b , c ∈ F 有
T
(
v
3
/
λ
3
)
=
b
v
1
+
c
v
2
+
v
3
.
T
v
3
/
λ
3
=
b
v
1
+
c
v
2
+
v
3
.
T(v_(3)//lambda_(3))=bv_(1)+cv_(2)+v_(3). T\left(v_{3} / \lambda_{3}\right)=b v_{1}+c v_{2}+v_{3} . T ( v 3 / λ 3 ) = b v 1 + c v 2 + v 3 .
上式左端以及
b
v
1
b
v
1
bv_(1) b v_{1} b v 1 和
c
v
2
c
v
2
cv_(2) c v_{2} c v 2 均含于 range
T
T
T T T . 于是
v
3
∈
range
T
v
3
∈
range
T
v_(3)in range T v_{3} \in \operatorname{range} T v 3 ∈ range T .
依此类推,可知
v
1
,
…
,
v
n
∈
range
T
v
1
,
…
,
v
n
∈
range
T
v_(1),dots,v_(n)in range T v_{1}, \ldots, v_{n} \in \operatorname{range} T v 1 , … , v n ∈ range T 。因为
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基, 所以
range
T
=
range
T
=
range T= \operatorname{range} T= range T =
V
V
V V V 。也就是说
T
T
T T T 是满的。于是
T
T
T T T 是可逆的(由于3.69)。
现在证明另一个方向,设
T
T
T T T 是可逆的。这表明
λ
1
≠
0
λ
1
≠
0
lambda_(1)!=0 \lambda_{1} \neq 0 λ 1 ≠ 0 ,否则有
T
ν
1
=
0
T
ν
1
=
0
Tnu_(1)=0 T \nu_{1}=0 T ν 1 = 0 。设
1
<
j
≤
n
,
λ
j
=
0
1
<
j
≤
n
,
λ
j
=
0
1 < j <= n,lambda_(j)=0 1<j \leq n, \lambda_{j}=0 1 < j ≤ n , λ j = 0 。则 5.31 表明
T
T
T T T 将
span
(
v
1
,
…
,
v
j
)
span
v
1
,
…
,
v
j
span(v_(1),dots,v_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( v 1 , … , v j ) 映入
span
(
v
1
,
…
,
v
j
−
1
)
span
v
1
,
…
,
v
j
−
1
span(v_(1),dots,v_(j-1)) \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right) span ( v 1 , … , v j − 1 ) 。由于
dim
span
(
v
1
,
…
,
v
j
)
=
j
且
dim
span
(
v
1
,
…
,
v
j
−
1
)
=
j
−
1
,
dim
span
v
1
,
…
,
v
j
=
j
且
dim
span
v
1
,
…
,
v
j
−
1
=
j
−
1
,
dim span(v_(1),dots,v_(j))=j quad" 且 "quad dim span(v_(1),dots,v_(j-1))=j-1", " \operatorname{dim} \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)=j \quad \text { 且 } \quad \operatorname{dim} \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)=j-1 \text {, } 且 dim span ( v 1 , … , v j ) = j 且 dim span ( v 1 , … , v j − 1 ) = j − 1 ,
这表明
T
T
T T T 限制在
span
(
v
1
,
…
,
v
j
)
span
v
1
,
…
,
v
j
span(v_(1),dots,v_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( v 1 , … , v j ) 上不是单的(由于3.23)。因此有
v
∈
span
(
v
1
,
…
,
v
j
)
v
∈
span
v
1
,
…
,
v
j
v in span(v_(1),dots,v_(j)) v \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) v ∈ span ( v 1 , … , v j ) 使得
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 且
T
v
=
0
T
v
=
0
Tv=0 T v=0 T v = 0 . 于是
T
T
T T T 不是单的, 这与
T
T
T T T 是可逆的假设相矛盾. 这个矛盾表明
λ
j
=
0
λ
j
=
0
lambda_(j)=0 \lambda_{j}=0 λ j = 0 一定不成立. 于是
λ
j
≠
0
λ
j
≠
0
lambda_(j)!=0 \lambda_{j} \neq 0 λ j ≠ 0 。
作为上述命题的一个应用,我们看到例 5.23 中的算子是可逆的.
令人遗憾的是,现在还无法利用算子的矩阵来精确计算算子的本征值。但是,如果我们
利用算子的矩阵,有强大的数值技术来近似计算算子的本征值。
有幸找到一个基使得算子关于这个基的矩阵是上三角的,则本征值的计算问题就变得平凡了,如下面的定理所示。
5.32 从上三角矩阵确定本征值
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 关于
V
V
V V V 的某个基有上三角矩阵。则
T
T
T T T 的本征值恰为这个上三角矩阵对角线上的元素。
证明 设
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基,并且
T
T
T T T 关于这个基有上三角矩阵
M
(
T
)
=
(
λ
1
∗
λ
2
⋱
0
λ
n
)
M
(
T
)
=
λ
1
∗
λ
2
⋱
0
λ
n
M(T)=([lambda_(1),,,**],[,lambda_(2),,],[,,ddots,],[0,,,lambda_(n)]) \mathcal{M}(T)=\left(\begin{array}{llll}
\lambda_{1} & & & * \\
& \lambda_{2} & & \\
& & \ddots & \\
0 & & & \lambda_{n}
\end{array}\right) M ( T ) = ( λ 1 ∗ λ 2 ⋱ 0 λ n )
设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F . 则
M
(
T
−
λ
I
)
=
(
λ
1
−
λ
∗
λ
2
−
λ
⋱
0
λ
n
−
λ
)
M
(
T
−
λ
I
)
=
λ
1
−
λ
∗
λ
2
−
λ
⋱
0
λ
n
−
λ
M(T-lambda I)=([lambda_(1)-lambda,,,**],[,lambda_(2)-lambda,,],[,,ddots,],[0,,,lambda_(n)-lambda]) \mathcal{M}(T-\lambda I)=\left(\begin{array}{cccc}
\lambda_{1}-\lambda & & & * \\
& \lambda_{2}-\lambda & & \\
& & \ddots & \\
0 & & & \lambda_{n}-\lambda
\end{array}\right) M ( T − λ I ) = ( λ 1 − λ ∗ λ 2 − λ ⋱ 0 λ n − λ )
因此,
(
T
−
λ
I
)
(
T
−
λ
I
)
(T-lambda I) (T-\lambda I) ( T − λ I ) 不可逆当且仅当
λ
λ
lambda \lambda λ 等于
λ
1
,
…
,
λ
n
λ
1
,
…
,
λ
n
lambda_(1),dots,lambda_(n) \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 中的某一个(由于 5.30)。于是
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值当且仅当
λ
λ
lambda \lambda λ 等于
λ
1
,
…
,
λ
n
λ
1
,
…
,
λ
n
lambda_(1),dots,lambda_(n) \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 中的某一个.
5.33 例 定义
T
∈
L
(
F
3
)
T
∈
L
F
3
T inL(F^(3)) T \in \mathcal{L}\left(\mathbf{F}^{3}\right) T ∈ L ( F 3 ) 为
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T(x,y,z)=(2x+y,5y+3z,8z) T(x, y, z)=(2 x+y, 5 y+3 z, 8 z) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) . 求
T
T
T T T 的本征值.解
T
T
T T T 关于标准基的矩阵为
M
(
T
)
=
(
2
1
0
0
5
3
0
0
8
)
M
(
T
)
=
2
1
0
0
5
3
0
0
8
M(T)=([2,1,0],[0,5,3],[0,0,8]) \mathcal{M}(T)=\left(\begin{array}{lll}
2 & 1 & 0 \\
0 & 5 & 3 \\
0 & 0 & 8
\end{array}\right) M ( T ) = ( 2 1 0 0 5 3 0 0 8 )
M
(
T
)
M
(
T
)
M(T) \mathcal{M}(T) M ( T ) 是上三角矩阵. 5.32 表明
T
T
T T T 的本征值是
2
,
5
,
8
2
,
5
,
8
2,5,8 2,5,8 2 , 5 , 8 .
一旦知道
F
n
F
n
F^(n) \mathbf{F}^{n} F n 上一个算子的本征值,就很容易利用高斯消元法求出本征向量.
习题 5.B
1 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且存在正整数
n
n
n n n 使得
T
n
=
0
T
n
=
0
T^(n)=0 T^{n}=0 T n = 0 .
(a) 证明
(
I
−
T
)
(
I
−
T
)
(I-T) (I-T) ( I − T ) 是可逆的且
(
I
−
T
)
−
1
=
I
+
T
+
⋯
+
T
n
−
1
(
I
−
T
)
−
1
=
I
+
T
+
⋯
+
T
n
−
1
(I-T)^(-1)=I+T+cdots+T^(n-1) (I-T)^{-1}=I+T+\cdots+T^{n-1} ( I − T ) − 1 = I + T + ⋯ + T n − 1 .
(b) 解释一下如何想到上面的公式.
2 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
(
T
−
2
I
)
(
T
−
3
I
)
(
T
−
4
I
)
=
0
(
T
−
2
I
)
(
T
−
3
I
)
(
T
−
4
I
)
=
0
(T-2I)(T-3I)(T-4I)=0 (T-2 I)(T-3 I)(T-4 I)=0 ( T − 2 I ) ( T − 3 I ) ( T − 4 I ) = 0 . 设
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值. 证明
λ
=
2
λ
=
2
lambda=2 \lambda=2 λ = 2 或
λ
=
3
λ
=
3
lambda=3 \lambda=3 λ = 3 或
λ
=
4
λ
=
4
lambda=4 \lambda=4 λ = 4 。
3 设
T
∈
L
(
V
)
,
T
2
=
I
T
∈
L
(
V
)
,
T
2
=
I
T inL(V),T^(2)=I T \in \mathcal{L}(V), T^{2}=I T ∈ L ( V ) , T 2 = I 且 -1 不是
T
T
T T T 的本征值. 证明
T
=
I
T
=
I
T=I T=I T = I .
4 设
P
∈
L
(
V
)
,
P
2
=
P
P
∈
L
(
V
)
,
P
2
=
P
P inL(V),P^(2)=P P \in \mathcal{L}(V), P^{2}=P P ∈ L ( V ) , P 2 = P . 证明
V
=
V
=
V= V= V = null
P
⊕
range
P
P
⊕
range
P
P o+range P P \oplus \operatorname{range} P P ⊕ range P .
5 设
S
,
T
∈
L
(
V
)
S
,
T
∈
L
(
V
)
S,T inL(V) S, T \in \mathcal{L}(V) S , T ∈ L ( V ) 且
S
S
S S S 是可逆的. 设
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) 是多项式. 证明
p
(
S
T
S
−
1
)
=
p
S
T
S
−
1
=
p(STS^(-1))= p\left(S T S^{-1}\right)= p ( S T S − 1 ) =
S
p
(
T
)
S
−
1
S
p
(
T
)
S
−
1
Sp(T)S^(-1) S p(T) S^{-1} S p ( T ) S − 1 。
6 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
U
U
U U U 是
V
V
V V V 的在
T
T
T T T 下不变的子空间。证明:对每个多项式
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) 都有
U
U
U U U 在
p
(
T
)
p
(
T
)
p(T) p(T) p ( T ) 下不变。
7 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明 9 是
T
2
T
2
T^(2) T^{2} T 2 的本征值当且仅当 3 或 -3 是
T
T
T T T 的本征值.
8 找出一个
T
∈
L
(
R
2
)
T
∈
L
R
2
T inL(R^(2)) T \in \mathcal{L}\left(\mathbf{R}^{2}\right) T ∈ L ( R 2 ) 使得
T
4
=
−
I
T
4
=
−
I
T^(4)=-I T^{4}=-I T 4 = − I .
9 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
,
v
∈
V
T
∈
L
(
V
)
,
v
∈
V
T inL(V),v in V T \in \mathcal{L}(V), v \in V T ∈ L ( V ) , v ∈ V 且
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 。设
p
p
p p p 是使得
p
(
T
)
v
=
0
p
(
T
)
v
=
0
p(T)v=0 p(T) v=0 p ( T ) v = 0 的次数最小的非零多项式。证明
p
p
p p p 的每个零点都是
T
T
T T T 的本征值.
10 设
T
∈
L
(
V
)
,
v
T
∈
L
(
V
)
,
v
T inL(V),v T \in \mathcal{L}(V), v T ∈ L ( V ) , v 是
T
T
T T T 的相应于本征值
λ
λ
lambda \lambda λ 的本征向量. 设
p
∈
P
(
F
)
p
∈
P
(
F
)
p inP(F) p \in \mathcal{P}(\mathbf{F}) p ∈ P ( F ) . 证明
p
(
T
)
v
=
p
(
λ
)
v
p
(
T
)
v
=
p
(
λ
)
v
p(T)v=p(lambda)v p(T) v=p(\lambda) v p ( T ) v = p ( λ ) v .
11 设
F
=
C
,
T
∈
L
(
V
)
,
p
∈
P
(
C
)
F
=
C
,
T
∈
L
(
V
)
,
p
∈
P
(
C
)
F=C,T inL(V),p inP(C) \mathbf{F}=\mathbf{C}, T \in \mathcal{L}(V), p \in \mathcal{P}(\mathbf{C}) F = C , T ∈ L ( V ) , p ∈ P ( C ) 是多项式,
α
∈
C
α
∈
C
alpha inC \alpha \in \mathbf{C} α ∈ C 。证明:
α
α
alpha \alpha α 是
p
(
T
)
p
(
T
)
p(T) p(T) p ( T ) 的本征值当且仅当
T
T
T T T 有一个本征值
λ
λ
lambda \lambda λ 使得
α
=
p
(
λ
)
α
=
p
(
λ
)
alpha=p(lambda) \alpha=p(\lambda) α = p ( λ ) .
12 证明:若将
C
C
C \mathbf{C} C 换成
R
R
R \mathbf{R} R ,则上题的结论不再成立。
13 设
W
W
W W W 是复向量空间,并设
T
∈
L
(
W
)
T
∈
L
(
W
)
T inL(W) T \in \mathcal{L}(W) T ∈ L ( W ) 没有本征值。证明:
W
W
W W W 的在
T
T
T T T 下不变的子空间是
{
0
}
{
0
}
{0} \{0\} { 0 } 或者是无限维的。
14 给出一个算子, 它关于某个基的矩阵的对角线上只有 0 , 但这个算子是可逆的.本题和下题表明,要是去掉 "上三角矩阵" 这一假设,5.30就不再成立。
15 给出一个算子,它关于某个基的矩阵的对角线上全是非零数,但这个算子是不可逆的。
16 利用将
p
∈
P
n
(
C
)
p
∈
P
n
(
C
)
p inP_(n)(C) p \in \mathcal{P}_{n}(\mathbf{C}) p ∈ P n ( C ) 变为
(
p
(
T
)
)
v
∈
V
(
p
(
T
)
)
v
∈
V
(p(T))v in V (p(T)) v \in V ( p ( T ) ) v ∈ V 的线性映射(并利用3.23)改写5.21的证明。
17 利用将
p
∈
P
n
2
(
C
)
p
∈
P
n
2
(
C
)
p inP_(n^(2))(C) p \in \mathcal{P}_{n^{2}}(\mathbf{C}) p ∈ P n 2 ( C ) 变为
p
(
T
)
∈
L
(
V
)
p
(
T
)
∈
L
(
V
)
p(T)inL(V) p(T) \in \mathcal{L}(V) p ( T ) ∈ L ( V ) 的线性映射(并利用 3.23)改写5.21的证明。
18 设
V
V
V V V 是有限维的复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 定义函数
f
:
C
→
R
f
:
C
→
R
f:CrarrR f: \mathbf{C} \rightarrow \mathbf{R} f : C → R 为
f
(
λ
)
=
dim
range
(
T
−
λ
I
)
f
(
λ
)
=
dim
range
(
T
−
λ
I
)
f(lambda)=dim range(T-lambda I) f(\lambda)=\operatorname{dim} \operatorname{range}(T-\lambda I) f ( λ ) = dim range ( T − λ I )
证明
f
f
f f f 不是连续函数.
19 设
V
V
V V V 是有限维的,
dim
V
>
1
,
T
∈
L
(
V
)
dim
V
>
1
,
T
∈
L
(
V
)
dim V > 1,T inL(V) \operatorname{dim} V>1, T \in \mathcal{L}(V) dim V > 1 , T ∈ L ( V ) 。证明
{
p
(
T
)
:
p
∈
P
(
F
)
}
≠
L
(
V
)
{
p
(
T
)
:
p
∈
P
(
F
)
}
≠
L
(
V
)
{p(T):p inP(F)}!=L(V) \{p(T): p \in \mathcal{P}(\mathbf{F})\} \neq \mathcal{L}(V) { p ( T ) : p ∈ P ( F ) } ≠ L ( V ) .
20 设
V
V
V V V 是有限维的复向量空间,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。证明:对每个
k
=
1
,
…
,
dim
V
,
T
k
=
1
,
…
,
dim
V
,
T
k=1,dots,dim V,T k=1, \ldots, \operatorname{dim} V, T k = 1 , … , dim V , T 都有
k
k
k k k 维的不变子空间。
5.C 本征空间与对角矩阵
5.34 定义 对角矩阵(diagonal matrix)
对角矩阵是对角线以外的元素全是 0 的方阵。
5.35 例
(
8
0
0
0
5
0
0
0
5
)
8
0
0
0
5
0
0
0
5
([8,0,0],[0,5,0],[0,0,5]) \left(\begin{array}{lll}
8 & 0 & 0 \\
0 & 5 & 0 \\
0 & 0 & 5
\end{array}\right) ( 8 0 0 0 5 0 0 0 5 )
是对角矩阵。
显然每个对角矩阵都是上三角的,但是对角矩阵一般要比上三角矩阵有更多的 0.
若一个算子关于某个基有对角矩阵,则对角线上的元素恰为该算子的本征值. 这可由 5.32 得到(或直接给出一个对于对角矩阵的简单证明)。
5.36 定义 本征空间(eigenspace),
E
(
λ
,
T
)
E
(
λ
,
T
)
E(lambda,T) E(\lambda, T) E ( λ , T )
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 且
λ
∈
F
.
T
λ
∈
F
.
T
lambda inF.T \lambda \in \mathbf{F} . T λ ∈ F . T 的相应于
λ
λ
lambda \lambda λ 的本征空间(记作
E
(
λ
,
T
)
E
(
λ
,
T
)
E(lambda,T) E(\lambda, T) E ( λ , T ) )定义为
E
(
λ
,
T
)
=
null
(
T
−
λ
I
)
E
(
λ
,
T
)
=
null
(
T
−
λ
I
)
E(lambda,T)=null(T-lambda I) E(\lambda, T)=\operatorname{null}(T-\lambda I) E ( λ , T ) = null ( T − λ I )
也就是说,
E
(
λ
,
T
)
E
(
λ
,
T
)
E(lambda,T) E(\lambda, T) E ( λ , T ) 是
T
T
T T T 的相应于
λ
λ
lambda \lambda λ 的全体本征向量加上 0 向量构成的集合.
对于
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 和
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F ,本征空间
E
(
λ
,
T
)
E
(
λ
,
T
)
E(lambda,T) E(\lambda, T) E ( λ , T ) 是
V
V
V V V 的子空间(因为
V
V
V V V 上每个线性映射的零空间都是
V
V
V V V 的子空间)。由定义可知
λ
λ
lambda \lambda λ 是
T
T
T T T 的本征值当且仅当
E
(
λ
,
T
)
≠
{
0
}
E
(
λ
,
T
)
≠
{
0
}
E(lambda,T)!={0} E(\lambda, T) \neq\{0\} E ( λ , T ) ≠ { 0 } .
5.37 例 设算子
T
∈
(
V
)
T
∈
(
V
)
T in(V) T \in(V) T ∈ ( V ) 关于
V
V
V V V 的基
v
1
,
v
2
,
v
3
v
1
,
v
2
,
v
3
v_(1),v_(2),v_(3) v_{1}, v_{2}, v_{3} v 1 , v 2 , v 3 的矩阵是上面例 5.35 中的矩阵。则
E
(
8
,
T
)
=
span
(
v
1
)
,
E
(
5
,
T
)
=
span
(
v
2
,
v
3
)
E
(
8
,
T
)
=
span
v
1
,
E
(
5
,
T
)
=
span
v
2
,
v
3
E(8,T)=span(v_(1)),quad E(5,T)=span(v_(2),v_(3)) E(8, T)=\operatorname{span}\left(v_{1}\right), \quad E(5, T)=\operatorname{span}\left(v_{2}, v_{3}\right) E ( 8 , T ) = span ( v 1 ) , E ( 5 , T ) = span ( v 2 , v 3 )
若
λ
λ
lambda \lambda λ 是
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 的本征值,则
T
T
T T T 限制到
E
(
λ
,
T
)
E
(
λ
,
T
)
E(lambda,T) E(\lambda, T) E ( λ , T ) 上恰为
λ
λ
lambda \lambda λ 确定的标量乘算子。
5.38 本征空间之和是直和
设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的互异的本征值. 则
E
(
λ
1
,
T
)
+
⋯
+
E
(
λ
m
,
T
)
E
λ
1
,
T
+
⋯
+
E
λ
m
,
T
E(lambda_(1),T)+cdots+E(lambda_(m),T) E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right) E ( λ 1 , T ) + ⋯ + E ( λ m , T )
是直和. 此外,
dim
E
(
λ
1
,
T
)
+
⋯
+
dim
E
(
λ
m
,
T
)
≤
dim
V
dim
E
λ
1
,
T
+
⋯
+
dim
E
λ
m
,
T
≤
dim
V
dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) <= dim V \operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) \leq \operatorname{dim} V dim E ( λ 1 , T ) + ⋯ + dim E ( λ m , T ) ≤ dim V
证明 为了证明
E
(
λ
1
,
T
)
+
⋯
+
E
(
λ
m
,
T
)
E
λ
1
,
T
+
⋯
+
E
λ
m
,
T
E(lambda_(1),T)+cdots+E(lambda_(m),T) E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right) E ( λ 1 , T ) + ⋯ + E ( λ m , T ) 是直和,假设
u
1
+
⋯
+
u
m
=
0
u
1
+
⋯
+
u
m
=
0
u_(1)+cdots+u_(m)=0 u_{1}+\cdots+u_{m}=0 u 1 + ⋯ + u m = 0
其中每个
u
j
u
j
u_(j) u_{j} u j 含于
E
(
λ
j
,
T
)
E
λ
j
,
T
E(lambda_(j),T) E\left(\lambda_{j}, T\right) E ( λ j , T ) 。因为相应于不同本征值的本征向量是线性无关的(参见 5.10 ),所以每个
u
j
u
j
u_(j) u_{j} u j 均等于 0 。这表明
E
(
λ
1
,
T
)
+
⋯
+
E
(
λ
m
,
T
)
E
λ
1
,
T
+
⋯
+
E
λ
m
,
T
E(lambda_(1),T)+cdots+E(lambda_(m),T) E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right) E ( λ 1 , T ) + ⋯ + E ( λ m , T ) 是直和(由于 1.44)。
现在有
dim
E
(
λ
1
,
T
)
+
⋯
+
dim
E
(
λ
m
,
T
)
=
dim
(
E
(
λ
1
,
T
)
⊕
⋯
⊕
E
(
λ
m
,
T
)
)
≤
dim
V
dim
E
λ
1
,
T
+
⋯
+
dim
E
λ
m
,
T
=
dim
E
λ
1
,
T
⊕
⋯
⊕
E
λ
m
,
T
≤
dim
V
dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T)=dim(E(lambda_(1),T)o+cdots o+E(lambda_(m),T)) <= dim V \operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right)=\operatorname{dim}\left(E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right)\right) \leq \operatorname{dim} V dim E ( λ 1 , T ) + ⋯ + dim E ( λ m , T ) = dim ( E ( λ 1 , T ) ⊕ ⋯ ⊕ E ( λ m , T ) ) ≤ dim V ,其中的等号由 2.C 节的习题 16 得到.
5.39 定义 可对角化 (diagonalizable)
算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 称为可对角化的,如果该算子关于
V
V
V V V 的某个基有对角矩阵。
5.40 例 定义
T
∈
L
(
R
2
)
T
∈
L
R
2
T inL(R^(2)) T \in \mathcal{L}\left(\mathbf{R}^{2}\right) T ∈ L ( R 2 ) 为
T
(
x
,
y
)
=
(
41
x
+
7
y
,
−
20
x
+
74
y
)
T
(
x
,
y
)
=
(
41
x
+
7
y
,
−
20
x
+
74
y
)
T(x,y)=(41 x+7y,-20 x+74 y) T(x, y)=(41 x+7 y,-20 x+74 y) T ( x , y ) = ( 41 x + 7 y , − 20 x + 74 y ) .
T
T
T T T 关于
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 的标准基的矩阵为
(
41
7
−
20
74
)
41
7
−
20
74
([41,7],[-20,74]) \left(\begin{array}{cc}
41 & 7 \\
-20 & 74
\end{array}\right) ( 41 7 − 20 74 )
这不是一个对角矩阵. 但
T
T
T T T 可对角化,请验证
T
T
T T T 关于基
(
1
,
4
)
,
(
7
,
5
)
(
1
,
4
)
,
(
7
,
5
)
(1,4),(7,5) (1,4),(7,5) ( 1 , 4 ) , ( 7 , 5 ) 的矩阵为
(
69
0
0
46
)
69
0
0
46
([69,0],[0,46]) \left(\begin{array}{cc}
69 & 0 \\
0 & 46
\end{array}\right) ( 69 0 0 46 )
5.41 可对角化的等价条件
设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 用
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 表示
T
T
T T T 的所有互异的本征值. 则下列条件等价:
(a)
T
T
T T T 可对角化;
(b)
V
V
V V V 有由
T
T
T T T 的本征向量构成的基;
(c)
V
V
V V V 有在
T
T
T T T 下不变的一维子空间
U
1
,
…
,
U
n
U
1
,
…
,
U
n
U_(1),dots,U_(n) U_{1}, \ldots, U_{n} U 1 , … , U n 使得
V
=
U
1
⊕
⋯
⊕
U
n
V
=
U
1
⊕
⋯
⊕
U
n
V=U_(1)o+cdots o+U_(n) V=U_{1} \oplus \cdots \oplus U_{n} V = U 1 ⊕ ⋯ ⊕ U n ;
(d)
V
=
E
(
λ
1
,
T
)
⊕
⋯
⊕
E
(
λ
m
,
T
)
V
=
E
λ
1
,
T
⊕
⋯
⊕
E
λ
m
,
T
V=E(lambda_(1),T)o+cdots o+E(lambda_(m),T) V=E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right) V = E ( λ 1 , T ) ⊕ ⋯ ⊕ E ( λ m , T ) ;
(e)
dim
V
=
dim
E
(
λ
1
,
T
)
+
⋯
+
dim
E
(
λ
m
,
T
)
dim
V
=
dim
E
λ
1
,
T
+
⋯
+
dim
E
λ
m
,
T
dim V=dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) \operatorname{dim} V=\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) dim V = dim E ( λ 1 , T ) + ⋯ + dim E ( λ m , T ) .
证明 算子
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 关于
V
V
V V V 的基
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 有对角矩阵
(
λ
1
0
⋱
0
λ
n
)
λ
1
0
⋱
0
λ
n
([lambda_(1),,0],[,ddots,],[0,,lambda_(n)]) \left(\begin{array}{ccc}
\lambda_{1} & & 0 \\
& \ddots & \\
0 & & \lambda_{n}
\end{array}\right) ( λ 1 0 ⋱ 0 λ n )
当且仅当对每个
j
j
j j j 均有
T
v
j
=
λ
j
v
j
T
v
j
=
λ
j
v
j
Tv_(j)=lambda_(j)v_(j) T v_{j}=\lambda_{j} v_{j} T v j = λ j v j . 于是(a)和(b)等价。.
假设(b)成立,则
V
V
V V V 有一个由
T
T
T T T 的本征向量组成的基
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 。对每个
j
j
j j j ,设
U
j
=
span
(
v
j
)
U
j
=
span
v
j
U_(j)=span(v_(j)) U_{j}=\operatorname{span}\left(v_{j}\right) U j = span ( v j ) 。显然每个
U
j
U
j
U_(j) U_{j} U j 都是
V
V
V V V 的一维子空间且在
T
T
T T T 下不变。因为
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基,所以
V
V
V V V 中每个向量都可以唯一地写成
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 的线性组合。也就是说,
V
V
V V V 中每个向量都可以唯一地写成一个和
u
1
+
⋯
+
u
n
u
1
+
⋯
+
u
n
u_(1)+cdots+u_(n) u_{1}+\cdots+u_{n} u 1 + ⋯ + u n ,其中每个
u
j
∈
U
j
u
j
∈
U
j
u_(j)inU_(j) u_{j} \in U_{j} u j ∈ U j 。于是
V
=
U
1
⊕
⋯
⊕
U
n
V
=
U
1
⊕
⋯
⊕
U
n
V=U_(1)o+cdots o+U_(n) V=U_{1} \oplus \cdots \oplus U_{n} V = U 1 ⊕ ⋯ ⊕ U n 。因此(b)蕴涵(c)。
现在假设(c)成立,则
V
V
V V V 有在
T
T
T T T 下不变的一维子空间
U
1
,
…
,
U
n
U
1
,
…
,
U
n
U_(1),dots,U_(n) U_{1}, \ldots, U_{n} U 1 , … , U n 使得
V
=
V
=
V= V= V =
U
1
⊕
⋯
⊕
U
n
U
1
⊕
⋯
⊕
U
n
U_(1)o+cdots o+U_(n) U_{1} \oplus \cdots \oplus U_{n} U 1 ⊕ ⋯ ⊕ U n 。对每个
j
j
j j j ,设
v
j
v
j
v_(j) v_{j} v j 是
U
j
U
j
U_(j) U_{j} U j 中的一个非零向量,则每个
v
j
v
j
v_(j) v_{j} v j 都是
T
T
T T T 的本征向量. 因为
V
V
V V V 中每个向量都可以唯一地写成和
u
1
+
⋯
+
u
n
u
1
+
⋯
+
u
n
u_(1)+cdots+u_(n) u_{1}+\cdots+u_{n} u 1 + ⋯ + u n ,其中每个
u
j
∈
U
j
u
j
∈
U
j
u_(j)inU_(j) u_{j} \in U_{j} u j ∈ U j (所以每个
u
j
u
j
u_(j) u_{j} u j 都是
v
j
v
j
v_(j) v_{j} v j 的标量倍),所以
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基。因此 (c) 蕴涵 (b).
现在已经证明了(a),(b),(c)等价。为完成证明,我们要证明(b)蕴涵(d)、(d)蕴涵 (e)、(e) 蕴涵 (b).
假设(b)成立,则
V
V
V V V 有一个由
T
T
T T T 的本征向量组成的基. 于是,
V
V
V V V 中每个向量都是
T
T
T T T 的本征向量的线性组合. 因此
V
=
E
(
λ
1
,
T
)
+
⋯
+
E
(
λ
m
,
T
)
V
=
E
λ
1
,
T
+
⋯
+
E
λ
m
,
T
V=E(lambda_(1),T)+cdots+E(lambda_(m),T) V=E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right) V = E ( λ 1 , T ) + ⋯ + E ( λ m , T )
现在 5.38 表明 (d) 成立。
由 2.C 节的习题 16 立即可知 (d) 蕴涵(e)。
最后,假设(e)成立,则
5.42
dim
V
=
dim
E
(
λ
1
,
T
)
+
⋯
+
dim
E
(
λ
m
,
T
)
dim
V
=
dim
E
λ
1
,
T
+
⋯
+
dim
E
λ
m
,
T
dim V=dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) \operatorname{dim} V=\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) dim V = dim E ( λ 1 , T ) + ⋯ + dim E ( λ m , T )
在每个
E
(
λ
j
,
T
)
E
λ
j
,
T
E(lambda_(j),T) E\left(\lambda_{j}, T\right) E ( λ j , T ) 中取一个基,把这些基合在一起就得到了
T
T
T T T 的一组本征向量
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n ,其中
n
=
dim
V
n
=
dim
V
n=dim V n=\operatorname{dim} V n = dim V (由于 5.42 )。为了证明这组向量线性无关,假设
a
1
v
1
+
⋯
+
a
n
v
n
=
0
a
1
v
1
+
⋯
+
a
n
v
n
=
0
a_(1)v_(1)+cdots+a_(n)v_(n)=0 a_{1} v_{1}+\cdots+a_{n} v_{n}=0 a 1 v 1 + ⋯ + a n v n = 0
其中
a
1
,
…
,
a
n
∈
F
a
1
,
…
,
a
n
∈
F
a_(1),dots,a_(n)inF a_{1}, \ldots, a_{n} \in \mathbf{F} a 1 , … , a n ∈ F 。对每个
j
=
1
,
…
,
m
j
=
1
,
…
,
m
j=1,dots,m j=1, \ldots, m j = 1 , … , m ,设
u
j
u
j
u_(j) u_{j} u j 表示所有
a
k
v
k
a
k
v
k
a_(k)v_(k) a_{k} v_{k} a k v k 的和,其中
v
k
∈
v
k
∈
v_(k)in v_{k} \in v k ∈
E
(
λ
j
,
T
)
E
λ
j
,
T
E(lambda_(j),T) E\left(\lambda_{j}, T\right) E ( λ j , T ) . 则每个
u
j
u
j
u_(j) u_{j} u j 含于
E
(
λ
j
,
T
)
E
λ
j
,
T
E(lambda_(j),T) E\left(\lambda_{j}, T\right) E ( λ j , T ) , 并且
u
1
+
⋯
+
u
m
=
0
u
1
+
⋯
+
u
m
=
0
u_(1)+cdots+u_(m)=0 u_{1}+\cdots+u_{m}=0 u 1 + ⋯ + u m = 0
因为相应于互异本征值的本征向量线性无关(参见 5.10),所以每个
u
j
u
j
u_(j) u_{j} u j 都等于 0 。由于每个
u
j
u
j
u_(j) u_{j} u j 都是一些
a
k
v
k
a
k
v
k
a_(k)v_(k) a_{k} v_{k} a k v k 的和,其中的这些
v
k
v
k
v_(k) v_{k} v k 组成了
E
(
λ
j
,
T
)
E
λ
j
,
T
E(lambda_(j),T) E\left(\lambda_{j}, T\right) E ( λ j , T ) 的基,从而所有的
a
k
a
k
a_(k) a_{k} a k 都等于 0 。于是
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 线性无关,因此是
V
V
V V V 的基(由于 2.39)。这就证明了(e)蕴涵 (b).
可惜并非每个算子都可对角化. 这种糟糕的情况甚至可能出现在复向量空间上,如下例所示。
5.43 例 证明由
T
(
w
,
z
)
=
(
z
,
0
)
T
(
w
,
z
)
=
(
z
,
0
)
T(w,z)=(z,0) T(w, z)=(z, 0) T ( w , z ) = ( z , 0 ) 定义的算子
T
∈
L
(
C
2
)
T
∈
L
C
2
T inL(C^(2)) T \in \mathcal{L}\left(\mathbf{C}^{2}\right) T ∈ L ( C 2 ) 不可对角化.
证明 容易验证 0 是
T
T
T T T 的唯一本征值且
E
(
0
,
T
)
=
{
(
w
,
0
)
∈
C
2
:
w
∈
C
}
E
(
0
,
T
)
=
(
w
,
0
)
∈
C
2
:
w
∈
C
E(0,T)={(w,0)inC^(2):w inC} E(0, T)=\left\{(w, 0) \in \mathbf{C}^{2}: w \in \mathbf{C}\right\} E ( 0 , T ) = { ( w , 0 ) ∈ C 2 : w ∈ C } .
于是容易看出 5.41 中的条件 (b), (c), (d), (e) 都不成立(当然, 由于这些条件是等价的,只需验证其中之一不成立)。于是 5.41 中的 (a) 也不成立, 故
T
T
T T T 不可对角化.
以下命题表明, 如果一个算子的互异本征值的个数与定义域的维数相同, 则此算子可对角化。
5.44 本征值足够多则可对角化
若
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 有
dim
V
dim
V
dim V \operatorname{dim} V dim V 个互异的本征值, 则
T
T
T T T 可对角化.
证明 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 有
dim
V
dim
V
dim V \operatorname{dim} V dim V 个互异的本征值
λ
1
,
…
,
λ
dim
V
λ
1
,
…
,
λ
dim
V
lambda_(1),dots,lambda_(dim V) \lambda_{1}, \ldots, \lambda_{\operatorname{dim} V} λ 1 , … , λ dim V 。对每个
j
j
j j j , 设
v
j
∈
V
v
j
∈
V
v_(j)in V v_{j} \in V v j ∈ V 是相应于本征值
λ
j
λ
j
lambda_(j) \lambda_{j} λ j 的本征向量。因为相应于互异本征值的本征向量线性无关(参见 5.10),所以
v
1
,
…
,
v
dim
V
v
1
,
…
,
v
dim
V
v_(1),dots,v_(dim V) v_{1}, \ldots, v_{\operatorname{dim} V} v 1 , … , v dim V 线性无关。
V
V
V V V 中由
dim
V
dim
V
dim V \operatorname{dim} V dim V 个向量组成的线性无关组是
V
V
V V V 的基(参见 2.39)。于是
v
1
,
…
,
v
dim
V
v
1
,
…
,
v
dim
V
v_(1),dots,v_(dim V) v_{1}, \ldots, v_{\operatorname{dim} V} v 1 , … , v dim V 是
V
V
V V V 的基。关于这个由本征向量组成的基,
T
T
T T T 有对角矩阵。
5.45 例 定义
T
∈
L
(
F
3
)
T
∈
L
F
3
T inL(F^(3)) T \in \mathcal{L}\left(\mathbf{F}^{3}\right) T ∈ L ( F 3 ) 为
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T
(
x
,
y
,
z
)
=
(
2
x
+
y
,
5
y
+
3
z
,
8
z
)
T(x,y,z)=(2x+y,5y+3z,8z) T(x, y, z)=(2 x+y, 5 y+3 z, 8 z) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) . 求
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 的一个基使得
T
T
T T T 关于这个基有对角矩阵。
(
2
1
0
0
5
3
0
0
8
)
2
1
0
0
5
3
0
0
8
([2,1,0],[0,5,3],[0,0,8]) \left(\begin{array}{lll}
2 & 1 & 0 \\
0 & 5 & 3 \\
0 & 0 & 8
\end{array}\right) ( 2 1 0 0 5 3 0 0 8 )
这个矩阵是上三角的. 由
5.32
,
T
5.32
,
T
5.32,T 5.32, T 5.32 , T 的本征值是
2
,
5
,
8
2
,
5
,
8
2,5,8 2,5,8 2 , 5 , 8 . 因为
T
T
T T T 是三维向量空间上的算子且
T
T
T T T 有三个互异的本征值,由 5.44 可知
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 有一个基使得
T
T
T T T 关于这个基有对角矩阵。
为了求这个基, 只需对每个本征值求出本征向量. 也就是说, 对
λ
=
2
、
λ
=
5
λ
=
2
、
λ
=
5
lambda=2、lambda=5 \lambda=2 、 \lambda=5 、 λ = 2 、 λ = 5 和
λ
=
8
λ
=
8
lambda=8 \lambda=8 λ = 8 分别求出方程
T
(
x
,
y
,
z
)
=
λ
(
x
,
y
,
z
)
T
(
x
,
y
,
z
)
=
λ
(
x
,
y
,
z
)
T(x,y,z)=lambda(x,y,z) T(x, y, z)=\lambda(x, y, z) T ( x , y , z ) = λ ( x , y , z )
的非零解. 这些简单方程很容易求解:对
λ
=
2
λ
=
2
lambda=2 \lambda=2 λ = 2 有本征向量
(
1
,
0
,
0
)
(
1
,
0
,
0
)
(1,0,0) (1,0,0) ( 1 , 0 , 0 ) ,对
λ
=
5
λ
=
5
lambda=5 \lambda=5 λ = 5 有本征向量
(
1
,
3
,
0
)
(
1
,
3
,
0
)
(1,3,0) (1,3,0) ( 1 , 3 , 0 ) ,对
λ
=
8
λ
=
8
lambda=8 \lambda=8 λ = 8 有本征向量
(
1
,
6
,
6
)
(
1
,
6
,
6
)
(1,6,6) (1,6,6) ( 1 , 6 , 6 ) .
于是
(
1
,
0
,
0
)
,
(
1
,
3
,
0
)
,
(
1
,
6
,
6
)
(
1
,
0
,
0
)
,
(
1
,
3
,
0
)
,
(
1
,
6
,
6
)
(1,0,0),(1,3,0),(1,6,6) (1,0,0),(1,3,0),(1,6,6) ( 1 , 0 , 0 ) , ( 1 , 3 , 0 ) , ( 1 , 6 , 6 ) 是
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 的基, 且
T
T
T T T 关于这个基的矩阵为
(
2
0
0
0
5
0
0
0
8
)
2
0
0
0
5
0
0
0
8
([2,0,0],[0,5,0],[0,0,8]) \left(\begin{array}{lll}
2 & 0 & 0 \\
0 & 5 & 0 \\
0 & 0 & 8
\end{array}\right) ( 2 0 0 0 5 0 0 0 8 )
5.44 的逆命题不成立。 例如,三维空间
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 上的算子
T
(
z
1
,
z
2
,
z
3
)
=
(
4
z
1
,
4
z
2
,
5
z
3
)
T
z
1
,
z
2
,
z
3
=
4
z
1
,
4
z
2
,
5
z
3
T(z_(1),z_(2),z_(3))=(4z_(1),4z_(2),5z_(3)) T\left(z_{1}, z_{2}, z_{3}\right)=\left(4 z_{1}, 4 z_{2}, 5 z_{3}\right) T ( z 1 , z 2 , z 3 ) = ( 4 z 1 , 4 z 2 , 5 z 3 )
只有两个本征值(4和5),但这个算子关于标准基有对角矩阵。
在后面的章节中,我们会找到算子可对角化的其他条件。
习题 5.C
1 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 可对角化. 证明
V
=
null
T
⊕
range
T
V
=
null
T
⊕
range
T
V=null T o+range T V=\operatorname{null} T \oplus \operatorname{range} T V = null T ⊕ range T .
2 证明上题的逆命题或给出反例.
3 设
V
V
V V V 是有限维的且
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明下列条件等价:
(a)
V
=
null
T
⊕
range
T
V
=
null
T
⊕
range
T
V=null T o+range T V=\operatorname{null} T \oplus \operatorname{range} T V = null T ⊕ range T ;
(b)
V
=
null
T
+
range
T
V
=
null
T
+
range
T
V=null T+range T V=\operatorname{null} T+\operatorname{range} T V = null T + range T ;
(c) null
T
∩
range
T
=
{
0
}
T
∩
range
T
=
{
0
}
T nn range T={0} T \cap \operatorname{range} T=\{0\} T ∩ range T = { 0 } .
4 举例说明如果去掉 "
V
V
V V V 是有限维的" 这个假设, 则上题的结论不再成立.
5 设
V
V
V V V 是有限维的复向量空间且
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 证明:
T
T
T T T 可对角化当且仅当对每个
λ
∈
C
λ
∈
C
lambda inC \lambda \in \mathbf{C} λ ∈ C 有
V
=
null
(
T
−
λ
I
)
⊕
range
(
T
−
λ
I
)
V
=
null
(
T
−
λ
I
)
⊕
range
(
T
−
λ
I
)
V=null(T-lambda I)o+range(T-lambda I) V=\operatorname{null}(T-\lambda I) \oplus \operatorname{range}(T-\lambda I) V = null ( T − λ I ) ⊕ range ( T − λ I ) .
6 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 有
dim
V
dim
V
dim V \operatorname{dim} V dim V 个互异的本征值,
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 与
T
T
T T T 有相同的本征向量(未必相应于同一本征值)。证明
S
T
=
T
S
S
T
=
T
S
ST=TS S T=T S S T = T S 。
7 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 关于
V
V
V V V 的某个基有对角矩阵
A
,
λ
∈
F
A
,
λ
∈
F
A,lambda inF A, \lambda \in \mathbf{F} A , λ ∈ F 。证明
λ
λ
lambda \lambda λ 在
A
A
A A A 的对角线上恰好出现
dim
E
(
λ
,
T
)
dim
E
(
λ
,
T
)
dim E(lambda,T) \operatorname{dim} E(\lambda, T) dim E ( λ , T ) 次。
8 设
T
∈
L
(
F
5
)
T
∈
L
F
5
T inL(F^(5)) T \in \mathcal{L}\left(\mathbf{F}^{5}\right) T ∈ L ( F 5 ) 且
dim
E
(
8
,
T
)
=
4
dim
E
(
8
,
T
)
=
4
dim E(8,T)=4 \operatorname{dim} E(8, T)=4 dim E ( 8 , T ) = 4 . 证明
(
T
−
2
I
)
(
T
−
2
I
)
(T-2I) (T-2 I) ( T − 2 I ) 或
(
T
−
6
I
)
(
T
−
6
I
)
(T-6I) (T-6 I) ( T − 6 I ) 是可逆的.
9 设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 是可逆的。证明对每个非零的
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 均有
E
(
λ
,
T
)
=
E
(
1
λ
,
T
−
1
)
E
(
λ
,
T
)
=
E
1
λ
,
T
−
1
E(lambda,T)=E((1)/(lambda),T^(-1)) E(\lambda, T)=E\left(\frac{1}{\lambda}, T^{-1}\right) E ( λ , T ) = E ( 1 λ , T − 1 ) .
10 设
V
V
V V V 是有限维的且
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 。设
λ
1
,
…
,
λ
m
λ
1
,
…
,
λ
m
lambda_(1),dots,lambda_(m) \lambda_{1}, \ldots, \lambda_{m} λ 1 , … , λ m 是
T
T
T T T 的互异的非零本征值. 证明
dim
E
(
λ
1
,
T
)
+
⋯
+
dim
E
(
λ
m
,
T
)
≤
dim
range
T
dim
E
λ
1
,
T
+
⋯
+
dim
E
λ
m
,
T
≤
dim
range
T
dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) <= dim" range "T \operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) \leq \operatorname{dim} \text { range } T dim E ( λ 1 , T ) + ⋯ + dim E ( λ m , T ) ≤ dim range T
11 证明例 5.40 中的结论。
12 设
R
,
T
∈
L
(
F
3
)
R
,
T
∈
L
F
3
R,T inL(F^(3)) R, T \in \mathcal{L}\left(\mathbf{F}^{3}\right) R , T ∈ L ( F 3 ) , 本征值均为
2
,
6
,
7
2
,
6
,
7
2,6,7 2,6,7 2 , 6 , 7 . 证明存在可逆算子
S
∈
L
(
F
3
)
S
∈
L
F
3
S inL(F^(3)) S \in \mathcal{L}\left(\mathbf{F}^{3}\right) S ∈ L ( F 3 ) 使得
R
=
S
−
1
T
S
R
=
S
−
1
T
S
R=S^(-1)TS R=S^{-1} T S R = S − 1 T S 。
13 求
R
,
T
∈
L
(
F
4
)
R
,
T
∈
L
F
4
R,T inL(F^(4)) R, T \in \mathcal{L}\left(\mathbf{F}^{4}\right) R , T ∈ L ( F 4 ) 使得
R
R
R R R 和
T
T
T T T 均有本征值
2
,
6
,
7
2
,
6
,
7
2,6,7 2,6,7 2 , 6 , 7 , 均没有其他本征值, 且不存在可逆算子
S
∈
L
(
F
4
)
S
∈
L
F
4
S inL(F^(4)) S \in \mathcal{L}\left(\mathbf{F}^{4}\right) S ∈ L ( F 4 ) 使得
R
=
S
−
1
T
S
R
=
S
−
1
T
S
R=S^(-1)TS R=S^{-1} T S R = S − 1 T S 。
14 求
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 使得 6 和 7 是
T
T
T T T 的本征值,且
T
T
T T T 关于
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 的任意基的矩阵都不是对角矩阵。
15 设
T
∈
L
(
C
3
)
T
∈
L
C
3
T inL(C^(3)) T \in \mathcal{L}\left(\mathbf{C}^{3}\right) T ∈ L ( C 3 ) 使得 6 和 7 是
T
T
T T T 的本征值,且
T
T
T T T 关于
C
3
C
3
C^(3) \mathbf{C}^{3} C 3 的任意基的矩阵都不是对角矩阵。证明存在
(
x
,
y
,
z
)
∈
C
3
(
x
,
y
,
z
)
∈
C
3
(x,y,z)inC^(3) (x, y, z) \in \mathbf{C}^{3} ( x , y , z ) ∈ C 3 使得
T
(
x
,
y
,
z
)
=
(
17
+
8
x
,
5
+
8
y
,
2
π
+
8
z
)
T
(
x
,
y
,
z
)
=
(
17
+
8
x
,
5
+
8
y
,
2
π
+
8
z
)
T(x,y,z)=(17+8x,sqrt5+8y,2pi+8z) T(x, y, z)=(17+8 x, \sqrt{5}+8 y, 2 \pi+8 z) T ( x , y , z ) = ( 17 + 8 x , 5 + 8 y , 2 π + 8 z ) .
16 斐波那契序列
F
1
,
F
2
,
…
F
1
,
F
2
,
…
F_(1),F_(2),dots F_{1}, F_{2}, \ldots F 1 , F 2 , … 定义为
F
1
=
1
,
F
2
=
1
,
F
n
=
F
n
−
2
+
F
n
−
1
(
n
≥
3
)
F
1
=
1
,
F
2
=
1
,
F
n
=
F
n
−
2
+
F
n
−
1
(
n
≥
3
)
F_(1)=1,quadF_(2)=1,quadF_(n)=F_(n-2)+F_(n-1)(n >= 3) F_{1}=1, \quad F_{2}=1, \quad F_{n}=F_{n-2}+F_{n-1}(n \geq 3) F 1 = 1 , F 2 = 1 , F n = F n − 2 + F n − 1 ( n ≥ 3 )
定义
T
∈
L
(
R
2
)
T
∈
L
R
2
T inL(R^(2)) T \in \mathcal{L}\left(\mathbf{R}^{2}\right) T ∈ L ( R 2 ) 为
T
(
x
,
y
)
=
(
y
,
x
+
y
)
T
(
x
,
y
)
=
(
y
,
x
+
y
)
T(x,y)=(y,x+y) T(x, y)=(y, x+y) T ( x , y ) = ( y , x + y ) 。
(a) 证明对每个正整数
n
n
n n n 均有
T
n
(
0
,
1
)
=
(
F
n
,
F
n
+
1
)
T
n
(
0
,
1
)
=
F
n
,
F
n
+
1
T^(n)(0,1)=(F_(n),F_(n+1)) T^{n}(0,1)=\left(F_{n}, F_{n+1}\right) T n ( 0 , 1 ) = ( F n , F n + 1 ) .
(b) 求
T
T
T T T 的本征值.
(c)求
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 的一个由
T
T
T T T 的本征向量构成的基.
(d) 利用 (c) 的解计算
T
n
(
0
,
1
)
T
n
(
0
,
1
)
T^(n)(0,1) T^{n}(0,1) T n ( 0 , 1 ) . 由此证明:对每个正整数
n
n
n n n 有
F
n
=
1
5
[
(
1
+
5
2
)
n
−
(
1
−
5
2
)
n
]
F
n
=
1
5
1
+
5
2
n
−
1
−
5
2
n
F_(n)=(1)/(sqrt5)[((1+sqrt5)/(2))^(n)-((1-sqrt5)/(2))^(n)] F_{n}=\frac{1}{\sqrt{5}}\left[\left(\frac{1+\sqrt{5}}{2}\right)^{n}-\left(\frac{1-\sqrt{5}}{2}\right)^{n}\right] F n = 1 5 [ ( 1 + 5 2 ) n − ( 1 − 5 2 ) n ]
(e) 利用 (d) 证明: 对每个正整数
n
n
n n n , 斐波那契数
F
n
F
n
F_(n) F_{n} F n 是最接近于
1
5
(
1
+
5
2
)
n
1
5
1
+
5
2
n
(1)/(sqrt5)((1+sqrt5)/(2))^(n) \frac{1}{\sqrt{5}}\left(\frac{1+\sqrt{5}}{2}\right)^{n} 1 5 ( 1 + 5 2 ) n
的整数。