意大利数学家比萨的列奥纳多(又称斐波那契,约 1170 1250 ) 1170 1250 ) 1170-1250)1170-1250)11701250) 的塑像。第5.C 节的习题 16 说明如何利用线性代数找出斐波那契序列的显式公式。

本征值、本征向量、不变子空间

第3章研究的是一个向量空间到另一个向量空间的线性映射。现在开始研究有限维向量空间到其自身的线性映射. 对这种线性映射的研究构成了线性代数最重要的部分.
我们总采用如下假定:
5.1 记号 F V F V F、V\mathbf{F} 、 VFV
  • F 表示 R R R\mathbf{R}R C C C\mathbf{C}C
  • V V VVV 表示 F F F\mathbf{F}F 上的向量空间.

本章的学习目标

  • 不变子空间
  • 本征值、本征向量、本征空间
  • 有限维复向量空间上的每个算子均有本征值, 并且关于某个基有上三角矩阵

5.A 不变子空间

本章我们要引进一些工具,这将有助于我们理解算子的结构。回想一下,算子是从一个向量空间到其自身的线性映射, V V VVV 上算子的集合记为 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V), 即 L ( V ) = L ( V ) = L(V)=\mathcal{L}(V)=L(V)= L ( V , V ) L ( V , V ) L(V,V)\mathcal{L}(V, V)L(V,V)
我们来看看如何能更好地理解算子。设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 如果 V V VVV 有直和分解
V = U 1 U m V = U 1 U m V=U_(1)o+cdots o+U_(m)V=U_{1} \oplus \cdots \oplus U_{m}V=U1Um
其中每个 U j U j U_(j)U_{j}Uj 都是 V V VVV 的真子空间,那么,要想了解 T T TTT 的特性,我们只需了解每个 T | U j T U j T|_(U_(j))\left.T\right|_{U_{j}}T|Uj的特性,这里 T | U j T U j T|_(U_(j))\left.T\right|_{U_{j}}T|Uj 表示把 T T TTT 限制到更小的定义域 U j U j U_(j)U_{j}Uj 上。因为 U j U j U_(j)U_{j}Uj 是比 V V VVV 更小的向量空间,所以处理 T | U j T U j T|_(U_(j))\left.T\right|_{U_{j}}T|Uj 应该比处理 T T TTT 更容易。
但是,如果想要使用算子研究中的一些有效工具(比如取幂),那么就会有一个问题: T | U j T U j T|_(U_(j))\left.T\right|_{U_{j}}T|Uj 可能不把 U j U j U_(j)U_{j}Uj 映到自身;也就是说 T | U j T U j T|_(U_(j))\left.T\right|_{U_{j}}T|Uj 可能不是 U j U j U_(j)U_{j}Uj 上的算子. 因此我们只考虑具有以下性质的 V V VVV 的直和分解: T T TTT 把其中的每个 U j U j U_(j)U_{j}Uj 都映到自身。
被算子映到自身的子空间十分重要,应当有个名字。
5.2 定义 不变子空间(invariant subspace)
T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 称 V V VVV 的子空间 U U UUU T T TTT 下不变, 如果对每个 u U u U u in Uu \in UuU 都有 T u U T u U Tu in UT u \in UTuU.
也就是说, U U UUU T T TTT 下不变当且仅当 T | U T U T|_(U)\left.T\right|_{U}T|U U U UUU 上的算子.
5.3 例 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明 V V VVV 的下列子空间在 T T TTT 下不变:
(a) { 0 } { 0 } {0}\{0\}{0};
(b) V V VVV;
(c) null T null T null T\operatorname{null} TnullT;
(d) range T T TTT.
在泛函分析中,最著名的尚未解决的问题叫作不变子空间问题。它研究无限维向量空间上算子的不变子空间。

证明

(a)若 u { 0 } u { 0 } u in{0}u \in\{0\}u{0}, 则 u = 0 u = 0 u=0u=0u=0, 所以 T u = 0 { 0 } T u = 0 { 0 } Tu=0in{0}T u=0 \in\{0\}Tu=0{0}. 于是 { 0 } { 0 } {0}\{0\}{0} T T TTT 下不变.
(b) 若 u V u V u in Vu \in VuV, 则 T u V T u V Tu in VT u \in VTuV. 于是 V V VVV T T TTT 下不变.
(c) 若 u null T u null T u in null Tu \in \operatorname{null} TunullT, 则 T u = 0 T u = 0 Tu=0T u=0Tu=0, 所以 T u null T T u null T Tu in null TT u \in \operatorname{null} TTunullT. 于是 null T T TTT T T TTT 下不变.
(d) 若 u range T u range T u in range Tu \in \operatorname{range} TurangeT ,则 T u range T T u range T Tu in range TT u \in \operatorname{range} TTurangeT 。于是 range T T TTT T T TTT 下不变.
一个算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是不是一定有不同于 { 0 } { 0 } {0}\{0\}{0} V V VVV 的不变子空间呢?我们以后会看到,如果 V V VVV 是有限维的,且 dim V > 1 dim V > 1 dim V > 1\operatorname{dim} V>1dimV>1 (对于 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C )或 dim V > 2 dim V > 2 dim V > 2\operatorname{dim} V>2dimV>2 (对于 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R ),这个问题有肯定的答案。见5.21和9.8.
虽然 null T T TTT 和 range T T TTT 都在 T T TTT 下不变,但是这并未为是否存在异于 { 0 } { 0 } {0}\{0\}{0} V V VVV 的不变子空间这一问题提供简单答案,这是因为,null T T TTT 可能等于 { 0 } { 0 } {0}\{0\}{0} ,而 range T T TTT 可能等于 V V VVV (当 T T TTT 可逆时,就是这样)。
5.4 例 设 T L ( P ( R ) ) T L ( P ( R ) ) T inL(P(R))T \in \mathcal{L}(\mathcal{P}(\mathbf{R}))TL(P(R)) 定义为 T p = p T p = p Tp=p^(')T p=p^{\prime}Tp=p 。则 P ( R ) P ( R ) P(R)\mathcal{P}(\mathbf{R})P(R) 的子空间 P 4 ( R ) P 4 ( R ) P_(4)(R)\mathcal{P}_{4}(\mathbf{R})P4(R) T T TTT 下不变, 因为若 p P ( R ) p P ( R ) p inP(R)p \in \mathcal{P}(\mathbf{R})pP(R) 的次数不超过 4 则 p p p^(')p^{\prime}p 的次数也不超过 4 .

本征值与本征向量

我们以后还会回过头来更深入地研究不变子空间. 现在先来研究最简单的非平凡不变子空间———维不变子空间。
任取 v V , v 0 v V , v 0 v in V,v!=0v \in V, v \neq 0vV,v0 ,并设 U U UUU v v vvv 的标量倍构成的集合:
U = { λ v : λ F } = span ( v ) U = { λ v : λ F } = span ( v ) U={lambda v:lambda inF}=span(v)U=\{\lambda v: \lambda \in \mathbf{F}\}=\operatorname{span}(v)U={λv:λF}=span(v)
U U UUU V V VVV 的一维子空间(而且 V V VVV 的每个一维子空间都具有这种形式)。若 U U UUU 在算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 下不变,则 T v U T v U Tv in UT v \in UTvU ,因此必有标量 λ F λ F lambda inF\lambda \in \mathbf{F}λF 使得 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv
反之,若有某个 λ F λ F lambda inF\lambda \in \mathbf{F}λF 使得 T v = λ ν T v = λ ν Tv=lambda nuT v=\lambda \nuTv=λν ,则 span ( v ) span ( v ) span(v)\operatorname{span}(v)span(v) V V VVV 的在 T T TTT 下不变的一维子空间。
我们刚才见过的那个方程
T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv
与一维不变子空间密切相关,十分重要。满足此方程的向量 v v vvv 和标量 λ λ lambda\lambdaλ 都有一个特殊的名字。

5.5 定义 本征值(eigenvalue)

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 称数 λ F λ F lambda inF\lambda \in \mathbf{F}λF T T TTT 的本征值,若存在 v V v V v in Vv \in VvV 使得 v 0 v 0 v!=0v \neq 0v0 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv
上面这些解释表明, T T TTT 有一维不变子空间当且仅当 T T TTT 有本征值.
在上面的定义中,我们要求 v 0 v 0 v!=0v \neq 0v0 ,这是因为每个标量 λ F λ F lambda inF\lambda \in \mathbf{F}λF 都满足 T 0 = λ 0 T 0 = λ 0 T0=lambda0T 0=\lambda 0T0=λ0
eigenvalue 这个词一半是德文,一半是英文。德文形容词 eigen 的意思是"特有的"。有些数学家使用术语特征值而不是本征值。

5.6 本征值的等价条件

V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) λ F λ F lambda in F\lambda \in FλF. 则以下条件等价:
(a) λ λ lambda\lambdaλ T T TTT 的本征值;
(b) T λ I T λ I T-lambda IT-\lambda ITλI 不是单的;
(c) T λ I T λ I T-lambda IT-\lambda ITλI 不是满的;
(d) T λ I T λ I T-lambda IT-\lambda ITλI 不是可逆的.
回想一下 I L ( V ) I L ( V ) I inL(V)I \in \mathcal{L}(V)IL(V) 是恒等算子,即对所有 v V v V v in Vv \in VvV 均有 I v = v I v = v Iv=vI v=vIv=v
证明 条件 (a) 和 (b) 等价,因为等式 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv 等价于等式 ( T λ I ) v = 0 ( T λ I ) v = 0 (T-lambda I)v=0(T-\lambda I) v=0(TλI)v=0 。由 3.69 可知条件 (b)、(c)、(d) 等价.

5.7 定义 本征向量(eigenvector)

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V), 并设 λ F λ F lambda inF\lambda \in \mathbf{F}λF T T TTT 的本征值. 称向量 v V v V v in Vv \in VvV T T TTT 的相应于 λ λ lambda\lambdaλ 的本征向量, 如果 v 0 v 0 v!=0v \neq 0v0 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv
因为 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv 当且仅当 ( T λ I ) v = 0 ( T λ I ) v = 0 (T-lambda I)v=0(T-\lambda I) v=0(TλI)v=0, 所以非零向量 v V v V v in Vv \in VvV T T TTT 的相应于 λ λ lambda\lambdaλ 的本征向量当且仅当 v null ( T λ I ) v null ( T λ I ) v in null(T-lambda I)v \in \operatorname{null}(T-\lambda I)vnull(TλI).
5.8 例 设 T L ( F 2 ) T L F 2 T inL(F^(2))T \in \mathcal{L}\left(\mathbf{F}^{2}\right)TL(F2) 定义为 T ( w , z ) = ( z , w ) T ( w , z ) = ( z , w ) T(w,z)=(-z,w)T(w, z)=(-z, w)T(w,z)=(z,w).
(a) 当 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R 时,求 T T TTT 的本征值和本征向量。
(b) 当 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C 时, 求 T T TTT 的本征值和本征向量.

(a) 若 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R, 则 T T TTT R 2 R 2 R^(2)\mathbf{R}^{2}R2 中绕原点的逆时针 90 90 90^(@)90^{\circ}90 旋转。一个算子有本征值当且仅当在定义域中存在非零向量能被该算子映成此向量的标量倍. R 2 R 2 R^(2)\mathbf{R}^{2}R2 中非零向量的逆时针 90 90 90^(@)90^{\circ}90 旋转显然不能等于此向量的标量倍. 结论: 若 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R, 则 T T TTT 没有本征值 (因此也没有本征向量)。
(b) 为了求 T T TTT 的本征值,我们必须求标量 λ λ lambda\lambdaλ 使得
T ( w , z ) = λ ( w , z ) T ( w , z ) = λ ( w , z ) T(w,z)=lambda(w,z)T(w, z)=\lambda(w, z)T(w,z)=λ(w,z)
w = z = 0 w = z = 0 w=z=0w=z=0w=z=0 外还有其他解. 上面的方程等价于联立方程
5.9 z = λ w , w = λ z  5.9  z = λ w , w = λ z " 5.9 "-z=lambda w,quad w=lambda z\text { 5.9 }-z=\lambda w, \quad w=\lambda z 5.9 z=λw,w=λz
把第二个方程中 w w www 的表达式代入第一个方程可得
z = λ 2 z z = λ 2 z -z=lambda^(2)z-z=\lambda^{2} zz=λ2z
现在 z z zzz 不能等于 0 (否则,由 5.9 可知 w = 0 w = 0 w=0w=0w=0 ,而我们要找的 5.9 的解应使 ( w , z ) ( w , z ) (w,z)(w, z)(w,z)不是零向量),故由上面的方程可得
1 = λ 2 . 1 = λ 2 . -1=lambda^(2).-1=\lambda^{2} .1=λ2.
这个方程的解是 λ = i λ = i lambda=i\lambda=\mathrm{i}λ=i λ = i λ = i lambda=-i\lambda=-\mathrm{i}λ=i 。容易验证 i 和 -i 都是 T T TTT 的本征值。的确,相应于本征值 i 的本征向量是形如 ( w , w i ) ( w , w i ) (w,-wi)(w,-w \mathrm{i})(w,wi) 的向量, 而相应于本征值 -i 的本征向量是形如 ( w , w i ) ( w , w i ) (w,wi)(w, w \mathrm{i})(w,wi) 的向量,其中 w C w C w inCw \in \mathbf{C}wC w 0 w 0 w!=0w \neq 0w0
现在我们来证明:相应于不同本征值的本征向量是线性无关的.

5.10 线性无关的本征向量

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。设 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的互不相同的本征值,并设 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 是相应的本征向量,则 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 是线性无关的。
证明 设 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 是线性相关的. 设 k k kkk 是使得
5.11
v k span ( v 1 , , v k 1 ) v k span v 1 , , v k 1 v_(k)in span(v_(1),dots,v_(k-1))v_{k} \in \operatorname{span}\left(v_{1}, \ldots, v_{k-1}\right)vkspan(v1,,vk1)
成立的最小正整数. 由线性相关性引理 2.21 可知具有这种性质的 k k kkk 一定存在. 于是有 a 1 , , a k 1 F a 1 , , a k 1 F a_(1),dots,a_(k-1)inFa_{1}, \ldots, a_{k-1} \in \mathbf{F}a1,,ak1F 使得
5.12
v k = a 1 v 1 + + a k 1 v k 1 v k = a 1 v 1 + + a k 1 v k 1 v_(k)=a_(1)v_(1)+cdots+a_(k-1)v_(k-1)v_{k}=a_{1} v_{1}+\cdots+a_{k-1} v_{k-1}vk=a1v1++ak1vk1
T T TTT 作用到这个等式的两端可得
λ k v k = a 1 λ 1 v 1 + + a k 1 λ k 1 v k 1 λ k v k = a 1 λ 1 v 1 + + a k 1 λ k 1 v k 1 lambda_(k)v_(k)=a_(1)lambda_(1)v_(1)+cdots+a_(k-1)lambda_(k-1)v_(k-1)\lambda_{k} v_{k}=a_{1} \lambda_{1} v_{1}+\cdots+a_{k-1} \lambda_{k-1} v_{k-1}λkvk=a1λ1v1++ak1λk1vk1
在 5.12 的两端乘以 λ k λ k lambda_(k)\lambda_{k}λk, 然后减去上式, 得
0 = a 1 ( λ k λ 1 ) v 1 + + a k 1 ( λ k λ k 1 ) v k 1 0 = a 1 λ k λ 1 v 1 + + a k 1 λ k λ k 1 v k 1 0=a_(1)(lambda_(k)-lambda_(1))v_(1)+cdots+a_(k-1)(lambda_(k)-lambda_(k-1))v_(k-1)0=a_{1}\left(\lambda_{k}-\lambda_{1}\right) v_{1}+\cdots+a_{k-1}\left(\lambda_{k}-\lambda_{k-1}\right) v_{k-1}0=a1(λkλ1)v1++ak1(λkλk1)vk1
因为我们选取的 k k kkk 是满足 5.11 的最小正整数,所以 v 1 , , v k 1 v 1 , , v k 1 v_(1),dots,v_(k-1)v_{1}, \ldots, v_{k-1}v1,,vk1 是线性无关的。于是,由上面的等式可知,这些 a a aaa 都是 0 (回忆一下, λ k λ k lambda_(k)\lambda_{k}λk 不等于 λ 1 , , λ k 1 λ 1 , , λ k 1 lambda_(1),dots,lambda_(k-1)\lambda_{1}, \ldots, \lambda_{k-1}λ1,,λk1 中的任何一个)。但是,这意味着 v k v k v_(k)v_{k}vk 等于 0 (参见 5.12),这与 v k v k v_(k)v_{k}vk 是本征向量的假设相矛盾。所以 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 线性相关的假设不成立。
下面的推论表明,算子的互异本征值的个数不超过向量空间的维数.

5.13 本征值的个数

V V VVV 是有限维的,则 V V VVV 上的每个算子最多有 dim V dim V dim V\operatorname{dim} VdimV 个互不相同的本征值.
证明 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。设 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的互不相同的本征值, v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 是相应的本征向量。定理5.10表明组 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 线性无关。因此 m dim V m dim V m <= dim Vm \leq \operatorname{dim} VmdimV (参见 2.23)。

限制算子与商算子

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) U U UUU V V VVV 的在 T T TTT 下不变的子空间,则 U U UUU 以自然的方式确定了另外两个算子 T | U L ( U ) T U L ( U ) T|_(U)inL(U)\left.T\right|_{U} \in \mathcal{L}(U)T|UL(U) T / U L ( V / U ) T / U L ( V / U ) T//U inL(V//U)T / U \in \mathcal{L}(V / U)T/UL(V/U) ,其定义如下。
5.14 定义 限制算子(restriction operator), T | U T U T|_(U)\left.T\right|_{U}T|U商算子(quotient operator), T / U T / U T//UT / UT/U
T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) U U UUU V V VVV 的在 T T TTT 下不变的子空间.
  • 限制算子 T | U L ( U ) T U L ( U ) T|_(U)inL(U)\left.T\right|_{U} \in \mathcal{L}(U)T|UL(U) 定义为
T | U ( u ) = T u T U ( u ) = T u T|_(U)(u)=Tu\left.T\right|_{U}(u)=T uT|U(u)=Tu
其中 u U u U u in Uu \in UuU.
  • 商算子 T / U L ( V / U ) T / U L ( V / U ) T//U inL(V//U)T / U \in \mathcal{L}(V / U)T/UL(V/U) 定义为
( T / U ) ( v + U ) = T v + U ( T / U ) ( v + U ) = T v + U (T//U)(v+U)=Tv+U(T / U)(v+U)=T v+U(T/U)(v+U)=Tv+U
其中 v V v V v in Vv \in VvV.
对于上面定义的两个算子,应该关注一下它们的定义域,并花点时间思考一下为什么这两个算子在它们的定义域上是定义合理的。首先考虑限制算子 T | U L ( U ) T U L ( U ) T|_(U)inL(U)\left.T\right|_{U} \in \mathcal{L}(U)T|UL(U),它就是将 T T TTT 的定义域限定为 U U UUU ,并认为 T T TTT 是映到 U U UUU 的而不是映到 V V VVV 的。 U U UUU T T TTT 下不变这一条件, 使得我们可以将 T | U T U T|_(U)\left.T\right|_{U}T|U 视为 U U UUU 上的算子, 即从定义域到同一空间的线性映射,而不仅仅是从一个向量空间到另一个向量空间的线性映射。
要证明上面的商算子的定义是有意义的, 我们需要验证: 若 v + U = w + U v + U = w + U v+U=w+Uv+U=w+Uv+U=w+U, 则 T v + U = T w + U T v + U = T w + U Tv+U=Tw+UT v+U=T w+UTv+U=Tw+U 。现在设 v + U = w + U v + U = w + U v+U=w+Uv+U=w+Uv+U=w+U. 则 v w U v w U v-w in Uv-w \in UvwU (见 3.85)。由于 U U UUU T T TTT 下不变,我们有 T ( v w ) U T ( v w ) U T(v-w)in UT(v-w) \in UT(vw)U ,这表明 T v T w U T v T w U Tv-Tw in UT v-T w \in UTvTwU ,于是 T v + U = T w + U T v + U = T w + U Tv+U=Tw+UT v+U=T w+UTv+U=Tw+U
T T TTT 有限维向量空间 V V VVV 上的算子,且 U U UUU V V VVV 的在 T T TTT 下不变的子空间使得 U { 0 } U { 0 } U!={0}U \neq\{0\}U{0} U V U V U!=VU \neq VUV. 在某种意义下, 可以通过研究算子 T | U T U T|_(U)\left.T\right|_{U}T|U T / U T / U T//UT / UT/U 来了解算子 T T TTT,而 T | U T U T|_(U)\left.T\right|_{U}T|U T / U T / U T//UT / UT/U 都是维数小于 V V VVV 的维数的向量空间上的算子. 例如, 5.27 的第二个证明就很好地使用了 T / U T / U T//UT / UT/U
然而,有时候 T | U T U T|_(U)\left.T\right|_{U}T|U T / U T / U T//UT / UT/U 并没有给出关于 T T TTT 的足够信息。在下面的例子中, T | U T U T|_(U)\left.T\right|_{U}T|U T / U T / U T//UT / UT/U 都是 0 , 即便 T T TTT 不是 0 算子。
5.15 例 定义算子 T L ( F 2 ) T L F 2 T inL(F^(2))T \in \mathcal{L}\left(\mathbf{F}^{2}\right)TL(F2) T ( x , y ) = ( y , 0 ) T ( x , y ) = ( y , 0 ) T(x,y)=(y,0)T(x, y)=(y, 0)T(x,y)=(y,0). 设 U = { ( x , 0 ) : x F } U = { ( x , 0 ) : x F } U={(x,0):x inF}U=\{(x, 0): x \in \mathbf{F}\}U={(x,0):xF} 。证明
(a) U U UUU T T TTT 下不变,且 T | U T U T|_(U)\left.T\right|_{U}T|U U U UUU 上的 0 算子;
(b) 不存在 F 2 F 2 F^(2)\mathbf{F}^{2}F2 的在 T T TTT 下不变的子空间 W W WWW 使得 F 2 = U W F 2 = U W F^(2)=U o+W\mathbf{F}^{2}=U \oplus WF2=UW;
(c) T / U T / U T//UT / UT/U F 2 / U F 2 / U F^(2)//U\mathbf{F}^{2} / UF2/U 上的 0 算子.
证明
(a) 对于 ( x , 0 ) U ( x , 0 ) U (x,0)in U(x, 0) \in U(x,0)U, 我们有 T ( x , 0 ) = ( 0 , 0 ) U T ( x , 0 ) = ( 0 , 0 ) U T(x,0)=(0,0)in UT(x, 0)=(0,0) \in UT(x,0)=(0,0)U. 于是 U U UUU T T TTT 下不变, 且 T | U T U T|_(U)\left.T\right|_{U}T|U U U UUU上的 0 算子.
(b) 设 W W WWW V V VVV 的子空间使得 F 2 = U W F 2 = U W F^(2)=U o+W\mathbf{F}^{2}=U \oplus WF2=UW 。由于 dim F 2 = 2 dim F 2 = 2 dimF^(2)=2\operatorname{dim} \mathbf{F}^{2}=2dimF2=2 dim U = 1 dim U = 1 dim U=1\operatorname{dim} U=1dimU=1 ,我们有 dim W = 1 dim W = 1 dim W=1\operatorname{dim} W=1dimW=1. 若 W W WWW T T TTT 下不变, 则 W W WWW 的每个非零向量都是 T T TTT 的本征向量. 然
而, 很容易看出 0 是 T T TTT 的唯一本征值, 且 T T TTT 的所有本征向量都在 U U UUU 中. 于是 W W WWW并非在 T T TTT 下不变。
(c) 对于 ( x , y ) F 2 ( x , y ) F 2 (x,y)inF^(2)(x, y) \in \mathbf{F}^{2}(x,y)F2 ,我们有
( T / U ) ( ( x , y ) + U ) = T ( x , y ) + U = ( y , 0 ) + U = 0 + U ( T / U ) ( ( x , y ) + U ) = T ( x , y ) + U = ( y , 0 ) + U = 0 + U (T//U)((x,y)+U)=T(x,y)+U=(y,0)+U=0+U(T / U)((x, y)+U)=T(x, y)+U=(y, 0)+U=0+U(T/U)((x,y)+U)=T(x,y)+U=(y,0)+U=0+U
这里最后一个等号成立是因为 ( y , 0 ) U ( y , 0 ) U (y,0)in U(y, 0) \in U(y,0)U. 上面的等式表明 T / U T / U T//UT / UT/U 是 0 算子.

习题 5.A

1 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V), 并设 U U UUU V V VVV 的子空间.
(a) 证明:若 U null T U null T U sub null TU \subset \operatorname{null} TUnullT U U UUU T T TTT 下不变.
(b) 证明:若 range T U T U T sub UT \subset UTU U U UUU T T TTT 下不变.
2 设 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V) 使得 S T = T S S T = T S ST=TSS T=T SST=TS. 证明 null S S SSS T T TTT 下不变。
3 设 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V) 使得 S T = T S S T = T S ST=TSS T=T SST=TS. 证明 range S S SSS T T TTT 下不变。
4 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) U 1 , , U m U 1 , , U m U_(1),dots,U_(m)U_{1}, \ldots, U_{m}U1,,Um V V VVV 的在 T T TTT 下不变的子空间。证明 U 1 + + U m U 1 + + U m U_(1)+cdots+U_(m)U_{1}+\cdots+U_{m}U1++Um T T TTT 下不变。
5 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明 V V VVV 的任意一组在 T T TTT 下不变的子空间的交仍在 T T TTT 下不变.
6 证明或给出反例:若 V V VVV 是有限维的, U U UUU V V VVV 的子空间且在 V V VVV 的每个算子下不变,则 U = { 0 } U = { 0 } U={0}U=\{0\}U={0} U = V U = V U=VU=VU=V.
7 定义 T L ( R 2 ) T L R 2 T inL(R^(2))T \in \mathcal{L}\left(\mathbf{R}^{2}\right)TL(R2) T ( x , y ) = ( 3 y , x ) T ( x , y ) = ( 3 y , x ) T(x,y)=(-3y,x)T(x, y)=(-3 y, x)T(x,y)=(3y,x). 求 T T TTT 的本征值.
8 定义 T L ( F 2 ) T L F 2 T inL(F^(2))T \in \mathcal{L}\left(\mathbf{F}^{2}\right)TL(F2) T ( w , z ) = ( z , w ) T ( w , z ) = ( z , w ) T(w,z)=(z,w)T(w, z)=(z, w)T(w,z)=(z,w). 求 T T TTT 的所有本征值和本征向量.
9 定义 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) T ( z 1 , z 2 , z 3 ) = ( 2 z 2 , 0 , 5 z 3 ) T z 1 , z 2 , z 3 = 2 z 2 , 0 , 5 z 3 T(z_(1),z_(2),z_(3))=(2z_(2),0,5z_(3))T\left(z_{1}, z_{2}, z_{3}\right)=\left(2 z_{2}, 0,5 z_{3}\right)T(z1,z2,z3)=(2z2,0,5z3). 求 T T TTT 的所有本征值和本征向量.
10 定义 T L ( F n ) T L F n T inL(F^(n))T \in \mathcal{L}\left(\mathbf{F}^{n}\right)TL(Fn) T ( x 1 , x 2 , x 3 , , x n ) = ( x 1 , 2 x 2 , 3 x 3 , , n x n ) T x 1 , x 2 , x 3 , , x n = x 1 , 2 x 2 , 3 x 3 , , n x n T(x_(1),x_(2),x_(3),dots,x_(n))=(x_(1),2x_(2),3x_(3),dots,nx_(n))T\left(x_{1}, x_{2}, x_{3}, \ldots, x_{n}\right)=\left(x_{1}, 2 x_{2}, 3 x_{3}, \ldots, n x_{n}\right)T(x1,x2,x3,,xn)=(x1,2x2,3x3,,nxn)
(a) 求 T T TTT 的所有本征值和本征向量.
(b) 求 T T TTT 的所有不变子空间.
11 定义 T : P ( R ) P ( R ) T : P ( R ) P ( R ) T:P(R)rarrP(R)T: \mathcal{P}(\mathbf{R}) \rightarrow \mathcal{P}(\mathbf{R})T:P(R)P(R) T p = p T p = p Tp=p^(')T p=p^{\prime}Tp=p. 求 T T TTT 的所有本征值和本征向量.
12 定义 T L ( P 4 ( R ) ) T L P 4 ( R ) T inL(P_(4)(R))T \in \mathcal{L}\left(\mathcal{P}_{4}(\mathbf{R})\right)TL(P4(R)) 如下: 对所有 x R x R x inRx \in \mathbf{R}xR ( T p ) ( x ) = x p ( x ) ( T p ) ( x ) = x p ( x ) (Tp)(x)=xp^(')(x)(T p)(x)=x p^{\prime}(x)(Tp)(x)=xp(x). 求 T T TTT 的所有本征值和本征向量.
13 设 V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) λ F λ F lambda inF\lambda \in \mathbf{F}λF 。证明存在 α F α F alpha inF\alpha \in \mathbf{F}αF 使得 | α λ | < 1 1000 | α λ | < 1 1000 |alpha-lambda| < (1)/(1000)|\alpha-\lambda|<\frac{1}{1000}|αλ|<11000 ( T α I ) ( T α I ) (T-alpha I)(T-\alpha I)(TαI) 是可逆的。
14 设 V = U W V = U W V=U o+WV=U \oplus WV=UW ,其中 U U UUU W W WWW 均为 V V VVV 的非零子空间。定义 P L ( V ) P L ( V ) P inL(V)P \in \mathcal{L}(V)PL(V) 如下:对 u U u U u in Uu \in UuU w W w W w in Ww \in WwW P ( u + w ) = u P ( u + w ) = u P(u+w)=uP(u+w)=uP(u+w)=u. 求 P P PPP 的所有本征值和本征向量.
15 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 设 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 是可逆的.
(a) 证明 T T TTT S 1 T S S 1 T S S^(-1)TSS^{-1} T SS1TS 有相同的本征值.
(b) T T TTT 的本征向量与 S 1 T S S 1 T S S^(-1)TSS^{-1} T SS1TS 的本征向量之间有什么关系?
16 设 V V VVV 是复向量空间, T L ( V ) , T T L ( V ) , T T inL(V),TT \in \mathcal{L}(V), TTL(V),T 关于 V V VVV 的某个基的矩阵的元素均为实数。证明:若 λ λ lambda\lambdaλ T T TTT 的本征值,则 λ ¯ λ ¯ bar(lambda)\bar{\lambda}λ¯ 也是 T T TTT 的本征值。
17 给出一个没有(实)本征值的算子 T L ( R 4 ) T L R 4 T inL(R^(4))T \in \mathcal{L}\left(\mathbf{R}^{4}\right)TL(R4)
18 定义 T L ( C ) T L C T inL(C^(oo))T \in \mathcal{L}\left(\mathbf{C}^{\infty}\right)TL(C) T ( z 1 , z 2 , ) = ( 0 , z 1 , z 2 , ) T z 1 , z 2 , = 0 , z 1 , z 2 , T(z_(1),z_(2),dots)=(0,z_(1),z_(2),dots)T\left(z_{1}, z_{2}, \ldots\right)=\left(0, z_{1}, z_{2}, \ldots\right)T(z1,z2,)=(0,z1,z2,). 证明 T T TTT 没有本征值。
19 设 n n nnn 是正整数,定义 T L ( F n ) T L F n T inL(F^(n))T \in \mathcal{L}\left(\mathbf{F}^{n}\right)TL(Fn) T ( x 1 , , x n ) = ( x 1 + + x n , , x 1 + + x n ) T x 1 , , x n = x 1 + + x n , , x 1 + + x n T(x_(1),dots,x_(n))=(x_(1)+cdots+x_(n),dots,x_(1)+cdots+x_(n))T\left(x_{1}, \ldots, x_{n}\right)=\left(x_{1}+\cdots+x_{n}, \ldots, x_{1}+\cdots+x_{n}\right)T(x1,,xn)=(x1++xn,,x1++xn) ,也就是说算子 T T TTT (对于标准基)的矩阵的元素全是1. 求 T T TTT 的所有本征值和本征向量。
20 定义向后移位算子 T L ( F ) T L F T inL(F^(oo))T \in \mathcal{L}\left(\mathbf{F}^{\infty}\right)TL(F) T ( z 1 , z 2 , z 3 , ) = ( z 2 , z 3 , ) T z 1 , z 2 , z 3 , = z 2 , z 3 , T(z_(1),z_(2),z_(3),dots)=(z_(2),z_(3),dots)T\left(z_{1}, z_{2}, z_{3}, \ldots\right)=\left(z_{2}, z_{3}, \ldots\right)T(z1,z2,z3,)=(z2,z3,). 求 T T TTT 的所有本征值和本征向量。
21 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是可逆的。
(a) 设 λ F , λ 0 λ F , λ 0 lambda inF,lambda!=0\lambda \in \mathbf{F}, \lambda \neq 0λF,λ0. 证明 λ λ lambda\lambdaλ T T TTT 的本征值当且仅当 1 λ 1 λ (1)/(lambda)\frac{1}{\lambda}1λ T 1 T 1 T^(-1)T^{-1}T1 的本征值.
(b) 证明 T T TTT T 1 T 1 T^(-1)T^{-1}T1 有相同的本征向量.
22 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 且存在 V V VVV 中的非零向量 v v vvv w w www 使得 T v = 3 w T v = 3 w Tv=3wT v=3 wTv=3w T w = 3 v T w = 3 v Tw=3vT w=3 vTw=3v. 证明 3 或者 -3 是 T T TTT 的本征值。
23 设 V V VVV 是有限维的且 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V). 证明 S T S T STS TST T S T S TST STS 有相同的本征值.
24 设 A A AAA 是元素属于 F F F\mathbf{F}F n × n n × n n xx nn \times nn×n 矩阵。定义 T L ( F n ) T L F n T inL(F^(n))T \in \mathcal{L}\left(\mathbf{F}^{n}\right)TL(Fn) T x = A x T x = A x Tx=AxT x=A xTx=Ax ,这里 F n F n F^(n)\mathbf{F}^{n}Fn 中的元素视为 n × 1 n × 1 n xx1n \times 1n×1 的列向量。
(a) 设 A A AAA 的每行的元素之和都等于1. 证明 1 是 T T TTT 的本征值.
(b) 设 A A AAA 的每列的元素之和都等于 1 . 证明 1 是 T T TTT 的本征值.
25 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) u u uuu v v vvv 均为 T T TTT 的本征向量使得 u + v u + v u+vu+vu+v 也是 T T TTT 的本征向量. 证明 u u uuu v v vvv T T TTT 的相应于同一本征值的本征向量。
26 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 使得 V V VVV 中的每个非零向量都是 T T TTT 的本征向量. 证明 T T TTT 是恒等算子的标量倍。
27 设 V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 使得 V V VVV 的每个 dim V 1 dim V 1 dim V-1\operatorname{dim} V-1dimV1 维子空间都在 T T TTT 下不变。证明 T T TTT 是恒等算子的标量倍。
28 设 V V VVV 是有限维的, dim V 3 dim V 3 dim V >= 3\operatorname{dim} V \geq 3dimV3 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 使得 V V VVV 的每个二维子空间在 T T TTT 下不变. 证明 T T TTT 是恒等算子的标量倍。
29 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) dim range T = k dim range T = k dim range T=k\operatorname{dim} \operatorname{range} T=kdimrangeT=k. 证明 T T TTT 至多有 k + 1 k + 1 k+1k+1k+1 个不同的本征值.
30 设 T L ( R 3 ) T L R 3 T inL(R^(3))T \in \mathcal{L}\left(\mathbf{R}^{3}\right)TL(R3) 4 , 5 , 7 4 , 5 , 7 -4,5,sqrt7-4,5, \sqrt{7}4,5,7 均为 T T TTT 的本征值. 证明存在 x R 3 x R 3 x inR^(3)x \in \mathbf{R}^{3}xR3 使得 T x 9 x = T x 9 x = Tx-9x=T x-9 x=Tx9x= ( 4 , 5 , 7 ) ( 4 , 5 , 7 ) (-4,5,sqrt7)(-4,5, \sqrt{7})(4,5,7).
31 设 V V VVV 是有限维的且 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm V V VVV 中的一组向量。证明 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 线性无关当且仅当存在 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 使得 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm T T TTT 的相应于不同本征值的本征向量。
32 设 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 是一组互异实数。证明在由 R R R\mathbf{R}R 上的实值函数构成的向量空间中,组 e λ 1 x , , e λ n x e λ 1 x , , e λ n x e^(lambda_(1)x),dots,e^(lambda_(n)x)e^{\lambda_{1} x}, \ldots, e^{\lambda_{n} x}eλ1x,,eλnx 线性无关。
提示: 设 V = span ( e λ 1 x , , e λ n x ) V = span e λ 1 x , , e λ n x V=span(e^(lambda_(1)x),dots,e^(lambda_(n)x))V=\operatorname{span}\left(e^{\lambda_{1} x}, \ldots, e^{\lambda_{n} x}\right)V=span(eλ1x,,eλnx) ,定义算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) T f = f T f = f Tf=f^(')T f=f^{\prime}Tf=f 。求 T T TTT 的本征值和本征向量。
33 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。证明 T / ( T / ( T//(T /(T/( range T ) = 0 T ) = 0 T)=0T)=0T)=0
34 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明 T / ( null T ) T / ( null T ) T//(null T)T /(\operatorname{null} T)T/(nullT) 是单的当且仅当 ( null T ) ( range T ) = { 0 } ( null T ) ( range T ) = { 0 } (null T)nn(range T)={0}(\operatorname{null} T) \cap(\operatorname{range} T)=\{0\}(nullT)(rangeT)={0}.
35 设 V V VVV 是有限维的, T L ( V ) , U T L ( V ) , U T inL(V),UT \in \mathcal{L}(V), UTL(V),U T T TTT 下不变。证明 T / U T / U T//UT / UT/U 的每个本征值均为 T T TTT 的本征值。
下题是让你验证本习题中 " V V VVV 是有限维的" 这一假设是必需的.
36 找出一个向量空间 V V VVV 和一个算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) ,以及 V V VVV 的在 T T TTT 下不变的子空间 U U UUU ,使得 T / U T / U T//UT / UT/U 的某个本征值不是 T T TTT 的本征值。

5.B 本征向量与上三角矩阵

多项式作用于算子

算子(它把一个向量空间映到自身)理论要比线性映射理论更丰富,主要原因是算子能自乘为幂。我们从算子的幂以及多项式作用于算子这一关键概念的定义开始。
T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V), 则 T T T T TTT TTT 有意义, 并且也含于 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V). 通常用 T 2 T 2 T^(2)T^{2}T2 代替 T T T T TTT TTT. 更一般地,我们有下面的定义。

5.16 定义 T m T m T^(m)T^{m}Tm

T L ( V ) , m T L ( V ) , m T inL(V),mT \in \mathcal{L}(V), mTL(V),m 是正整数.
  • 定义 T m T m T^(m)T^{m}Tm T m = T T m T m = T T m  个  T^(m)=ubrace(T cdots Tubrace)_(m" 个 ")T^{m}=\underbrace{T \cdots T}_{m \text { 个 }}Tm=TTm 个 
  • 定义 T 0 T 0 T^(0)T^{0}T0 V V VVV 上的恒等算子 I I III.
  • T T TTT 是可逆的且其逆为 T 1 T 1 T^(-1)T^{-1}T1, 则定义 T m T m T^(-m)T^{-m}Tm T m = ( T 1 ) m T m = T 1 m T^(-m)=(T^(-1))^(m)T^{-m}=\left(T^{-1}\right)^{m}Tm=(T1)m.
请自行验证,若 T T TTT 是算子,则有
T m T n = T m + n ( T m ) n = T m n , T m T n = T m + n  和  T m n = T m n T^(m)T^(n)=T^(m+n)quad" 和 "quad(T^(m))^(n)=T^(mn)", "T^{m} T^{n}=T^{m+n} \quad \text { 和 } \quad\left(T^{m}\right)^{n}=T^{m n} \text {, }TmTn=Tm+n 和 (Tm)n=Tmn
T T TTT 可逆时 m m mmm n n nnn 是任意整数, 当 T T TTT 不可逆时 m m mmm n n nnn 是非负整数.

5.17 定义 p ( T ) p ( T ) p(T)p(T)p(T)

T L ( V ) , p P ( F ) T L ( V ) , p P ( F ) T inL(V),p inP(F)T \in \mathcal{L}(V), p \in \mathcal{P}(\mathbf{F})TL(V),pP(F) ,对 z F z F z inFz \in \mathbf{F}zF p ( z ) = a 0 + a 1 z + a 2 z 2 + + a m z m p ( z ) = a 0 + a 1 z + a 2 z 2 + + a m z m p(z)=a_(0)+a_(1)z+a_(2)z^(2)+cdots+a_(m)z^(m)p(z)=a_{0}+a_{1} z+a_{2} z^{2}+\cdots+a_{m} z^{m}p(z)=a0+a1z+a2z2++amzm 。则 p ( T ) p ( T ) p(T)p(T)p(T) 是定义为 p ( T ) = a 0 I + a 1 T + a 2 T 2 + + a m T m p ( T ) = a 0 I + a 1 T + a 2 T 2 + + a m T m p(T)=a_(0)I+a_(1)T+a_(2)T^(2)+cdots+a_(m)T^(m)p(T)=a_{0} I+a_{1} T+a_{2} T^{2}+\cdots+a_{m} T^{m}p(T)=a0I+a1T+a2T2++amTm 的算子.
这是符号 p p ppp 的新用法,因为我们把它作用于算子,而不仅仅作用于 F F F\mathbf{F}F 的元素.
5.18 例 设 D L ( P ( R ) ) D L ( P ( R ) ) D inL(P(R))D \in \mathcal{L}(\mathcal{P}(\mathbf{R}))DL(P(R)) 是由 D q = q D q = q Dq=q^(')D q=q^{\prime}Dq=q 定义的微分算子, p p ppp 是多项式 p ( x ) = p ( x ) = p(x)=p(x)=p(x)= 7 3 x + 5 x 2 7 3 x + 5 x 2 7-3x+5x^(2)7-3 x+5 x^{2}73x+5x2 。则 p ( D ) = 7 I 3 D + 5 D 2 p ( D ) = 7 I 3 D + 5 D 2 p(D)=7I-3D+5D^(2)p(D)=7 I-3 D+5 D^{2}p(D)=7I3D+5D2 。于是对每个 q P ( R ) q P ( R ) q inP(R)q \in \mathcal{P}(\mathbf{R})qP(R) ( p ( D ) ) q = ( p ( D ) ) q = (p(D))q=(p(D)) q=(p(D))q= 7 q 3 q + 5 q 7 q 3 q + 5 q 7q-3q^(')+5q^('')7 q-3 q^{\prime}+5 q^{\prime \prime}7q3q+5q.
请自行验证,如果固定一个算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) ,则由 p p ( T ) p p ( T ) p|->p(T)p \mapsto p(T)pp(T) 所定义的从 P ( F ) P ( F ) P(F)\mathcal{P}(\mathbf{F})P(F) L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 的函数是线性的.

5.19 定义 多项式的积 (product of polynomials)

p , q P ( F ) p , q P ( F ) p,q inP(F)p, q \in \mathcal{P}(\mathbf{F})p,qP(F), 则 p q P ( F ) p q P ( F ) pq inP(F)p q \in \mathcal{P}(\mathbf{F})pqP(F) 是如下定义的多项式: 对 z F z F z inFz \in \mathbf{F}zF ( p q ) ( z ) = ( p q ) ( z ) = (pq)(z)=(p q)(z)=(pq)(z)= p ( z ) q ( z ) p ( z ) q ( z ) p(z)q(z)p(z) q(z)p(z)q(z).
下面我们将要证明:一个算子的任意两个多项式是交换的。

5.20 乘积性质

p , q P ( F ) , T L ( V ) p , q P ( F ) , T L ( V ) p,q inP(F),T inL(V)p, q \in \mathcal{P}(\mathbf{F}), T \in \mathcal{L}(V)p,qP(F),TL(V). 则
(a) ( p q ) ( T ) = p ( T ) q ( T ) ( p q ) ( T ) = p ( T ) q ( T ) (pq)(T)=p(T)q(T)(p q)(T)=p(T) q(T)(pq)(T)=p(T)q(T);
(b) p ( T ) q ( T ) = q ( T ) p ( T ) p ( T ) q ( T ) = q ( T ) p ( T ) p(T)q(T)=q(T)p(T)p(T) q(T)=q(T) p(T)p(T)q(T)=q(T)p(T).
(a) 成立是因为在用分配性质把多项式的乘积展开时,其中的符号是 z z zzz 还是 T T TTT 没有什么影响。

证明

(a) 设 p ( z ) = j = 0 m a j z j , q ( z ) = k = 0 n b k z k p ( z ) = j = 0 m a j z j , q ( z ) = k = 0 n b k z k p(z)=sum_(j=0)^(m)a_(j)z^(j),q(z)=sum_(k=0)^(n)b_(k)z^(k)p(z)=\sum_{j=0}^{m} a_{j} z^{j}, q(z)=\sum_{k=0}^{n} b_{k} z^{k}p(z)=j=0majzj,q(z)=k=0nbkzk, 其中 z F z F z inFz \in \mathbf{F}zF. 则
( p q ) ( z ) = j = 0 m k = 0 n a j b k z j + k ( p q ) ( z ) = j = 0 m k = 0 n a j b k z j + k (pq)(z)=sum_(j=0)^(m)sum_(k=0)^(n)a_(j)b_(k)z^(j+k)(p q)(z)=\sum_{j=0}^{m} \sum_{k=0}^{n} a_{j} b_{k} z^{j+k}(pq)(z)=j=0mk=0najbkzj+k
于是
( p q ) ( T ) = j = 0 m k = 0 n a j b k T j + k = ( j = 0 m a j T j ) ( k = 0 n b k T k ) = p ( T ) q ( T ) ( p q ) ( T ) = j = 0 m k = 0 n a j b k T j + k = j = 0 m a j T j k = 0 n b k T k = p ( T ) q ( T ) (pq)(T)=sum_(j=0)^(m)sum_(k=0)^(n)a_(j)b_(k)T^(j+k)=(sum_(j=0)^(m)a_(j)T^(j))(sum_(k=0)^(n)b_(k)T^(k))=p(T)q(T)(p q)(T)=\sum_{j=0}^{m} \sum_{k=0}^{n} a_{j} b_{k} T^{j+k}=\left(\sum_{j=0}^{m} a_{j} T^{j}\right)\left(\sum_{k=0}^{n} b_{k} T^{k}\right)=p(T) q(T)(pq)(T)=j=0mk=0najbkTj+k=(j=0majTj)(k=0nbkTk)=p(T)q(T)
(b) 因为 (a), 我们有 p ( T ) q ( T ) = ( p q ) ( T ) = ( q p ) ( T ) = q ( T ) p ( T ) p ( T ) q ( T ) = ( p q ) ( T ) = ( q p ) ( T ) = q ( T ) p ( T ) p(T)q(T)=(pq)(T)=(qp)(T)=q(T)p(T)p(T) q(T)=(p q)(T)=(q p)(T)=q(T) p(T)p(T)q(T)=(pq)(T)=(qp)(T)=q(T)p(T).

本征值的存在性

现在给出复向量空间上算子的中心结果之一.

5.21 复向量空间上的算子都有本征值

有限维非零复向量空间上的每个算子都有本征值.
证明 设 V V VVV n n nnn 维复向量空间, n > 0 n > 0 n > 0n>0n>0 ,并设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 取 v V v V v in Vv \in VvV v 0 v 0 v!=0v \neq 0v0. 因为 V V VVV n n nnn 维的,所以 n + 1 n + 1 n+1n+1n+1 个向量
v , T v , T 2 v , , T n v v , T v , T 2 v , , T n v v,Tv,T^(2)v,dots,T^(n)vv, T v, T^{2} v, \ldots, T^{n} vv,Tv,T2v,,Tnv
线性相关. 于是有不全为 0 的复数 a 0 , , a n a 0 , , a n a_(0),dots,a_(n)a_{0}, \ldots, a_{n}a0,,an 使得
0 = a 0 v + a 1 T v + + a n T n v 0 = a 0 v + a 1 T v + + a n T n v 0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v0=a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v0=a0v+a1Tv++anTnv
注意 a 1 , , a n a 1 , , a n a_(1),dots,a_(n)a_{1}, \ldots, a_{n}a1,,an 不全为 0 , 否则上面等式将变成 0 = a 0 v 0 = a 0 v 0=a_(0)v0=a_{0} v0=a0v, 这将使 a 0 a 0 a_(0)a_{0}a0 也必须是 0.
以这些 a j a j a_(j)a_{j}aj 为系数作一个多项式,利用代数学基本定理 4.14 可将此多项式分解成
a 0 + a 1 z + + a n z n = c ( z λ 1 ) ( z λ m ) a 0 + a 1 z + + a n z n = c z λ 1 z λ m a_(0)+a_(1)z+cdots+a_(n)z^(n)=c(z-lambda_(1))cdots(z-lambda_(m))a_{0}+a_{1} z+\cdots+a_{n} z^{n}=c\left(z-\lambda_{1}\right) \cdots\left(z-\lambda_{m}\right)a0+a1z++anzn=c(zλ1)(zλm)
其中 c c ccc 是非零复数,每个 λ j λ j lambda_(j)\lambda_{j}λj 属于 C C C\mathbf{C}C ,且上面等式对所有 z C z C z inCz \in \mathbf{C}zC 均成立(这里 m m mmm 未必等于 n n nnn, 因为 a n a n a_(n)a_{n}an 可能等于 0 ). 则
0 = a 0 v + a 1 T v + + a n T n v = ( a 0 I + a 1 T + + a n T n ) v = c ( T λ 1 I ) ( T λ m I ) v 0 = a 0 v + a 1 T v + + a n T n v = a 0 I + a 1 T + + a n T n v = c T λ 1 I T λ m I v {:[0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v],[=(a_(0)I+a_(1)T+cdots+a_(n)T^(n))v],[=c(T-lambda_(1)I)cdots(T-lambda_(m)I)v]:}\begin{aligned} 0 & =a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v \\ & =\left(a_{0} I+a_{1} T+\cdots+a_{n} T^{n}\right) v \\ & =c\left(T-\lambda_{1} I\right) \cdots\left(T-\lambda_{m} I\right) v \end{aligned}0=a0v+a1Tv++anTnv=(a0I+a1T++anTn)v=c(Tλ1I)(TλmI)v
于是至少有一个 j j jjj 使得 ( T λ j I ) T λ j I (T-lambda_(j)I)\left(T-\lambda_{j} I\right)(TλjI) 不是单的. 也就是说, T T TTT 有本征值.
上面的证明依赖于代数学基本定理, 这是该结果一个典型的证明. 此结果的其他证明见习题 16 和习题 17,思路与上面的证明稍有不同.

上三角矩阵

在第3章我们讨论了从一个向量空间到另一个向量空间的线性映射的矩阵. 该矩阵依赖于这两个向量空间的基的选取。既然我们要研究将向量空间映到其自身的算子,要强调的就是现在只使用一个基。

5.22 定义 算子的矩阵(matrix of an operator), M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T)

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) ,并设 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基. T T TTT 关于该基的矩阵定义为 n × n n × n n xx nn \times nn×n 矩阵
M ( T ) = ( A 1 , 1 A 1 , n A n , 1 A n , n ) M ( T ) = A 1 , 1 A 1 , n A n , 1 A n , n M(T)=([A_(1,1),dots,A_(1,n)],[vdots,,vdots],[A_(n,1),dots,A_(n,n)])\mathcal{M}(T)=\left(\begin{array}{ccc} A_{1,1} & \ldots & A_{1, n} \\ \vdots & & \vdots \\ A_{n, 1} & \ldots & A_{n, n} \end{array}\right)M(T)=(A1,1A1,nAn,1An,n)
其元素 A j , k A j , k A_(j,k)A_{j, k}Aj,k 定义为
T v k = A 1 , k v 1 + + A n , k v n T v k = A 1 , k v 1 + + A n , k v n Tv_(k)=A_(1,k)v_(1)+cdots+A_(n,k)v_(n)T v_{k}=A_{1, k} v_{1}+\cdots+A_{n, k} v_{n}Tvk=A1,kv1++An,kvn
如果基在上下文中不是自明的,则使用记号 M ( T , ( v 1 , , v n ) ) M T , v 1 , , v n M(T,(v_(1),dots,v_(n)))\mathcal{M}\left(T,\left(v_{1}, \ldots, v_{n}\right)\right)M(T,(v1,,vn))
注意算子的矩阵是正方形阵列,而早先考虑的线性映射的矩阵是更一般的长方形阵列。
T v k T v k Tv_(k)T v_{k}Tvk 写成 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 的线性组合时使用的那些系数构成了矩阵 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的第 k k kkk 列。
T T TTT F n F n F^(n)\mathbf{F}^{n}Fn 的算子,且没有指定基,则假定为标准基(第 j j jjj 个基向量的第 j j jjj 个位置是 1 ,其余位置均为 0 )。此时可以认为 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的第 j j jjj列是 T T TTT 作用到第 j j jjj 个标准基上得到的向量。
5.23 例 定义 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T(x,y,z)=(2x+y,5y+3z,8z)T(x, y, z)=(2 x+y, 5 y+3 z, 8 z)T(x,y,z)=(2x+y,5y+3z,8z). 则
M ( T ) = ( 2 1 0 0 5 3 0 0 8 ) M ( T ) = 2      1      0 0      5      3 0      0      8 M(T)=([2,1,0],[0,5,3],[0,0,8])\mathcal{M}(T)=\left(\begin{array}{lll} 2 & 1 & 0 \\ 0 & 5 & 3 \\ 0 & 0 & 8 \end{array}\right)M(T)=(210053008)
线性代数的一个中心目标就是要证明,对于给定的算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) ,必定存在 V V VVV的一个基使得 T T TTT 关于该基有一个相当简单的矩阵。这种表述比较含糊,说得更具体一点,就是我们要选择 V V VVV 的基以使 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 有很多的 0 。
V V VVV 是有限维的复向量空间,那么我们已经知道很多,足以证明 V V VVV 有一个基使得 T T TTT 关于这个基的矩阵的第一列除第一个元素之外全是 0 , 也就是说, V V VVV 有一个基使得 T T TTT 关于这个基的矩阵形如
( λ 0 0 ) λ 0 0 ([lambda,,],[0,**],[vdots,],[0,])\left(\begin{array}{ccc} \lambda & & \\ 0 & * \\ \vdots & \\ 0 & \end{array}\right)(λ00)
这里 * 表示第一列之外的所有其他元素。为了证明这个事实, 设 λ λ lambda\lambdaλ T T TTT 的本征值 (由 5.21 知一定存在),并且 v v vvv 是相应的本征向量。把 v v vvv 扩充成 V V VVV 的基,则 T T TTT 关于这个基的矩阵就有上述形式。
马上就会看到, 可以选取 V V VVV 的一个基使得 T T TTT 关于这个基的矩阵有更多的 0.

5.24 定义 矩阵的对角线(diagonal of a matrix)

方阵的对角线由位于从左上角到右下角的直线上的元素组成.
例如, 5.23 中矩阵的对角线由元素 2 , 5 , 8 2 , 5 , 8 2,5,82,5,82,5,8 组成.

5.25 定义 上三角矩阵(upper-triangular matrix)

一个矩阵称为上三角的,如果位于对角线下方的元素全为 0 。
例如, 5.23 中的矩阵是上三角的.
上三角矩阵具有如下的典型形式
( λ 1 0 λ n ) λ 1 0 λ n ([lambda_(1),,**],[,ddots,],[0,,lambda_(n)])\left(\begin{array}{ccc} \lambda_{1} & & * \\ & \ddots & \\ 0 & & \lambda_{n} \end{array}\right)(λ10λn)
上面矩阵中的那个 0 表示在这个 n × n n × n n xx nn \times nn×n 矩阵中位于对角线下方的元素全等于 0 。可以认为上三角矩阵是相当简单的——因为当 n n nnn 比较大时,
我们经常用 *** 表示矩阵的末知元素或其取值对所讨论的问题无关紧要的元素。
n × n n × n n xx nn \times nn×n 上三角矩阵有几乎一半的元素等于 0 。
下面的命题揭示了上三角矩阵与不变子空间之间的一个很有用的联系.

5.26 上三角矩阵的条件

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V), 且 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基. 则以下条件等价:
(a) T T TTT 关于 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 的矩阵是上三角的;
(b) 对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n T v j span ( v 1 , , v j ) T v j span v 1 , , v j Tv_(j)in span(v_(1),dots,v_(j))T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)Tvjspan(v1,,vj);
(c) 对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n span ( v 1 , , v j ) span v 1 , , v j span(v_(1),dots,v_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(v1,,vj) T T TTT 下不变.
证明 根据定义,稍加思考即可得(a)和(b)的等价性。显然(c)蕴涵(b)。因此,为了完成证明,只需证明(b)蕴涵(c)。
假设(b)成立。取定 j { 1 , , n } j { 1 , , n } j in{1,dots,n}j \in\{1, \ldots, n\}j{1,,n} 。由 (b) 可知
T v 1 span ( v 1 ) span ( v 1 , , v j ) , T v 2 span ( v 1 , v 2 ) span ( v 1 , , v j ) T v 1 span v 1 span v 1 , , v j , T v 2 span v 1 , v 2 span v 1 , , v j {:[Tv_(1)in span(v_(1))sub span(v_(1),dots,v_(j))","],[Tv_(2)in span(v_(1),v_(2))sub span(v_(1),dots,v_(j))]:}\begin{aligned} & T v_{1} \in \operatorname{span}\left(v_{1}\right) \subset \operatorname{span}\left(v_{1}, \ldots, v_{j}\right), \\ & T v_{2} \in \operatorname{span}\left(v_{1}, v_{2}\right) \subset \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) \end{aligned}Tv1span(v1)span(v1,,vj),Tv2span(v1,v2)span(v1,,vj)
T v j span ( v 1 , , v j ) T v j span v 1 , , v j Tv_(j)in span(v_(1),dots,v_(j))T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)Tvjspan(v1,,vj)
因此,若 v v vvv v 1 , , v j v 1 , , v j v_(1),dots,v_(j)v_{1}, \ldots, v_{j}v1,,vj 的线性组合,则
T v span ( v 1 , , v j ) T v span v 1 , , v j Tv in span(v_(1),dots,v_(j))T v \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)Tvspan(v1,,vj)
也就是说 span ( v 1 , , v j ) span v 1 , , v j span(v_(1),dots,v_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(v1,,vj) T T TTT 下不变。
现在我们可以证明:对于复向量空间上的每个算子,都有一个基使得该算子关于这个基的矩阵的对角线下方只有 0 . 在第 8 章我们将改进这个结果。
深刻的见解往往源于一个定理的多种证明。因此我们对下面的定理给出两个证明。你可以采用其中更合你心意的那一个。
下面的定理对实向量空间不成立,这是因为, 若算子关于一个基有上三角矩阵, 则这个基的第一个向量必定是该算子的本征向量。因此,若实向量空间上的一个算子没有本征值(例如,见5.8(a)),则该算子关于任何基都不会有上三角矩阵。

5.27 在 C 上, 每个算子均有上三角矩阵

V V VVV 是有限维复向量空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。则 T T TTT 关于 V V VVV 的某个基有上三角矩阵.
证明 1 对 V V VVV 的维数用归纳法. 若 dim V = 1 dim V = 1 dim V=1\operatorname{dim} V=1dimV=1, 则结论显然成立.
现在假设 dim V > 1 dim V > 1 dim V > 1\operatorname{dim} V>1dimV>1, 并设对于所有维数比 V V VVV 小的复向量空间结论都成立. 设 λ λ lambda\lambdaλ T T TTT 的任意本征值( 5.21 保证了 T T TTT 有本征值)。设
U = range ( T λ I ) U = range ( T λ I ) U=range(T-lambda I)U=\operatorname{range}(T-\lambda I)U=range(TλI)
因为 ( T λ I ) ( T λ I ) (T-lambda I)(T-\lambda I)(TλI) 不是满的(参见 3.69),所以 dim U < dim V dim U < dim V dim U < dim V\operatorname{dim} U<\operatorname{dim} VdimU<dimV 。进一步, U U UUU T T TTT 下不变。为了证明这点, 设 u U u U u in Uu \in UuU. 则
T u = ( T λ I ) u + λ u T u = ( T λ I ) u + λ u Tu=(T-lambda I)u+lambda uT u=(T-\lambda I) u+\lambda uTu=(TλI)u+λu
显然, ( T λ I ) u U ( T λ I ) u U (T-lambda I)u in U(T-\lambda I) u \in U(TλI)uU (因为 U U UUU 等于 ( T λ I ) ( T λ I ) (T-lambda I)(T-\lambda I)(TλI) 的值域),并且 λ u U λ u U lambda u in U\lambda u \in UλuU 。因此上式表明 T u U T u U Tu in UT u \in UTuU 。所以 U U UUU T T TTT 下不变。
因此 T | U T U T|_(U)\left.T\right|_{U}T|U U U UUU 上的算子。由归纳法假设, U U UUU 有基 u 1 , , u m u 1 , , u m u_(1),dots,u_(m)u_{1}, \ldots, u_{m}u1,,um 使得 T | U T U T|_(U)\left.T\right|_{U}T|U 关于这个基有上三角矩阵. 因此, 对每个 j j jjj 都有(利用 5.26)

5.28

T u j = ( T | U ) ( u j ) span ( u 1 , , u j ) T u j = T U u j span u 1 , , u j Tu_(j)=(T|_(U))(u_(j))in span(u_(1),dots,u_(j))T u_{j}=\left(\left.T\right|_{U}\right)\left(u_{j}\right) \in \operatorname{span}\left(u_{1}, \ldots, u_{j}\right)Tuj=(T|U)(uj)span(u1,,uj)
u 1 , , u m u 1 , , u m u_(1),dots,u_(m)u_{1}, \ldots, u_{m}u1,,um 扩充成 V V VVV 的基 u 1 , , u m , v 1 , , v n u 1 , , u m , v 1 , , v n u_(1),dots,u_(m),v_(1),dots,v_(n)u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{n}u1,,um,v1,,vn 。对每个 k k kkk 都有
T v k = ( T λ I ) v k + λ v k T v k = ( T λ I ) v k + λ v k Tv_(k)=(T-lambda I)v_(k)+lambdav_(k)T v_{k}=(T-\lambda I) v_{k}+\lambda v_{k}Tvk=(TλI)vk+λvk
U U UUU 的定义表明 ( T λ I ) v k U = span ( u 1 , , u m ) ( T λ I ) v k U = span u 1 , , u m (T-lambda I)v_(k)in U=span(u_(1),dots,u_(m))(T-\lambda I) v_{k} \in U=\operatorname{span}\left(u_{1}, \ldots, u_{m}\right)(TλI)vkU=span(u1,,um). 因此由上式可得
5.29
T v k span ( u 1 , , u m , v 1 , , v k ) T v k span u 1 , , u m , v 1 , , v k Tv_(k)in span(u_(1),dots,u_(m),v_(1),dots,v_(k))T v_{k} \in \operatorname{span}\left(u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{k}\right)Tvkspan(u1,,um,v1,,vk)
利用 5.26,由 5.28 和 5.29 可知 T T TTT 关于基 u 1 , , u m , v 1 , , v n u 1 , , u m , v 1 , , v n u_(1),dots,u_(m),v_(1),dots,v_(n)u_{1}, \ldots, u_{m}, v_{1}, \ldots, v_{n}u1,,um,v1,,vn 有上三角矩阵.证明 2 对 V V VVV 的维数用归纳法. 若 dim V = 1 dim V = 1 dim V=1\operatorname{dim} V=1dimV=1, 则结论显然成立.
现在假设 dim V = n > 1 dim V = n > 1 dim V=n > 1\operatorname{dim} V=n>1dimV=n>1, 并设对于所有 n 1 n 1 n-1n-1n1 维的复向量空间结果均成立. 设 v 1 v 1 v_(1)v_{1}v1 T T TTT 的任意一个本征向量(5.21 保证了 T T TTT 有本征向量)。设 U = span ( v 1 ) U = span v 1 U=span(v_(1))U=\operatorname{span}\left(v_{1}\right)U=span(v1) 。则 U U UUU T T TTT 的不变子空间且 dim U = 1 dim U = 1 dim U=1\operatorname{dim} U=1dimU=1
由于 dim V / U = n 1 dim V / U = n 1 dim V//U=n-1\operatorname{dim} V / U=n-1dimV/U=n1 (见 3.89),我们可以对 T / U L ( V / U ) T / U L ( V / U ) T//U inL(V//U)T / U \in \mathcal{L}(V / U)T/UL(V/U) 用归纳法假设。于是 V / U V / U V//UV / UV/U 有一个基 v 2 + U , , v n + U v 2 + U , , v n + U v_(2)+U,dots,v_(n)+Uv_{2}+U, \ldots, v_{n}+Uv2+U,,vn+U 使得 T / U T / U T//UT / UT/U 关于该基有上三角矩阵。由 5.26 , 对每个 j = 2 , , n j = 2 , , n j=2,dots,nj=2, \ldots, nj=2,,n
( T / U ) ( v j + U ) span ( v 2 + U , , v j + U ) ( T / U ) v j + U span v 2 + U , , v j + U (T//U)(v_(j)+U)in span(v_(2)+U,dots,v_(j)+U)(T / U)\left(v_{j}+U\right) \in \operatorname{span}\left(v_{2}+U, \ldots, v_{j}+U\right)(T/U)(vj+U)span(v2+U,,vj+U)
通过解释上面这个包含关系的含义可知,对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n
T v j span ( v 1 , , v j ) T v j span v 1 , , v j Tv_(j)in span(v_(1),dots,v_(j))T v_{j} \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)Tvjspan(v1,,vj)
于是由 5.26 , T 5.26 , T 5.26,T5.26, T5.26,T 关于 V V VVV 的基 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 具有上三角矩阵(容易验证 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基. 更一般的结论,请参见 3.E 节的习题 13)。
如何通过观察一个算子的矩阵来确定该算子是否可逆呢?如果我们很幸运地有一个基使得该算子关于这个基的矩阵是上三角的,那么问题就会变得很简单,如下面的命题所示。

5.30 由上三角矩阵确定可逆性

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 关于 V V VVV 的某个基有上三角矩阵. 则 T T TTT 是可逆的当且仅当这个上三角矩阵对角线上的元素都不是 0 。
证明 设 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基使得 T T TTT 关于这个基具有上三角矩阵
5.31
M ( T ) = ( λ 1 λ 2 0 λ n ) M ( T ) = λ 1 λ 2 0 λ n M(T)=([lambda_(1),,,**],[,lambda_(2),,],[,,ddots,],[0,,,lambda_(n)])\mathcal{M}(T)=\left(\begin{array}{cccc} \lambda_{1} & & & * \\ & \lambda_{2} & & \\ & & \ddots & \\ 0 & & & \lambda_{n} \end{array}\right)M(T)=(λ1λ20λn)
我们需要证明: T T TTT 是可逆的当且仅当所有 λ j λ j lambda_(j)\lambda_{j}λj 均不为 0 .
首先设对角线元素 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 均不为 0.5 .31 中的上三角阵表明 T v 1 = λ 1 v 1 T v 1 = λ 1 v 1 Tv_(1)=lambda_(1)v_(1)T v_{1}=\lambda_{1} v_{1}Tv1=λ1v1 。因为 λ 1 0 λ 1 0 lambda_(1)!=0\lambda_{1} \neq 0λ10 ,所以 T ( v 1 / λ 1 ) = v 1 T v 1 / λ 1 = v 1 T(v_(1)//lambda_(1))=v_(1)T\left(v_{1} / \lambda_{1}\right)=v_{1}T(v1/λ1)=v1 。于是 v 1 range T v 1 range T v_(1)in range Tv_{1} \in \operatorname{range} Tv1rangeT
现在对某个 a F a F a inFa \in \mathbf{F}aF
T ( v 2 / λ 2 ) = a v 1 + v 2 T v 2 / λ 2 = a v 1 + v 2 T(v_(2)//lambda_(2))=av_(1)+v_(2)T\left(v_{2} / \lambda_{2}\right)=a v_{1}+v_{2}T(v2/λ2)=av1+v2
上式左端以及 a ν 1 a ν 1 anu_(1)a \nu_{1}aν1 均含于 range T T TTT 。于是 v 2 range T v 2 range T v_(2)in range Tv_{2} \in \operatorname{range} Tv2rangeT
类似地,对某个 b , c F b , c F b,c inFb, c \in \mathbf{F}b,cF
T ( v 3 / λ 3 ) = b v 1 + c v 2 + v 3 . T v 3 / λ 3 = b v 1 + c v 2 + v 3 . T(v_(3)//lambda_(3))=bv_(1)+cv_(2)+v_(3).T\left(v_{3} / \lambda_{3}\right)=b v_{1}+c v_{2}+v_{3} .T(v3/λ3)=bv1+cv2+v3.
上式左端以及 b v 1 b v 1 bv_(1)b v_{1}bv1 c v 2 c v 2 cv_(2)c v_{2}cv2 均含于 range T T TTT. 于是 v 3 range T v 3 range T v_(3)in range Tv_{3} \in \operatorname{range} Tv3rangeT.
依此类推,可知 v 1 , , v n range T v 1 , , v n range T v_(1),dots,v_(n)in range Tv_{1}, \ldots, v_{n} \in \operatorname{range} Tv1,,vnrangeT 。因为 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基, 所以 range T = range T = range T=\operatorname{range} T=rangeT= V V VVV 。也就是说 T T TTT 是满的。于是 T T TTT 是可逆的(由于3.69)。
现在证明另一个方向,设 T T TTT 是可逆的。这表明 λ 1 0 λ 1 0 lambda_(1)!=0\lambda_{1} \neq 0λ10 ,否则有 T ν 1 = 0 T ν 1 = 0 Tnu_(1)=0T \nu_{1}=0Tν1=0 。设 1 < j n , λ j = 0 1 < j n , λ j = 0 1 < j <= n,lambda_(j)=01<j \leq n, \lambda_{j}=01<jn,λj=0 。则 5.31 表明 T T TTT span ( v 1 , , v j ) span v 1 , , v j span(v_(1),dots,v_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(v1,,vj) 映入 span ( v 1 , , v j 1 ) span v 1 , , v j 1 span(v_(1),dots,v_(j-1))\operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)span(v1,,vj1) 。由于
dim span ( v 1 , , v j ) = j dim span ( v 1 , , v j 1 ) = j 1 , dim span v 1 , , v j = j  且  dim span v 1 , , v j 1 = j 1 dim span(v_(1),dots,v_(j))=j quad" 且 "quad dim span(v_(1),dots,v_(j-1))=j-1", "\operatorname{dim} \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)=j \quad \text { 且 } \quad \operatorname{dim} \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)=j-1 \text {, }dimspan(v1,,vj)=j 且 dimspan(v1,,vj1)=j1
这表明 T T TTT 限制在 span ( v 1 , , v j ) span v 1 , , v j span(v_(1),dots,v_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(v1,,vj) 上不是单的(由于3.23)。因此有 v span ( v 1 , , v j ) v span v 1 , , v j v in span(v_(1),dots,v_(j))v \in \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)vspan(v1,,vj)使得 v 0 v 0 v!=0v \neq 0v0 T v = 0 T v = 0 Tv=0T v=0Tv=0. 于是 T T TTT 不是单的, 这与 T T TTT 是可逆的假设相矛盾. 这个矛盾表明 λ j = 0 λ j = 0 lambda_(j)=0\lambda_{j}=0λj=0 一定不成立. 于是 λ j 0 λ j 0 lambda_(j)!=0\lambda_{j} \neq 0λj0
作为上述命题的一个应用,我们看到例 5.23 中的算子是可逆的.
令人遗憾的是,现在还无法利用算子的矩阵来精确计算算子的本征值。但是,如果我们
利用算子的矩阵,有强大的数值技术来近似计算算子的本征值。
有幸找到一个基使得算子关于这个基的矩阵是上三角的,则本征值的计算问题就变得平凡了,如下面的定理所示。

5.32 从上三角矩阵确定本征值

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 关于 V V VVV 的某个基有上三角矩阵。则 T T TTT 的本征值恰为这个上三角矩阵对角线上的元素。
证明 设 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基,并且 T T TTT 关于这个基有上三角矩阵
M ( T ) = ( λ 1 λ 2 0 λ n ) M ( T ) = λ 1                     λ 2                          0                λ n M(T)=([lambda_(1),,,**],[,lambda_(2),,],[,,ddots,],[0,,,lambda_(n)])\mathcal{M}(T)=\left(\begin{array}{llll} \lambda_{1} & & & * \\ & \lambda_{2} & & \\ & & \ddots & \\ 0 & & & \lambda_{n} \end{array}\right)M(T)=(λ1λ20λn)
λ F λ F lambda inF\lambda \in \mathbf{F}λF. 则
M ( T λ I ) = ( λ 1 λ λ 2 λ 0 λ n λ ) M ( T λ I ) = λ 1 λ λ 2 λ 0 λ n λ M(T-lambda I)=([lambda_(1)-lambda,,,**],[,lambda_(2)-lambda,,],[,,ddots,],[0,,,lambda_(n)-lambda])\mathcal{M}(T-\lambda I)=\left(\begin{array}{cccc} \lambda_{1}-\lambda & & & * \\ & \lambda_{2}-\lambda & & \\ & & \ddots & \\ 0 & & & \lambda_{n}-\lambda \end{array}\right)M(TλI)=(λ1λλ2λ0λnλ)
因此, ( T λ I ) ( T λ I ) (T-lambda I)(T-\lambda I)(TλI) 不可逆当且仅当 λ λ lambda\lambdaλ 等于 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 中的某一个(由于 5.30)。于是 λ λ lambda\lambdaλ T T TTT 的本征值当且仅当 λ λ lambda\lambdaλ 等于 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 中的某一个.
5.33 例 定义 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T(x,y,z)=(2x+y,5y+3z,8z)T(x, y, z)=(2 x+y, 5 y+3 z, 8 z)T(x,y,z)=(2x+y,5y+3z,8z). 求 T T TTT 的本征值.解 T T TTT 关于标准基的矩阵为
M ( T ) = ( 2 1 0 0 5 3 0 0 8 ) M ( T ) = 2      1      0 0      5      3 0      0      8 M(T)=([2,1,0],[0,5,3],[0,0,8])\mathcal{M}(T)=\left(\begin{array}{lll} 2 & 1 & 0 \\ 0 & 5 & 3 \\ 0 & 0 & 8 \end{array}\right)M(T)=(210053008)
M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 是上三角矩阵. 5.32 表明 T T TTT 的本征值是 2 , 5 , 8 2 , 5 , 8 2,5,82,5,82,5,8.
一旦知道 F n F n F^(n)\mathbf{F}^{n}Fn 上一个算子的本征值,就很容易利用高斯消元法求出本征向量.

习题 5.B

1 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 且存在正整数 n n nnn 使得 T n = 0 T n = 0 T^(n)=0T^{n}=0Tn=0.
(a) 证明 ( I T ) ( I T ) (I-T)(I-T)(IT) 是可逆的且 ( I T ) 1 = I + T + + T n 1 ( I T ) 1 = I + T + + T n 1 (I-T)^(-1)=I+T+cdots+T^(n-1)(I-T)^{-1}=I+T+\cdots+T^{n-1}(IT)1=I+T++Tn1.
(b) 解释一下如何想到上面的公式.
2 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) ( T 2 I ) ( T 3 I ) ( T 4 I ) = 0 ( T 2 I ) ( T 3 I ) ( T 4 I ) = 0 (T-2I)(T-3I)(T-4I)=0(T-2 I)(T-3 I)(T-4 I)=0(T2I)(T3I)(T4I)=0. 设 λ λ lambda\lambdaλ T T TTT 的本征值. 证明 λ = 2 λ = 2 lambda=2\lambda=2λ=2 λ = 3 λ = 3 lambda=3\lambda=3λ=3 λ = 4 λ = 4 lambda=4\lambda=4λ=4
3 设 T L ( V ) , T 2 = I T L ( V ) , T 2 = I T inL(V),T^(2)=IT \in \mathcal{L}(V), T^{2}=ITL(V),T2=I 且 -1 不是 T T TTT 的本征值. 证明 T = I T = I T=IT=IT=I.
4 设 P L ( V ) , P 2 = P P L ( V ) , P 2 = P P inL(V),P^(2)=PP \in \mathcal{L}(V), P^{2}=PPL(V),P2=P. 证明 V = V = V=V=V= null P range P P range P P o+range PP \oplus \operatorname{range} PPrangeP.
5 设 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V) S S SSS 是可逆的. 设 p P ( F ) p P ( F ) p inP(F)p \in \mathcal{P}(\mathbf{F})pP(F) 是多项式. 证明 p ( S T S 1 ) = p S T S 1 = p(STS^(-1))=p\left(S T S^{-1}\right)=p(STS1)= S p ( T ) S 1 S p ( T ) S 1 Sp(T)S^(-1)S p(T) S^{-1}Sp(T)S1
6 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) U U UUU V V VVV 的在 T T TTT 下不变的子空间。证明:对每个多项式 p P ( F ) p P ( F ) p inP(F)p \in \mathcal{P}(\mathbf{F})pP(F)都有 U U UUU p ( T ) p ( T ) p(T)p(T)p(T) 下不变。
7 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明 9 是 T 2 T 2 T^(2)T^{2}T2 的本征值当且仅当 3 或 -3 是 T T TTT 的本征值.
8 找出一个 T L ( R 2 ) T L R 2 T inL(R^(2))T \in \mathcal{L}\left(\mathbf{R}^{2}\right)TL(R2) 使得 T 4 = I T 4 = I T^(4)=-IT^{4}=-IT4=I.
9 设 V V VVV 是有限维的, T L ( V ) , v V T L ( V ) , v V T inL(V),v in VT \in \mathcal{L}(V), v \in VTL(V),vV v 0 v 0 v!=0v \neq 0v0 。设 p p ppp 是使得 p ( T ) v = 0 p ( T ) v = 0 p(T)v=0p(T) v=0p(T)v=0 的次数最小的非零多项式。证明 p p ppp 的每个零点都是 T T TTT 的本征值.
10 设 T L ( V ) , v T L ( V ) , v T inL(V),vT \in \mathcal{L}(V), vTL(V),v T T TTT 的相应于本征值 λ λ lambda\lambdaλ 的本征向量. 设 p P ( F ) p P ( F ) p inP(F)p \in \mathcal{P}(\mathbf{F})pP(F). 证明 p ( T ) v = p ( λ ) v p ( T ) v = p ( λ ) v p(T)v=p(lambda)vp(T) v=p(\lambda) vp(T)v=p(λ)v.
11 设 F = C , T L ( V ) , p P ( C ) F = C , T L ( V ) , p P ( C ) F=C,T inL(V),p inP(C)\mathbf{F}=\mathbf{C}, T \in \mathcal{L}(V), p \in \mathcal{P}(\mathbf{C})F=C,TL(V),pP(C) 是多项式, α C α C alpha inC\alpha \in \mathbf{C}αC 。证明: α α alpha\alphaα p ( T ) p ( T ) p(T)p(T)p(T) 的本征值当且仅当 T T TTT 有一个本征值 λ λ lambda\lambdaλ 使得 α = p ( λ ) α = p ( λ ) alpha=p(lambda)\alpha=p(\lambda)α=p(λ).
12 证明:若将 C C C\mathbf{C}C 换成 R R R\mathbf{R}R ,则上题的结论不再成立。
13 设 W W WWW 是复向量空间,并设 T L ( W ) T L ( W ) T inL(W)T \in \mathcal{L}(W)TL(W) 没有本征值。证明: W W WWW 的在 T T TTT 下不变的子空间是 { 0 } { 0 } {0}\{0\}{0} 或者是无限维的。
14 给出一个算子, 它关于某个基的矩阵的对角线上只有 0 , 但这个算子是可逆的.本题和下题表明,要是去掉 "上三角矩阵" 这一假设,5.30就不再成立。
15 给出一个算子,它关于某个基的矩阵的对角线上全是非零数,但这个算子是不可逆的。
16 利用将 p P n ( C ) p P n ( C ) p inP_(n)(C)p \in \mathcal{P}_{n}(\mathbf{C})pPn(C) 变为 ( p ( T ) ) v V ( p ( T ) ) v V (p(T))v in V(p(T)) v \in V(p(T))vV 的线性映射(并利用3.23)改写5.21的证明。
17 利用将 p P n 2 ( C ) p P n 2 ( C ) p inP_(n^(2))(C)p \in \mathcal{P}_{n^{2}}(\mathbf{C})pPn2(C) 变为 p ( T ) L ( V ) p ( T ) L ( V ) p(T)inL(V)p(T) \in \mathcal{L}(V)p(T)L(V) 的线性映射(并利用 3.23)改写5.21的证明。
18 设 V V VVV 是有限维的复向量空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 定义函数 f : C R f : C R f:CrarrRf: \mathbf{C} \rightarrow \mathbf{R}f:CR
f ( λ ) = dim range ( T λ I ) f ( λ ) = dim range ( T λ I ) f(lambda)=dim range(T-lambda I)f(\lambda)=\operatorname{dim} \operatorname{range}(T-\lambda I)f(λ)=dimrange(TλI)
证明 f f fff 不是连续函数.
19 设 V V VVV 是有限维的, dim V > 1 , T L ( V ) dim V > 1 , T L ( V ) dim V > 1,T inL(V)\operatorname{dim} V>1, T \in \mathcal{L}(V)dimV>1,TL(V) 。证明 { p ( T ) : p P ( F ) } L ( V ) { p ( T ) : p P ( F ) } L ( V ) {p(T):p inP(F)}!=L(V)\{p(T): p \in \mathcal{P}(\mathbf{F})\} \neq \mathcal{L}(V){p(T):pP(F)}L(V).
20 设 V V VVV 是有限维的复向量空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。证明:对每个 k = 1 , , dim V , T k = 1 , , dim V , T k=1,dots,dim V,Tk=1, \ldots, \operatorname{dim} V, Tk=1,,dimV,T 都有 k k kkk 维的不变子空间。

5.C 本征空间与对角矩阵

5.34 定义 对角矩阵(diagonal matrix)
对角矩阵是对角线以外的元素全是 0 的方阵。

5.35 例

( 8 0 0 0 5 0 0 0 5 ) 8      0      0 0      5      0 0      0      5 ([8,0,0],[0,5,0],[0,0,5])\left(\begin{array}{lll} 8 & 0 & 0 \\ 0 & 5 & 0 \\ 0 & 0 & 5 \end{array}\right)(800050005)
是对角矩阵。
显然每个对角矩阵都是上三角的,但是对角矩阵一般要比上三角矩阵有更多的 0.
若一个算子关于某个基有对角矩阵,则对角线上的元素恰为该算子的本征值. 这可由 5.32 得到(或直接给出一个对于对角矩阵的简单证明)。
5.36 定义 本征空间(eigenspace), E ( λ , T ) E ( λ , T ) E(lambda,T)E(\lambda, T)E(λ,T)
T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) λ F . T λ F . T lambda inF.T\lambda \in \mathbf{F} . TλF.T 的相应于 λ λ lambda\lambdaλ 的本征空间(记作 E ( λ , T ) E ( λ , T ) E(lambda,T)E(\lambda, T)E(λ,T) )定义为
E ( λ , T ) = null ( T λ I ) E ( λ , T ) = null ( T λ I ) E(lambda,T)=null(T-lambda I)E(\lambda, T)=\operatorname{null}(T-\lambda I)E(λ,T)=null(TλI)
也就是说, E ( λ , T ) E ( λ , T ) E(lambda,T)E(\lambda, T)E(λ,T) T T TTT 的相应于 λ λ lambda\lambdaλ 的全体本征向量加上 0 向量构成的集合.
对于 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) λ F λ F lambda inF\lambda \in \mathbf{F}λF ,本征空间 E ( λ , T ) E ( λ , T ) E(lambda,T)E(\lambda, T)E(λ,T) V V VVV 的子空间(因为 V V VVV 上每个线性映射的零空间都是 V V VVV 的子空间)。由定义可知 λ λ lambda\lambdaλ T T TTT 的本征值当且仅当 E ( λ , T ) { 0 } E ( λ , T ) { 0 } E(lambda,T)!={0}E(\lambda, T) \neq\{0\}E(λ,T){0}.
5.37 例 设算子 T ( V ) T ( V ) T in(V)T \in(V)T(V) 关于 V V VVV 的基 v 1 , v 2 , v 3 v 1 , v 2 , v 3 v_(1),v_(2),v_(3)v_{1}, v_{2}, v_{3}v1,v2,v3 的矩阵是上面例 5.35 中的矩阵。则
E ( 8 , T ) = span ( v 1 ) , E ( 5 , T ) = span ( v 2 , v 3 ) E ( 8 , T ) = span v 1 , E ( 5 , T ) = span v 2 , v 3 E(8,T)=span(v_(1)),quad E(5,T)=span(v_(2),v_(3))E(8, T)=\operatorname{span}\left(v_{1}\right), \quad E(5, T)=\operatorname{span}\left(v_{2}, v_{3}\right)E(8,T)=span(v1),E(5,T)=span(v2,v3)
λ λ lambda\lambdaλ T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 的本征值,则 T T TTT 限制到 E ( λ , T ) E ( λ , T ) E(lambda,T)E(\lambda, T)E(λ,T) 上恰为 λ λ lambda\lambdaλ 确定的标量乘算子。

5.38 本征空间之和是直和

V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 设 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的互异的本征值. 则
E ( λ 1 , T ) + + E ( λ m , T ) E λ 1 , T + + E λ m , T E(lambda_(1),T)+cdots+E(lambda_(m),T)E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right)E(λ1,T)++E(λm,T)
是直和. 此外,
dim E ( λ 1 , T ) + + dim E ( λ m , T ) dim V dim E λ 1 , T + + dim E λ m , T dim V dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) <= dim V\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) \leq \operatorname{dim} VdimE(λ1,T)++dimE(λm,T)dimV
证明 为了证明 E ( λ 1 , T ) + + E ( λ m , T ) E λ 1 , T + + E λ m , T E(lambda_(1),T)+cdots+E(lambda_(m),T)E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right)E(λ1,T)++E(λm,T) 是直和,假设
u 1 + + u m = 0 u 1 + + u m = 0 u_(1)+cdots+u_(m)=0u_{1}+\cdots+u_{m}=0u1++um=0
其中每个 u j u j u_(j)u_{j}uj 含于 E ( λ j , T ) E λ j , T E(lambda_(j),T)E\left(\lambda_{j}, T\right)E(λj,T) 。因为相应于不同本征值的本征向量是线性无关的(参见 5.10 ),所以每个 u j u j u_(j)u_{j}uj 均等于 0 。这表明 E ( λ 1 , T ) + + E ( λ m , T ) E λ 1 , T + + E λ m , T E(lambda_(1),T)+cdots+E(lambda_(m),T)E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right)E(λ1,T)++E(λm,T) 是直和(由于 1.44)。
现在有
dim E ( λ 1 , T ) + + dim E ( λ m , T ) = dim ( E ( λ 1 , T ) E ( λ m , T ) ) dim V dim E λ 1 , T + + dim E λ m , T = dim E λ 1 , T E λ m , T dim V dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T)=dim(E(lambda_(1),T)o+cdots o+E(lambda_(m),T)) <= dim V\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right)=\operatorname{dim}\left(E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right)\right) \leq \operatorname{dim} VdimE(λ1,T)++dimE(λm,T)=dim(E(λ1,T)E(λm,T))dimV,其中的等号由 2.C 节的习题 16 得到.

5.39 定义 可对角化 (diagonalizable)

算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 称为可对角化的,如果该算子关于 V V VVV 的某个基有对角矩阵。
5.40 例 定义 T L ( R 2 ) T L R 2 T inL(R^(2))T \in \mathcal{L}\left(\mathbf{R}^{2}\right)TL(R2) T ( x , y ) = ( 41 x + 7 y , 20 x + 74 y ) T ( x , y ) = ( 41 x + 7 y , 20 x + 74 y ) T(x,y)=(41 x+7y,-20 x+74 y)T(x, y)=(41 x+7 y,-20 x+74 y)T(x,y)=(41x+7y,20x+74y). T T TTT 关于 R 2 R 2 R^(2)\mathbf{R}^{2}R2 的标准基的矩阵为
( 41 7 20 74 ) 41 7 20 74 ([41,7],[-20,74])\left(\begin{array}{cc} 41 & 7 \\ -20 & 74 \end{array}\right)(4172074)
这不是一个对角矩阵. 但 T T TTT 可对角化,请验证 T T TTT 关于基 ( 1 , 4 ) , ( 7 , 5 ) ( 1 , 4 ) , ( 7 , 5 ) (1,4),(7,5)(1,4),(7,5)(1,4),(7,5) 的矩阵为
( 69 0 0 46 ) 69 0 0 46 ([69,0],[0,46])\left(\begin{array}{cc} 69 & 0 \\ 0 & 46 \end{array}\right)(690046)

5.41 可对角化的等价条件

V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 用 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm 表示 T T TTT 的所有互异的本征值. 则下列条件等价:
(a) T T TTT 可对角化;
(b) V V VVV 有由 T T TTT 的本征向量构成的基;
(c) V V VVV 有在 T T TTT 下不变的一维子空间 U 1 , , U n U 1 , , U n U_(1),dots,U_(n)U_{1}, \ldots, U_{n}U1,,Un 使得 V = U 1 U n V = U 1 U n V=U_(1)o+cdots o+U_(n)V=U_{1} \oplus \cdots \oplus U_{n}V=U1Un;
(d) V = E ( λ 1 , T ) E ( λ m , T ) V = E λ 1 , T E λ m , T V=E(lambda_(1),T)o+cdots o+E(lambda_(m),T)V=E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right)V=E(λ1,T)E(λm,T);
(e) dim V = dim E ( λ 1 , T ) + + dim E ( λ m , T ) dim V = dim E λ 1 , T + + dim E λ m , T dim V=dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T)\operatorname{dim} V=\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right)dimV=dimE(λ1,T)++dimE(λm,T).
证明 算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 关于 V V VVV 的基 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 有对角矩阵
( λ 1 0 0 λ n ) λ 1 0 0 λ n ([lambda_(1),,0],[,ddots,],[0,,lambda_(n)])\left(\begin{array}{ccc} \lambda_{1} & & 0 \\ & \ddots & \\ 0 & & \lambda_{n} \end{array}\right)(λ100λn)
当且仅当对每个 j j jjj 均有 T v j = λ j v j T v j = λ j v j Tv_(j)=lambda_(j)v_(j)T v_{j}=\lambda_{j} v_{j}Tvj=λjvj. 于是(a)和(b)等价。.
假设(b)成立,则 V V VVV 有一个由 T T TTT 的本征向量组成的基 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 。对每个 j j jjj ,设 U j = span ( v j ) U j = span v j U_(j)=span(v_(j))U_{j}=\operatorname{span}\left(v_{j}\right)Uj=span(vj) 。显然每个 U j U j U_(j)U_{j}Uj 都是 V V VVV 的一维子空间且在 T T TTT 下不变。因为 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基,所以 V V VVV 中每个向量都可以唯一地写成 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 的线性组合。也就是说, V V VVV 中每个向量都可以唯一地写成一个和 u 1 + + u n u 1 + + u n u_(1)+cdots+u_(n)u_{1}+\cdots+u_{n}u1++un ,其中每个 u j U j u j U j u_(j)inU_(j)u_{j} \in U_{j}ujUj 。于是 V = U 1 U n V = U 1 U n V=U_(1)o+cdots o+U_(n)V=U_{1} \oplus \cdots \oplus U_{n}V=U1Un 。因此(b)蕴涵(c)。
现在假设(c)成立,则 V V VVV 有在 T T TTT 下不变的一维子空间 U 1 , , U n U 1 , , U n U_(1),dots,U_(n)U_{1}, \ldots, U_{n}U1,,Un 使得 V = V = V=V=V= U 1 U n U 1 U n U_(1)o+cdots o+U_(n)U_{1} \oplus \cdots \oplus U_{n}U1Un 。对每个 j j jjj ,设 v j v j v_(j)v_{j}vj U j U j U_(j)U_{j}Uj 中的一个非零向量,则每个 v j v j v_(j)v_{j}vj 都是 T T TTT 的本征向量. 因为 V V VVV 中每个向量都可以唯一地写成和 u 1 + + u n u 1 + + u n u_(1)+cdots+u_(n)u_{1}+\cdots+u_{n}u1++un ,其中每个 u j U j u j U j u_(j)inU_(j)u_{j} \in U_{j}ujUj (所以每个 u j u j u_(j)u_{j}uj 都是 v j v j v_(j)v_{j}vj 的标量倍),所以 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基。因此 (c) 蕴涵 (b).
现在已经证明了(a),(b),(c)等价。为完成证明,我们要证明(b)蕴涵(d)、(d)蕴涵 (e)、(e) 蕴涵 (b).
假设(b)成立,则 V V VVV 有一个由 T T TTT 的本征向量组成的基. 于是, V V VVV 中每个向量都是 T T TTT 的本征向量的线性组合. 因此
V = E ( λ 1 , T ) + + E ( λ m , T ) V = E λ 1 , T + + E λ m , T V=E(lambda_(1),T)+cdots+E(lambda_(m),T)V=E\left(\lambda_{1}, T\right)+\cdots+E\left(\lambda_{m}, T\right)V=E(λ1,T)++E(λm,T)
现在 5.38 表明 (d) 成立。
由 2.C 节的习题 16 立即可知 (d) 蕴涵(e)。
最后,假设(e)成立,则
5.42
dim V = dim E ( λ 1 , T ) + + dim E ( λ m , T ) dim V = dim E λ 1 , T + + dim E λ m , T dim V=dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T)\operatorname{dim} V=\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right)dimV=dimE(λ1,T)++dimE(λm,T)
在每个 E ( λ j , T ) E λ j , T E(lambda_(j),T)E\left(\lambda_{j}, T\right)E(λj,T) 中取一个基,把这些基合在一起就得到了 T T TTT 的一组本征向量 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn ,其中 n = dim V n = dim V n=dim Vn=\operatorname{dim} Vn=dimV (由于 5.42 )。为了证明这组向量线性无关,假设
a 1 v 1 + + a n v n = 0 a 1 v 1 + + a n v n = 0 a_(1)v_(1)+cdots+a_(n)v_(n)=0a_{1} v_{1}+\cdots+a_{n} v_{n}=0a1v1++anvn=0
其中 a 1 , , a n F a 1 , , a n F a_(1),dots,a_(n)inFa_{1}, \ldots, a_{n} \in \mathbf{F}a1,,anF 。对每个 j = 1 , , m j = 1 , , m j=1,dots,mj=1, \ldots, mj=1,,m ,设 u j u j u_(j)u_{j}uj 表示所有 a k v k a k v k a_(k)v_(k)a_{k} v_{k}akvk 的和,其中 v k v k v_(k)inv_{k} \invk E ( λ j , T ) E λ j , T E(lambda_(j),T)E\left(\lambda_{j}, T\right)E(λj,T). 则每个 u j u j u_(j)u_{j}uj 含于 E ( λ j , T ) E λ j , T E(lambda_(j),T)E\left(\lambda_{j}, T\right)E(λj,T), 并且
u 1 + + u m = 0 u 1 + + u m = 0 u_(1)+cdots+u_(m)=0u_{1}+\cdots+u_{m}=0u1++um=0
因为相应于互异本征值的本征向量线性无关(参见 5.10),所以每个 u j u j u_(j)u_{j}uj 都等于 0 。由于每个 u j u j u_(j)u_{j}uj 都是一些 a k v k a k v k a_(k)v_(k)a_{k} v_{k}akvk 的和,其中的这些 v k v k v_(k)v_{k}vk 组成了 E ( λ j , T ) E λ j , T E(lambda_(j),T)E\left(\lambda_{j}, T\right)E(λj,T) 的基,从而所有的 a k a k a_(k)a_{k}ak都等于 0 。于是 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 线性无关,因此是 V V VVV 的基(由于 2.39)。这就证明了(e)蕴涵 (b).
可惜并非每个算子都可对角化. 这种糟糕的情况甚至可能出现在复向量空间上,如下例所示。
5.43 例 证明由 T ( w , z ) = ( z , 0 ) T ( w , z ) = ( z , 0 ) T(w,z)=(z,0)T(w, z)=(z, 0)T(w,z)=(z,0) 定义的算子 T L ( C 2 ) T L C 2 T inL(C^(2))T \in \mathcal{L}\left(\mathbf{C}^{2}\right)TL(C2) 不可对角化.
证明 容易验证 0 是 T T TTT 的唯一本征值且 E ( 0 , T ) = { ( w , 0 ) C 2 : w C } E ( 0 , T ) = ( w , 0 ) C 2 : w C E(0,T)={(w,0)inC^(2):w inC}E(0, T)=\left\{(w, 0) \in \mathbf{C}^{2}: w \in \mathbf{C}\right\}E(0,T)={(w,0)C2:wC}.
于是容易看出 5.41 中的条件 (b), (c), (d), (e) 都不成立(当然, 由于这些条件是等价的,只需验证其中之一不成立)。于是 5.41 中的 (a) 也不成立, 故 T T TTT 不可对角化.
以下命题表明, 如果一个算子的互异本征值的个数与定义域的维数相同, 则此算子可对角化。

5.44 本征值足够多则可对角化

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) dim V dim V dim V\operatorname{dim} VdimV 个互异的本征值, 则 T T TTT 可对角化.
证明 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) dim V dim V dim V\operatorname{dim} VdimV 个互异的本征值 λ 1 , , λ dim V λ 1 , , λ dim V lambda_(1),dots,lambda_(dim V)\lambda_{1}, \ldots, \lambda_{\operatorname{dim} V}λ1,,λdimV 。对每个 j j jjj, 设 v j V v j V v_(j)in Vv_{j} \in VvjV 是相应于本征值 λ j λ j lambda_(j)\lambda_{j}λj 的本征向量。因为相应于互异本征值的本征向量线性无关(参见 5.10),所以 v 1 , , v dim V v 1 , , v dim V v_(1),dots,v_(dim V)v_{1}, \ldots, v_{\operatorname{dim} V}v1,,vdimV 线性无关。 V V VVV 中由 dim V dim V dim V\operatorname{dim} VdimV 个向量组成的线性无关组是 V V VVV 的基(参见 2.39)。于是 v 1 , , v dim V v 1 , , v dim V v_(1),dots,v_(dim V)v_{1}, \ldots, v_{\operatorname{dim} V}v1,,vdimV V V VVV 的基。关于这个由本征向量组成的基, T T TTT 有对角矩阵。
5.45 例 定义 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T ( x , y , z ) = ( 2 x + y , 5 y + 3 z , 8 z ) T(x,y,z)=(2x+y,5y+3z,8z)T(x, y, z)=(2 x+y, 5 y+3 z, 8 z)T(x,y,z)=(2x+y,5y+3z,8z). 求 F 3 F 3 F^(3)\mathbf{F}^{3}F3 的一个基使得 T T TTT关于这个基有对角矩阵。
T T TTT 关于标准基的矩阵为
( 2 1 0 0 5 3 0 0 8 ) 2      1      0 0      5      3 0      0      8 ([2,1,0],[0,5,3],[0,0,8])\left(\begin{array}{lll} 2 & 1 & 0 \\ 0 & 5 & 3 \\ 0 & 0 & 8 \end{array}\right)(210053008)
这个矩阵是上三角的. 由 5.32 , T 5.32 , T 5.32,T5.32, T5.32,T 的本征值是 2 , 5 , 8 2 , 5 , 8 2,5,82,5,82,5,8. 因为 T T TTT 是三维向量空间上的算子且 T T TTT 有三个互异的本征值,由 5.44 可知 F 3 F 3 F^(3)\mathbf{F}^{3}F3 有一个基使得 T T TTT 关于这个基有对角矩阵。
为了求这个基, 只需对每个本征值求出本征向量. 也就是说, 对 λ = 2 λ = 5 λ = 2 λ = 5 lambda=2、lambda=5\lambda=2 、 \lambda=5λ=2λ=5 λ = 8 λ = 8 lambda=8\lambda=8λ=8 分别求出方程
T ( x , y , z ) = λ ( x , y , z ) T ( x , y , z ) = λ ( x , y , z ) T(x,y,z)=lambda(x,y,z)T(x, y, z)=\lambda(x, y, z)T(x,y,z)=λ(x,y,z)
的非零解. 这些简单方程很容易求解:对 λ = 2 λ = 2 lambda=2\lambda=2λ=2 有本征向量 ( 1 , 0 , 0 ) ( 1 , 0 , 0 ) (1,0,0)(1,0,0)(1,0,0) ,对 λ = 5 λ = 5 lambda=5\lambda=5λ=5 有本征向量 ( 1 , 3 , 0 ) ( 1 , 3 , 0 ) (1,3,0)(1,3,0)(1,3,0) ,对 λ = 8 λ = 8 lambda=8\lambda=8λ=8 有本征向量 ( 1 , 6 , 6 ) ( 1 , 6 , 6 ) (1,6,6)(1,6,6)(1,6,6).
于是 ( 1 , 0 , 0 ) , ( 1 , 3 , 0 ) , ( 1 , 6 , 6 ) ( 1 , 0 , 0 ) , ( 1 , 3 , 0 ) , ( 1 , 6 , 6 ) (1,0,0),(1,3,0),(1,6,6)(1,0,0),(1,3,0),(1,6,6)(1,0,0),(1,3,0),(1,6,6) F 3 F 3 F^(3)\mathbf{F}^{3}F3 的基, 且 T T TTT 关于这个基的矩阵为
( 2 0 0 0 5 0 0 0 8 ) 2      0      0 0      5      0 0      0      8 ([2,0,0],[0,5,0],[0,0,8])\left(\begin{array}{lll} 2 & 0 & 0 \\ 0 & 5 & 0 \\ 0 & 0 & 8 \end{array}\right)(200050008)
5.44 的逆命题不成立。 例如,三维空间 F 3 F 3 F^(3)\mathbf{F}^{3}F3 上的算子
T ( z 1 , z 2 , z 3 ) = ( 4 z 1 , 4 z 2 , 5 z 3 ) T z 1 , z 2 , z 3 = 4 z 1 , 4 z 2 , 5 z 3 T(z_(1),z_(2),z_(3))=(4z_(1),4z_(2),5z_(3))T\left(z_{1}, z_{2}, z_{3}\right)=\left(4 z_{1}, 4 z_{2}, 5 z_{3}\right)T(z1,z2,z3)=(4z1,4z2,5z3)
只有两个本征值(4和5),但这个算子关于标准基有对角矩阵。
在后面的章节中,我们会找到算子可对角化的其他条件。

习题 5.C

1 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 可对角化. 证明 V = null T range T V = null T range T V=null T o+range TV=\operatorname{null} T \oplus \operatorname{range} TV=nullTrangeT.
2 证明上题的逆命题或给出反例.
3 设 V V VVV 是有限维的且 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明下列条件等价:
(a) V = null T range T V = null T range T V=null T o+range TV=\operatorname{null} T \oplus \operatorname{range} TV=nullTrangeT;
(b) V = null T + range T V = null T + range T V=null T+range TV=\operatorname{null} T+\operatorname{range} TV=nullT+rangeT;
(c) null T range T = { 0 } T range T = { 0 } T nn range T={0}T \cap \operatorname{range} T=\{0\}TrangeT={0}.
4 举例说明如果去掉 " V V VVV 是有限维的" 这个假设, 则上题的结论不再成立.
5 设 V V VVV 是有限维的复向量空间且 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明: T T TTT 可对角化当且仅当对每个 λ C λ C lambda inC\lambda \in \mathbf{C}λC V = null ( T λ I ) range ( T λ I ) V = null ( T λ I ) range ( T λ I ) V=null(T-lambda I)o+range(T-lambda I)V=\operatorname{null}(T-\lambda I) \oplus \operatorname{range}(T-\lambda I)V=null(TλI)range(TλI).
6 设 V V VVV 是有限维的, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) dim V dim V dim V\operatorname{dim} VdimV 个互异的本征值, S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) T T TTT 有相同的本征向量(未必相应于同一本征值)。证明 S T = T S S T = T S ST=TSS T=T SST=TS
7 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 关于 V V VVV 的某个基有对角矩阵 A , λ F A , λ F A,lambda inFA, \lambda \in \mathbf{F}A,λF 。证明 λ λ lambda\lambdaλ A A AAA 的对角线上恰好出现 dim E ( λ , T ) dim E ( λ , T ) dim E(lambda,T)\operatorname{dim} E(\lambda, T)dimE(λ,T) 次。
8 设 T L ( F 5 ) T L F 5 T inL(F^(5))T \in \mathcal{L}\left(\mathbf{F}^{5}\right)TL(F5) dim E ( 8 , T ) = 4 dim E ( 8 , T ) = 4 dim E(8,T)=4\operatorname{dim} E(8, T)=4dimE(8,T)=4. 证明 ( T 2 I ) ( T 2 I ) (T-2I)(T-2 I)(T2I) ( T 6 I ) ( T 6 I ) (T-6I)(T-6 I)(T6I) 是可逆的.
9 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是可逆的。证明对每个非零的 λ F λ F lambda inF\lambda \in \mathbf{F}λF 均有 E ( λ , T ) = E ( 1 λ , T 1 ) E ( λ , T ) = E 1 λ , T 1 E(lambda,T)=E((1)/(lambda),T^(-1))E(\lambda, T)=E\left(\frac{1}{\lambda}, T^{-1}\right)E(λ,T)=E(1λ,T1).
10 设 V V VVV 是有限维的且 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。设 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的互异的非零本征值. 证明
dim E ( λ 1 , T ) + + dim E ( λ m , T ) dim range T dim E λ 1 , T + + dim E λ m , T dim  range  T dim E(lambda_(1),T)+cdots+dim E(lambda_(m),T) <= dim" range "T\operatorname{dim} E\left(\lambda_{1}, T\right)+\cdots+\operatorname{dim} E\left(\lambda_{m}, T\right) \leq \operatorname{dim} \text { range } TdimE(λ1,T)++dimE(λm,T)dim range T
11 证明例 5.40 中的结论。
12 设 R , T L ( F 3 ) R , T L F 3 R,T inL(F^(3))R, T \in \mathcal{L}\left(\mathbf{F}^{3}\right)R,TL(F3), 本征值均为 2 , 6 , 7 2 , 6 , 7 2,6,72,6,72,6,7. 证明存在可逆算子 S L ( F 3 ) S L F 3 S inL(F^(3))S \in \mathcal{L}\left(\mathbf{F}^{3}\right)SL(F3) 使得 R = S 1 T S R = S 1 T S R=S^(-1)TSR=S^{-1} T SR=S1TS
13 求 R , T L ( F 4 ) R , T L F 4 R,T inL(F^(4))R, T \in \mathcal{L}\left(\mathbf{F}^{4}\right)R,TL(F4) 使得 R R RRR T T TTT 均有本征值 2 , 6 , 7 2 , 6 , 7 2,6,72,6,72,6,7, 均没有其他本征值, 且不存在可逆算子 S L ( F 4 ) S L F 4 S inL(F^(4))S \in \mathcal{L}\left(\mathbf{F}^{4}\right)SL(F4) 使得 R = S 1 T S R = S 1 T S R=S^(-1)TSR=S^{-1} T SR=S1TS
14 求 T L ( C 3 ) T L C 3 T inL(C^(3))T \in \mathcal{L}\left(\mathbf{C}^{3}\right)TL(C3) 使得 6 和 7 是 T T TTT 的本征值,且 T T TTT 关于 C 3 C 3 C^(3)\mathbf{C}^{3}C3 的任意基的矩阵都不是对角矩阵。
15 设 T L ( C 3 ) T L C 3 T inL(C^(3))T \in \mathcal{L}\left(\mathbf{C}^{3}\right)TL(C3) 使得 6 和 7 是 T T TTT 的本征值,且 T T TTT 关于 C 3 C 3 C^(3)\mathbf{C}^{3}C3 的任意基的矩阵都不是对角矩阵。证明存在 ( x , y , z ) C 3 ( x , y , z ) C 3 (x,y,z)inC^(3)(x, y, z) \in \mathbf{C}^{3}(x,y,z)C3 使得 T ( x , y , z ) = ( 17 + 8 x , 5 + 8 y , 2 π + 8 z ) T ( x , y , z ) = ( 17 + 8 x , 5 + 8 y , 2 π + 8 z ) T(x,y,z)=(17+8x,sqrt5+8y,2pi+8z)T(x, y, z)=(17+8 x, \sqrt{5}+8 y, 2 \pi+8 z)T(x,y,z)=(17+8x,5+8y,2π+8z).
16 斐波那契序列 F 1 , F 2 , F 1 , F 2 , F_(1),F_(2),dotsF_{1}, F_{2}, \ldotsF1,F2, 定义为
F 1 = 1 , F 2 = 1 , F n = F n 2 + F n 1 ( n 3 ) F 1 = 1 , F 2 = 1 , F n = F n 2 + F n 1 ( n 3 ) F_(1)=1,quadF_(2)=1,quadF_(n)=F_(n-2)+F_(n-1)(n >= 3)F_{1}=1, \quad F_{2}=1, \quad F_{n}=F_{n-2}+F_{n-1}(n \geq 3)F1=1,F2=1,Fn=Fn2+Fn1(n3)
定义 T L ( R 2 ) T L R 2 T inL(R^(2))T \in \mathcal{L}\left(\mathbf{R}^{2}\right)TL(R2) T ( x , y ) = ( y , x + y ) T ( x , y ) = ( y , x + y ) T(x,y)=(y,x+y)T(x, y)=(y, x+y)T(x,y)=(y,x+y)
(a) 证明对每个正整数 n n nnn 均有 T n ( 0 , 1 ) = ( F n , F n + 1 ) T n ( 0 , 1 ) = F n , F n + 1 T^(n)(0,1)=(F_(n),F_(n+1))T^{n}(0,1)=\left(F_{n}, F_{n+1}\right)Tn(0,1)=(Fn,Fn+1).
(b) 求 T T TTT 的本征值.
(c)求 R 2 R 2 R^(2)\mathbf{R}^{2}R2 的一个由 T T TTT 的本征向量构成的基.
(d) 利用 (c) 的解计算 T n ( 0 , 1 ) T n ( 0 , 1 ) T^(n)(0,1)T^{n}(0,1)Tn(0,1). 由此证明:对每个正整数 n n nnn
F n = 1 5 [ ( 1 + 5 2 ) n ( 1 5 2 ) n ] F n = 1 5 1 + 5 2 n 1 5 2 n F_(n)=(1)/(sqrt5)[((1+sqrt5)/(2))^(n)-((1-sqrt5)/(2))^(n)]F_{n}=\frac{1}{\sqrt{5}}\left[\left(\frac{1+\sqrt{5}}{2}\right)^{n}-\left(\frac{1-\sqrt{5}}{2}\right)^{n}\right]Fn=15[(1+52)n(152)n]
(e) 利用 (d) 证明: 对每个正整数 n n nnn, 斐波那契数 F n F n F_(n)F_{n}Fn 是最接近于
1 5 ( 1 + 5 2 ) n 1 5 1 + 5 2 n (1)/(sqrt5)((1+sqrt5)/(2))^(n)\frac{1}{\sqrt{5}}\left(\frac{1+\sqrt{5}}{2}\right)^{n}15(1+52)n
的整数。