第7章

艾萨克 - 牛顿(1642

-1727),1795 年英国诗人和画家威廉 • 布莱克根据想象所绘.

内积空间上的算子

我们现在要讨论内积空间上的算子, 这方面的研究成果在内积空间理论中最为深刻. 我们将利用伴随的性质详细描述内积空间上的几类重要算子。
下面的第二条是本章采用的新约定:

7.1 记号 F、V、W

  • F 表示 R 或 C .
  • V V VVV W W WWW 表示 F F F\mathbf{F}F 上的有限维内积空间。

本章的学习目标

  • 伴随
  • 谱定理
  • 正算子
  • 等距同构
  • 极分解
  • 奇异值分解

7.A 自伴算子与正规算子

伴随

7.2 定义 伴随(adjoint), T T T^(**)T^{*}T

T L ( V , W ) . T T L ( V , W ) . T T inL(V,W).TT \in \mathcal{L}(V, W) . TTL(V,W).T 的伴随是满足如下条件的函数 T : W V T : W V T^(**):W rarr VT^{*}: W \rightarrow VT:WV :对所有 v V v V v in Vv \in VvV和所有 w W w W w in Ww \in WwW 均有 T v , w = v , T w T v , w = v , T w (:Tv,w:)=(:v,T^(**)w:)\langle T v, w\rangle=\left\langle v, T^{*} w\right\rangleTv,w=v,Tw.
伴随这个词在线性代数中还有另一个意思。在本书中我们不需要第二种意思。要是你在别处遇到伴随的第二种含义的话, 要注意, 伴随的这两种意思之间没有任何联系。
想要看出上面的定义有意义,我们设 T T T inT \inT L ( V , W ) L ( V , W ) L(V,W)\mathcal{L}(V, W)L(V,W) ,并取定 w W w W w in Ww \in WwW 。考虑 V V VVV 上将 v V v V v in Vv \in VvV映成 T v , w T v , w (:Tv,w:)\langle T v, w\rangleTv,w 的线性泛函,这个线性泛函依赖于 T T TTT w w www. 由里斯表示定理 6.42,存在 V V VVV 中唯一一个向量使得该线性泛函是通过与该向量做内积给出的,我们将这个唯一的向量记为 T w T w T^(**)wT^{*} wTw 。也就是说, T w T w T^(**)wT^{*} wTw V V VVV 中唯一一个满足下面条件的向量:对每个 v V v V v in Vv \in VvV 均有 T v , w = v , T w T v , w = v , T w (:Tv,w:)=(:v,T^(**)w:)\langle T v, w\rangle=\left\langle v, T^{*} w\right\rangleTv,w=v,Tw.
7.3 例 定义 T : R 3 R 2 T : R 3 R 2 T:R^(3)rarrR^(2)T: \mathbf{R}^{3} \rightarrow \mathbf{R}^{2}T:R3R2 T ( x 1 , x 2 , x 3 ) = ( x 2 + 3 x 3 , 2 x 1 ) T x 1 , x 2 , x 3 = x 2 + 3 x 3 , 2 x 1 T(x_(1),x_(2),x_(3))=(x_(2)+3x_(3),2x_(1))T\left(x_{1}, x_{2}, x_{3}\right)=\left(x_{2}+3 x_{3}, 2 x_{1}\right)T(x1,x2,x3)=(x2+3x3,2x1). 求 T T T^(**)T^{*}T.
T T T^(**)T^{*}T R 2 R 2 R^(2)\mathbf{R}^{2}R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 的函数. 要计算 T T T^(**)T^{*}T, 取定一个点 ( y 1 , y 2 ) R 2 y 1 , y 2 R 2 (y_(1),y_(2))inR^(2)\left(y_{1}, y_{2}\right) \in \mathbf{R}^{2}(y1,y2)R2, 那么对于每个 ( x 1 , x 2 , x 3 ) R 3 x 1 , x 2 , x 3 R 3 (x_(1),x_(2),x_(3))inR^(3)\left(x_{1}, x_{2}, x_{3}\right) \in \mathbf{R}^{3}(x1,x2,x3)R3
( x 1 , x 2 , x 3 ) , T ( y 1 , y 2 ) = T ( x 1 , x 2 , x 3 ) , ( y 1 , y 2 ) = ( x 2 + 3 x 3 , 2 x 1 ) , ( y 1 , y 2 ) = x 2 y 1 + 3 x 3 y 1 + 2 x 1 y 2 = ( x 1 , x 2 , x 3 ) , ( 2 y 2 , y 1 , 3 y 1 ) . x 1 , x 2 , x 3 , T y 1 , y 2 = T x 1 , x 2 , x 3 , y 1 , y 2 = x 2 + 3 x 3 , 2 x 1 , y 1 , y 2 = x 2 y 1 + 3 x 3 y 1 + 2 x 1 y 2 = x 1 , x 2 , x 3 , 2 y 2 , y 1 , 3 y 1 . {:[(:(x_(1),x_(2),x_(3)),T^(**)(y_(1),y_(2)):)=(:T(x_(1),x_(2),x_(3)),(y_(1),y_(2)):)],[=(:(x_(2)+3x_(3),2x_(1)),(y_(1),y_(2)):)],[=x_(2)y_(1)+3x_(3)y_(1)+2x_(1)y_(2)],[=(:(x_(1),x_(2),x_(3)),(2y_(2),y_(1),3y_(1)):).]:}\begin{aligned} \left\langle\left(x_{1}, x_{2}, x_{3}\right), T^{*}\left(y_{1}, y_{2}\right)\right\rangle & =\left\langle T\left(x_{1}, x_{2}, x_{3}\right),\left(y_{1}, y_{2}\right)\right\rangle \\ & =\left\langle\left(x_{2}+3 x_{3}, 2 x_{1}\right),\left(y_{1}, y_{2}\right)\right\rangle \\ & =x_{2} y_{1}+3 x_{3} y_{1}+2 x_{1} y_{2} \\ & =\left\langle\left(x_{1}, x_{2}, x_{3}\right),\left(2 y_{2}, y_{1}, 3 y_{1}\right)\right\rangle . \end{aligned}(x1,x2,x3),T(y1,y2)=T(x1,x2,x3),(y1,y2)=(x2+3x3,2x1),(y1,y2)=x2y1+3x3y1+2x1y2=(x1,x2,x3),(2y2,y1,3y1).
于是 T ( y 1 , y 2 ) = ( 2 y 2 , y 1 , 3 y 1 ) T y 1 , y 2 = 2 y 2 , y 1 , 3 y 1 T^(**)(y_(1),y_(2))=(2y_(2),y_(1),3y_(1))T^{*}\left(y_{1}, y_{2}\right)=\left(2 y_{2}, y_{1}, 3 y_{1}\right)T(y1,y2)=(2y2,y1,3y1).
7.4 例 取定 u V u V u in Vu \in VuV x W x W x in Wx \in WxW. 定义 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) 如下: 对每个 v V v V v in Vv \in VvV T v = v , u x T v = v , u x Tv=(:v,u:)xT v=\langle v, u\rangle xTv=v,ux.求 T T T^(**)T^{*}T
解 取定 w W w W w in Ww \in WwW. 则对每个 v V v V v in Vv \in VvV
v , T w = T v , w = v , u x , w = v , u x , w = v , w , x u . v , T w = T v , w = v , u x , w = v , u x , w = v , w , x u . {:[(:v,T^(**)w:)=(:Tv","w:)],[=(:(:v","u:)x","w:)],[=(:v","u:)(:x","w:)],[=(:v","(:w","x:)u:).]:}\begin{aligned} \left\langle v, T^{*} w\right\rangle & =\langle T v, w\rangle \\ & =\langle\langle v, u\rangle x, w\rangle \\ & =\langle v, u\rangle\langle x, w\rangle \\ & =\langle v,\langle w, x\rangle u\rangle . \end{aligned}v,Tw=Tv,w=v,ux,w=v,ux,w=v,w,xu.
于是 T w = w , x u T w = w , x u T^(**)w=(:w,x:)uT^{*} w=\langle w, x\rangle uTw=w,xu.
上两例中的 T T T^(**)T^{*}T 不只是函数而且还是线性映射。以下命题表明这是普遍成立的.
下面两个命题的证明用到了一个共同的技巧:将 T T T^(**)T^{*}T 从内积的一个向量上移到另一个向量上就变为 T T TTT.

7.5 伴随是线性映射

T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W), 则 T L ( W , V ) T L ( W , V ) T^(**)inL(W,V)T^{*} \in \mathcal{L}(W, V)TL(W,V).
证明 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W). 取定 w 1 , w 2 W w 1 , w 2 W w_(1),w_(2)in Ww_{1}, w_{2} \in Ww1,w2W. 若 v V v V v in Vv \in VvV, 则
v , T ( w 1 + w 2 ) = T v , w 1 + w 2 = T v , w 1 + T v , w 2 = v , T w 1 + v , T w 2 = v , T w 1 + T w 2 , v , T w 1 + w 2 = T v , w 1 + w 2 = T v , w 1 + T v , w 2 = v , T w 1 + v , T w 2 = v , T w 1 + T w 2 , {:[(:v,T^(**)(w_(1)+w_(2)):)=(:Tv,w_(1)+w_(2):)],[=(:Tv,w_(1):)+(:Tv,w_(2):)],[=(:v,T^(**)w_(1):)+(:v,T^(**)w_(2):)],[=(:v,T^(**)w_(1)+T^(**)w_(2):)","]:}\begin{aligned} \left\langle v, T^{*}\left(w_{1}+w_{2}\right)\right\rangle & =\left\langle T v, w_{1}+w_{2}\right\rangle \\ & =\left\langle T v, w_{1}\right\rangle+\left\langle T v, w_{2}\right\rangle \\ & =\left\langle v, T^{*} w_{1}\right\rangle+\left\langle v, T^{*} w_{2}\right\rangle \\ & =\left\langle v, T^{*} w_{1}+T^{*} w_{2}\right\rangle, \end{aligned}v,T(w1+w2)=Tv,w1+w2=Tv,w1+Tv,w2=v,Tw1+v,Tw2=v,Tw1+Tw2,
这表明 T ( w 1 + w 2 ) = T w 1 + T w 2 T w 1 + w 2 = T w 1 + T w 2 T^(**)(w_(1)+w_(2))=T^(**)w_(1)+T^(**)w_(2)T^{*}\left(w_{1}+w_{2}\right)=T^{*} w_{1}+T^{*} w_{2}T(w1+w2)=Tw1+Tw2
取定 w W w W w in Ww \in WwW λ F λ F lambda inF\lambda \in \mathbf{F}λF. 若 v V v V v in Vv \in VvV, 则
v , T ( λ w ) = T v , λ w = λ ¯ T v , w = λ ¯ v , T w = v , λ T w , v , T ( λ w ) = T v , λ w = λ ¯ T v , w = λ ¯ v , T w = v , λ T w , {:[(:v,T^(**)(lambda w):)=(:Tv","lambda w:)],[= bar(lambda)(:Tv","w:)],[= bar(lambda)(:v,T^(**)w:)],[=(:v,lambdaT^(**)w:)","]:}\begin{aligned} \left\langle v, T^{*}(\lambda w)\right\rangle & =\langle T v, \lambda w\rangle \\ & =\bar{\lambda}\langle T v, w\rangle \\ & =\bar{\lambda}\left\langle v, T^{*} w\right\rangle \\ & =\left\langle v, \lambda T^{*} w\right\rangle, \end{aligned}v,T(λw)=Tv,λw=λ¯Tv,w=λ¯v,Tw=v,λTw,
这表明 T ( λ w ) = λ T w T ( λ w ) = λ T w T^(**)(lambda w)=lambdaT^(**)wT^{*}(\lambda w)=\lambda T^{*} wT(λw)=λTw 。因此 T T T^(**)T^{*}T 是线性映射.

7.6 伴随的性质

(a) 对所有 S , T L ( V , W ) S , T L ( V , W ) S,T inL(V,W)S, T \in \mathcal{L}(V, W)S,TL(V,W) 均有 ( S + T ) = S + T ( S + T ) = S + T (S+T)^(**)=S^(**)+T^(**)(S+T)^{*}=S^{*}+T^{*}(S+T)=S+T;
(b) 对所有 λ F λ F lambda inF\lambda \in \mathbf{F}λF T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) 均有 ( λ T ) = λ ¯ T ( λ T ) = λ ¯ T (lambda T)^(**)= bar(lambda)T^(**)(\lambda T)^{*}=\bar{\lambda} T^{*}(λT)=λ¯T;
(c) 对所有 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) 均有 ( T ) = T T = T (T^(**))^(**)=T\left(T^{*}\right)^{*}=T(T)=T;
(d) I = I I = I I^(**)=II^{*}=II=I, 这里 I I III V V VVV 上的恒等算子;
(e) 对所有 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) S L ( W , U ) S L ( W , U ) S inL(W,U)S \in \mathcal{L}(W, U)SL(W,U) 均有 ( S T ) = T S ( S T ) = T S (ST)^(**)=T^(**)S^(**)(S T)^{*}=T^{*} S^{*}(ST)=TS (这里 U U UUU F F F\mathbf{F}F 上的内积空间).

证明

(a) 设 S , T L ( V , W ) S , T L ( V , W ) S,T inL(V,W)S, T \in \mathcal{L}(V, W)S,TL(V,W). 若 v V v V v in Vv \in VvV w W w W w in Ww \in WwW, 则
v , ( S + T ) w = ( S + T ) v , w = S v , w + T v , w = v , S w + v , T w = v , S w + T w . v , ( S + T ) w = ( S + T ) v , w = S v , w + T v , w = v , S w + v , T w = v , S w + T w . {:[(:v,(S+T)^(**)w:)=(:(S+T)v","w:)],[=(:Sv","w:)+(:Tv","w:)],[=(:v,S^(**)w:)+(:v,T^(**)w:)],[=(:v,S^(**)w+T^(**)w:).]:}\begin{aligned} \left\langle v,(S+T)^{*} w\right\rangle & =\langle(S+T) v, w\rangle \\ & =\langle S v, w\rangle+\langle T v, w\rangle \\ & =\left\langle v, S^{*} w\right\rangle+\left\langle v, T^{*} w\right\rangle \\ & =\left\langle v, S^{*} w+T^{*} w\right\rangle . \end{aligned}v,(S+T)w=(S+T)v,w=Sv,w+Tv,w=v,Sw+v,Tw=v,Sw+Tw.
于是 ( S + T ) w = S w + T w ( S + T ) w = S w + T w (S+T)^(**)w=S^(**)w+T^(**)w(S+T)^{*} w=S^{*} w+T^{*} w(S+T)w=Sw+Tw.
(b) 设 λ F , T L ( V , W ) λ F , T L ( V , W ) lambda inF,T inL(V,W)\lambda \in \mathbf{F}, T \in \mathcal{L}(V, W)λF,TL(V,W). 若 v V v V v in Vv \in VvV w W w W w in Ww \in WwW, 则
v , ( λ T ) w = λ T v , w = λ T v , w = λ v , T w = v , λ ¯ T w v , ( λ T ) w = λ T v , w = λ T v , w = λ v , T w = v , λ ¯ T w (:v,(lambda T)^(**)w:)=(:lambda Tv,w:)=lambda(:Tv,w:)=lambda(:v,T^(**)w:)=(:v,( bar(lambda))T^(**)w:)\left\langle v,(\lambda T)^{*} w\right\rangle=\langle\lambda T v, w\rangle=\lambda\langle T v, w\rangle=\lambda\left\langle v, T^{*} w\right\rangle=\left\langle v, \bar{\lambda} T^{*} w\right\ranglev,(λT)w=λTv,w=λTv,w=λv,Tw=v,λ¯Tw
于是 ( λ T ) w = λ ¯ T w ( λ T ) w = λ ¯ T w (lambda T)^(**)w= bar(lambda)T^(**)w(\lambda T)^{*} w=\bar{\lambda} T^{*} w(λT)w=λ¯Tw.
(c) 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W). 若 v V v V v in Vv \in VvV w W w W w in Ww \in WwW ,则
w , ( T ) v = T w , v = v , T w = T v , w = w , T v . w , T v = T w , v = v , T w ¯ = T v , w ¯ = w , T v . (:w,(T^(**))^(**)v:)=(:T^(**)w,v:)= bar((:v,T^(**)w:))= bar((:Tv,w:))=(:w,Tv:).\left\langle w,\left(T^{*}\right)^{*} v\right\rangle=\left\langle T^{*} w, v\right\rangle=\overline{\left\langle v, T^{*} w\right\rangle}=\overline{\langle T v, w\rangle}=\langle w, T v\rangle .w,(T)v=Tw,v=v,Tw=Tv,w=w,Tv.
于是 ( T ) v = T v T v = T v (T^(**))^(**)v=Tv\left(T^{*}\right)^{*} v=T v(T)v=Tv
(d) 若 v , u V v , u V v,u in Vv, u \in Vv,uV ,则
v , I u = I v , u = v , u = v , I u . v , I u = I v , u = v , u = v , I u . (:v,I^(**)u:)=(:Iv,u:)=(:v,u:)=(:v,Iu:).\left\langle v, I^{*} u\right\rangle=\langle I v, u\rangle=\langle v, u\rangle=\langle v, I u\rangle .v,Iu=Iv,u=v,u=v,Iu.
于是 I u = I u I u = I u I^(**)u=IuI^{*} u=I uIu=Iu.
(e) 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) S L ( W , U ) S L ( W , U ) S inL(W,U)S \in \mathcal{L}(W, U)SL(W,U). 若 v V v V v in Vv \in VvV u U u U u in Uu \in UuU, 则
v , ( S T ) u = S T v , u = T v , S u = v , T ( S u ) v , ( S T ) u = S T v , u = T v , S u = v , T S u (:v,(ST)^(**)u:)=(:STv,u:)=(:Tv,S^(**)u:)=(:v,T^(**)(S^(**)u):)\left\langle v,(S T)^{*} u\right\rangle=\langle S T v, u\rangle=\left\langle T v, S^{*} u\right\rangle=\left\langle v, T^{*}\left(S^{*} u\right)\right\ranglev,(ST)u=STv,u=Tv,Su=v,T(Su)
于是 ( S T ) u = T ( S u ) ( S T ) u = T S u (ST)^(**)u=T^(**)(S^(**)u)(S T)^{*} u=T^{*}\left(S^{*} u\right)(ST)u=T(Su).
以下命题描述了线性映射及其伴随的零空间和值域之间的关系。记号 Longleftrightarrow\Longleftrightarrow 的意思是 "当且仅当",这个记号也可以理解为 "等价于"。

7.7 T 7.7 T 7.7T^(**)7.7 T^{*}7.7T 的零空间与值域

T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W). 则
(a) null T = ( range T ) T = (  range  T ) T^(**)=(" range "T)^(_|_)T^{*}=(\text { range } T)^{\perp}T=( range T);
(b) range T = ( null T ) T = ( null T ) T^(**)=(null T)^(_|_)T^{*}=(\operatorname{null} T)^{\perp}T=(nullT);
(c) null T = ( range T ) T =  range  T T=(" range "T^(**))^(_|_)T=\left(\text { range } T^{*}\right)^{\perp}T=( range T);
(d) range T = ( null T ) T =  null  T T=(" null "T^(**))^(_|_)T=\left(\text { null } T^{*}\right)^{\perp}T=( null T).
证明 首先证明 (a). 设 w W w W w in Ww \in WwW. 则
w null T T w = 0 v , T w = 0 对所有 v V 成立 T v , w = 0 对所有 v V 成立 w ( range T ) . w null T T w = 0 v , T w = 0  对所有  v V  成立  T v , w = 0  对所有  v V  成立  w ( range T ) . {:[w in nullT^(**) LongleftrightarrowT^(**)w=0],[ Longleftrightarrow(:v,T^(**)w:)=0" 对所有 "v in V" 成立 "],[ Longleftrightarrow(:Tv","w:)=0" 对所有 "v in V" 成立 "],[ Longleftrightarrow w in(range T)^(_|_).]:}\begin{aligned} w \in \operatorname{null} T^{*} & \Longleftrightarrow T^{*} w=0 \\ & \Longleftrightarrow\left\langle v, T^{*} w\right\rangle=0 \text { 对所有 } v \in V \text { 成立 } \\ & \Longleftrightarrow\langle T v, w\rangle=0 \text { 对所有 } v \in V \text { 成立 } \\ & \Longleftrightarrow w \in(\operatorname{range} T)^{\perp} . \end{aligned}wnullTTw=0v,Tw=0 对所有 vV 成立 Tv,w=0 对所有 vV 成立 w(rangeT).
于是 null T = ( range T ) T = ( range T ) T^(**)=(range T)^(_|_)T^{*}=(\operatorname{range} T)^{\perp}T=(rangeT) ,这就证明了 (a).
对(a)的两端取正交补并利用 6.51 可得 (d). 在 (a) 中将 T T TTT 换成 T T T^(**)T^{*}T 并利用 7.6(c)可得 (c). 最后,在(d)中将 T T TTT 换成 T T T^(**)T^{*}T 可得(b)。
7.8 定义 共轭转置(conjugate transpose)
m × n m × n m xx nm \times nm×n 矩阵的共轭转置是先互换行和列,然后再对每个元素取复共轭得到的 n × m n × m n xx mn \times mn×m 矩阵。
7.9 例 矩阵 ( 2 3 + 4 i 7 6 5 8 i ) 2 3 + 4 i 7 6 5 8 i ([2,3+4i,7],[6,5,8i])\left(\begin{array}{ccc}2 & 3+4 i & 7 \\ 6 & 5 & 8 i\end{array}\right)(23+4i7658i)
的共轭转置是矩阵
F = R F = R F=R\mathbf{F}=\mathbf{R}F=R ,则矩阵的共轭转置等于转置,即通过互换行和列所得到的矩阵。
( 2 6 3 4 i 5 7 8 i ) 2 6 3 4 i 5 7 8 i ([2,6],[3-4i,5],[7,-8i])\left(\begin{array}{cc} 2 & 6 \\ 3-4 i & 5 \\ 7 & -8 i \end{array}\right)(2634i578i)
以下命题说明了怎样通过 T T TTT 的矩阵来计算 T T T^(**)T^{*}T 的矩阵。
注意:下面的结果只能对规范正交基使用,
线性映射的伴随与基的选取无关。这解释了为什么本书强调线性映射的伴随而不是矩阵的共轭转置。
而对于非规范正交基, T T T^(**)T^{*}T 的矩阵未必等于 T T TTT 的矩阵的共轭转置。

7.10 T 7.10 T 7.10T^(**)7.10 T^{*}7.10T 的矩阵

T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) 。假设 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的规范正交基, f 1 , , f m f 1 , , f m f_(1),dots,f_(m)f_{1}, \ldots, f_{m}f1,,fm W W WWW 的规范正交基。则 M ( T , ( f 1 , , f m ) , ( e 1 , , e n ) ) M T , f 1 , , f m , e 1 , , e n M(T^(**),(f_(1),dots,f_(m)),(e_(1),dots,e_(n)))\mathcal{M}\left(T^{*},\left(f_{1}, \ldots, f_{m}\right),\left(e_{1}, \ldots, e_{n}\right)\right)M(T,(f1,,fm),(e1,,en)) M ( T , ( e 1 , , e n ) , ( f 1 , , f m ) ) M T , e 1 , , e n , f 1 , , f m M(T,(e_(1),dots,e_(n)),(f_(1),dots,f_(m)))\mathcal{M}\left(T,\left(e_{1}, \ldots, e_{n}\right),\left(f_{1}, \ldots, f_{m}\right)\right)M(T,(e1,,en),(f1,,fm))的共轭转置。
证明 在本证明中,用 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 代替更长的记号 M ( T , ( e 1 , , e n ) , ( f 1 , , f m ) ) M T , e 1 , , e n , f 1 , , f m M(T,(e_(1),dots,e_(n)),(f_(1),dots,f_(m)))\mathcal{M}\left(T,\left(e_{1}, \ldots, e_{n}\right),\left(f_{1}, \ldots, f_{m}\right)\right)M(T,(e1,,en),(f1,,fm)) ,用 M ( T ) M T M(T^(**))\mathcal{M}\left(T^{*}\right)M(T) 代替 M ( T , ( f 1 , , f m ) , ( e 1 , , e n ) ) M T , f 1 , , f m , e 1 , , e n M(T^(**),(f_(1),dots,f_(m)),(e_(1),dots,e_(n)))\mathcal{M}\left(T^{*},\left(f_{1}, \ldots, f_{m}\right),\left(e_{1}, \ldots, e_{n}\right)\right)M(T,(f1,,fm),(e1,,en))
回想一下,把 T e k T e k Te_(k)T e_{k}Tek 写成这些 f j f j f_(j)f_{j}fj 的线性组合可得 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的第 k k kkk 列,在这个线性组合中用到的标量组成了 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的第 k k kkk 列。因为 f 1 , , f m f 1 , , f m f_(1),dots,f_(m)f_{1}, \ldots, f_{m}f1,,fm W W WWW 的规范正交基,所以我们知道怎样把 T e k T e k Te_(k)T e_{k}Tek 写成这些 f j f j f_(j)f_{j}fj 的线性组合(见 6.30):
T e k = T e k , f 1 f 1 + + T e k , f m f m T e k = T e k , f 1 f 1 + + T e k , f m f m Te_(k)=(:Te_(k),f_(1):)f_(1)+cdots+(:Te_(k),f_(m):)f_(m)T e_{k}=\left\langle T e_{k}, f_{1}\right\rangle f_{1}+\cdots+\left\langle T e_{k}, f_{m}\right\rangle f_{m}Tek=Tek,f1f1++Tek,fmfm
于是 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 中第 j j jjj 行第 k k kkk 列的元素是 T e k , f j T e k , f j (:Te_(k),f_(j):)\left\langle T e_{k}, f_{j}\right\rangleTek,fj.
T T TTT 替换成 T T T^(**)T^{*}T ,再互换诸 e e eee 和诸 f f fff 的角色,由此可得, M ( T ) M T M(T^(**))\mathcal{M}\left(T^{*}\right)M(T) 中第 j j jjj 行第 k k kkk 列的元素是 T f k , e j T f k , e j (:T^(**)f_(k),e_(j):)\left\langle T^{*} f_{k}, e_{j}\right\rangleTfk,ej ,它等于 f k , T e j f k , T e j (:f_(k),Te_(j):)\left\langle f_{k}, T e_{j}\right\ranglefk,Tej ,这等于 T e j , f k T e j , f k ¯ bar((:Te_(j),f_(k):))\overline{\left\langle T e_{j}, f_{k}\right\rangle}Tej,fk ,这又等于 M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 中第 k k kkk 行第 j j jjj 列元素的复共轭。 也就是说, M ( T ) M T M(T^(**))\mathcal{M}\left(T^{*}\right)M(T) M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的共轭转置。

自伴算子

现在我们将注意力转移向内积空间上的算子。因此我们将关注 V V VVV V V VVV 的线性映射(回想一下这样的线性映射称为算子),而不是 V V VVV W W WWW 的线性映射。

7.11 定义 自伴的(self-adjoint)

算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 称为自伴的, 如果 T = T T = T T=T^(**)T=T^{*}T=T. 也就是说, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的当且仅当对所有 v , w V v , w V v,w in Vv, w \in Vv,wV 均有 T v , w = v , T w T v , w = v , T w (:Tv,w:)=(:v,Tw:)\langle T v, w\rangle=\langle v, T w\rangleTv,w=v,Tw.
7.12 例 设 T T TTT F 2 F 2 F^(2)\mathbf{F}^{2}F2 上的算子,它(关于标准基)的矩阵是
( 2 b 3 7 ) 2      b 3      7 ([2,b],[3,7])\left(\begin{array}{ll} 2 & b \\ 3 & 7 \end{array}\right)(2b37)
求数 b b bbb 使得 T T TTT 是自伴的.
解 算子 T T TTT 是自伴的当且仅当 b = 3 b = 3 b=3b=3b=3 (因为 M ( T ) = M ( T ) M ( T ) = M T M(T)=M(T^(**))\mathcal{M}(T)=\mathcal{M}\left(T^{*}\right)M(T)=M(T) 当且仅当 b = 3 b = 3 b=3b=3b=3. 回想一下 M ( T ) M T M(T^(**))\mathcal{M}\left(T^{*}\right)M(T) M ( T ) M ( T ) M(T)\mathcal{M}(T)M(T) 的共轭转置,参见 7.10)。
请自行验证:两个自伴算子的和是自伴的,实数和自伴算子的乘积是自伴的.
有的数学家采用术语"埃尔米特的"代替"自伴的",以纪念法国数学家夏尔 • 埃尔米特,他在 1873年首次证明了 e 不是任何整系数多项式的根。
请记住一个很好的类比(尤其是当 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C时):伴随在 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 上所起的作用犹如复共轭在 C C C\mathbf{C}C 上所起的作用. 复数 z z zzz 是实的当且仅当 z = z ¯ z = z ¯ z= bar(z)z=\bar{z}z=z¯ ,因此自伴算子( T = T T = T T=T^(**)T=T^{*}T=T )可与实数类比。
我们将看到,这种类比也反映在自伴算子的某些重要性质上,先来看本征值.
F = R F = R F=R\mathbf{F}=\mathbf{R}F=R, 则由定义可知每个本征值都是实的, 所以下面的命题仅当 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C 时才有意思。

7.13 自伴算子的本征值是实的

自伴算子的每个本征值都是实的.
证明 设 T T TTT V V VVV 上的自伴算子, λ λ lambda\lambdaλ T T TTT 的本征值, v v vvv V V VVV 中的非零向量使得 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv.则
λ v 2 = λ v , v = T v , v = v , T v = v , λ v = λ ¯ v 2 . λ v 2 = λ v , v = T v , v = v , T v = v , λ v = λ ¯ v 2 . lambda||v||^(2)=(:lambda v,v:)=(:Tv,v:)=(:v,Tv:)=(:v,lambda v:)= bar(lambda)||v||^(2).\lambda\|v\|^{2}=\langle\lambda v, v\rangle=\langle T v, v\rangle=\langle v, T v\rangle=\langle v, \lambda v\rangle=\bar{\lambda}\|v\|^{2} .λv2=λv,v=Tv,v=v,Tv=v,λv=λ¯v2.
于是 λ = λ ¯ λ = λ ¯ lambda= bar(lambda)\lambda=\bar{\lambda}λ=λ¯, 即 λ λ lambda\lambdaλ 是实的.
下面的命题对实内积空间不成立. 例如, 考虑如下定义的算子 T L ( R 2 ) T L R 2 T inL(R^(2))T \in \mathcal{L}\left(\mathbf{R}^{2}\right)TL(R2), 它是绕原点的逆时针 90 90 90^(@)90^{\circ}90 旋转,因此 T ( x , y ) = ( y , x ) T ( x , y ) = ( y , x ) T(x,y)=(-y,x)T(x, y)=(-y, x)T(x,y)=(y,x) 。显然对每个 v R 2 v R 2 v inR^(2)v \in \mathbf{R}^{2}vR2 T v T v TvT vTv 正交于 v v vvv ,即使 T 0 T 0 T!=0T \neq 0T0

7.14 在 C 上,只有 0 算子才能使得 T v T v TvT vTv 总正交于 v v vvv

V V VVV 是复内积空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 假设对所有 v V v V v in Vv \in VvV 均有 T v , v = 0 T v , v = 0 (:Tv,v:)=0\langle T v, v\rangle=0Tv,v=0, 则 T = 0 T = 0 T=0T=0T=0.
证明 对所有 u , w V u , w V u,w in Vu, w \in Vu,wV 均有
T u , w = T ( u + w ) , u + w T ( u w ) , u w 4 + T ( u + i w ) , u + i w T ( u i w ) , u i w 4 i . T u , w = T ( u + w ) , u + w T ( u w ) , u w 4 + T ( u + i w ) , u + i w T ( u i w ) , u i w 4 i . {:[(:Tu","w:)=((:T(u+w),u+w:)-(:T(u-w),u-w:))/(4)],[+((:T(u+iw),u+iw:)-(:T(u-iw),u-iw:))/(4)i.]:}\begin{aligned} \langle T u, w\rangle= & \frac{\langle T(u+w), u+w\rangle-\langle T(u-w), u-w\rangle}{4} \\ & +\frac{\langle T(u+\mathrm{i} w), u+\mathrm{i} w\rangle-\langle T(u-\mathrm{i} w), u-\mathrm{i} w\rangle}{4} \mathrm{i} . \end{aligned}Tu,w=T(u+w),u+wT(uw),uw4+T(u+iw),u+iwT(uiw),uiw4i.
这个等式可通过计算右端得到。注意到右端的每一项都具有 T v , v T v , v (:Tv,v:)\langle T v, v\rangleTv,v 的形式. 我们的假设表明对所有 u , w V u , w V u,w in Vu, w \in Vu,wV 均有 T u , w = 0 T u , w = 0 (:Tu,w:)=0\langle T u, w\rangle=0Tu,w=0 ,从而 T = 0 T = 0 T=0T=0T=0 (取 w = T u w = T u w=Tuw=T uw=Tu )。
通过考虑实内积空间上的非自伴算子可知,下面的命题对实内积空间不成立。
下面的命题提供了自伴算子与实数具有相似性质的另一个例子。

7.15 在 C 上,仅自伴算子才能使 T v , v T v , v (:Tv,v:)\langle T v, v\rangleTv,v 都是实数

V V VVV 是复内积空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则 T T TTT 是自伴的当且仅当对每个 v V v V v in Vv \in VvV 均有 T v , v R T v , v R (:Tv,v:)inR\langle T v, v\rangle \in \mathbf{R}Tv,vR.
证明 设 v V v V v in Vv \in VvV. 则
T v , v T v , v = T v , v v , T v = T v , v T v , v = ( T T ) v , v . T v , v T v , v ¯ = T v , v v , T v = T v , v T v , v = T T v , v . (:Tv,v:)- bar((:Tv,v:))=(:Tv,v:)-(:v,Tv:)=(:Tv,v:)-(:T^(**)v,v:)=(:(T-T^(**))v,v:).\langle T v, v\rangle-\overline{\langle T v, v\rangle}=\langle T v, v\rangle-\langle v, T v\rangle=\langle T v, v\rangle-\left\langle T^{*} v, v\right\rangle=\left\langle\left(T-T^{*}\right) v, v\right\rangle .Tv,vTv,v=Tv,vv,Tv=Tv,vTv,v=(TT)v,v.
若对每个 v V v V v in Vv \in VvV 均有 T v , v R T v , v R (:Tv,v:)inR\langle T v, v\rangle \in \mathbf{R}Tv,vR, 则上式左端等于 0 , 所以对每个 v V v V v in Vv \in VvV 均有 ( T T ) v , v = 0 T T v , v = 0 (:(T-T^(**))v,v:)=0\left\langle\left(T-T^{*}\right) v, v\right\rangle=0(TT)v,v=0. 这表明 T T = 0 T T = 0 T-T^(**)=0T-T^{*}=0TT=0 (由于 7.14). 因此 T T TTT 是自伴的.
反之, 若 T T TTT 是自伴的, 则上式的右端等于 0 , 所以对每个 v V v V v in Vv \in VvV 均有 T v , v = T v , v = (:Tv,v:)=\langle T v, v\rangle=Tv,v= T v , v T v , v ¯ bar((:Tv,v:))\overline{\langle T v, v\rangle}Tv,v 。这表明对每个 v V v V v in Vv \in VvV 均有 T v , v R T v , v R (:Tv,v:)inR\langle T v, v\rangle \in \mathbf{R}Tv,vR.
在实内积空间 V V VVV 上,非零算子 T T TTT 可能使得对所有 v V v V v in Vv \in VvV 均有 T v , v = 0 T v , v = 0 (:Tv,v:)=0\langle T v, v\rangle=0Tv,v=0. 然而,以下命题表明对于非零自伴算子就不会出现这种情况。
7.16 若 T = T T = T T=T^(**)T=T^{*}T=T 且对所有 v v vvv 均有 T v , v = 0 T v , v = 0 (:Tv,v:)=0\langle T v, v\rangle=0Tv,v=0, 则 T = 0 T = 0 T=0T=0T=0
T T TTT V V VVV 上的自伴算子使得对所有 v V v V v in Vv \in VvV 均有 T v , v = 0 T v , v = 0 (:Tv,v:)=0\langle T v, v\rangle=0Tv,v=0, 则 T = 0 T = 0 T=0T=0T=0.
证明 我们已经对复内积空间证明了这一结论(没有 T T TTT 自伴的假设,参见 7.14). 因此可设 V V VVV 是实内积空间。若 u , w V u , w V u,w in Vu, w \in Vu,wV ,则
7.17
T u , w = T ( u + w ) , u + w T ( u w ) , u w 4 . T u , w = T ( u + w ) , u + w T ( u w ) , u w 4 . (:Tu,w:)=((:T(u+w),u+w:)-(:T(u-w),u-w:))/(4).\langle T u, w\rangle=\frac{\langle T(u+w), u+w\rangle-\langle T(u-w), u-w\rangle}{4} .Tu,w=T(u+w),u+wT(uw),uw4.
为证明上述等式,可利用下面的等式计算上式的右端:
T w , u = w , T u = T u , w , T w , u = w , T u = T u , w , (:Tw,u:)=(:w,Tu:)=(:Tu,w:),\langle T w, u\rangle=\langle w, T u\rangle=\langle T u, w\rangle,Tw,u=w,Tu=Tu,w,
其中第一个等号成立是因为 T T TTT 是自伴的,第二个等号成立是因为我们处理的是实内积空间。
7.17 右端的每一项都形如 T v , v T v , v (:Tv,v:)\langle T v, v\rangleTv,v 。因此对所有 u , w V u , w V u,w in Vu, w \in Vu,wV 均有 T u , w = 0 T u , w = 0 (:Tu,w:)=0\langle T u, w\rangle=0Tu,w=0, 从而 T = 0 T = 0 T=0T=0T=0 (取 w = T u w = T u w=Tuw=T uw=Tu )。

正规算子

7.18 定义 正规的(normal)

  • 内积空间上的算子称为正规的, 如果它和它的伴随是交换的.
  • 也就是说, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的, 如果 T T = T T T T = T T TT^(**)=T^(**)TT T^{*}=T^{*} TTT=TT.
自伴算子显然是正规的, 这是因为若 T T TTT 是自伴的, 则 T = T T = T T^(**)=TT^{*}=TT=T.
7.19 例 设 T T TTT F 2 F 2 F^(2)\mathbf{F}^{2}F2 上的算子,它(关于标准基)的矩阵为
( 2 3 3 2 ) 2 3 3 2 ([2,-3],[3,2])\left(\begin{array}{cc} 2 & -3 \\ 3 & 2 \end{array}\right)(2332)
证明 T T TTT 不是自伴的但 T T TTT 是正规的。
证明 这个算子不是自伴的, 因为第 2 行第 1 列的元素(等于3)不是第 1 行第 2 列元素(等于 -3 )的复共轭。
T T T T TT^(**)T T^{*}TT 的矩阵是
( 2 3 3 2 ) ( 2 3 3 2 ) = ( 13 0 0 13 ) . 2 3 3 2 2 3 3 2 = 13 0 0 13 . ([2,-3],[3,2])([2,3],[-3,2])=([13,0],[0,13]).\left(\begin{array}{cc} 2 & -3 \\ 3 & 2 \end{array}\right)\left(\begin{array}{cc} 2 & 3 \\ -3 & 2 \end{array}\right)=\left(\begin{array}{cc} 13 & 0 \\ 0 & 13 \end{array}\right) .(2332)(2332)=(130013).
类似地, T T T T T^(**)TT^{*} TTT 的矩阵是
( 2 3 3 2 ) ( 2 3 3 2 ) = ( 13 0 0 13 ) . 2 3 3 2 2 3 3 2 = 13 0 0 13 . ([2,3],[-3,2])([2,-3],[3,2])=([13,0],[0,13]).\left(\begin{array}{cc} 2 & 3 \\ -3 & 2 \end{array}\right)\left(\begin{array}{cc} 2 & -3 \\ 3 & 2 \end{array}\right)=\left(\begin{array}{cc} 13 & 0 \\ 0 & 13 \end{array}\right) .(2332)(2332)=(130013).
因为 T T T T TT^(**)T T^{*}TT T T T T T^(**)TT^{*} TTT 有相同的矩阵, 所以 T T = T T T T = T T TT^(**)=T^(**)TT T^{*}=T^{*} TTT=TT, 于是 T T TTT 是正规的.
以下命题表明对每个正规算子 T T TTT 均有 null T = null T T = null T T=nullT^(**)T=\operatorname{null} T^{*}T=nullT.
在下一节我们会看到为什么正规算子值得特别关注。
以下命题给出了正规算子的简单刻画。
7.20 T 7.20 T 7.20 T7.20 T7.20T 是正规的当且仅当对所有 v v vvv 均有 T v = T v T v = T v ||Tv||=||T^(**)v||\|T v\|=\left\|T^{*} v\right\|Tv=Tv
算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的当且仅当对所有 v V v V v in Vv \in VvV 均有 T v = T v T v = T v ||Tv||=||T^(**)v||\|T v\|=\left\|T^{*} v\right\|Tv=Tv.
证明 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 我们将同时证明这个结论的两个方面. 注意到 T T TTT 是正规的 T T T T = 0 T T T T = 0 LongleftrightarrowT^(**)T-TT^(**)=0\Longleftrightarrow T^{*} T-T T^{*}=0TTTT=0 ( T T T T ) ν , v = 0 T T T T ν , v = 0 Longleftrightarrow(:(T^(**)T-TT^(**))nu,v:)=0\Longleftrightarrow\left\langle\left(T^{*} T-T T^{*}\right) \nu, v\right\rangle=0(TTTT)ν,v=0 对所有 v V v V v in Vv \in VvV 成立 T T v , v = T T v , v T T v , v = T T v , v Longleftrightarrow(:T^(**)Tv,v:)=(:TT^(**)v,v:)\Longleftrightarrow\left\langle T^{*} T v, v\right\rangle=\left\langle T T^{*} v, v\right\rangleTTv,v=TTv,v 对所有 v V v V v in Vv \in VvV 成立 T v 2 = T v 2 T v 2 = T v 2 Longleftrightarrow||Tv||^(2)=||T^(**)v||^(2)\Longleftrightarrow\|T v\|^{2}=\left\|T^{*} v\right\|^{2}Tv2=Tv2 对所有 v V v V v in Vv \in VvV 成立,
其中第二个等价性由 7.16 得到(注意到算子 T T T T T T T T T^(**)T-TT^(**)T^{*} T-T T^{*}TTTT 是自伴的)。第一个条件和最后一个条件的等价性给出了要证明的结果。
把下面的命题与习题 2 比较一下。那个习题是说,算子的伴随的所有本征值(作为集合)等于该算子所有本征值的复共轭。但是该习题没说本征向量的事,这是因为算子与其伴随可以有不同的本征向量. 然而,由下面的命题可知,正规算子与其伴随有相同的本征向量。

7.21 若 T T TTT 正规, 则 T T TTT T T T^(**)T^{*}T 有相同的本征向量

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的,且 v V v V v in Vv \in VvV T T TTT 的相应于本征值 λ λ lambda\lambdaλ 的本征向量. 则 v v vvv 也是 T T T^(**)T^{*}T 的相应于本征值 λ ¯ λ ¯ bar(lambda)\bar{\lambda}λ¯ 的本征向量。
证明 因为 T T TTT 是正规的, 所以 T λ I T λ I T-lambda IT-\lambda ITλI 也是正规的(请自行验证)。利用 7.20 可得
0 = ( T λ I ) v = ( T λ I ) v = ( T λ ¯ I ) v 0 = ( T λ I ) v = ( T λ I ) v = T λ ¯ I v 0=||(T-lambda I)v||=||(T-lambda I)^(**)v||=||(T^(**)-( bar(lambda))I)v||0=\|(T-\lambda I) v\|=\left\|(T-\lambda I)^{*} v\right\|=\left\|\left(T^{*}-\bar{\lambda} I\right) v\right\|0=(TλI)v=(TλI)v=(Tλ¯I)v
因此 v v vvv T T T^(**)T^{*}T 的相应于本征值 λ ¯ λ ¯ bar(lambda)\bar{\lambda}λ¯ 的本征向量.
因为自伴算子是正规的,所以下面的命题也适用于自伴算子。

7.22 正规算子的正交本征向量

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的. 则 T T TTT 的相应于不同本征值的本征向量是正交的.
证明 设 α , β α , β alpha,beta\alpha, \betaα,β T T TTT 的不同本征值, u , v u , v u,vu, vu,v 分别是相应的本征向量, 于是 T u = α u T u = α u Tu=alpha uT u=\alpha uTu=αu T v = β v T v = β v Tv=beta vT v=\beta vTv=βv. 由 7.21 有 T v = β ¯ v T v = β ¯ v T^(**)v= bar(beta)vT^{*} v=\bar{\beta} vTv=β¯v 。因此
( α β ) u , v = α u , v u , β ¯ v = T u , v u , T v = 0 ( α β ) u , v = α u , v u , β ¯ v = T u , v u , T v = 0 {:[(alpha-beta)(:u","v:)=(:alpha u","v:)-(:u"," bar(beta)v:)],[=(:Tu","v:)-(:u,T^(**)v:)],[=0]:}\begin{aligned} (\alpha-\beta)\langle u, v\rangle & =\langle\alpha u, v\rangle-\langle u, \bar{\beta} v\rangle \\ & =\langle T u, v\rangle-\left\langle u, T^{*} v\right\rangle \\ & =0 \end{aligned}(αβ)u,v=αu,vu,β¯v=Tu,vu,Tv=0
因为 α β α β alpha!=beta\alpha \neq \betaαβ, 上面的等式表明 u , v = 0 u , v = 0 (:u,v:)=0\langle u, v\rangle=0u,v=0. 因此 u u uuu v v vvv 是正交的.

习题 7.A

1 设 n n nnn 是正整数. 定义 T L ( F n ) T L F n T inL(F^(n))T \in \mathcal{L}\left(\mathbf{F}^{n}\right)TL(Fn)
T ( z 1 , , z n ) = ( 0 , z 1 , , z n 1 ) T z 1 , , z n = 0 , z 1 , , z n 1 T(z_(1),dots,z_(n))=(0,z_(1),dots,z_(n-1))T\left(z_{1}, \ldots, z_{n}\right)=\left(0, z_{1}, \ldots, z_{n-1}\right)T(z1,,zn)=(0,z1,,zn1)
T ( z 1 , , z n ) T z 1 , , z n T^(**)(z_(1),dots,z_(n))T^{*}\left(z_{1}, \ldots, z_{n}\right)T(z1,,zn).
2 设 T L ( V ) , λ F T L ( V ) , λ F T inL(V),lambda inFT \in \mathcal{L}(V), \lambda \in \mathbf{F}TL(V),λF. 证明: λ λ lambda\lambdaλ T T TTT 的本征值当且仅当 λ ¯ λ ¯ bar(lambda)\bar{\lambda}λ¯ T T T^(**)T^{*}T 的本征值.
3 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) U U UUU V V VVV 的子空间。证明: U U UUU T T TTT 下不变当且仅当 U U U^(_|_)U^{\perp}U T T T^(**)T^{*}T 下不变。
4 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W). 证明:
(a) T T TTT 是单的当且仅当 T T T^(**)T^{*}T 是满的;
(b) T T TTT 是满的当且仅当 T T T^(**)T^{*}T 是单的.
5 证明:对每个 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) 均有
dim null T = dim null T + dim W dim V dim null T = dim null T + dim W dim V dim nullT^(**)=dim null T+dim W-dim V\operatorname{dim} \operatorname{null} T^{*}=\operatorname{dim} \operatorname{null} T+\operatorname{dim} W-\operatorname{dim} VdimnullT=dimnullT+dimWdimV
以及
dim range T = dim range T .  dim range  T = dim  range  T " dim range "T^(**)=dim" range "T". "\text { dim range } T^{*}=\operatorname{dim} \text { range } T \text {. } dim range T=dim range T
6 P 2 ( R ) 6 P 2 ( R ) 6P_(2)(R)6 \mathcal{P}_{2}(\mathbf{R})6P2(R) 按照内积
p , q = 0 1 p ( x ) q ( x ) d x p , q = 0 1 p ( x ) q ( x ) d x (:p,q:)=int_(0)^(1)p(x)q(x)dx\langle p, q\rangle=\int_{0}^{1} p(x) q(x) \mathrm{d} xp,q=01p(x)q(x)dx
是内积空间。定义 T L ( P 2 ( R ) ) T L P 2 ( R ) T inL(P_(2)(R))T \in \mathcal{L}\left(\mathcal{P}_{2}(\mathbf{R})\right)TL(P2(R)) 使得 T ( a 0 + a 1 x + a 2 x 2 ) = a 1 x T a 0 + a 1 x + a 2 x 2 = a 1 x T(a_(0)+a_(1)x+a_(2)x^(2))=a_(1)xT\left(a_{0}+a_{1} x+a_{2} x^{2}\right)=a_{1} xT(a0+a1x+a2x2)=a1x.
(a) 证明 T T TTT 不是自伴的.
(b) T T TTT 关于基 ( 1 , x , x 2 ) 1 , x , x 2 (1,x,x^(2))\left(1, x, x^{2}\right)(1,x,x2) 的矩阵为
( 0 0 0 0 1 0 0 0 0 ) 0      0      0 0      1      0 0      0      0 ([0,0,0],[0,1,0],[0,0,0])\left(\begin{array}{lll} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array}\right)(000010000)
虽然 T T TTT 不是自伴的,但是上面的矩阵等于其共轭转置. 解释为什么这并不矛盾。
7 设 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V) 都是自伴的。证明 S T S T STS TST 是自伴的当且仅当 S T = T S S T = T S ST=TSS T=T SST=TS.
8 设 V V VVV 是实内积空间。证明 V V VVV 上自伴算子的集合是 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 的子空间。
9 设 V V VVV 是复内积空间且 V { 0 } V { 0 } V!={0}V \neq\{0\}V{0} 。证明 V V VVV 上自伴算子的集合不是 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 的子空间。
10 设 dim V 2 dim V 2 dim V >= 2\operatorname{dim} V \geq 2dimV2. 证明 V V VVV 上正规算子的集合不是 L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 的子空间.
11 设 P L ( V ) P L ( V ) P inL(V)P \in \mathcal{L}(V)PL(V) 使得 P 2 = P P 2 = P P^(2)=PP^{2}=PP2=P. 证明: V V VVV 有一个子空间 U U UUU 使得 P = P U P = P U P=P_(U)P=P_{U}P=PU 当且仅当 P P PPP是自伴的。
12 设 T T TTT V V VVV 上的正规算子且 3 和 4 都是 T T TTT 的本征值. 证明存在向量 v V v V v in Vv \in VvV 使得 v = 2 v = 2 ||v||=sqrt2\|v\|=\sqrt{2}v=2 T v = 5 T v = 5 ||Tv||=5\|T v\|=5Tv=5
13 找出一个算子 T L ( C 4 ) T L C 4 T inL(C^(4))T \in \mathcal{L}\left(\mathbf{C}^{4}\right)TL(C4) 使得 T T TTT 是正规的但不是自伴的。
14 设 T T TTT V V VVV 上的正规算子,并设 v , w V v , w V v,w in Vv, w \in Vv,wV 满足
v = w = 2 , T v = 3 v , T w = 4 w v = w = 2 , T v = 3 v , T w = 4 w ||v||=||w||=2,quad Tv=3v,quad Tw=4w\|v\|=\|w\|=2, \quad T v=3 v, \quad T w=4 wv=w=2,Tv=3v,Tw=4w
证明 T ( v + w ) = 10 T ( v + w ) = 10 ||T(v+w)||=10\|T(v+w)\|=10T(v+w)=10
15 取定 u , x V u , x V u,x in Vu, x \in Vu,xV. 定义 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 如下: 对每个 v V v V v in Vv \in VvV T v = v , u x T v = v , u x Tv=(:v,u:)xT v=\langle v, u\rangle xTv=v,ux.
(a)设 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R. 证明: T T TTT 是自伴的当且仅当 u , x u , x u,xu, xu,x 是线性相关的.
(b) 证明: T T TTT 是正规的当且仅当 u , x u , x u,xu, xu,x 是线性相关的.
16 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的。证明 range T = range T T = range T T=rangeT^(**)T=\operatorname{range} T^{*}T=rangeT
17 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的. 证明:对每个正整数 k k kkk 均有
null T k = null T range T k = range T . null T k = null T  且  range T k = range T . nullT^(k)=null T quad" 且 "quad rangeT^(k)=range T.\operatorname{null} T^{k}=\operatorname{null} T \quad \text { 且 } \quad \operatorname{range} T^{k}=\operatorname{range} T .nullTk=nullT 且 rangeTk=rangeT.
18 证明或给出反例:若 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) V V VVV 有规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得对每个 j j jjj 均有 T e j = T e j T e j = T e j ||Te_(j)||=||T^(**)e_(j)||\left\|T e_{j}\right\|=\left\|T^{*} e_{j}\right\|Tej=Tej ,那么 T T TTT 是正规的。
19 设 T L ( C 3 ) T L C 3 T inL(C^(3))T \in \mathcal{L}\left(\mathbf{C}^{3}\right)TL(C3) 是正规的且 T ( 1 , 1 , 1 ) = ( 2 , 2 , 2 ) T ( 1 , 1 , 1 ) = ( 2 , 2 , 2 ) T(1,1,1)=(2,2,2)T(1,1,1)=(2,2,2)T(1,1,1)=(2,2,2). 设 ( z 1 , z 2 , z 3 ) null T z 1 , z 2 , z 3 null T (z_(1),z_(2),z_(3))in null T\left(z_{1}, z_{2}, z_{3}\right) \in \operatorname{null} T(z1,z2,z3)nullT. 证明 z 1 + z 2 + z 3 = 0 z 1 + z 2 + z 3 = 0 z_(1)+z_(2)+z_(3)=0z_{1}+z_{2}+z_{3}=0z1+z2+z3=0.
20 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W) F = R F = R F=R\mathbf{F}=\mathbf{R}F=R. 设 Φ V Φ V Phi_(V)\Phi_{V}ΦV 是 6.B 节习题 17 中给出的从 V V VVV 到对偶空间 V V V^(')V^{\prime}V的那个同构,并设 Φ W Φ W Phi_(W)\Phi_{W}ΦW 是从 W W WWW W W W^(')W^{\prime}W 的类似的同构。证明:如果我们通过 Φ V Φ V Phi_(V)\Phi_{V}ΦV Φ W Φ W Phi_(W)\Phi_{W}ΦW V V VVV W W WWW 等同于 V V V^(')V^{\prime}V W W W^(')W^{\prime}W ,那么 T T T^(**)T^{*}T 等同于对偶映射 T T T^(')T^{\prime}T 。更确切地,证明 Φ V T = T Φ W Φ V T = T Φ W Phi_(V)@T^(**)=T^(')@Phi_(W)\Phi_{V} \circ T^{*}=T^{\prime} \circ \Phi_{W}ΦVT=TΦW.
21 取定正整数 n n nnn. [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上的实值连续函数按内积
f , g = π π f ( x ) g ( x ) d x f , g = π π f ( x ) g ( x ) d x (:f,g:)=int_(-pi)^(pi)f(x)g(x)dx\langle f, g\rangle=\int_{-\pi}^{\pi} f(x) g(x) \mathrm{d} xf,g=ππf(x)g(x)dx
构成内积空间,在这个内积空间中设
V = span ( 1 , cos x , cos 2 x , , cos n x , sin x , sin 2 x , , sin n x ) V = span ( 1 , cos x , cos 2 x , , cos n x , sin x , sin 2 x , , sin n x ) V=span(1,cos x,cos 2x,dots,cos nx,sin x,sin 2x,dots,sin nx)V=\operatorname{span}(1, \cos x, \cos 2 x, \ldots, \cos n x, \sin x, \sin 2 x, \ldots, \sin n x)V=span(1,cosx,cos2x,,cosnx,sinx,sin2x,,sinnx)
(a) 定义 D L ( V ) D L ( V ) D inL(V)D \in \mathcal{L}(V)DL(V) D f = f D f = f Df=f^(')D f=f^{\prime}Df=f 。证明 D = D D = D D^(**)=-DD^{*}=-DD=D. 由此得出如下结论: D D DDD 是正规的但不是自伴的.
(b) 定义 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) T f = f T f = f Tf=f^('')T f=f^{\prime \prime}Tf=f 。证明 T T TTT 是自伴的.

7.B 谱定理

回想一下,对角矩阵是对角线之外的元素都是 0 的方阵; V V VVV 上的算子关于某个基有对角矩阵当且仅当这个基是由该算子的本征向量组成的(参见5.41)。
关于 V V VVV 的某个规范正交基具有对角矩阵的算子是 V V VVV 上最好的算子, 它们恰好是具有如下性质的算子 T L ( V ) : V T L ( V ) : V T inL(V):VT \in \mathcal{L}(V): VTL(V):V 有一个由 T T TTT 的本征向量组成的规范正交基. 本节的目的是证明谱定理。谱定理表明:具有上述性质的算子当 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C 时恰为正规算子,当 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R 时恰为自伴算子。谱定理可能是研究内积空间上算子的最有用的工具.
因为谱定理的结论依赖于 F F F\mathbf{F}F ,所以我们把谱定理分成两部分,分别叫做复谱定理和实谱定理。同线性代数中的大多数情形一样,处理复向量空间要比处理实向量空间容易,因此我们先给出复谱定理。

复谱定理

复谱定理 7.24 主要是说,若 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规的,则 T T TTT 关于 V V VVV 的某个规范正交基具有对角矩阵. 下面的例子解释了这个结论.
7.23 例 考虑例 7.19 中的正规算子 T L ( C 2 ) T L C 2 T inL(C^(2))T \in \mathcal{L}\left(\mathbf{C}^{2}\right)TL(C2) ,它(关于标准基)的矩阵是
( 2 3 3 2 ) 2 3 3 2 ([2,-3],[3,2])\left(\begin{array}{cc} 2 & -3 \\ 3 & 2 \end{array}\right)(2332)
请自行验证, ( i , 1 ) 2 , ( i , 1 ) 2 ( i , 1 ) 2 , ( i , 1 ) 2 ((i,1))/(sqrt2),((-i,1))/(sqrt2)\frac{(\mathrm{i}, 1)}{\sqrt{2}}, \frac{(-\mathrm{i}, 1)}{\sqrt{2}}(i,1)2,(i,1)2 是由 T T TTT 的本征向量构成的 C 2 C 2 C^(2)\mathbf{C}^{2}C2 的规范正交基, T T TTT 关于此基有对角矩阵
( 2 + 3 i 0 0 2 3 i ) 2 + 3 i 0 0 2 3 i ([2+3i,0],[0,2-3i])\left(\begin{array}{cc} 2+3 \mathrm{i} & 0 \\ 0 & 2-3 \mathrm{i} \end{array}\right)(2+3i0023i)
在下面的定理中, (b) 和 (c) 的等价性是容易的(参见 5.41)。所以我们只需证明 (c)蕴涵(a)且(a)蕴涵(c)。

7.24 复谱定理

F = C F = C F=C\mathbf{F}=\mathbf{C}F=C T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则以下条件等价:
(a) T T TTT 是正规的.
(b) V V VVV 有一个由 T T TTT 的本征向量组成的规范正交基.
(c) T T TTT 关于 V V VVV 的某个规范正交基具有对角矩阵。
证明 首先假定(c)成立,则 T T TTT V V VVV 的某个规范正交基下具有对角矩阵。 T T T^(**)T^{*}T (关于同一个基)的矩阵是 T T TTT 的矩阵的共轭转置,所以 T T T^(**)T^{*}T 也具有对角矩阵。任意两个对角矩阵都是交换的,所以 T T TTT T T T^(**)T^{*}T 是交换的,从而 T T TTT 是正规的。也就是说(a)成立。
现在假定(a)成立,则 T T TTT 是正规的。由舒尔定理6.38, V V VVV 有一个规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得 T T TTT 关于此基有上三角矩阵。于是
7.25
M ( T , ( e 1 , , e n ) ) = ( a 1 , 1 a 1 , n 0 a n , n ) M T , e 1 , , e n = a 1 , 1 a 1 , n 0 a n , n M(T,(e_(1),dots,e_(n)))=([a_(1,1),dots,a_(1,n)],[,ddots,vdots],[0,,a_(n,n)])\mathcal{M}\left(T,\left(e_{1}, \ldots, e_{n}\right)\right)=\left(\begin{array}{ccc} a_{1,1} & \ldots & a_{1, n} \\ & \ddots & \vdots \\ 0 & & a_{n, n} \end{array}\right)M(T,(e1,,en))=(a1,1a1,n0an,n)
我们将证明这个矩阵实际上是对角矩阵。
由上面的矩阵可得
T e 1 2 = | a 1 , 1 | 2 T e 1 2 = a 1 , 1 2 ||Te_(1)||^(2)=|a_(1,1)|^(2)\left\|T e_{1}\right\|^{2}=\left|a_{1,1}\right|^{2}Te12=|a1,1|2
T e 1 2 = | a 1 , 1 | 2 + | a 1 , 2 | 2 + + | a 1 , n | 2 T e 1 2 = a 1 , 1 2 + a 1 , 2 2 + + a 1 , n 2 ||T^(**)e_(1)||^(2)=|a_(1,1)|^(2)+|a_(1,2)|^(2)+cdots+|a_(1,n)|^(2)\left\|T^{*} e_{1}\right\|^{2}=\left|a_{1,1}\right|^{2}+\left|a_{1,2}\right|^{2}+\cdots+\left|a_{1, n}\right|^{2}Te12=|a1,1|2+|a1,2|2++|a1,n|2
因为 T T TTT 是正规的,所以 T e 1 = T e 1 T e 1 = T e 1 ||Te_(1)||=||T^(**)e_(1)||\left\|T e_{1}\right\|=\left\|T^{*} e_{1}\right\|Te1=Te1 (见 7.20)。于是由上面的两个等式可知, 7.25 中矩阵的第一行除了第一个元素 a 1 , 1 a 1 , 1 a_(1,1)a_{1,1}a1,1 之外都等于 0 .
现在由 7.25 可得
T e 2 2 = | a 2 , 2 | 2 T e 2 2 = a 2 , 2 2 ||Te_(2)||^(2)=|a_(2,2)|^(2)\left\|T e_{2}\right\|^{2}=\left|a_{2,2}\right|^{2}Te22=|a2,2|2
(因为如上一段所证 a 1 , 2 = 0 a 1 , 2 = 0 a_(1,2)=0a_{1,2}=0a1,2=0 ) 且
T e 2 2 = | a 2 , 2 | 2 + | a 2 , 3 | 2 + + | a 2 , n | 2 . T e 2 2 = a 2 , 2 2 + a 2 , 3 2 + + a 2 , n 2 . ||T^(**)e_(2)||^(2)=|a_(2,2)|^(2)+|a_(2,3)|^(2)+cdots+|a_(2,n)|^(2).\left\|T^{*} e_{2}\right\|^{2}=\left|a_{2,2}\right|^{2}+\left|a_{2,3}\right|^{2}+\cdots+\left|a_{2, n}\right|^{2} .Te22=|a2,2|2+|a2,3|2++|a2,n|2.
因为 T T TTT 是正规的, 所以 T e 2 = T e 2 T e 2 = T e 2 ||Te_(2)||=||T^(**)e_(2)||\left\|T e_{2}\right\|=\left\|T^{*} e_{2}\right\|Te2=Te2. 于是由上面的两个等式可知, 7.25 中矩阵的第二行除了对角线元素 a 2 , 2 a 2 , 2 a_(2,2)a_{2,2}a2,2 之外都等于 0 。
如此继续下去可知, 7.25 中矩阵的非对角线元素都等于 0 。因此(c)成立。

实谱定理

为证明实谱定理,我们需要几个引理,它们对于实内积空间和复内积空间都适用。
你可能会猜到下面的引理,甚至可能通过考虑实系数的二次多项式给出其证明。具体来
这种配方法可以用来推导二次方程的求根公式。
说,设 b , c R b , c R b,c inRb, c \in \mathbf{R}b,cR b 2 < 4 c b 2 < 4 c b^(2) < 4cb^{2}<4 cb2<4c ,设 x x xxx 是实数,则
x 2 + b x + c = ( x + b 2 ) 2 + ( c b 2 4 ) > 0 x 2 + b x + c = x + b 2 2 + c b 2 4 > 0 x^(2)+bx+c=(x+(b)/(2))^(2)+(c-(b^(2))/(4)) > 0x^{2}+b x+c=\left(x+\frac{b}{2}\right)^{2}+\left(c-\frac{b^{2}}{4}\right)>0x2+bx+c=(x+b2)2+(cb24)>0
特别地, x 2 + b x + c x 2 + b x + c x^(2)+bx+cx^{2}+b x+cx2+bx+c 是可逆实数("非 0 " 的一种诘屈表达)。用自伴算子代替实数 x x xxx (回想一下实数和自伴算子之间的类比)可以得出下面的引理。

7.26 可逆的二次式

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的, 并设 b , c R b , c R b,c inRb, c \in \mathbf{R}b,cR 使得 b 2 < 4 c b 2 < 4 c b^(2) < 4cb^{2}<4 cb2<4c. 则
T 2 + b T + c I T 2 + b T + c I T^(2)+bT+cIT^{2}+b T+c IT2+bT+cI
是可逆的。
证明 设 v v vvv V V VVV 中的非零向量. 则
( T 2 + b T + c I ) v , v = T 2 v , v + b T v , v + c v , v = T v , T v + b T v , v + c v 2 T v 2 | b | T v v + c v 2 = ( T v | b | v 2 ) 2 + ( c b 2 4 ) v 2 > 0 T 2 + b T + c I v , v = T 2 v , v + b T v , v + c v , v = T v , T v + b T v , v + c v 2 T v 2 | b | T v v + c v 2 = T v | b | v 2 2 + c b 2 4 v 2 > 0 {:[(:(T^(2)+bT+cI)v,v:)=(:T^(2)v,v:)+b(:Tv","v:)+c(:v","v:)],[=(:Tv","Tv:)+b(:Tv","v:)+c||v||^(2)],[ >= ||Tv||^(2)-|b|||Tv||||v||+c||v||^(2)],[=(||Tv||-(|b|||v||)/(2))^(2)+(c-(b^(2))/(4))||v||^(2)],[ > 0]:}\begin{aligned} \left\langle\left(T^{2}+b T+c I\right) v, v\right\rangle & =\left\langle T^{2} v, v\right\rangle+b\langle T v, v\rangle+c\langle v, v\rangle \\ & =\langle T v, T v\rangle+b\langle T v, v\rangle+c\|v\|^{2} \\ & \geq\|T v\|^{2}-|b|\|T v\|\|v\|+c\|v\|^{2} \\ & =\left(\|T v\|-\frac{|b|\|v\|}{2}\right)^{2}+\left(c-\frac{b^{2}}{4}\right)\|v\|^{2} \\ & >0 \end{aligned}(T2+bT+cI)v,v=T2v,v+bTv,v+cv,v=Tv,Tv+bTv,v+cv2Tv2|b|Tvv+cv2=(Tv|b|v2)2+(cb24)v2>0
其中第三行成立是利用柯西-施瓦茨不等式 6.15. 由上面最后的那个不等式可得 ( T 2 + b T + c I ) v 0 T 2 + b T + c I v 0 (T^(2)+bT+cI)v!=0\left(T^{2}+b T+c I\right) v \neq 0(T2+bT+cI)v0. 于是 T 2 + b T + c I T 2 + b T + c I T^(2)+bT+cIT^{2}+b T+c IT2+bT+cI 是单的,从而是可逆的(参见3.69).
我们已经知道,有限维非零复向量空间上的算子无论自伴与否都有本征值(参见 5.21 ,因此下面的引理仅对实内积空间是新的。

7.27 自伴算子都有本征值

V { 0 } V { 0 } V!={0}V \neq\{0\}V{0} T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴算子, 则 T T TTT 有本征值.
证明 如前所述,可设 V V VVV 是实内积空间. 设 n = dim V n = dim V n=dim Vn=\operatorname{dim} Vn=dimV. 取 v V v V v in Vv \in VvV 使得 v 0 v 0 v!=0v \neq 0v0. 则
v , T v , T 2 v , , T n v v , T v , T 2 v , , T n v v,Tv,T^(2)v,dots,T^(n)vv, T v, T^{2} v, \ldots, T^{n} vv,Tv,T2v,,Tnv
不可能是线性无关的,这是因为 V V VVV n n nnn 维的,而这里有 n + 1 n + 1 n+1n+1n+1 个向量. 于是,有不全为 0 的实数 a 0 , , a n a 0 , , a n a_(0),dots,a_(n)a_{0}, \ldots, a_{n}a0,,an 使得
0 = a 0 v + a 1 T v + + a n T n v 0 = a 0 v + a 1 T v + + a n T n v 0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v0=a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v0=a0v+a1Tv++anTnv
以这些 a j a j a_(j)a_{j}aj 为系数作一个多项式,并将此多项式分解成(参见 4.17)
a 0 + a 1 x + + a n x n = c ( x 2 + b 1 x + c 1 ) ( x 2 + b M x + c M ) ( x λ 1 ) ( x λ m ) a 0 + a 1 x + + a n x n = c x 2 + b 1 x + c 1 x 2 + b M x + c M x λ 1 x λ m {:[a_(0)+a_(1)x+cdots+a_(n)x^(n)],[quad=c(x^(2)+b_(1)x+c_(1))cdots(x^(2)+b_(M)x+c_(M))(x-lambda_(1))cdots(x-lambda_(m))]:}\begin{aligned} & a_{0}+a_{1} x+\cdots+a_{n} x^{n} \\ & \quad=c\left(x^{2}+b_{1} x+c_{1}\right) \cdots\left(x^{2}+b_{M} x+c_{M}\right)\left(x-\lambda_{1}\right) \cdots\left(x-\lambda_{m}\right) \end{aligned}a0+a1x++anxn=c(x2+b1x+c1)(x2+bMx+cM)(xλ1)(xλm)
其中 c c ccc 是非零实数,每个 b j , c j b j , c j b_(j),c_(j)b_{j}, c_{j}bj,cj λ j λ j lambda_(j)\lambda_{j}λj 都是实的,每个 b j 2 b j 2 b_(j)^(2)b_{j}{ }^{2}bj2 小于 4 c j , m + M 1 4 c j , m + M 1 4c_(j),m+M >= 14 c_{j}, m+M \geq 14cj,m+M1 ,并且上面的等式对所有实的 x x xxx 都成立。那么我们有
0 = a 0 v + a 1 T v + + a n T n v = ( a 0 I + a 1 T + + a n T n ) v = c ( T 2 + b 1 T + c 1 I ) ( T 2 + b M T + c M I ) ( T λ 1 I ) ( T λ m I ) v 0 = a 0 v + a 1 T v + + a n T n v = a 0 I + a 1 T + + a n T n v = c T 2 + b 1 T + c 1 I T 2 + b M T + c M I T λ 1 I T λ m I v {:[0=a_(0)v+a_(1)Tv+cdots+a_(n)T^(n)v],[=(a_(0)I+a_(1)T+cdots+a_(n)T^(n))v],[=c(T^(2)+b_(1)T+c_(1)I)dots(T^(2)+b_(M)T+c_(M)I)(T-lambda_(1)I)dots(T-lambda_(m)I)v]:}\begin{aligned} & 0=a_{0} v+a_{1} T v+\cdots+a_{n} T^{n} v \\ & =\left(a_{0} I+a_{1} T+\cdots+a_{n} T^{n}\right) v \\ & =c\left(T^{2}+b_{1} T+c_{1} I\right) \ldots\left(T^{2}+b_{M} T+c_{M} I\right)\left(T-\lambda_{1} I\right) \ldots\left(T-\lambda_{m} I\right) v \end{aligned}0=a0v+a1Tv++anTnv=(a0I+a1T++anTn)v=c(T2+b1T+c1I)(T2+bMT+cMI)(Tλ1I)(TλmI)v
由 7.26, 每个 T 2 + b j T + c j I T 2 + b j T + c j I T^(2)+b_(j)T+c_(j)IT^{2}+b_{j} T+c_{j} IT2+bjT+cjI 都是可逆的. 而 c 0 c 0 c!=0c \neq 0c0. 所以上面的等式表明 m > 0 m > 0 m > 0m>0m>0
0 = ( T λ 1 I ) ( T λ m I ) v 0 = T λ 1 I T λ m I v 0=(T-lambda_(1)I)cdots(T-lambda_(m)I)v0=\left(T-\lambda_{1} I\right) \cdots\left(T-\lambda_{m} I\right) v0=(Tλ1I)(TλmI)v
所以至少有一个 j j jjj 使得 T λ j I T λ j I T-lambda_(j)IT-\lambda_{j} ITλjI 不是单的。也就是说 T T TTT 有本征值.
下面的引理表明,若 U U UUU V V VVV 的在自伴算子 T T TTT 下不变的子空间,则 U U U^(_|_)U^{\perp}U 也在 T T TTT下不变。我们以后会证明 " T T TTT 是自伴的"这一假设可以换成更弱的假设 " T T TTT 是正规的"(参见 9.30)。

7.28 自伴算子与不变子空间

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的,并设 U U UUU V V VVV 的在 T T TTT 下不变的子空间. 则
(a) U U U^(_|_)U^{\perp}U T T TTT 下不变;
(b) T | U L ( U ) T U L ( U ) T|_(U)inL(U)\left.T\right|_{U} \in \mathcal{L}(U)T|UL(U) 是自伴的;
(c) T | U L ( U ) T U L U T|_(U _|_)inL(U^(_|_))\left.T\right|_{U \perp} \in \mathcal{L}\left(U^{\perp}\right)T|UL(U) 是自伴的.
证明 为证明 (a), 设 v U , u U v U , u U v inU^(_|_),u in Uv \in U^{\perp}, u \in UvU,uU. 则
T v , u = v , T u = 0 , T v , u = v , T u = 0 , (:Tv,u:)=(:v,Tu:)=0,\langle T v, u\rangle=\langle v, T u\rangle=0,Tv,u=v,Tu=0,
其中第一个等号成立是因为 T T TTT 是自伴的,第二个等号成立是因为 U U UUU T T TTT 下不变 (从而 T u U T u U Tu in UT u \in UTuU )以及 v U v U v inU^(_|_)v \in U^{\perp}vU 。因为上面的等式对每个 u U u U u in Uu \in UuU 都成立,所以可得 T v U T v U Tv inU^(_|_)T v \in U^{\perp}TvU 。因此 U U U^(_|_)U^{\perp}U T T TTT 下不变, 这就证明了 (a).
为证明(b),注意到若 u , v U u , v U u,v in Uu, v \in Uu,vU
( T | U ) u , v = T u , v = u , T v = u , ( T | U ) v T U u , v = T u , v = u , T v = u , T U v (:(T|_(U))u,v:)=(:Tu,v:)=(:u,Tv:)=(:u,(T|_(U))v:)\left\langle\left(\left.T\right|_{U}\right) u, v\right\rangle=\langle T u, v\rangle=\langle u, T v\rangle=\left\langle u,\left(\left.T\right|_{U}\right) v\right\rangle(T|U)u,v=Tu,v=u,Tv=u,(T|U)v
因此 T | U T U T|_(U)\left.T\right|_{U}T|U 是自伴的.
由于 (a), U U U^(_|_)U^{\perp}U T T TTT 下不变, 所以将 (b) 中的 U U UUU 换成 U U U^(_|_)U^{\perp}U 可得 (c).
现在我们来证明实谱定理,它是线性代数的主要定理之一。

7.29 实谱定理

F = R F = R F=R\mathbf{F}=\mathbf{R}F=R T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则以下条件等价:
(a) T T TTT 是自伴的.
(b) V V VVV 有一个由 T T TTT 的本征向量组成的规范正交基.
(c) T T TTT 关于 V V V\boldsymbol{V}V 的某个规范正交基具有对角矩阵。
证明 首先设(c)成立,则 T T TTT 关于 V V VVV 的某个规范正交基具有对角矩阵。对角矩阵等于其转置. 故 T = T T = T T=T^(**)T=T^{*}T=T ,因此 T T TTT 是自伴的。也就是说(a)成立。
我们将对 dim V dim V dim V\operatorname{dim} VdimV 用归纳法来证明(a)蕴涵(b)。首先,注意到若 dim V = 1 dim V = 1 dim V=1\operatorname{dim} V=1dimV=1 则(a)蕴涵 (b). 现在设 dim V > 1 dim V > 1 dim V > 1\operatorname{dim} V>1dimV>1 ,并假设在维数更小的实内积空间上 (a) 蕴涵 (b).
设 (a) 成立,则 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的。设 u u uuu T T TTT 的本征向量且 u = 1 u = 1 ||u||=1\|u\|=1u=1 (7.27 保证了 T T TTT 有本征向量,除以它的范数就可以得到一个范数为 1 的本征向量)。设 U = U = U=U=U= span ( u ) span ( u ) span(u)\operatorname{span}(u)span(u) 。则 U U UUU V V VVV 的一维子空间且在 T T TTT 下不变。由于 7.28 (c), 算子 T | U L ( U ) T U L U T|_(U^(_|_))inL(U^(_|_))\left.T\right|_{U^{\perp}} \in \mathcal{L}\left(U^{\perp}\right)T|UL(U)是自伴的。
由归纳法假设, U U U^(_|_)U^{\perp}U 有一个由 T | U T U T|_(U^(_|_))\left.T\right|_{U^{\perp}}T|U 的本征向量组成的规范正交基. 把 u u uuu 添加到 U U U^(_|_)U^{\perp}U 的这个规范正交基,就得到了 V V VVV 的一个由 T T TTT 的本征向量组成的规范正交基,这就证明了(a)蕴涵(b)。
我们已经证明了 (c) 蕴涵 (a) 且 (a) 蕴涵 (b). 显然 (b) 蕴涵 (c), 这就完成了证明.
7.30 例 考虑 R 3 R 3 R^(3)\mathbf{R}^{3}R3 上的自伴算子 T T TTT ,其(关于标准基的)矩阵为
( 14 13 8 13 14 8 8 8 7 ) 14 13 8 13 14 8 8 8 7 ([14,-13,8],[-13,14,8],[8,8,-7])\left(\begin{array}{ccc} 14 & -13 & 8 \\ -13 & 14 & 8 \\ 8 & 8 & -7 \end{array}\right)(1413813148887)
请自行验证
( 1 , 1 , 0 ) 2 , ( 1 , 1 , 1 ) 3 , ( 1 , 1 , 2 ) 6 ( 1 , 1 , 0 ) 2 , ( 1 , 1 , 1 ) 3 , ( 1 , 1 , 2 ) 6 ((1,-1,0))/(sqrt2),((1,1,1))/(sqrt3),((1,1,-2))/(sqrt6)\frac{(1,-1,0)}{\sqrt{2}}, \frac{(1,1,1)}{\sqrt{3}}, \frac{(1,1,-2)}{\sqrt{6}}(1,1,0)2,(1,1,1)3,(1,1,2)6
R 3 R 3 R^(3)\mathbf{R}^{3}R3 的由 T T TTT 的本征向量构成的规范正交基,且 T T TTT 关于这个基的矩阵是对角矩阵
( 27 0 0 0 9 0 0 0 15 ) 27 0 0 0 9 0 0 0 15 ([27,0,0],[0,9,0],[0,0,-15])\left(\begin{array}{ccc} 27 & 0 & 0 \\ 0 & 9 & 0 \\ 0 & 0 & -15 \end{array}\right)(27000900015)
F = C F = C F=C\mathbf{F}=\mathbf{C}F=C ,则复谱定理给出了 V V VVV 上正规算子的完全描述。由此可以完全描述 V V VVV上的自伴算子(它们是 V V VVV 上的正规算子且本征值都是实的,见习题 6)。
F = R F = R F=R\mathbf{F}=\mathbf{R}F=R ,则实谱定理给出了 V V VVV 上自伴算子的完全描述。在第9章,我们将给出 V V VVV 上正规算子的完全描述(参见9.34)。

习题 7.B

1 判断正误(并证明你的结论):存在 T L ( R 3 ) T L R 3 T inL(R^(3))T \in \mathcal{L}\left(\mathbf{R}^{3}\right)TL(R3) 使得 T T TTT (关于通常的内积)不是自伴的并且 R 3 R 3 R^(3)\mathbf{R}^{3}R3 有一个由 T T TTT 的本征向量构成的基。
2 设 T T TTT 是有限维内积空间上的自伴算子,且 2 和 3 是 T T TTT 仅有的本征值. 证明 T 2 5 T + 6 I = 0 T 2 5 T + 6 I = 0 T^(2)-5T+6I=0T^{2}-5 T+6 I=0T25T+6I=0.
3 找出一个算子 T L ( C 3 ) T L C 3 T inL(C^(3))T \in \mathcal{L}\left(\mathbf{C}^{3}\right)TL(C3) 使得 2 和 3 是 T T TTT 仅有的征值且 T 2 5 T + 6 I 0 T 2 5 T + 6 I 0 T^(2)-5T+6I!=0T^{2}-5 T+6 I \neq 0T25T+6I0.
4 设 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。证明: T T TTT 是正规的当且仅当 T T TTT 的对应于不同本征值的任意一对本征向量都是正交的且
V = E ( λ 1 , T ) E ( λ m , T ) V = E λ 1 , T E λ m , T V=E(lambda_(1),T)o+cdots o+E(lambda_(m),T)V=E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right)V=E(λ1,T)E(λm,T)
这里 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的全体互不相同的本征值.
5 设 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明: T T TTT 是自伴的当且仅当 T T TTT 的对应于不同本征值的任意一对本征向量都是正交的且
V = E ( λ 1 , T ) E ( λ m , T ) V = E λ 1 , T E λ m , T V=E(lambda_(1),T)o+cdots o+E(lambda_(m),T)V=E\left(\lambda_{1}, T\right) \oplus \cdots \oplus E\left(\lambda_{m}, T\right)V=E(λ1,T)E(λm,T)
这里 λ 1 , , λ m λ 1 , , λ m lambda_(1),dots,lambda_(m)\lambda_{1}, \ldots, \lambda_{m}λ1,,λm T T TTT 的全体互不相同的本征值.
6 证明:复内积空间上的正规算子是自伴的当且仅当它的所有本征值都是实的。本题(对正规算子)加强了自伴算子与实数之间的类比。
7 设 V V VVV 是复内积空间, T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正规算子使得 T 9 = T 8 T 9 = T 8 T^(9)=T^(8)T^{9}=T^{8}T9=T8 。证明: T T TTT 是自伴的且 T 2 = T T 2 = T T^(2)=TT^{2}=TT2=T
8 找出复向量空间的一个算子 T T TTT 使得 T 9 = T 8 T 9 = T 8 T^(9)=T^(8)T^{9}=T^{8}T9=T8 T 2 T T 2 T T^(2)!=TT^{2} \neq TT2T.
9 设 V V VVV 是复内积空间。证明 V V VVV 上的每个正规算子都有平方根. (算子 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 称为 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 的平方根,如果 S 2 = T S 2 = T S^(2)=TS^{2}=TS2=T 。)
10 找出一个实内积空间 V V VVV T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 以及满足 b 2 < 4 c b 2 < 4 c b^(2) < 4cb^{2}<4 cb2<4c 的实数 b , c b , c b,cb, cb,c 使得 T 2 + b T + c I T 2 + b T + c I T^(2)+bT+cIT^{2}+b T+c IT2+bT+cI不是可逆的。
本题表明,即使对于实向量空间, 7.26 中 T T TTT 自伴的假设也是必要的.
11 证明或给出反例: V V VVV 上每个自伴算子都有立方根。(算子 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 称为 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V)的立方根,如果 S 3 = T S 3 = T S^(3)=TS^{3}=TS3=T 。)
12 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的, λ F λ F lambda inF\lambda \in \mathbf{F}λF ϵ > 0 ϵ > 0 epsilon > 0\epsilon>0ϵ>0. 假设存在 v V v V v in Vv \in VvV 使得 v = 1 v = 1 ||v||=1\|v\|=1v=1
T v λ v < ϵ T v λ v < ϵ ||Tv-lambda v|| < epsilon\|T v-\lambda v\|<\epsilonTvλv<ϵ
证明 T T TTT 有一个本征值 λ λ lambda^(')\lambda^{\prime}λ 使得 | λ λ | < ϵ λ λ < ϵ |lambda-lambda^(')| < epsilon\left|\lambda-\lambda^{\prime}\right|<\epsilon|λλ|<ϵ.
13 给出复谱定理的另一个证明,不要使用舒尔定理,而是按照实谱定理的证明方式。
14 设 U U UUU 是有限维的实向量空间且 T L ( U ) T L ( U ) T inL(U)T \in \mathcal{L}(U)TL(U). 证明: U U UUU 有一个由 T T TTT 的本征向量构成的基当且仅当存在 U U UUU 上的内积使得 T T TTT 是自伴算子。
15 求出下面被遮住的矩阵元素。

7.C 正算子与等距同构

正算子

7.31 定义 正算子(positive operator)
称算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正的, 如果 T T TTT 是自伴的且对所有 v V v V v in Vv \in VvV 均有 T v , v 0 T v , v 0 (:Tv,v:) >= 0\langle T v, v\rangle \geq 0Tv,v0.
V V VVV 是复向量空间,则 T T TTT 自伴的条件可以从上面的定义中去掉(由于 7.15)。

7.32 例 正算子

(a) 若 U U UUU V V VVV 的子空间,则正交投影 P U P U P_(U)P_{U}PU 是正算子(请自行验证).
(b) 若 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的,且 b , c R b , c R b,c inRb, c \in \mathbf{R}b,cR 使得 b 2 < 4 c b 2 < 4 c b^(2) < 4cb^{2}<4 cb2<4c ,则 T 2 + b T + c I T 2 + b T + c I T^(2)+bT+cIT^{2}+b T+c IT2+bT+cI 是正算子,如 7.26 的证明所示。

7.33 定义 平方根(square root)

算子 R R RRR 称为算子 T T TTT 的平方根,如果 R 2 = T R 2 = T R^(2)=TR^{2}=TR2=T
7.34 例 设 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) 是由 T ( z 1 , z 2 , z 3 ) = ( z 3 , 0 , 0 ) T z 1 , z 2 , z 3 = z 3 , 0 , 0 T(z_(1),z_(2),z_(3))=(z_(3),0,0)T\left(z_{1}, z_{2}, z_{3}\right)=\left(z_{3}, 0,0\right)T(z1,z2,z3)=(z3,0,0) 定义的算子, 则由 R ( z 1 , z 2 , z 3 ) = R z 1 , z 2 , z 3 = R(z_(1),z_(2),z_(3))=R\left(z_{1}, z_{2}, z_{3}\right)=R(z1,z2,z3)= ( z 2 , z 3 , 0 ) z 2 , z 3 , 0 (z_(2),z_(3),0)\left(z_{2}, z_{3}, 0\right)(z2,z3,0) 定义的算子 R L ( F 3 ) R L F 3 R inL(F^(3))R \in \mathcal{L}\left(\mathbf{F}^{3}\right)RL(F3) T T TTT 的平方根。
正算子对应于 [ 0 , ) [ 0 , ) [0,oo)[0, \infty)[0,) 中的数, 因此在术语上更应该称为非负的而不是称为正的。然而算子理论学家始终称之为正算子,因此我们将沿袭这个传统。
下面的定理对正算子的刻画与 C C C\mathbf{C}C 中非负数的刻画是相对应的。具体来说,复数 z z zzz 非负当且仅当它有非负平方根,这对应于条件(c)。此外, z z zzz 非负当且仅当它有实的平方根,这对应于条件 (d). 最后, z z zzz 非负当且仅当有复数 w w www 使得 z = w ¯ w z = w ¯ w z= bar(w)wz=\bar{w} wz=w¯w ,这对应于条件(e)。

7.35 正算子的刻画

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则以下条件等价:
(a) T T TTT 是正的;
(b) T T TTT 是自伴的且 T T TTT 的所有本征值非负;
(c) T T TTT 有正的平方根;
(d) T T TTT 有自伴的平方根;
(e) 存在算子 R L ( V ) R L ( V ) R inL(V)R \in \mathcal{L}(V)RL(V) 使得 T = R R T = R R T=R^(**)RT=R^{*} RT=RR.
证明 我们将证明 ( a ) ( b ) ( c ) ( d ) ( e ) ( a ) ( a ) ( b ) ( c ) ( d ) ( e ) ( a ) (a)=>(b)=>(c)=>(d)=>(e)=>(a)(a) \Rightarrow(b) \Rightarrow(c) \Rightarrow(d) \Rightarrow(e) \Rightarrow(a)(a)(b)(c)(d)(e)(a).
首先假设(a)成立,则 T T TTT 是正的。显然 T T TTT 是自伴的(根据正算子的定义)。为证 (b) 中的其他结果,设 λ λ lambda\lambdaλ T T TTT 的本征值, v v vvv T T TTT 的相应于 λ λ lambda\lambdaλ 的本征向量,则
0 T v , v = λ v , v = λ v , v . 0 T v , v = λ v , v = λ v , v . 0 <= (:Tv,v:)=(:lambda v,v:)=lambda(:v,v:).0 \leq\langle T v, v\rangle=\langle\lambda v, v\rangle=\lambda\langle v, v\rangle .0Tv,v=λv,v=λv,v.
于是 λ λ lambda\lambdaλ 是非负数. 因此 (b) 成立.
现在假设 (b) 成立, 则 T T TTT 是自伴的, 并且 T T TTT 的所有本征值都是非负的. 由谱定理 (7.24 和 7.29), V V VVV 有一个由 T T TTT 的本征向量组成的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 。设 T T TTT 的相应于 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 的本征值为 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn ,则每个 λ j λ j lambda_(j)\lambda_{j}λj 都是非负数。设 R R RRR 是从 V V VVV V V VVV 的线性映射使得对 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n
R e j = λ j e j R e j = λ j e j Re_(j)=sqrt(lambda_(j))e_(j)R e_{j}=\sqrt{\lambda_{j}} e_{j}Rej=λjej
(见 3.5). 那么 R R RRR 是正算子(请自行验证)。此外,对每个 j j jjj 都有 R 2 e j = λ j e j = T e j R 2 e j = λ j e j = T e j R^(2)e_(j)=lambda_(j)e_(j)=Te_(j)R^{2} e_{j}=\lambda_{j} e_{j}=T e_{j}R2ej=λjej=Tej ,由此可得 R 2 = T R 2 = T R^(2)=TR^{2}=TR2=T. 于是 R R RRR T T TTT 的正平方根, 因此 (c) 成立.
显然(c)蕴涵(d)(因为由定义知正算子都是自伴的)。
现在假设(d)成立,即有 V V VVV 上的自伴算子 R R RRR 使得 T = R 2 T = R 2 T=R^(2)T=R^{2}T=R2 。那么 T = R R T = R R T=R^(**)RT=R^{*} RT=RR (因为 R = R R = R R^(**)=RR^{*}=RR=R ),所以(e)成立。
最后,假设(e)成立. 设 R L ( V ) R L ( V ) R inL(V)R \in \mathcal{L}(V)RL(V) 使得 T = R R T = R R T=R^(**)RT=R^{*} RT=RR ,则 T = ( R R ) = R ( R ) = T = R R = R R = T^(**)=(R^(**)R)^(**)=R^(**)(R^(**))^(**)=T^{*}=\left(R^{*} R\right)^{*}=R^{*}\left(R^{*}\right)^{*}=T=(RR)=R(R)= R R = T R R = T R^(**)R=TR^{*} R=TRR=T ,所以 T T TTT 是自伴的。为证明(a)成立,注意到对每个 v V v V v in Vv \in VvV 均有
T v , v = R R v , v = R v , R v 0 T v , v = R R v , v = R v , R v 0 (:Tv,v:)=(:R^(**)Rv,v:)=(:Rv,Rv:) >= 0\langle T v, v\rangle=\left\langle R^{*} R v, v\right\rangle=\langle R v, R v\rangle \geq 0Tv,v=RRv,v=Rv,Rv0
于是 T T TTT 是正的。
每个非负数都有唯一的非负平方根.以下命题表明正算子也具有类似的性质。
有的数学家采用半正定算子这个术语,意思与正算子相同。

7.36 每个正算子都有唯一的正平方根

V V VVV 上每个正算子都有唯一的正平方根.
证明 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正的, v V v V v in Vv \in VvV T T TTT 的一个本征向量. 则有 λ 0 λ 0 lambda >= 0\lambda \geq 0λ0 使得 T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv.
R R RRR T T TTT 的正平方根。往证 R v = λ v R v = λ v Rv=sqrtlambdavR v=\sqrt{\lambda} vRv=λv ,这将意味着 R R RRR T T TTT 的本征向量上是唯一确定的。因为 V V VVV 有一个由 T T TTT 的本征向量构成的基 (由谱定理),这意味着 R R RRR 是唯一确定的。
正算子可能有无穷多个平方根(尽管其中只有一个是正的)。例如,若 dim V > 1 dim V > 1 dim V > 1\operatorname{dim} V>1dimV>1 ,则 V V VVV 上的恒等算子就有无穷多个平方根。
为证明 R v = λ v R v = λ v Rv=sqrtlambdavR v=\sqrt{\lambda} vRv=λv ,注意谱定理是说 V V VVV 有一个由 R R RRR 的本征向量构成的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 。因为 R R RRR 是正算子,所以其本征值都是非负的。因此存在非负数 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn使得对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n 均有 R e j = λ j e j R e j = λ j e j Re_(j)=sqrt(lambda_(j))e_(j)R e_{j}=\sqrt{\lambda_{j}} e_{j}Rej=λjej
因为 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的基,所以有 a 1 , , a n F a 1 , , a n F a_(1),dots,a_(n)inFa_{1}, \ldots, a_{n} \in \mathbf{F}a1,,anF 使得
v = a 1 e 1 + + a n e n v = a 1 e 1 + + a n e n v=a_(1)e_(1)+cdots+a_(n)e_(n)v=a_{1} e_{1}+\cdots+a_{n} e_{n}v=a1e1++anen
于是
R v = a 1 λ 1 e 1 + + a n λ n e n R v = a 1 λ 1 e 1 + + a n λ n e n Rv=a_(1)sqrt(lambda_(1))e_(1)+cdots+a_(n)sqrt(lambda_(n))e_(n)R v=a_{1} \sqrt{\lambda_{1}} e_{1}+\cdots+a_{n} \sqrt{\lambda_{n}} e_{n}Rv=a1λ1e1++anλnen
因此
R 2 v = a 1 λ 1 e 1 + + a n λ n e n R 2 v = a 1 λ 1 e 1 + + a n λ n e n R^(2)v=a_(1)lambda_(1)e_(1)+cdots+a_(n)lambda_(n)e_(n)R^{2} v=a_{1} \lambda_{1} e_{1}+\cdots+a_{n} \lambda_{n} e_{n}R2v=a1λ1e1++anλnen
R 2 = T R 2 = T R^(2)=TR^{2}=TR2=T T v = λ v T v = λ v Tv=lambda vT v=\lambda vTv=λv 。所以上式表明
a 1 λ e 1 + + a n λ e n = a 1 λ 1 e 1 + + a n λ n e n a 1 λ e 1 + + a n λ e n = a 1 λ 1 e 1 + + a n λ n e n a_(1)lambdae_(1)+cdots+a_(n)lambdae_(n)=a_(1)lambda_(1)e_(1)+cdots+a_(n)lambda_(n)e_(n)a_{1} \lambda e_{1}+\cdots+a_{n} \lambda e_{n}=a_{1} \lambda_{1} e_{1}+\cdots+a_{n} \lambda_{n} e_{n}a1λe1++anλen=a1λ1e1++anλnen
上式意味着对 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n a j ( λ λ j ) = 0 a j λ λ j = 0 a_(j)(lambda-lambda_(j))=0a_{j}\left(\lambda-\lambda_{j}\right)=0aj(λλj)=0. 所以
v = { j : λ j = λ } a j e j , v = j : λ j = λ a j e j , v=sum_({j:lambda_(j)=lambda})a_(j)e_(j),v=\sum_{\left\{j: \lambda_{j}=\lambda\right\}} a_{j} e_{j},v={j:λj=λ}ajej,
于是
R v = { j : λ j = λ } a j λ e j = λ v R v = j : λ j = λ a j λ e j = λ v Rv=sum_({j:lambda_(j)=lambda})a_(j)sqrtlambdae_(j)=sqrtlambdavR v=\sum_{\left\{j: \lambda_{j}=\lambda\right\}} a_{j} \sqrt{\lambda} e_{j}=\sqrt{\lambda} vRv={j:λj=λ}ajλej=λv

等距同构

保持范数的算子十分重要,它们应该有一个名字。

7.37 定义 等距同构(isometry)

  • 算子 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 称为等距同构, 如果对所有 v V v V v in Vv \in VvV 均有 S v = v S v = v ||Sv||=||v||\|S v\|=\|v\|Sv=v.
  • 也就是说, 算子是等距同构当且仅当它保持范数.
在希腊语中,单词isos 的意思是相等;单词 metron 的意思是度量。因此 isometry 的字面意思是度量相等。
例如, 当 λ F λ F lambda inF\lambda \in \mathbf{F}λF 满足 | λ | = 1 | λ | = 1 |lambda|=1|\lambda|=1|λ|=1 时, λ I λ I lambda I\lambda IλI 是等距同构。我们马上就会看到如果 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C ,则下面的例子包括了所有的等距同构。
7.38 例 设 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 都是绝对值为 1 的标量, e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的规范正交基, S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 满足 S e j = λ j e j S e j = λ j e j Se_(j)=lambda_(j)e_(j)S e_{j}=\lambda_{j} e_{j}Sej=λjej 。证明 S S SSS 是等距同构。
证明 设 v V v V v in Vv \in VvV. 则
7.39
v = v , e 1 e 1 + + v , e n e n v = v , e 1 e 1 + + v , e n e n v=(:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n)v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n}v=v,e1e1++v,enen

7.40
v 2 = | v , e 1 | 2 + + | v , e n | 2 v 2 = v , e 1 2 + + v , e n 2 ||v||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(n):)|^(2)\|v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{n}\right\rangle\right|^{2}v2=|v,e1|2++|v,en|2
这里我们利用了 6.30. 把 S S SSS 作用到 7.39 的两端可得
S v = v , e 1 S e 1 + + v , e n S e n = λ 1 v , e 1 e 1 + + λ n v , e n e n S v = v , e 1 S e 1 + + v , e n S e n = λ 1 v , e 1 e 1 + + λ n v , e n e n {:[Sv=(:v,e_(1):)Se_(1)+cdots+(:v,e_(n):)Se_(n)],[=lambda_(1)(:v,e_(1):)e_(1)+cdots+lambda_(n)(:v,e_(n):)e_(n)]:}\begin{aligned} S v & =\left\langle v, e_{1}\right\rangle S e_{1}+\cdots+\left\langle v, e_{n}\right\rangle S e_{n} \\ & =\lambda_{1}\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\lambda_{n}\left\langle v, e_{n}\right\rangle e_{n} \end{aligned}Sv=v,e1Se1++v,enSen=λ1v,e1e1++λnv,enen
由于 | λ j | = 1 λ j = 1 |lambda_(j)|=1\left|\lambda_{j}\right|=1|λj|=1 ,上面最后的等式表明
7.41
S v 2 = | v , e 1 | 2 + + | v , e n | 2 S v 2 = v , e 1 2 + + v , e n 2 ||Sv||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(n):)|^(2)\|S v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{n}\right\rangle\right|^{2}Sv2=|v,e1|2++|v,en|2
比较 7.40 和 7.41 可得 v = S v v = S v ||v||=||Sv||\|v\|=\|S v\|v=Sv. 也就是说 S S SSS 是等距同构.
实内积空间上的等距同构通常称为正交算子。复内积空间上的等距同构通常称为酉算子。我们将采用等距同构这个术语,以使我们的结果对于实内积空间和复内积空间都适用。
以下定理给出了等距同构的若干等价条件。 (a) 和(b)的等价性表明一个算子是等距同构当且仅当它保内积。(a)和(c)的等价性(或者(a)和(d)的等价性)表明,一个算子是等距同构当且仅当关于每一个(或某一个)规范正交基,其矩阵的列是规范正交的。习题 10 表明在前一句话中也可用 "行"代替 "列"。

7.42 等距同构的刻画

S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V). 则以下条件等价:
(a) S S SSS 是等距同构;
(b) 对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 S u , S v = u , v S u , S v = u , v (:Su,Sv:)=(:u,v:)\langle S u, S v\rangle=\langle u, v\rangleSu,Sv=u,v;
(c) 对 V V VVV 中的任意规范正交向量组 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 均有 S e 1 , , S e n S e 1 , , S e n Se_(1),dots,Se_(n)S e_{1}, \ldots, S e_{n}Se1,,Sen 是规范正交的;
(d) V V VVV 有规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得 S e 1 , , S e n S e 1 , , S e n Se_(1),dots,Se_(n)S e_{1}, \ldots, S e_{n}Se1,,Sen 是规范正交的;
(e) S S = I S S = I S^(**)S=IS^{*} S=ISS=I;
(f) S S = I S S = I SS^(**)=IS S^{*}=ISS=I;
(g) S S S^(**)S^{*}S 是等距同构;
(h) S S SSS 是可逆的且 S 1 = S S 1 = S S^(-1)=S^(**)S^{-1}=S^{*}S1=S.
证明 首先假设 (a) 成立,即 S S SSS 是等距同构。 6.A 节的习题 19 和习题 20 证明了内积可通过范数来计算. 由于 S S SSS 保范数, 所以 S S SSS 保内积, 故 (b) 成立. 更确切地, 若 V V VVV 是实内积空间,则对任意 u , v V u , v V u,v in Vu, v \in Vu,vV
S u , S v = ( S u + S v 2 S u S v 2 ) / 4 = ( S ( u + v ) 2 S ( u v ) 2 ) / 4 = ( u + v 2 u v 2 ) / 4 = u , v S u , S v = S u + S v 2 S u S v 2 / 4 = S ( u + v ) 2 S ( u v ) 2 / 4 = u + v 2 u v 2 / 4 = u , v {:[(:Su","Sv:)=(||Su+Sv||^(2)-||Su-Sv||^(2))//4],[=(||S(u+v)||^(2)-||S(u-v)||^(2))//4],[=(||u+v||^(2)-||u-v||^(2))//4],[=(:u","v:)]:}\begin{aligned} \langle S u, S v\rangle & =\left(\|S u+S v\|^{2}-\|S u-S v\|^{2}\right) / 4 \\ & =\left(\|S(u+v)\|^{2}-\|S(u-v)\|^{2}\right) / 4 \\ & =\left(\|u+v\|^{2}-\|u-v\|^{2}\right) / 4 \\ & =\langle u, v\rangle \end{aligned}Su,Sv=(Su+Sv2SuSv2)/4=(S(u+v)2S(uv)2)/4=(u+v2uv2)/4=u,v
其中第一个等式可以由 6 . A 6 . A 6.A6 . \mathrm{A}6.A 节的习题 19 推出,第二个等式可以由 S S SSS 的线性推出,第三个等式成立是因为 S S SSS 是等距同构,而最后的等式也是由 6 . A 6 . A 6.A6 . \mathrm{A}6.A 节的习题 19 推出。若 V V VVV 是复内积空间,则由 6 . A 6 . A 6.A6 . \mathrm{A}6.A 节的习题 20 代替习题 19 可以得到同样的结论。无论哪种情况,都有(b)成立。
现在假设 (b) 成立, 即 S S SSS 保内积. 设 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 中的一个规范正交向量组.则由 S e j , S e k = e j , e k S e j , S e k = e j , e k (:Se_(j),Se_(k):)=(:e_(j),e_(k):)\left\langle S e_{j}, S e_{k}\right\rangle=\left\langle e_{j}, e_{k}\right\rangleSej,Sek=ej,ek 知组 S e 1 , , S e n S e 1 , , S e n Se_(1),dots,Se_(n)S e_{1}, \ldots, S e_{n}Se1,,Sen 是规范正交的. 因此 (c) 成立.
显然(c)蕴涵(d)。
现在假设 (d) 成立. 设 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的规范正交基使得 S e 1 , , S e n S e 1 , , S e n Se_(1),dots,Se_(n)S e_{1}, \ldots, S e_{n}Se1,,Sen 是规范正交的. 则对 j , k = 1 , , n j , k = 1 , , n j,k=1,dots,nj, k=1, \ldots, nj,k=1,,n
S S e j , e k = e j , e k S S e j , e k = e j , e k (:S^(**)Se_(j),e_(k):)=(:e_(j),e_(k):)\left\langle S^{*} S e_{j}, e_{k}\right\rangle=\left\langle e_{j}, e_{k}\right\rangleSSej,ek=ej,ek
(这是因为左端等于 S e j , S e k S e j , S e k (:Se_(j),Se_(k):)\left\langle S e_{j}, S e_{k}\right\rangleSej,Sek ,而 ( S e 1 , , S e n ) S e 1 , , S e n (Se_(1),dots,Se_(n))\left(S e_{1}, \ldots, S e_{n}\right)(Se1,,Sen) 是规范正交的)。所有的向量 u , v V u , v V u,v in Vu, v \in Vu,vV 都可以写成 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 的线性组合,因此上式表明 S S u , v = u , v S S u , v = u , v (:S^(**)Su,v:)=(:u,v:)\left\langle S^{*} S u, v\right\rangle=\langle u, v\rangleSSu,v=u,v 。所以 S S = I S S = I S^(**)S=IS^{*} S=ISS=I ,也就是说(e)成立。
现在假设 (e) 成立, 即 S S = I S S = I S^(**)S=IS^{*} S=ISS=I. 一般地, 算子 S S SSS 未必与 S S S^(**)S^{*}S 交换. 然而, S S = I S S = I S^(**)S=IS^{*} S=ISS=I当且仅当 S S = I S S = I SS^(**)=IS S^{*}=ISS=I, 这是 3.D 节习题 10 的一个特殊情形。因此 S S = I S S = I SS^(**)=IS S^{*}=ISS=I, 这证明了 (f) 成立.
现在假设(f)成立,即 S S = I S S = I SS^(**)=IS S^{*}=ISS=I 。若 v V v V v in Vv \in VvV ,则
S v 2 = S v , S v = S S v , v = v , v = v 2 S v 2 = S v , S v = S S v , v = v , v = v 2 ||S^(**)v||^(2)=(:S^(**)v,S^(**)v:)=(:SS^(**)v,v:)=(:v,v:)=||v||^(2)\left\|S^{*} v\right\|^{2}=\left\langle S^{*} v, S^{*} v\right\rangle=\left\langle S S^{*} v, v\right\rangle=\langle v, v\rangle=\|v\|^{2}Sv2=Sv,Sv=SSv,v=v,v=v2
因此 S S S^(**)S^{*}S 是等距同构, 这证明了(g)成立。
现在假设 (g) 成立, 即 S S S^(**)S^{*}S 是等距同构. 已知 ( a ) ( e ) ( a ) ( e ) (a)=>(e)(\mathrm{a}) \Rightarrow(\mathrm{e})(a)(e) 且 (a) =>\Rightarrow (f), 这是因为我们已证明了 ( a ) ( b ) ( c ) ( d ) ( e ) ( f ) ( a ) ( b ) ( c ) ( d ) ( e ) ( f ) (a)=>(b)=>(c)=>(d)=>(e)=>(f)(\mathrm{a}) \Rightarrow(\mathrm{b}) \Rightarrow(\mathrm{c}) \Rightarrow(\mathrm{d}) \Rightarrow(\mathrm{e}) \Rightarrow(\mathrm{f})(a)(b)(c)(d)(e)(f) 。利用 ( a ) ( e ) ( a ) ( e ) (a)=>(e)(\mathrm{a}) \Rightarrow(\mathrm{e})(a)(e) ( a ) ( f ) ( a ) ( f ) (a)=>(f)(\mathrm{a}) \Rightarrow(\mathrm{f})(a)(f) ,并将其中的 S S SSS 换成 S S S^(**)S^{*}S 可得 S S = I S S = I SS^(**)=IS S^{*}=ISS=I S S = I S S = I S^(**)S=IS^{*} S=ISS=I 。因此 S S SSS 可逆且 S 1 = S S 1 = S S^(-1)=S^(**)S^{-1}=S^{*}S1=S, 也就是说 (h) 成立.
现在假设 (h) 成立, 即 S S SSS 可逆且 S 1 = S S 1 = S S^(-1)=S^(**)S^{-1}=S^{*}S1=S. 于是 S S = I S S = I S^(**)S=IS^{*} S=ISS=I. 若 v V v V v in Vv \in VvV, 则
S v 2 = S v , S v = S S v , v = v , v = v 2 S v 2 = S v , S v = S S v , v = v , v = v 2 ||Sv||^(2)=(:Sv,Sv:)=(:S^(**)Sv,v:)=(:v,v:)=||v||^(2)\|S v\|^{2}=\langle S v, S v\rangle=\left\langle S^{*} S v, v\right\rangle=\langle v, v\rangle=\|v\|^{2}Sv2=Sv,Sv=SSv,v=v,v=v2
因此 S S SSS 是等距同构,这证明了(a)成立。
我们已经证明 (a) =>\Rightarrow (b) =>\Rightarrow (c) ( d ) ( e ) ( f ) ( g ) ( h ) ( a ) ( d ) ( e ) ( f ) ( g ) ( h ) ( a ) =>(d)=>(e)=>(f)=>(g)=>(h)=>(a)\Rightarrow(\mathrm{d}) \Rightarrow(\mathrm{e}) \Rightarrow(\mathrm{f}) \Rightarrow(\mathrm{g}) \Rightarrow(\mathrm{h}) \Rightarrow(\mathrm{a})(d)(e)(f)(g)(h)(a).
上述定理证明了每个等距同构都是正规的(见 7.42 的(a),(e),(f))。于是,正规算子的刻画可以用来给出等距同构的描述。复的情形见以下定理,实的情形在第 9 章 (见 9.36).

7.43 F = C F = C F=C\mathrm{F}=\mathrm{C}F=C 时等距同构的描述

V V VVV 是复内积空间, S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V). 则以下条件等价:
(a) S S SSS 是等距同构.
(b) V V VVV 有一个由 S S SSS 的本征向量组成的规范正交基, 相应的本征值的绝对值均为 1 .
证明 我们已经证明了(b)蕴涵(a)(见例7.38)。
为了证明另一个方面,假设 (a) 成立,即 S S SSS 是等距同构。由复谱定理 7.24, V V VVV 有一个由 S S SSS 的本征向量组成的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 。对于 j { 1 , , n } j { 1 , , n } j in{1,dots,n}j \in\{1, \ldots, n\}j{1,,n} ,设 λ j λ j lambda_(j)\lambda_{j}λj 是相应于 e j e j e_(j)e_{j}ej 的本征值, 则
| λ j | = λ j e j = S e j = e j = 1 λ j = λ j e j = S e j = e j = 1 |lambda_(j)|=||lambda_(j)e_(j)||=||Se_(j)||=||e_(j)||=1\left|\lambda_{j}\right|=\left\|\lambda_{j} e_{j}\right\|=\left\|S e_{j}\right\|=\left\|e_{j}\right\|=1|λj|=λjej=Sej=ej=1
因此 S S SSS 的每个本征值的绝对值都是1, 这就完成了证明.

习题 7.C

1 证明或给出反例:若 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的,且 V V VVV 有一个规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得对每个 j j jjj T e j , e j 0 T e j , e j 0 (:Te_(j),e_(j):) >= 0\left\langle T e_{j}, e_{j}\right\rangle \geq 0Tej,ej0 ,则 T T TTT 是正算子。
2 设 T T TTT V V VVV 上的正算子。设 v , w V v , w V v,w in Vv, w \in Vv,wV 使得
T v = w T w = v . T v = w  且  T w = v . Tv=w quad" 且 "quad Tw=v.T v=w \quad \text { 且 } \quad T w=v .Tv=w 且 Tw=v.
证明 v = w v = w v=wv=wv=w.
3 设 T T TTT V V VVV 上的正算子, 且 U U UUU V V VVV 的在 T T TTT 下不变的子空间. 证明 T | U L ( U ) T U L ( U ) T|_(U)inL(U)\left.T\right|_{U} \in \mathcal{L}(U)T|UL(U) U U UUU 上的正算子。
4 设 T L ( V , W ) T L ( V , W ) T inL(V,W)T \in \mathcal{L}(V, W)TL(V,W). 证明: T T T T T^(**)TT^{*} TTT V V VVV 上的正算子, T T T T TT^(**)T T^{*}TT W W WWW 上的正算子.
5 证明 V V VVV 上两个正算子的和是正算子。
6 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是正算子. 证明:对每个正整数 k , T k k , T k k,T^(k)k, T^{k}k,Tk 是正算子.
7 设 T T TTT V V VVV 上的正算子. 证明: T T TTT 是可逆的当且仅当对每个满足 v 0 v 0 v!=0v \neq 0v0 v V v V v in Vv \in VvV 均有 T v , v > 0 T v , v > 0 (:Tv,v:) > 0\langle T v, v\rangle>0Tv,v>0
8 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。对 u , v V u , v V u,v in Vu, v \in Vu,vV 定义 u , v T u , v T (:u,v:)_(T)\langle u, v\rangle_{T}u,vT u , v T = T u , v u , v T = T u , v (:u,v:)_(T)=(:Tu,v:)\langle u, v\rangle_{T}=\langle T u, v\rangleu,vT=Tu,v 。证明: , T , T (:*,*:)_(T)\langle\cdot, \cdot\rangle_{T},T V V VVV 上的内积当且仅当 T T TTT 是(关于原内积 , , (:*,*:)\langle\cdot, \cdot\rangle, 的)可逆正算子。
9 证明或反驳: F 2 F 2 F^(2)\mathbf{F}^{2}F2 上的恒等算子有无穷多个自伴的平方根。
10 设 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V). 证明以下条件等价:
(a) S S SSS 是等距同构;
(b) 对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 S u , S v = u , v S u , S v = u , v (:S^(**)u,S^(**)v:)=(:u,v:)\left\langle S^{*} u, S^{*} v\right\rangle=\langle u, v\rangleSu,Sv=u,v;
(c) 对 V V VVV 中的每个规范正交组 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 均有 S e 1 , , S e m S e 1 , , S e m S^(**)e_(1),dots,S^(**)e_(m)S^{*} e_{1}, \ldots, S^{*} e_{m}Se1,,Sem 是规范正交组;
(d) 对 V V VVV 中的某个规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en S e 1 , , S e n S e 1 , , S e n S^(**)e_(1),dots,S^(**)e_(n)S^{*} e_{1}, \ldots, S^{*} e_{n}Se1,,Sen 是规范正交基.
11 设 T 1 , T 2 T 1 , T 2 T_(1),T_(2)T_{1}, T_{2}T1,T2 均为 L ( F 3 ) L F 3 L(F^(3))\mathcal{L}\left(\mathbf{F}^{3}\right)L(F3) 上的正规算子且两个算子的本征值均为 2 , 5 , 7 2 , 5 , 7 2,5,72,5,72,5,7. 证明: 存在等距同构 S L ( F 3 ) S L F 3 S inL(F^(3))S \in \mathcal{L}\left(\mathbf{F}^{3}\right)SL(F3) 使得 T 1 = S T 2 S T 1 = S T 2 S T_(1)=S^(**)T_(2)ST_{1}=S^{*} T_{2} ST1=ST2S
12 找出两个自伴算子 T 1 , T 2 L ( F 4 ) T 1 , T 2 L F 4 T_(1),T_(2)inL(F^(4))T_{1}, T_{2} \in \mathcal{L}\left(\mathbf{F}^{4}\right)T1,T2L(F4) 使得它们的本征值均为 2 , 5 , 7 2 , 5 , 7 2,5,72,5,72,5,7, 但不存在等距同构 S L ( F 4 ) S L F 4 S inL(F^(4))S \in \mathcal{L}\left(\mathbf{F}^{4}\right)SL(F4) 使得 T 1 = S T 2 S T 1 = S T 2 S T_(1)=S^(**)T_(2)ST_{1}=S^{*} T_{2} ST1=ST2S 。一定要解释为什么不存在满足条件的等距同构。
13 证明或给出反例:若 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 且存在 V V VVV 的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得对每个 e j e j e_(j)e_{j}ej均有 S e j = 1 S e j = 1 ||Se_(j)||=1\left\|S e_{j}\right\|=1Sej=1, 则 S S SSS 是等距同构.
14 设 T T TTT 是 7.A 节习题 21 的二阶导数算子. 证明 T T -T-TT 是正算子.

7.D 极分解与奇异值分解

极分解

回想一下我们在 C C C\mathbf{C}C L ( V ) L ( V ) L(V)\mathcal{L}(V)L(V) 之间做的类比。按照这个类比,一个复数 z z zzz 相应于一个算子 T T TTT ,而 z ¯ z ¯ bar(z)\bar{z}z¯ 相应于 T T T^(**)T^{*}T 。实数 ( z = z ¯ ) ( z = z ¯ ) (z= bar(z))(z=\bar{z})(z=z¯) 相应于自伴算子 ( T = T ) T = T (T=T^(**))\left(T=T^{*}\right)(T=T) ,而非负数相应于正算子(一个不太恰当的称谓)。
C C C\mathbf{C}C 的另一个重要的子集是单位圆,它由所有满足 | z | = 1 | z | = 1 |z|=1|z|=1|z|=1 的复数 z z zzz 组成. 条件 | z | = 1 | z | = 1 |z|=1|z|=1|z|=1 等价于 z ¯ z = 1 z ¯ z = 1 bar(z)z=1\bar{z} z=1z¯z=1 。按照我们的类比,这相应于条件 T T = I T T = I T^(**)T=IT^{*} T=ITT=I ,等价于 T T TTT 是等距同构(参见 7.42)。 也就是说, C 中的单位圆相应于全体等距同构。
继续我们的类比,注意到每个非零复数 z z zzz 都可以写成
z = ( z | z | ) | z | = ( z | z | ) z ¯ z z = z | z | | z | = z | z | z ¯ z z=((z)/(|z|))|z|=((z)/(|z|))sqrt( bar(z)z)z=\left(\frac{z}{|z|}\right)|z|=\left(\frac{z}{|z|}\right) \sqrt{\bar{z} z}z=(z|z|)|z|=(z|z|)z¯z
的形式, 其中第一个因子(即 z / | z | z / | z | z//|z|z /|z|z/|z| )是单位圆中的元素。这种的类比使我们猜到,任何算子 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 都可以写成等距同构乘以 T T T T sqrt(T**T)\sqrt{T * T}TT 的形式。我们现在就来证明这个猜测确实是对的,在此之前先定义一个显然的记号,其合理性由 7.36 保证。

7.44 记号 T T sqrtT\sqrt{T}T

T T TTT 是正算子, 则用 T T sqrtT\sqrt{T}T 表示 T T TTT 的唯一的正平方根.
现在我们来陈述和证明极分解定理,它给出 V V VVV 上任意算子的一个漂亮的描述。注意对每个 T L ( V ) , T T T L ( V ) , T T T inL(V),T^(**)TT \in \mathcal{L}(V), T^{*} TTL(V),TT 都是正算子, 所以 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 定义合理。

7.45 极分解

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则有一个等距同构 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 使得 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT.
证明 若 v V v V v in Vv \in VvV ,则
T v 2 = T v , T v = T T v , v = T T T T v , v = T T v , T T v = T T v 2 . T v 2 = T v , T v = T T v , v = T T T T v , v = T T v , T T v = T T v 2 . {:[||Tv||^(2)=(:Tv","Tv:)=(:T^(**)Tv,v:)],[=(:sqrt(T^(**)T)sqrt(T^(**)T)v,v:)],[=(:sqrt(T^(**)T)v,sqrt(T^(**)T)v:)],[=||sqrt(T^(**)T)v||^(2).]:}\begin{aligned} \|T v\|^{2}=\langle T v, T v\rangle & =\left\langle T^{*} T v, v\right\rangle \\ & =\left\langle\sqrt{T^{*} T} \sqrt{T^{*} T} v, v\right\rangle \\ & =\left\langle\sqrt{T^{*} T} v, \sqrt{T^{*} T} v\right\rangle \\ & =\left\|\sqrt{T^{*} T} v\right\|^{2} . \end{aligned}Tv2=Tv,Tv=TTv,v=TTTTv,v=TTv,TTv=TTv2.
于是对所有 v V v V v in Vv \in VvV 均有
7.46
T v = T T v T v = T T v ||Tv||=||sqrt(T^(**)T)v||\|T v\|=\left\|\sqrt{T^{*} T} v\right\|Tv=TTv
定义线性映射 S 1 : range T T range T S 1 : range T T range T S_(1):rangesqrt(T^(**)T)rarr range TS_{1}: \operatorname{range} \sqrt{T^{*} T} \rightarrow \operatorname{range} TS1:rangeTTrangeT

7.47

S 1 ( T T v ) = T v S 1 T T v = T v S_(1)(sqrt(T^(**)T)v)=TvS_{1}\left(\sqrt{T^{*} T} v\right)=T vS1(TTv)=Tv
证明的思路是把 S 1 S 1 S_(1)S_{1}S1 扩张成一个等距同构 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 使得 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT. 现在来看具体证明。
首先必须验证 S 1 S 1 S_(1)S_{1}S1 的定义是合理的。为此,假设 v 1 , v 2 V v 1 , v 2 V v_(1),v_(2)in Vv_{1}, v_{2} \in Vv1,v2V 使得 T T v 1 = T T v 1 = sqrt(T**)Tv_(1)=\sqrt{T *} T v_{1}=TTv1= T T v 2 T T v 2 sqrt(T**)Tv_(2)\sqrt{T *} T v_{2}TTv2 。为使 7.47 给出的定义有意义,我们必须证明 T v 1 = T ν 2 T v 1 = T ν 2 Tv_(1)=Tnu_(2)T v_{1}=T \nu_{2}Tv1=Tν2 。注意
T v 1 T v 2 = T ( v 1 v 2 ) = T T ( v 1 v 2 ) = T T v 1 T T v 2 = 0 T v 1 T v 2 = T v 1 v 2 = T T v 1 v 2 = T T v 1 T T v 2 = 0 {:[||Tv_(1)-Tv_(2)||=||T(v_(1)-v_(2))||],[=||sqrt(T^(**)T)(v_(1)-v_(2))||],[=||sqrt(T^(**)T)v_(1)-sqrt(T^(**)T)v_(2)||],[=0]:}\begin{aligned} \left\|T v_{1}-T v_{2}\right\| & =\left\|T\left(v_{1}-v_{2}\right)\right\| \\ & =\left\|\sqrt{T^{*} T}\left(v_{1}-v_{2}\right)\right\| \\ & =\left\|\sqrt{T^{*} T} v_{1}-\sqrt{T^{*} T} v_{2}\right\| \\ & =0 \end{aligned}Tv1Tv2=T(v1v2)=TT(v1v2)=TTv1TTv2=0
其中第二个等式成立是由于 7.46. 上式证明了 T v 1 = T v 2 T v 1 = T v 2 Tv_(1)=Tv_(2)T v_{1}=T v_{2}Tv1=Tv2 ,所以 S 1 S 1 S_(1)S_{1}S1 的确是定义合理的。请自行验证 S 1 S 1 S_(1)S_{1}S1 是线性映射。
由 7.47 可知 S 1 S 1 S_(1)S_{1}S1 把 range T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 映到 range T T TTT 上. 显然,由 7.46 和 7.47 可知,对所有 u u u inu \inu range T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 都有 S 1 u = u S 1 u = u ||S_(1)u||=||u||\left\|S_{1} u\right\|=\|u\|S1u=u.
特别地, S 1 S 1 S_(1)S_{1}S1 是单的. 于是, 对 S 1 S 1 S_(1)S_{1}S1 应用线性映射基本定理 3.22 可得
在余下的证明中,要把 S 1 S 1 S_(1)S_{1}S1 扩张成整个 V V VVV 上的一个等距同构 S S SSS.
dim range T T = dim range T . dim range T T = dim range T dim rangesqrt(T^(**)T)=dim range T". "\operatorname{dim} \operatorname{range} \sqrt{T^{*} T}=\operatorname{dim} \operatorname{range} T \text {. }dimrangeTT=dimrangeT
这表明 dim ( range T T ) = dim ( range T ) dim  range  T T = dim (  range  T ) dim(" range "sqrt(T^(**)T))^(_|_)=dim(" range "T)^(_|_)\operatorname{dim}\left(\text { range } \sqrt{T^{*} T}\right)^{\perp}=\operatorname{dim}(\text { range } T)^{\perp}dim( range TT)=dim( range T) (见 6.50). 所以可取 ( (:}\left(\right.( range T T ) T T {:sqrt(T^(**)T))^(_|_)\left.\sqrt{T^{*} T}\right){ }^{\perp}TT)
交基的长度相同(记为 m m mmm )。定义线性映射 S 2 : ( range T T ) ( range T ) S 2 :  range  T T (  range  T ) S_(2):(" range "sqrt(T^(**)T))^(_|_)rarr(" range "T)^(_|_)S_{2}:\left(\text { range } \sqrt{T^{*} T}\right)^{\perp} \rightarrow(\text { range } T)^{\perp}S2:( range TT)( range T)
S 2 ( a 1 e 1 + + a m e m ) = a 1 f 1 + + a m f m S 2 a 1 e 1 + + a m e m = a 1 f 1 + + a m f m S_(2)(a_(1)e_(1)+cdots+a_(m)e_(m))=a_(1)f_(1)+cdots+a_(m)f_(m)S_{2}\left(a_{1} e_{1}+\cdots+a_{m} e_{m}\right)=a_{1} f_{1}+\cdots+a_{m} f_{m}S2(a1e1++amem)=a1f1++amfm
对所有 w ( range T T ) w  range  T T w in(" range "sqrt(T^(**)T))^(_|_)w \in\left(\text { range } \sqrt{T^{*} T}\right)^{\perp}w( range TT) 均有 S 2 w = w S 2 w = w ||S_(2)w||=||w||\left\|S_{2} w\right\|=\|w\|S2w=w (由于 6.25)。
现在设 S S SSS V V VVV 上的算子, 在 range T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 上和 S 1 S 1 S_(1)S_{1}S1 相等, 在 (range T T ) T T {:sqrt(T^(**)T))^(_|_)\left.\sqrt{T^{*} T}\right){ }^{\perp}TT) 上和 S 2 S 2 S_(2)S_{2}S2 相等. 更准确地说, 回想一下, 每个 v V v V v in Vv \in VvV 都可以唯一地写成

7.48

v = u + w , v = u + w , v=u+w,v=u+w,v=u+w,
其中 u range T T u range T T u in rangesqrt(T^(**)T)u \in \operatorname{range} \sqrt{T^{*} T}urangeTT w ( range T T ) w  range  T T w in(" range "sqrt(T^(**)T))^(_|_)\boldsymbol{w} \in\left(\text { range } \sqrt{T^{*} T}\right)^{\perp}w( range TT) (见6.47)。按照上述分解,对于 v V v V v in Vv \in VvV定义 S v S v SvS vSv
S v = S 1 u + S 2 w S v = S 1 u + S 2 w Sv=S_(1)u+S_(2)wS v=S_{1} u+S_{2} wSv=S1u+S2w
对每个 v V v V v in Vv \in VvV 均有
S ( T T v ) = S 1 ( T T v ) = T v , S T T v = S 1 T T v = T v , S(sqrt(T^(**)T)v)=S_(1)(sqrt(T^(**)T)v)=Tv,S\left(\sqrt{T^{*} T} v\right)=S_{1}\left(\sqrt{T^{*} T} v\right)=T v,S(TTv)=S1(TTv)=Tv,
所以 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT. 剩下的就是证明 S S SSS 是等距同构. 然而, 这很容易由勾股定理得到: 若 v V v V v in Vv \in VvV 已经分解成 7.48 的形式, 则
S v 2 = S 1 u + S 2 w 2 = S 1 u 2 + S 2 w 2 = u 2 + w 2 = v 2 , S v 2 = S 1 u + S 2 w 2 = S 1 u 2 + S 2 w 2 = u 2 + w 2 = v 2 , ||Sv||^(2)=||S_(1)u+S_(2)w||^(2)=||S_(1)u||^(2)+||S_(2)w||^(2)=||u||^(2)+||w||^(2)=||v||^(2),\|S v\|^{2}=\left\|S_{1} u+S_{2} w\right\|^{2}=\left\|S_{1} u\right\|^{2}+\left\|S_{2} w\right\|^{2}=\|u\|^{2}+\|w\|^{2}=\|v\|^{2},Sv2=S1u+S2w2=S1u2+S2w2=u2+w2=v2,
其中第二个等式成立是由于 S 1 u range T S 1 u range T S_(1)u in range TS_{1} u \in \operatorname{range} TS1urangeT S 2 w ( range T ) S 2 w (  range  T ) S_(2)w in(" range "T)^(_|_)S_{2} w \in(\text { range } T)^{\perp}S2w( range T)
极分解定理 7.45 说的是, V V VVV 上的每个算子都是一个等距同构和一个正算子的乘积. 于是, V V VVV 上的每个算子都可以写成两个算子的乘积, 这两个算子都来自我们已经完全描述并且能够比较好地理解的算子类. 7.43 和 9.36 描述了等距同构, 谱定理 (7.24 和 7.29)描述了正算子。
特别地, 考虑 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C 的情形, 设 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 的极分解, 其中 S S SSS是等距同构,则 V V VVV 有一个规范正交基使得 S S SSS 关于这个基有对角矩阵,并且 V V VVV 还有一个规范正交基使得 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 关于这个基有对角矩阵. 注意:未必有规范正交基使得 S S SSS T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 的矩阵同时具有这么好的对角形式. 也就是说, S S SSS 需要一个规范正交基,而 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 可能需要另一个不同的规范正交基.

奇异值分解

算子的本征值反映了算子的一些性质. 另一类数(称为奇异值)也是很有用的.回顾一下, 5.36 定义了本征空间和记号 E E EEE.

7.49 定义 奇异值(singular values)

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则 T T TTT 的奇异值就是 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 的本征值, 而且每个本征值 λ λ lambda\lambdaλ 都要重复 dim E ( λ , T T ) dim E λ , T T dim E(lambda,sqrt(T^(**)T))\operatorname{dim} E\left(\lambda, \sqrt{T^{*} T}\right)dimE(λ,TT) 次。
因为 T T TTT 的奇异值都是正算子 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 的本征值, 所以它们都非负.
7.50 例 定义 T L ( F 4 ) T L F 4 T inL(F^(4))T \in \mathcal{L}\left(\mathbf{F}^{4}\right)TL(F4)
T ( z 1 , z 2 , z 3 , z 4 ) = ( 0 , 3 z 1 , 2 z 2 , 3 z 4 ) T z 1 , z 2 , z 3 , z 4 = 0 , 3 z 1 , 2 z 2 , 3 z 4 T(z_(1),z_(2),z_(3),z_(4))=(0,3z_(1),2z_(2),-3z_(4))T\left(z_{1}, z_{2}, z_{3}, z_{4}\right)=\left(0,3 z_{1}, 2 z_{2},-3 z_{4}\right)T(z1,z2,z3,z4)=(0,3z1,2z2,3z4)
T T TTT 的奇异值.
解 计算表明 T T ( z 1 , z 2 , z 3 , z 4 ) = ( 9 z 1 , 4 z 2 , 0 , 9 z 4 ) T T z 1 , z 2 , z 3 , z 4 = 9 z 1 , 4 z 2 , 0 , 9 z 4 T^(**)T(z_(1),z_(2),z_(3),z_(4))=(9z_(1),4z_(2),0,9z_(4))T^{*} T\left(z_{1}, z_{2}, z_{3}, z_{4}\right)=\left(9 z_{1}, 4 z_{2}, 0,9 z_{4}\right)TT(z1,z2,z3,z4)=(9z1,4z2,0,9z4) (请自行验证)。于是
T T ( z 1 , z 2 , z 3 , z 4 ) = ( 3 z 1 , 2 z 2 , 0 , 3 z 4 ) T T z 1 , z 2 , z 3 , z 4 = 3 z 1 , 2 z 2 , 0 , 3 z 4 sqrt(T^(**)T)(z_(1),z_(2),z_(3),z_(4))=(3z_(1),2z_(2),0,3z_(4))\sqrt{T^{*} T}\left(z_{1}, z_{2}, z_{3}, z_{4}\right)=\left(3 z_{1}, 2 z_{2}, 0,3 z_{4}\right)TT(z1,z2,z3,z4)=(3z1,2z2,0,3z4)
从而 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 的本征值为 3 , 2 , 0 3 , 2 , 0 3,2,03,2,03,2,0, 且
dim E ( 3 , T T ) = 2 , dim E ( 2 , T T ) = 1 , dim E ( 0 , T T ) = 1 dim E 3 , T T = 2 , dim E 2 , T T = 1 , dim E 0 , T T = 1 dim E(3,sqrt(T^(**)T))=2,dim E(2,sqrt(T^(**)T))=1,dim E(0,sqrt(T^(**)T))=1\operatorname{dim} E\left(3, \sqrt{T^{*} T}\right)=2, \operatorname{dim} E\left(2, \sqrt{T^{*} T}\right)=1, \operatorname{dim} E\left(0, \sqrt{T^{*} T}\right)=1dimE(3,TT)=2,dimE(2,TT)=1,dimE(0,TT)=1
所以 T T TTT 的奇异值为 3 , 3 , 2 , 0 3 , 3 , 2 , 0 3,3,2,03,3,2,03,3,2,0.
注意 -3 和 0 是 T T TTT 仅有的本征值。在这种情形下, 本征值并不包含 T T TTT 的定义中用到的数 2 , 但是奇异值包含了 2 .
把谱定理和 5.41 (尤其是 5.41(e))用于正算子(因此也是自伴算子) T T T T sqrt(T**)T\sqrt{T *} TTT 可知,每个 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 都有 dim V dim V dim V\operatorname{dim} VdimV 个奇异值。例如,在四维向量空间 F 4 F 4 F^(4)\mathbf{F}^{4}F4 上,例 7.50 中定义的算子 T T TTT 有四个奇异值(如前所见,它们是 3 , 3 , 2 , 0 3 , 3 , 2 , 0 3,3,2,03,3,2,03,3,2,0 )。
以下命题表明,利用奇异值和 V V VVV 的两个规范正交基, V V VVV 上的每个算子都有一个简洁的描述。

7.51 奇异值分解

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 有奇异值 s 1 , , s n s 1 , , s n s_(1),dots,s_(n)s_{1}, \ldots, s_{n}s1,,sn. 则 V V VVV 有两个规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn使得对每个 v V v V v in Vv \in VvV 均有 T v = s 1 v , e 1 f 1 + + s n v , e n f n T v = s 1 v , e 1 f 1 + + s n v , e n f n Tv=s_(1)(:v,e_(1):)f_(1)+cdots+s_(n)(:v,e_(n):)f_(n)T v=s_{1}\left\langle v, e_{1}\right\rangle f_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle f_{n}Tv=s1v,e1f1++snv,enfn.
证明 对 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 应用谱定理可知,有 V V VVV 的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 使得对 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n均有 T T e j = s j e j T T e j = s j e j sqrt(T^(**)T)e_(j)=s_(j)e_(j)\sqrt{T^{*} T} e_{j}=s_{j} e_{j}TTej=sjej
对每个 v V v V v in Vv \in VvV 均有
v = v , e 1 e 1 + + v , e n e n v = v , e 1 e 1 + + v , e n e n v=(:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n)v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n}v=v,e1e1++v,enen
(见 6.30). 把 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 作用到这个等式的两端,则对每个 v V v V v in Vv \in VvV 均有
T T v = s 1 v , e 1 e 1 + + s n v , e n e n T T v = s 1 v , e 1 e 1 + + s n v , e n e n sqrt(T^(**)T)v=s_(1)(:v,e_(1):)e_(1)+cdots+s_(n)(:v,e_(n):)e_(n)\sqrt{T^{*} T} v=s_{1}\left\langle v, e_{1}\right\rangle e_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle e_{n}TTv=s1v,e1e1++snv,enen
由极分解定理 7.45 可知,有等距同构 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 使得 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT 。把 S S SSS 作用到上面的等式两端, 则对每个 v V v V v in Vv \in VvV 均有
T v = s 1 v , e 1 S e 1 + + s n v , e n S e n T v = s 1 v , e 1 S e 1 + + s n v , e n S e n Tv=s_(1)(:v,e_(1):)Se_(1)+cdots+s_(n)(:v,e_(n):)Se_(n)T v=s_{1}\left\langle v, e_{1}\right\rangle S e_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle S e_{n}Tv=s1v,e1Se1++snv,enSen
对每个 j j jjj f j = S e j f j = S e j f_(j)=Se_(j)f_{j}=S e_{j}fj=Sej 。因为 S S SSS 是等距同构, 所以 f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn V V VVV 的规范正交基(见 7.42)。上面的等式现在变成对每个 v V v V v in Vv \in VvV 均有
T v = s 1 v , e 1 f 1 + + s n v , e n f n T v = s 1 v , e 1 f 1 + + s n v , e n f n Tv=s_(1)(:v,e_(1):)f_(1)+cdots+s_(n)(:v,e_(n):)f_(n)T v=s_{1}\left\langle v, e_{1}\right\rangle f_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle f_{n}Tv=s1v,e1f1++snv,enfn
我们在研究从一个向量空间到另一个向量空间的线性映射时, 讨论了线性映射关于第一个向量空间的基和第二个向量空间的基的矩阵。在研究算子(即从一个向量空间到其自身的线性映射)时,我们几乎总是让同一个基扮演这两种角色。
奇异值分解给了我们一个难得的机会——对算子的矩阵同时用到两个不同的基.为此,设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。设 s 1 , , s n s 1 , , s n s_(1),dots,s_(n)s_{1}, \ldots, s_{n}s1,,sn T T TTT 的所有奇异值, e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn 都是 V V VVV 的规范正交基使得奇异值分解 7.51 成立. 因为对每个 j j jjj 均有 T e j = s j f j T e j = s j f j Te_(j)=s_(j)f_(j)T e_{j}=s_{j} f_{j}Tej=sjfj, 所以
M ( T , ( e 1 , , e n ) , ( f 1 , , f n ) ) = ( s 1 0 0 s n ) M T , e 1 , , e n , f 1 , , f n = s 1 0 0 s n M(T,(e_(1),dots,e_(n)),(f_(1),dots,f_(n)))=([s_(1),,0],[,ddots,],[0,,s_(n)])\mathcal{M}\left(T,\left(e_{1}, \ldots, e_{n}\right),\left(f_{1}, \ldots, f_{n}\right)\right)=\left(\begin{array}{ccc} s_{1} & & 0 \\ & \ddots & \\ 0 & & s_{n} \end{array}\right)M(T,(e1,,en),(f1,,fn))=(s100sn)
也就是说,只要允许我们在处理算子时使用两个不同的基,而不是像通常那样只使用单独的一个基,那么 V V VVV 上每个算子关于 V V VVV 的某些规范正交基都有对角矩阵。
奇异值和奇异值分解有很多应用(习题中给出了一些),包括在计算线性代数中的应用。为了计算算子 T T TTT 的奇异值的数值近似值, 首先计算 T T T T T^(**)TT^{*} TTT, 然后计算 T T T T T^(**)TT^{*} TTT 的近似本征值(计算正算子的近似本征值有很好的技术)。 T T T T T^(**)TT^{*} TTT 的这些(近似)本征值的非负平方根就是 T T TTT 的(近似)奇异值。 也就是说,无需计算 T T T T T^(**)TT^{*} TTT 的平方根就能得出 T T TTT 的近似奇异值。以下命题有助于解释采用 T T T T T^(**)TT^{*} TTT 而不采用 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT 的合理性。

7.52 不对算子开平方描述其奇异值

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则 T T TTT 的奇异值是 T T T T T^(**)TT^{*} TTT 的本征值的非负平方根, 且每个本征值 λ λ lambda\lambdaλ要重复 dim E ( λ , T T ) dim E λ , T T dim E(lambda,T^(**)T)\operatorname{dim} E\left(\lambda, T^{*} T\right)dimE(λ,TT) 次。
证明 谱定理表明有规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 和非负数 λ 1 , , λ n λ 1 , , λ n lambda_(1),dots,lambda_(n)\lambda_{1}, \ldots, \lambda_{n}λ1,,λn 使得对 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n 均有 T T e j = λ j e j T T e j = λ j e j T^(**)Te_(j)=lambda_(j)e_(j)T^{*} T e_{j}=\lambda_{j} e_{j}TTej=λjej 。易见,对 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n 均有 T T e j = λ j e j T T e j = λ j e j sqrt(T^(**)T)e_(j)=sqrt(lambda_(j))e_(j)\sqrt{T^{*} T} e_{j}=\sqrt{\lambda_{j}} e_{j}TTej=λjej ,这就得到了想要证明的结果。

习题 7.D

1 取定 u , x V u , x V u,x in Vu, x \in Vu,xV ,其中 u 0 u 0 u!=0u \neq 0u0 。定义 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 如下:对每个 v V v V v in Vv \in VvV T v = v , u x T v = v , u x Tv=(:v,u:)xT v=\langle v, u\rangle xTv=v,ux.证明:对每个 v V v V v in Vv \in VvV T T v = x u v , u u T T v = x u v , u u sqrt(T^(**)T)v=(||x||)/(||u||)(:v,u:)u\sqrt{T^{*} T} v=\frac{\|x\|}{\|u\|}\langle v, u\rangle uTTv=xuv,uu
2 找出一个 T L ( C 2 ) T L C 2 T inL(C^(2))T \in \mathcal{L}\left(\mathbf{C}^{2}\right)TL(C2) 使得 0 是 T T TTT 仅有的本征值且 T T TTT 的奇异值是 5,0 .
3 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明:存在等距同构 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 使得 T = T T S T = T T S T=sqrt(TT^(**))ST=\sqrt{T T^{*}} ST=TTS.
4 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) s s sss T T TTT 的一个奇异值. 证明:存在向量 v V v V v in Vv \in VvV 使得 v = 1 v = 1 ||v||=1\|v\|=1v=1 T v = s T v = s ||Tv||=s\|T v\|=sTv=s.
5 设 T L ( C 2 ) T L C 2 T inL(C^(2))T \in \mathcal{L}\left(\mathbf{C}^{2}\right)TL(C2) T ( x , y ) = ( 4 y , x ) T ( x , y ) = ( 4 y , x ) T(x,y)=(-4y,x)T(x, y)=(-4 y, x)T(x,y)=(4y,x) 定义. 求 T T TTT 的奇异值.
6 求由 D p = p D p = p Dp=p^(')D p=p^{\prime}Dp=p 定义的微分算子 D P 2 ( R ) D P 2 ( R ) D inP_(2)(R)D \in \mathcal{P}_{2}(\mathbf{R})DP2(R) 的奇异值, 这里 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 上的内积由例 6.33 给出。
7 定义 T L ( F 3 ) T L F 3 T inL(F^(3))T \in \mathcal{L}\left(\mathbf{F}^{3}\right)TL(F3) T ( z 1 , z 2 , z 3 ) = ( z 3 , 2 z 1 , 3 z 2 ) T z 1 , z 2 , z 3 = z 3 , 2 z 1 , 3 z 2 T(z_(1),z_(2),z_(3))=(z_(3),2z_(1),3z_(2))T\left(z_{1}, z_{2}, z_{3}\right)=\left(z_{3}, 2 z_{1}, 3 z_{2}\right)T(z1,z2,z3)=(z3,2z1,3z2). 求一个等距同构 S L ( F 3 ) S L F 3 S inL(F^(3))S \in \mathcal{L}\left(\mathbf{F}^{3}\right)SL(F3) 使得 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT.
8 设 T L ( V ) , S L ( V ) T L ( V ) , S L ( V ) T inL(V),S inL(V)T \in \mathcal{L}(V), S \in \mathcal{L}(V)TL(V),SL(V) 是一个等距同构, R L ( V ) R L ( V ) R inL(V)R \in \mathcal{L}(V)RL(V) 是一个正算子使得 T = S R T = S R T=SRT=S RT=SR.证明 R = T T R = T T R=sqrt(T^(**)T)R=\sqrt{T^{*} T}R=TT
本题表明,如果把 T T TTT 写成等距同构与一个正算子的乘积(如同在极分解 7.45 中),则此正算子必为 T T T T sqrt(T^(**)T)\sqrt{T^{*} T}TT
9 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明: T T TTT 是可逆的当且仅当存在唯一的等距同构 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 使得 T = S T T T = S T T T=Ssqrt(T^(**)T)T=S \sqrt{T^{*} T}T=STT.
10 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 是自伴的。证明 T T TTT 的奇异值等于 T T TTT 的本征值的绝对值(适当重复).
11 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明 T T TTT T T T^(**)T^{*}T 有相同的奇异值.
12 证明或给出反例: 若 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V), 则 T 2 T 2 T^(2)T^{2}T2 的奇异值等于 T T TTT 的奇异值的平方.
13 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明: T T TTT 是可逆的当且仅当 0 不是 T T TTT 的奇异值.
14 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 证明: dim dim dim\operatorname{dim}dim range T T TTT 等于 T T TTT 的非零奇异值的个数。
15 设 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V). 证明: S S SSS 是等距同构当且仅当 S S SSS 的所有奇异值都等于1.
16 设 T 1 , T 2 L ( V ) T 1 , T 2 L ( V ) T_(1),T_(2)inL(V)T_{1}, T_{2} \in \mathcal{L}(V)T1,T2L(V). 证明: T 1 T 1 T_(1)T_{1}T1 T 2 T 2 T_(2)T_{2}T2 有相同的奇异值当且仅当存在等距同构 S 1 , S 2 L ( V ) S 1 , S 2 L ( V ) S_(1),S_(2)inL(V)S_{1}, S_{2} \in \mathcal{L}(V)S1,S2L(V) 使得 T 1 = S 1 T 2 S 2 T 1 = S 1 T 2 S 2 T_(1)=S_(1)T_(2)S_(2)T_{1}=S_{1} T_{2} S_{2}T1=S1T2S2
17 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 有如下奇异值分解:对每个 v V v V v in Vv \in VvV
T v = s 1 v , e 1 f 1 + + s n v , e n f n T v = s 1 v , e 1 f 1 + + s n v , e n f n Tv=s_(1)(:v,e_(1):)f_(1)+cdots+s_(n)(:v,e_(n):)f_(n)T v=s_{1}\left\langle v, e_{1}\right\rangle f_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle f_{n}Tv=s1v,e1f1++snv,enfn
其中 s 1 , , s n s 1 , , s n s_(1),dots,s_(n)s_{1}, \ldots, s_{n}s1,,sn T T TTT 的奇异值, e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn 都是 V V VVV 的规范正交基.
(a)证明:若 v V v V v in Vv \in VvV ,则 T v = s 1 v , f 1 e 1 + + s n v , f n e n T v = s 1 v , f 1 e 1 + + s n v , f n e n T^(**)v=s_(1)(:v,f_(1):)e_(1)+cdots+s_(n)(:v,f_(n):)e_(n)T^{*} v=s_{1}\left\langle v, f_{1}\right\rangle e_{1}+\cdots+s_{n}\left\langle v, f_{n}\right\rangle e_{n}Tv=s1v,f1e1++snv,fnen.
(b) 证明: 若 v V v V v in Vv \in VvV, 则 T T v = s 1 2 v , e 1 e 1 + + s n 2 v , e n e n T T v = s 1 2 v , e 1 e 1 + + s n 2 v , e n e n T^(**)Tv=s_(1)^(2)(:v,e_(1):)e_(1)+cdots+s_(n)^(2)(:v,e_(n):)e_(n)T^{*} T v=s_{1}{ }^{2}\left\langle v, e_{1}\right\rangle e_{1}+\cdots+s_{n}{ }^{2}\left\langle v, e_{n}\right\rangle e_{n}TTv=s12v,e1e1++sn2v,enen.
(c) 证明: 若 v V v V v in Vv \in VvV, 则 T T v = s 1 v , e 1 e 1 + + s n v , e n e n T T v = s 1 v , e 1 e 1 + + s n v , e n e n sqrt(T^(**)T)v=s_(1)(:v,e_(1):)e_(1)+cdots+s_(n)(:v,e_(n):)e_(n)\sqrt{T^{*} T} v=s_{1}\left\langle v, e_{1}\right\rangle e_{1}+\cdots+s_{n}\left\langle v, e_{n}\right\rangle e_{n}TTv=s1v,e1e1++snv,enen.
(d) 设 T T TTT 是可逆的. 证明:若 v V v V v in Vv \in VvV ,则
T 1 v = v , f 1 e 1 s 1 + + v , f n e n s n T 1 v = v , f 1 e 1 s 1 + + v , f n e n s n T^(-1)v=((:v,f_(1):)e_(1))/(s_(1))+cdots+((:v,f_(n):)e_(n))/(s_(n))T^{-1} v=\frac{\left\langle v, f_{1}\right\rangle e_{1}}{s_{1}}+\cdots+\frac{\left\langle v, f_{n}\right\rangle e_{n}}{s_{n}}T1v=v,f1e1s1++v,fnensn
18 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 设 s ^ s ^ hat(s)\hat{s}s^ 表示 T T TTT 的最小奇异值, s s sss 表示 T T TTT 的最大奇异值.
(a) 证明对每个 v V v V v in Vv \in VvV 均有 s ^ v T v s v s ^ v T v s v hat(s)||v|| <= ||Tv|| <= s||v||\hat{s}\|v\| \leq\|T v\| \leq s\|v\|s^vTvsv.
(b) 设 λ λ lambda\lambdaλ T T TTT 的一个本征值. 证明 s ^ | λ | s s ^ | λ | s hat(s) <= |lambda| <= s\hat{s} \leq|\lambda| \leq ss^|λ|s.
19 设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 。证明 T T TTT 关于 V V VVV 上由 d ( u , v ) = u v d ( u , v ) = u v d(u,v)=||u-v||d(u, v)=\|u-v\|d(u,v)=uv 定义的度量 d d ddd 是一致连续的。
20 设 S , T L ( V ) S , T L ( V ) S,T inL(V)S, T \in \mathcal{L}(V)S,TL(V) 。设 s s sss 表示 S S SSS 的最大奇异值, t t ttt 表示 T T TTT 的最大奇异值, r r rrr 表示 S + T S + T S+TS+TS+T的最大奇异值. 证明 r s + t r s + t r <= s+tr \leq s+trs+t.