第6章

讲授几何的女人,摘自十四世纪版的欧几里得《几何原本》。

内积空间

我们在定义向量空间时推广了 R 2 R 2 R^(2)\mathbf{R}^{2}R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 的线性结构(加法和标量乘法),而忽略了其他的重要特征,例如长度和角度的概念。这些思想隐含于我们现在要研究的内积的概念中。
我们总采用如下假定:

6.1 记号 F、V

  • F F F\mathbf{F}F 表示 R R R\mathbf{R}R C C C\mathbf{C}C
  • V V VVV 表示 F F F\mathbf{F}F 上的向量空间。
本章的学习目标
  • 柯西-施瓦茨不等式
  • 格拉姆-施密特过程
  • 内积空间上的线性泛函
■ 计算到子空间的最小距离

6.A 内积与范数

内积

为了说明引入内积概念的动机,我们把 R 2 R 2 R^(2)\mathbf{R}^{2}R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 中的向量看作始于原点的箭头. R 2 R 2 R^(2)\mathbf{R}^{2}R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 中向量 x x xxx 的长度称为 x x xxx 的范数 (norm),记为 x x ||x||\|x\|x. 因此对于 x = ( x 1 , x 2 ) R 2 x = x 1 , x 2 R 2 x=(x_(1),x_(2))inR^(2)x=\left(x_{1}, x_{2}\right) \in \mathbf{R}^{2}x=(x1,x2)R2 x = x 1 2 + x 2 2 x = x 1 2 + x 2 2 ||x||=sqrt(x_(1)^(2)+x_(2)^(2))\|x\|=\sqrt{x_{1}{ }^{2}+x_{2}{ }^{2}}x=x12+x22.
类似地, 若 x = ( x 1 , x 2 , x 3 ) R 3 x = x 1 , x 2 , x 3 R 3 x=(x_(1),x_(2),x_(3))inR^(3)x=\left(x_{1}, x_{2}, x_{3}\right) \in \mathbf{R}^{3}x=(x1,x2,x3)R3, 则
向量 x x xxx 的长度是 x 1 2 + x 2 2 x 1 2 + x 2 2 sqrt(x_(1)^(2)+x_(2)^(2))\sqrt{x_{1}^{2}+x_{2}^{2}}x12+x22
x = x 1 2 + x 2 2 + x 3 2 x = x 1 2 + x 2 2 + x 3 2 ||x||=sqrt(x_(1)^(2)+x_(2)^(2)+x_(3)^(2))\|x\|=\sqrt{x_{1}^{2}+x_{2}^{2}+x_{3}^{2}}x=x12+x22+x32.
虽然我们画不出高维的图形,但是范数在 R n R n R^(n)\mathbf{R}^{n}Rn 上的推广是显然的:定义 x = x = x=x=x= ( x 1 , , x n ) R n x 1 , , x n R n (x_(1),dots,x_(n))inR^(n)\left(x_{1}, \ldots, x_{n}\right) \in \mathbf{R}^{n}(x1,,xn)Rn 的范数为
x = x 1 2 + + x n 2 . x = x 1 2 + + x n 2 . ||x||=sqrt(x_(1)^(2)+cdots+x_(n)^(2)).\|x\|=\sqrt{x_{1}^{2}+\cdots+x_{n}^{2}} .x=x12++xn2.
范数在 R n R n R^(n)\mathbf{R}^{n}Rn 上不是线性的. 为了把线性引入讨论, 我们引入点积.

6.2 定义 点积 (dot product)

对于 x , y R n , x x , y R n , x x,y inR^(n),xx, y \in \mathbf{R}^{n}, xx,yRn,x y y yyy 的点积(记作 x y x y x*yx \cdot yxy )定义为
x y = x 1 y 1 + + x n y n , x y = x 1 y 1 + + x n y n , x*y=x_(1)y_(1)+cdots+x_(n)y_(n),x \cdot y=x_{1} y_{1}+\cdots+x_{n} y_{n},xy=x1y1++xnyn,
其中 x = ( x 1 , , x n ) , y = ( y 1 , , y n ) x = x 1 , , x n , y = y 1 , , y n x=(x_(1),dots,x_(n)),y=(y_(1),dots,y_(n))x=\left(x_{1}, \ldots, x_{n}\right), y=\left(y_{1}, \ldots, y_{n}\right)x=(x1,,xn),y=(y1,,yn).
注意, R n R n R^(n)\mathbf{R}^{n}Rn 中两个向量的点积是一个数,而不是一个向量. 显然对所有 x R n x R n x inR^(n)x \in \mathbf{R}^{n}xRn x x = x 2 . R n x x = x 2 . R n x*x=||x||^(2).R^(n)x \cdot x=\|x\|^{2} . \mathbf{R}^{n}xx=x2.Rn 上的点积具有以下性质:
如果我们把向量看作点,而不是箭头, 那么 x x ||x||\|x\|x 应该解释成从原点到点 x x xxx 的距离。
  • 对所有 x R n x R n x inR^(n)x \in \mathbf{R}^{n}xRn 均有 x x 0 x x 0 x*x >= 0x \cdot x \geq 0xx0;
  • x x = 0 x x = 0 x*x=0x \cdot x=0xx=0 当且仅当 x = 0 x = 0 x=0x=0x=0;
  • 对于固定的 y R n , R n y R n , R n y inR^(n),R^(n)y \in \mathbf{R}^{n}, \mathbf{R}^{n}yRn,Rn R R R\mathbf{R}R 的将 x R n x R n x inR^(n)x \in \mathbf{R}^{n}xRn 变为 x y x y x*yx \cdot yxy 的映射是线性的;
  • 对所有 x , y R n x , y R n x,y inR^(n)x, y \in \mathbf{R}^{n}x,yRn 均有 x y = y x x y = y x x*y=y*xx \cdot y=y \cdot xxy=yx.
内积是点积的推广. 现在你可能会猜到, 定义内积就是把上一段所讨论的点积的性质抽象化. 这种猜测对实向量空间是正确的。为了使定义对实向量空间和复向量空间都可用,在给出定义之前,我们需要考察复数的情形。
回想一下, 若 λ = a + b i λ = a + b i lambda=a+bi\lambda=a+b \mathbf{i}λ=a+bi, 其中 a , b R a , b R a,b inRa, b \in \mathbf{R}a,bR, 则
  • λ λ lambda\lambdaλ 的绝对值(记作 | λ | | λ | |lambda||\lambda||λ| )定义为 | λ | = a 2 + b 2 | λ | = a 2 + b 2 |lambda|=sqrt(a^(2)+b^(2))|\lambda|=\sqrt{a^{2}+b^{2}}|λ|=a2+b2;
  • λ λ lambda\lambdaλ 的复共轭(记作 λ ¯ λ ¯ bar(lambda)\bar{\lambda}λ¯ )定义为 λ ¯ = a b j λ ¯ = a b j bar(lambda)=a-bj\bar{\lambda}=a-b \mathbf{j}λ¯=abj;
  • | λ | 2 = λ λ ¯ | λ | 2 = λ λ ¯ |lambda|^(2)=lambda bar(lambda)|\lambda|^{2}=\lambda \bar{\lambda}|λ|2=λλ¯.
关于绝对值和复共轭的定义和基本性质,见第4章。
对于 z = ( z 1 , , z n ) C n z = z 1 , , z n C n z=(z_(1),dots,z_(n))inC^(n)z=\left(z_{1}, \ldots, z_{n}\right) \in \mathbf{C}^{n}z=(z1,,zn)Cn, 定义 z z zzz 的范数为
z = | z 1 | 2 + + | z n | 2 . z = z 1 2 + + z n 2 . ||z||=sqrt(|z_(1)|^(2)+cdots+|z_(n)|^(2)).\|z\|=\sqrt{\left|z_{1}\right|^{2}+\cdots+\left|z_{n}\right|^{2}} .z=|z1|2++|zn|2.
因为我们希望 z z ||z||\|z\|z 是非负数, 所以上式中的绝对值是必要的. 注意
z 2 = z 1 z 1 + + z n z n z 2 = z 1 z 1 ¯ + + z n z n ¯ ||z||^(2)=z_(1) bar(z_(1))+cdots+z_(n) bar(z_(n))\|z\|^{2}=z_{1} \overline{z_{1}}+\cdots+z_{n} \overline{z_{n}}z2=z1z1++znzn
我们想把 z 2 z 2 ||z||^(2)\|z\|^{2}z2 看作 z z zzz 与自身的内积, 就像在 R n R n R^(n)\mathbf{R}^{n}Rn 中一样. 因此, 上面的等式提示我们, w = ( w 1 , , w n ) C n w = w 1 , , w n C n w=(w_(1),dots,w_(n))inC^(n)w=\left(w_{1}, \ldots, w_{n}\right) \in \mathbf{C}^{n}w=(w1,,wn)Cn z z zzz 的内积应该等于
w 1 z 1 + + w n z n . w 1 z 1 ¯ + + w n z n ¯ . w_(1) bar(z_(1))+cdots+w_(n) bar(z_(n)).w_{1} \overline{z_{1}}+\cdots+w_{n} \overline{z_{n}} .w1z1++wnzn.
要是互换 w w www z z zzz 的角色,上面的表达式就要用它的复共轭来代替。也就是说, w w www z z zzz的内积应该等于 z z zzz w w www 的内积的复共轭。有了这样的启示, 我们现在就可以定义 V V VVV上的内积了,这里 V V VVV 可以是实向量空间或者复向量空间.
关于下面定义中记号的两点说明:
  • λ λ lambda\lambdaλ 是复数, 则记号 λ 0 λ 0 lambda >= 0\lambda \geq 0λ0 表示 λ λ lambda\lambdaλ 是实数并且是非负的.
  • 我们使用通用的记号(尖括号) u , v u , v (:u,v:)\langle u, v\rangleu,v 表示内积。有些人使用圆括号,但 ( u , v ) ( u , v ) (u,v)(u, v)(u,v)这个记号比较含糊, 它既可以表示有序对, 又可以表示内积.

6.3 定义 内积(inner product)

V V VVV 上的内积就是一个函数,它把 V V VVV 中元素的每个有序对 ( u , v ) ( u , v ) (u,v)(u, v)(u,v) 都映成一个数 u , v F u , v F (:u,v:)inF\langle u, v\rangle \in \mathbf{F}u,vF, 并且具有下列性质:

正性(positivity)

对所有 v V v V v in Vv \in VvV 均有 v , v 0 v , v 0 (:v,v:) >= 0\langle v, v\rangle \geq 0v,v0;

定性(definiteness)

v , v = 0 v , v = 0 (:v,v:)=0\langle v, v\rangle=0v,v=0 当且仅当 v = 0 ; v = 0 ; v=0;v=0 ;v=0;

第一个位置的加性(additivity in first slot)

对所有 u , v , w V u , v , w V u,v,w in Vu, v, w \in Vu,v,wV 均有 u + v , w = u , w + v , w u + v , w = u , w + v , w (:u+v,w:)=(:u,w:)+(:v,w:)\langle u+v, w\rangle=\langle u, w\rangle+\langle v, w\rangleu+v,w=u,w+v,w;

第一个位置的齐性(homogeneity in first slot)

对所有 λ F λ F lambda inF\lambda \in \mathbf{F}λF 和所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 λ u , v = λ u , v λ u , v = λ u , v (:lambda u,v:)=lambda(:u,v:)\langle\lambda u, v\rangle=\lambda\langle u, v\rangleλu,v=λu,v;

共轭对称性 (conjugate symmetry)

对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 u , v = v , u u , v = v , u ¯ (:u,v:)= bar((:v,u:))\langle u, v\rangle=\overline{\langle v, u\rangle}u,v=v,u.
虽然大多数数学家按上面的方式定义内积,但是很多物理学家在定义内积时要求的是第二个位置的齐性,而不是第一个位置。
每个实数都等于它的复共轭。因此在处理实向量空间时,可以忽略上面最后一个条件中的复共轭而直接说:对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 u , v = v , u u , v = v , u (:u,v:)=(:v,u:)\langle u, v\rangle=\langle v, u\rangleu,v=v,u.

6.4 例 内积

(a) F n F n F^(n)\mathrm{F}^{n}Fn 上的欧几里得内积定义为
( w 1 , , w n ) , ( z 1 , , z n ) = w 1 z 1 + + w n z n w 1 , , w n , z 1 , , z n = w 1 z 1 ¯ + + w n z n ¯ (:(w_(1),dots,w_(n)),(z_(1),dots,z_(n)):)=w_(1) bar(z_(1))+cdots+w_(n) bar(z_(n))\left\langle\left(w_{1}, \ldots, w_{n}\right),\left(z_{1}, \ldots, z_{n}\right)\right\rangle=w_{1} \overline{z_{1}}+\cdots+w_{n} \overline{z_{n}}(w1,,wn),(z1,,zn)=w1z1++wnzn
(b) 若 c 1 , , c n c 1 , , c n c_(1),dots,c_(n)c_{1}, \ldots, c_{n}c1,,cn 均为正数, 则可以定义 F n F n F^(n)\mathbf{F}^{n}Fn 上的内积如下:
( w 1 , , w n ) , ( z 1 , , z n ) = c 1 w 1 z 1 + + c n w n z n w 1 , , w n , z 1 , , z n = c 1 w 1 z 1 ¯ + + c n w n z n ¯ (:(w_(1),dots,w_(n)),(z_(1),dots,z_(n)):)=c_(1)w_(1) bar(z_(1))+cdots+c_(n)w_(n) bar(z_(n))\left\langle\left(w_{1}, \ldots, w_{n}\right),\left(z_{1}, \ldots, z_{n}\right)\right\rangle=c_{1} w_{1} \overline{z_{1}}+\cdots+c_{n} w_{n} \overline{z_{n}}(w1,,wn),(z1,,zn)=c1w1z1++cnwnzn
(c) 在定义在区间 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的实值连续函数构成的向量空间上可定义内积如下:
f , g = 1 1 f ( x ) g ( x ) d x f , g = 1 1 f ( x ) g ( x ) d x (:f,g:)=int_(-1)^(1)f(x)g(x)dx\langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} xf,g=11f(x)g(x)dx
(d) 在 P ( R ) P ( R ) P(R)\mathcal{P}(\mathbf{R})P(R) 上可定义内积如下:
p , q = 0 p ( x ) q ( x ) e x d x p , q = 0 p ( x ) q ( x ) e x d x (:p,q:)=int_(0)^(oo)p(x)q(x)e^(-x)dx\langle p, q\rangle=\int_{0}^{\infty} p(x) q(x) e^{-x} \mathrm{~d} xp,q=0p(x)q(x)ex dx

6.5 定义 内积空间(inner product space)

内积空间就是带有内积的向量空间 V V VVV.
内积空间最重要的例子是 F n F n F^(n)\mathbf{F}^{n}Fn ,带有上面例子中(a)所定义的欧几里得内积. 当我们说 F n F n F^(n)\mathbf{F}^{n}Fn 是内积空间时,除非特别指明,总假设采用的是欧几里得内积。
为避免不断重复 V V VVV 是内积空间这一假设,在本章余下部分我们做如下假设:

6.6 记号 V V VVV

在本章的余下部分, V V VVV 表示 F F F\mathbf{F}F 上的内积空间.
注意这里稍稍有点滥用术语. 内积空间是带有内积的向量空间. 当我们说向量空间 V V VVV 是一个内积空间时,我们也隐含假定了 V V VVV 上的内积,或者从上下文中可以看出采用的是哪个内积(如果向量空间是 F n F n F^(n)\mathbf{F}^{n}Fn ,总是采用欧几里得内积)。

6.7 内积的基本性质

(a) 对每个取定的 u V u V u in Vu \in VuV ,将 v v vvv 变为 v , u v , u (:v,u:)\langle v, u\ranglev,u 的函数是 V V VVV F F F\mathbf{F}F 的线性映射.
(b) 对每个 u V u V u in Vu \in VuV 均有 0 , u = 0 0 , u = 0 (:0,u:)=0\langle 0, u\rangle=00,u=0.
(c) 对每个 u V u V u in Vu \in VuV 均有 u , 0 = 0 u , 0 = 0 (:u,0:)=0\langle u, 0\rangle=0u,0=0.
(d) 对所有 u , v , w V u , v , w V u,v,w in Vu, v, w \in Vu,v,wV 均有 u , v + w = u , v + u , w u , v + w = u , v + u , w (:u,v+w:)=(:u,v:)+(:u,w:)\langle u, v+w\rangle=\langle u, v\rangle+\langle u, w\rangleu,v+w=u,v+u,w.
(e) 对所有 λ F λ F lambda inF\lambda \in \mathbf{F}λF 和所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 u , λ v = λ ¯ u , v u , λ v = λ ¯ u , v (:u,lambda v:)= bar(lambda)(:u,v:)\langle u, \lambda v\rangle=\bar{\lambda}\langle u, v\rangleu,λv=λ¯u,v.

证明

(a)由内积定义中关于第一个位置的加性和齐性可知(a)成立。
(b) 由(a)及线性映射将 0 变为 0 知 (b) 成立。
(c) 由(a)及内积定义中的共轭对称性知(c)成立。
(d) 设 u , v , w V u , v , w V u,v,w in Vu, v, w \in Vu,v,wV. 则
u , v + w = v + w , u = v , u + w , u = v , u + w , u = u , v + u , w . u , v + w = v + w , u ¯ = v , u + w , u ¯ = v , u ¯ + w , u ¯ = u , v + u , w . {:[(:u","v+w:)= bar((:v+w,u:))],[= bar((:v,u:)+(:w,u:))],[= bar((:v,u:))+ bar((:w,u:))],[=(:u","v:)+(:u","w:).]:}\begin{aligned} \langle u, v+w\rangle & =\overline{\langle v+w, u\rangle} \\ & =\overline{\langle v, u\rangle+\langle w, u\rangle} \\ & =\overline{\langle v, u\rangle}+\overline{\langle w, u\rangle} \\ & =\langle u, v\rangle+\langle u, w\rangle . \end{aligned}u,v+w=v+w,u=v,u+w,u=v,u+w,u=u,v+u,w.
(e) 设 λ F , u , v V λ F , u , v V lambda inF,u,v in V\lambda \in \mathbf{F}, u, v \in VλF,u,vV. 则
u , λ v = λ v , u = λ v , u = λ ¯ v , u = λ ¯ u , v . u , λ v = λ v , u ¯ = λ v , u ¯ = λ ¯ v , u ¯ = λ ¯ u , v . {:[(:u","lambda v:)= bar((:lambda v,u:))],[= bar(lambda(:v,u:))],[= bar(lambda) bar((:v,u:))],[= bar(lambda)(:u","v:).]:}\begin{aligned} \langle u, \lambda v\rangle & =\overline{\langle\lambda v, u\rangle} \\ & =\overline{\lambda\langle v, u\rangle} \\ & =\bar{\lambda} \overline{\langle v, u\rangle} \\ & =\bar{\lambda}\langle u, v\rangle . \end{aligned}u,λv=λv,u=λv,u=λ¯v,u=λ¯u,v.
证毕.

范数

我们定义内积的动机最初来自于 R 2 R 2 R^(2)\mathbf{R}^{2}R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 中向量的范数. 下面我们会看到每个内积都确定了一种范数。
6.8 定义 范数 (norm), v v ||v||\|v\|v
对于 v V , v v V , v v in V,vv \in V, vvV,v 的范数(记作 v v ||v||\|v\|v )定义为 v = v , v v = v , v ||v||=sqrt((:v,v:))\|v\|=\sqrt{\langle v, v\rangle}v=v,v.

6.9 例 范数

(a) 若 ( z 1 , , z n ) F n z 1 , , z n F n (z_(1),dots,z_(n))inF^(n)\left(z_{1}, \ldots, z_{n}\right) \in \mathbf{F}^{n}(z1,,zn)Fn (取欧几里得内积), 则
( z 1 , , z n ) = | z 1 | 2 + + | z n | 2 z 1 , , z n = z 1 2 + + z n 2 ||(z_(1),dots,z_(n))||=sqrt(|z_(1)|^(2)+cdots+|z_(n)|^(2))\left\|\left(z_{1}, \ldots, z_{n}\right)\right\|=\sqrt{\left|z_{1}\right|^{2}+\cdots+\left|z_{n}\right|^{2}}(z1,,zn)=|z1|2++|zn|2
(b) 在 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的实值连续函数构成的向量空间中(取例 6.4(c) 中定义的内积)有
f = 1 1 ( f ( x ) ) 2 d x f = 1 1 ( f ( x ) ) 2 d x ||f||=sqrt(int_(-1)^(1)(f(x))^(2)dx)\|f\|=\sqrt{\int_{-1}^{1}(f(x))^{2} \mathrm{~d} x}f=11(f(x))2 dx

6.10 范数的基本性质

v V v V v in Vv \in VvV.
(a) v = 0 v = 0 ||v||=0\|v\|=0v=0 当且仅当 v = 0 v = 0 v=0v=0v=0
(b) 对所有 λ F λ F lambda inF\lambda \in \mathbf{F}λF 均有 λ v = | λ | v λ v = | λ | v ||lambda v||=|lambda|||v||\|\lambda v\|=|\lambda|\|v\|λv=|λ|v.

证明

(a)由于 v , v = 0 v , v = 0 (:v,v:)=0\langle v, v\rangle=0v,v=0 当且仅当 v = 0 v = 0 v=0v=0v=0, 故结论成立.
(b) 设 λ F λ F lambda inF\lambda \in \mathbf{F}λF. 则
λ v 2 = λ v , λ v = λ v , λ v = λ λ ¯ v , v = | λ | 2 v 2 . λ v 2 = λ v , λ v = λ v , λ v = λ λ ¯ v , v = | λ | 2 v 2 . {:[||lambda v||^(2)=(:lambda v","lambda v:)],[=lambda(:v","lambda v:)],[=lambda bar(lambda)(:v","v:)],[=|lambda|^(2)||v||^(2).]:}\begin{aligned} \|\lambda v\|^{2} & =\langle\lambda v, \lambda v\rangle \\ & =\lambda\langle v, \lambda v\rangle \\ & =\lambda \bar{\lambda}\langle v, v\rangle \\ & =|\lambda|^{2}\|v\|^{2} . \end{aligned}λv2=λv,λv=λv,λv=λλ¯v,v=|λ|2v2.
开平方即得要证的等式。
上面 (b) 的这个证明阐明了一个普遍原理:处理范数的平方通常比直接处理范数更容易。
现在给出一个关键的定义。

6.11 定义 正交(orthogonal)

两个向量 u , v V u , v V u,v in Vu, v \in Vu,vV 称为是正交的, 如果 u , v = 0 u , v = 0 (:u,v:)=0\langle u, v\rangle=0u,v=0.
在上述定义中向量的次序无关紧要,因为 u , v = 0 u , v = 0 (:u,v:)=0\langle u, v\rangle=0u,v=0 当且仅当 v , u = 0 v , u = 0 (:v,u:)=0\langle v, u\rangle=0v,u=0. 有时候我们说 u u uuu 正交于 v v vvv ,而不说 u u uuu v v vvv 是正交的。
习题 13 表明,若 u , v u , v u,vu, vu,v R 2 R 2 R^(2)\mathbf{R}^{2}R2 中的非零向量,则
u , v = u v cos θ u , v = u v cos θ (:u,v:)=||u||||v||cos theta\langle u, v\rangle=\|u\|\|v\| \cos \thetau,v=uvcosθ
其中 θ θ theta\thetaθ u u uuu v v vvv 间的夹角(把 u u uuu v v vvv 看成始于原点的箭头)。于是 R 2 R 2 R^(2)\mathbf{R}^{2}R2 中的两个向量是正交的(按照通常的欧几里得内积)当且仅当它们之间夹角的余弦是 0 ,当且仅当这两个向量在平面几何通常的意义下是垂直的. 因此正交是一个很酷的词, 意思就是垂直(perpendicular)。
我们从下面的简单结果开始研究正交性.

6.12 正交性与 0

(a) 0 正交于 V V VVV 中的任意向量.
(b) 0 是 V V VVV 中唯一一个与自身正交的向量.

证明

(a) 6.7(b)表明对每个 u V u V u in Vu \in VuV 均有 0 , u = 0 0 , u = 0 (:0,u:)=0\langle 0, u\rangle=00,u=0
(b) 若 v V v V v in Vv \in VvV v , v = 0 v , v = 0 (:v,v:)=0\langle v, v\rangle=0v,v=0 ,则 v = 0 v = 0 v=0v=0v=0 (由内积的定义)。
下面的定理是对于 V = R 2 V = R 2 V=R^(2)V=\mathbf{R}^{2}V=R2 的特殊情况,已经有 2500 多年历史了。当然, 这里给出的证明并不是原始的证明。
正交一词来源自希腊语的 orthogonios, 后者的意思是直角的.

6.13 勾股定理(又称毕达哥拉斯定理)

u u uuu v v vvv V V VVV 中的正交向量,则 u + v 2 = u 2 + v 2 u + v 2 = u 2 + v 2 ||u+v||^(2)=||u||^(2)+||v||^(2)\|u+v\|^{2}=\|u\|^{2}+\|v\|^{2}u+v2=u2+v2.
证明
u + v 2 = u + v , u + v = u , u + u , v + v , u + v , v = u 2 + v 2 . u + v 2 = u + v , u + v = u , u + u , v + v , u + v , v = u 2 + v 2 . {:[||u+v||^(2)=(:u+v","u+v:)],[=(:u","u:)+(:u","v:)+(:v","u:)+(:v","v:)],[=||u||^(2)+||v||^(2).]:}\begin{aligned} \|u+v\|^{2} & =\langle u+v, u+v\rangle \\ & =\langle u, u\rangle+\langle u, v\rangle+\langle v, u\rangle+\langle v, v\rangle \\ & =\|u\|^{2}+\|v\|^{2} . \end{aligned}u+v2=u+v,u+v=u,u+u,v+v,u+v,v=u2+v2.
上面给出的勾股定理证明表明,结论成立当且仅当 u , v + v , u = 0 u , v + v , u = 0 (:u,v:)+(:v,u:)=0\langle u, v\rangle+\langle v, u\rangle=0u,v+v,u=0 ,即 2 Re u , v = 0 2 Re u , v = 0 2Re(:u,v:)=02 \operatorname{Re}\langle u, v\rangle=02Reu,v=0. 因此勾股定理的逆命题在实内积空间中成立。
u , v V u , v V u,v in Vu, v \in Vu,vV v 0 v 0 v!=0v \neq 0v0 。我们想把 u u uuu 写成 v v vvv 的标量倍加上一个正交于 v v vvv 的向量 w w www ,如左下图所示。
正交分解
为了揭示如何将 u u uuu 写成 v v vvv 的标量倍加上一个正交于 v v vvv的向量,令 c F c F c inFc \in \mathbf{F}cF 表示一个标量,则
u = c v + ( u c v ) u = c v + ( u c v ) u=cv+(u-cv)u=c v+(u-c v)u=cv+(ucv)
因此需要选取 c c ccc 使得 v v vvv 正交于 ( u c v ) ( u c v ) (u-cv)(u-c v)(ucv). 也就是说,我们希望
0 = u c v , v = u , v c v 2 0 = u c v , v = u , v c v 2 0=(:u-cv,v:)=(:u,v:)-c||v||^(2)0=\langle u-c v, v\rangle=\langle u, v\rangle-c\|v\|^{2}0=ucv,v=u,vcv2
上式表明 c c ccc 应取成 u , v / v 2 u , v / v 2 (:u,v:)//||v||^(2)\langle u, v\rangle /\|v\|^{2}u,v/v2 。从而
u = u , v v 2 v + ( u u , v v 2 v ) . u = u , v v 2 v + u u , v v 2 v . u=((:u,v:))/(||v||^(2))v+(u-((:u,v:))/(||v||^(2))v).u=\frac{\langle u, v\rangle}{\|v\|^{2}} v+\left(u-\frac{\langle u, v\rangle}{\|v\|^{2}} v\right) .u=u,vv2v+(uu,vv2v).
上式把 u u uuu 写成了 v v vvv 的标量倍加上一个正交于 v v vvv 的向量(请自行验证)。也就是说,我们证明了以下命题。

6.14 正交分解

u , v V u , v V u,v in Vu, v \in Vu,vV v 0 v 0 v!=0v \neq 0v0. 令 c = u , v v 2 , w = u u , v v 2 v c = u , v v 2 , w = u u , v v 2 v c=((:u,v:))/(||v||^(2)),w=u-((:u,v:))/(||v||^(2))vc=\frac{\langle u, v\rangle}{\|v\|^{2}}, w=u-\frac{\langle u, v\rangle}{\|v\|^{2}} vc=u,vv2,w=uu,vv2v. 则 w , v = 0 w , v = 0 (:w,v:)=0\langle w, v\rangle=0w,v=0 u = c v + w u = c v + w u=cv+wu=c v+wu=cv+w.
1821 年,法国数学家奥古斯丁-路易 • 柯西(1789-1857)证明了 6.17(a). 1886年,德国数学家赫尔曼 • 施瓦茨(1843-1921)证明了 6.17(b).
正交分解 6.14 将被用于证明下面的定理 (柯西-施瓦茨不等式),它是数学中最重要的不等式之一。

6.15 柯西-施瓦茨不等式

u , v V u , v V u,v in Vu, v \in Vu,vV. 则 | u , v | u v | u , v | u v |(:u,v:)| <= ||u||||v|||\langle u, v\rangle| \leq\|u\|\|v\||u,v|uv. 等号成立当且仅当 u , v u , v u,vu, vu,v 之一是另一个的标量倍。
证明 若 v = 0 v = 0 v=0v=0v=0 ,则不等式的两端都等于 0 。因此可以假设 v 0 v 0 v!=0v \neq 0v0. 考虑 6.14 中给出的正交分解
u = u , v v 2 v + w u = u , v v 2 v + w u=((:u,v:))/(||v||^(2))v+wu=\frac{\langle u, v\rangle}{\|v\|^{2}} v+wu=u,vv2v+w
其中 w w www 正交于 v v vvv 。由勾股定理我们有
6.16
u 2 = u , v v 2 v 2 + w 2 = | u , v | 2 v 2 + w 2 | u , v | 2 v 2 u 2 = u , v v 2 v 2 + w 2 = | u , v | 2 v 2 + w 2 | u , v | 2 v 2 {:[||u||^(2)=||((:u,v:))/(||v||^(2))v||^(2)+||w||^(2)],[=(|(:u,v:)|^(2))/(||v||^(2))+||w||^(2)],[ >= (|(:u,v:)|^(2))/(||v||^(2))]:}\begin{aligned} \|u\|^{2} & =\left\|\frac{\langle u, v\rangle}{\|v\|^{2}} v\right\|^{2}+\|w\|^{2} \\ & =\frac{|\langle u, v\rangle|^{2}}{\|v\|^{2}}+\|w\|^{2} \\ & \geq \frac{|\langle u, v\rangle|^{2}}{\|v\|^{2}} \end{aligned}u2=u,vv2v2+w2=|u,v|2v2+w2|u,v|2v2
在这个不等式两端都乘以 v 2 v 2 ||v||^(2)\|v\|^{2}v2 ,再开平方即得所要证的不等式。
从上一段的证明可以看出柯西一施瓦茨不等式成为等式当且仅当 6.16 是等式. 显然,这成立当且仅当 w = 0 w = 0 w=0w=0w=0 。而 w = 0 w = 0 w=0w=0w=0 当且仅当 u u uuu v v vvv 的标量倍(参见6.14). 因此,柯西-施瓦茨不等式是等式当且仅当 u u uuu v v vvv 的标量倍或 v v vvv u u uuu 的标量倍(或二者都成立. 这样措辞是为了涵盖 u u uuu v v vvv 等于 0 的情况)。

6.17 例 柯西-施瓦茨不等式的例子

(a) 若 x 1 , , x n , y 1 , , y n R x 1 , , x n , y 1 , , y n R x_(1),dots,x_(n),y_(1),dots,y_(n)inRx_{1}, \ldots, x_{n}, y_{1}, \ldots, y_{n} \in \mathbf{R}x1,,xn,y1,,ynR ,则
| x 1 y 1 + + x n y n | 2 ( x 1 2 + + x n 2 ) ( y 1 2 + + y n 2 ) . x 1 y 1 + + x n y n 2 x 1 2 + + x n 2 y 1 2 + + y n 2 . |x_(1)y_(1)+cdots+x_(n)y_(n)|^(2) <= (x_(1)^(2)+cdots+x_(n)^(2))(y_(1)^(2)+cdots+y_(n)^(2)).\left|x_{1} y_{1}+\cdots+x_{n} y_{n}\right|^{2} \leq\left(x_{1}^{2}+\cdots+x_{n}^{2}\right)\left(y_{1}^{2}+\cdots+y_{n}{ }^{2}\right) .|x1y1++xnyn|2(x12++xn2)(y12++yn2).
(b) 若 f , g f , g f,gf, gf,g 均为 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的实值连续函数, 则
| 1 1 f ( x ) g ( x ) d x | 2 ( 1 1 ( f ( x ) ) 2 d x ) ( 1 1 ( g ( x ) ) 2 d x ) . 1 1 f ( x ) g ( x ) d x 2 1 1 ( f ( x ) ) 2 d x 1 1 ( g ( x ) ) 2 d x . |int_(-1)^(1)f(x)g(x)dx|^(2) <= (int_(-1)^(1)(f(x))^(2)(d)x)(int_(-1)^(1)(g(x))^(2)(d)x).\left|\int_{-1}^{1} f(x) g(x) \mathrm{d} x\right|^{2} \leq\left(\int_{-1}^{1}(f(x))^{2} \mathrm{~d} x\right)\left(\int_{-1}^{1}(g(x))^{2} \mathrm{~d} x\right) .|11f(x)g(x)dx|2(11(f(x))2 dx)(11(g(x))2 dx).
下面的命题称为三角不等式,它有如下的几何解释:三角形任意一边的长度小于另外两边的长度之和。
三角不等式表明两点之间的最短路线是直线.

6.18 三角不等式

u , v V u , v V u,v in Vu, v \in Vu,vV. 则 u + v u + v u + v u + v ||u+v|| <= ||u||+||v||\|u+v\| \leq\|u\|+\|v\|u+vu+v. 等号成立当且仅当 u , v u , v u,vu, vu,v 之一是另一个的非负标量倍。
证明 我们有
u + v 2 = u + v , u + v = u , u + v , v + u , v + v , u = u , u + v , v + u , v + u , v u + v 2 = u + v , u + v = u , u + v , v + u , v + v , u = u , u + v , v + u , v + u , v ¯ {:[||u+v||^(2)=(:u+v","u+v:)],[=(:u","u:)+(:v","v:)+(:u","v:)+(:v","u:)],[=(:u","u:)+(:v","v:)+(:u","v:)+ bar((:u,v:))]:}\begin{aligned} \|u+v\|^{2} & =\langle u+v, u+v\rangle \\ & =\langle u, u\rangle+\langle v, v\rangle+\langle u, v\rangle+\langle v, u\rangle \\ & =\langle u, u\rangle+\langle v, v\rangle+\langle u, v\rangle+\overline{\langle u, v\rangle} \end{aligned}u+v2=u+v,u+v=u,u+v,v+u,v+v,u=u,u+v,v+u,v+u,v
6.19
= u 2 + v 2 + 2 Re u , v = u 2 + v 2 + 2 Re u , v =||u||^(2)+||v||^(2)+2Re(:u,v:)=\|u\|^{2}+\|v\|^{2}+2 \operatorname{Re}\langle u, v\rangle=u2+v2+2Reu,v
u 2 + v 2 + 2 | u , v | u 2 + v 2 + 2 | u , v | <= ||u||^(2)+||v||^(2)+2|(:u,v:)|\leq\|u\|^{2}+\|v\|^{2}+2|\langle u, v\rangle|u2+v2+2|u,v|
6.20
u 2 + v 2 + 2 u v = ( u + v ) 2 u 2 + v 2 + 2 u v = ( u + v ) 2 {:[ <= ||u||^(2)+||v||^(2)+2||u||||v||],[=(||u||+||v||)^(2)]:}\begin{aligned} & \leq\|u\|^{2}+\|v\|^{2}+2\|u\|\|v\| \\ & =(\|u\|+\|v\|)^{2} \end{aligned}u2+v2+2uv=(u+v)2
其中 6.20 是利用柯西-施瓦茨不等式 6.15. 上面的不等式两端开平方即得所要证的不等式。
上面的证明表明,三角不等式是等式当且仅当 6.19 和 6.20 均为等式. 因此, 三角不等式是等式当且仅当

6.21

u , v = u v . u , v = u v . (:u,v:)=||u||||v||.\langle u, v\rangle=\|u\|\|v\| .u,v=uv.
请自行验证,如果 u , v u , v u,vu, vu,v 之一是另一个的非负标量倍,那么 6.21 成立. 反之,设 6.21成立,则由柯西-施瓦茨不等式 6.15 为等式的条件可知, u , v u , v u,vu, vu,v 之一必定是另一个的标量倍,再由 6.21 知这个标量显然是非负的。
下面的命题称为平行四边形恒等式,因为它的几何解释为:在任意平行四边形中,对角线长度的平方和等于四条边长度的平方和。
平行四边形恒等式

6.22 平行四边形恒等式

u , v V u , v V u,v in Vu, v \in Vu,vV. 则 u + v 2 + u v 2 = 2 ( u 2 + v 2 ) u + v 2 + u v 2 = 2 u 2 + v 2 ||u+v||^(2)+||u-v||^(2)=2(||u||^(2)+||v||^(2))\|u+v\|^{2}+\|u-v\|^{2}=2\left(\|u\|^{2}+\|v\|^{2}\right)u+v2+uv2=2(u2+v2).
证明
u + v 2 + u v 2 = u + v , u + v + u v , u v = u 2 + v 2 + u , v + v , u + u 2 + v 2 u , v v , u = 2 ( u 2 + v 2 ) . u + v 2 + u v 2 = u + v , u + v + u v , u v = u 2 + v 2 + u , v + v , u + u 2 + v 2 u , v v , u = 2 u 2 + v 2 . {:[||u+v||^(2)+||u-v||^(2)=(:u+v","u+v:)+(:u-v","u-v:)],[=||u||^(2)+||v||^(2)+(:u","v:)+(:v","u:)],[+||u||^(2)+||v||^(2)-(:u","v:)-(:v","u:)],[=2(||u||^(2)+||v||^(2)).]:}\begin{aligned} \|u+v\|^{2}+\|u-v\|^{2}= & \langle u+v, u+v\rangle+\langle u-v, u-v\rangle \\ = & \|u\|^{2}+\|v\|^{2}+\langle u, v\rangle+\langle v, u\rangle \\ & +\|u\|^{2}+\|v\|^{2}-\langle u, v\rangle-\langle v, u\rangle \\ = & 2\left(\|u\|^{2}+\|v\|^{2}\right) . \end{aligned}u+v2+uv2=u+v,u+v+uv,uv=u2+v2+u,v+v,u+u2+v2u,vv,u=2(u2+v2).

2010 年, 法学教授理查德 • 弗里德曼上诉到最高法院的一个案子:

弗里德曼先生:我认为那个议题和这个议题完全正交.
因为州政府承认——
罗伯茨首席大法官:对不起。完全什么?
弗里德曼先生:正交的.直角的.不相干的.无关的.
罗伯茨首席大法官:哦。
斯卡利亚大法官:那个形容词是什么?我喜欢它。
弗里德曼先生:正交的。
罗伯茨首席大法官:正交的。
弗里德曼先生:对,对。
斯卡利亚大法官:正交的,嚯。(大笑.)
肯尼迪大法官:我意识到这个案子给我们提出了一个问题。(大笑.)

习题 6.

1 证明将 ( ( x 1 , x 2 ) , ( y 1 , y 2 ) ) R 2 × R 2 x 1 , x 2 , y 1 , y 2 R 2 × R 2 ((x_(1),x_(2)),(y_(1),y_(2)))inR^(2)xxR^(2)\left(\left(x_{1}, x_{2}\right),\left(y_{1}, y_{2}\right)\right) \in \mathbf{R}^{2} \times \mathbf{R}^{2}((x1,x2),(y1,y2))R2×R2 变为 | x 1 y 1 | + | x 2 y 2 | x 1 y 1 + x 2 y 2 |x_(1)y_(1)|+|x_(2)y_(2)|\left|x_{1} y_{1}\right|+\left|x_{2} y_{2}\right||x1y1|+|x2y2| 的函数不是 R 2 R 2 R^(2)\mathbf{R}^{2}R2 上的内积。
2 证明将 ( ( x 1 , x 2 , x 3 ) , ( y 1 , y 2 , y 3 ) ) R 3 × R 3 x 1 , x 2 , x 3 , y 1 , y 2 , y 3 R 3 × R 3 ((x_(1),x_(2),x_(3)),(y_(1),y_(2),y_(3)))inR^(3)xxR^(3)\left(\left(x_{1}, x_{2}, x_{3}\right),\left(y_{1}, y_{2}, y_{3}\right)\right) \in \mathbf{R}^{3} \times \mathbf{R}^{3}((x1,x2,x3),(y1,y2,y3))R3×R3 变为 x 1 y 1 + x 3 y 3 x 1 y 1 + x 3 y 3 x_(1)y_(1)+x_(3)y_(3)x_{1} y_{1}+x_{3} y_{3}x1y1+x3y3 的函数不是 R 3 R 3 R^(3)\mathbf{R}^{3}R3 上的内积。
3 设 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R V { 0 } V { 0 } V!={0}V \neq\{0\}V{0} 。将内积定义 6.3 中的正性条件(对所有 v V v V v in Vv \in VvV 均有 v , v 0 v , v 0 (:v,v:) >= 0\langle v, v\rangle \geq 0v,v0 )改为对某个 v V v V v in Vv \in VvV v , v > 0 v , v > 0 (:v,v:) > 0\langle v, v\rangle>0v,v>0 。证明定义中的这个变化并不改变定义了 V V VVV 上内积的那些从 V × V V × V V xx VV \times VV×V R R R\mathbf{R}R 的函数所构成的集合。
4 设 V V VVV 是一个实内积空间。
(a) 证明对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有 u + v , u v = u 2 v 2 u + v , u v = u 2 v 2 (:u+v,u-v:)=||u||^(2)-||v||^(2)\langle u+v, u-v\rangle=\|u\|^{2}-\|v\|^{2}u+v,uv=u2v2.
(b) 证明若 u , v V u , v V u,v in Vu, v \in Vu,vV 具有相同的范数, 则 u + v u + v u+vu+vu+v 正交于 u v u v u-vu-vuv.
(c) 利用 (b) 证明菱形的对角线相互垂直.
5 设 V V VVV 是有限维向量空间,并设 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V) 使得对每个 v V v V v in Vv \in VvV 均有 T v v T v v ||Tv|| <= ||v||\|T v\| \leq\|v\|Tvv. 证明 ( T 2 I ) ( T 2 I ) (T-sqrt2I)(T-\sqrt{2} I)(T2I) 是可逆的。
6 设 u , v V u , v V u,v in Vu, v \in Vu,vV. 证明 u , v = 0 u , v = 0 (:u,v:)=0\langle u, v\rangle=0u,v=0 当且仅当对所有 a F a F a inFa \in \mathbf{F}aF 均有 u u + a v u u + a v ||u|| <= ||u+av||\|u\| \leq\|u+a v\|uu+av.
7 设 u , v V u , v V u,v in Vu, v \in Vu,vV 。证明 a u + b v = b u + a v a u + b v = b u + a v ||au+bv||=||bu+av||\|a u+b v\|=\|b u+a v\|au+bv=bu+av 对所有 a , b R a , b R a,b inRa, b \in \mathbf{R}a,bR 均成立当且仅当 u = v u = v ||u||=||v||\|u\|=\|v\|u=v.
8 设 u , v V , u = v = 1 u , v V , u = v = 1 u,v in V,||u||=||v||=1u, v \in V,\|u\|=\|v\|=1u,vV,u=v=1 u , v = 1 u , v = 1 (:u,v:)=1\langle u, v\rangle=1u,v=1. 证明 u = v u = v u=vu=vu=v
9 设 u , v V , u 1 u , v V , u 1 u,v in V,||u|| <= 1u, v \in V,\|u\| \leq 1u,vV,u1 v 1 v 1 ||v|| <= 1\|v\| \leq 1v1 。证明 1 u 2 1 v 2 1 | u , v | 1 u 2 1 v 2 1 | u , v | sqrt(1-||u||^(2))sqrt(1-||v||^(2)) <= 1-|(:u,v:)|\sqrt{1-\|u\|^{2}} \sqrt{1-\|v\|^{2}} \leq 1-|\langle u, v\rangle|1u21v21|u,v|.
10 求向量 u , v R 2 u , v R 2 u,v inR^(2)u, v \in \mathbf{R}^{2}u,vR2 使得 u u uuu ( 1 , 3 ) ( 1 , 3 ) (1,3)(1,3)(1,3) 的标量倍, v v vvv 正交于 ( 1 , 3 ) ( 1 , 3 ) (1,3)(1,3)(1,3) ( 1 , 2 ) = u + v ( 1 , 2 ) = u + v (1,2)=u+v(1,2)=u+v(1,2)=u+v.
11 证明对所有正数 a , b , c , d a , b , c , d a,b,c,da, b, c, da,b,c,d 均有 16 ( a + b + c + d ) ( 1 a + 1 b + 1 c + 1 d ) 16 ( a + b + c + d ) 1 a + 1 b + 1 c + 1 d 16 <= (a+b+c+d)((1)/(a)+(1)/(b)+(1)/(c)+(1)/(d))16 \leq(a+b+c+d)\left(\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}\right)16(a+b+c+d)(1a+1b+1c+1d).
12 证明对所有正整数 n n nnn 和实数 x 1 , , x n x 1 , , x n x_(1),dots,x_(n)x_{1}, \ldots, x_{n}x1,,xn 均有 ( x 1 + + x n ) 2 n ( x 1 2 + + x n 2 ) x 1 + + x n 2 n x 1 2 + + x n 2 (x_(1)+cdots+x_(n))^(2) <= n(x_(1)^(2)+cdots+x_(n)^(2))\left(x_{1}+\cdots+x_{n}\right)^{2} \leq n\left(x_{1}{ }^{2}+\cdots+x_{n}{ }^{2}\right)(x1++xn)2n(x12++xn2).
13 设 u , v u , v u,vu, vu,v R 2 R 2 R^(2)\mathbf{R}^{2}R2 中的非零向量。证明 u , v = u v cos θ u , v = u v cos θ (:u,v:)=||u||||v||cos theta\langle u, v\rangle=\|u\|\|v\| \cos \thetau,v=uvcosθ, 其中 θ θ theta\thetaθ u u uuu v v vvv 的夹角 (将 u u uuu v v vvv 看作始于原点的箭头)。
提示:画出 u v u v u、vu 、 vuv u v u v u-vu-vuv 形成的三角形,然后利用余弦定理。
14 R 2 14 R 2 14R^(2)14 \mathbf{R}^{2}14R2 R 3 R 3 R^(3)\mathbf{R}^{3}R3 中两个向量(视为始于原点的箭头)的夹角可以用几何的方法来定义。但是对 n > 3 , R n n > 3 , R n n > 3,R^(n)n>3, \mathbf{R}^{n}n>3,Rn 中的几何是不明确的。所以两个非零向量 x , y R n x , y R n x,y inR^(n)x, y \in \mathbf{R}^{n}x,yRn 的夹角定义为 arccos x , y x y arccos x , y x y arccos(((:x,y:))/(||x||||y||))\arccos \frac{\langle x, y\rangle}{\|x\|\|y\|}arccosx,yxy ,此定义的动机来自于上题。解释一下为什么证明上述定义有意义需要用到柯西一施瓦茨不等式。
15 证明对所有实数 a 1 , , a n a 1 , , a n a_(1),dots,a_(n)a_{1}, \ldots, a_{n}a1,,an b 1 , , b n b 1 , , b n b_(1),dots,b_(n)b_{1}, \ldots, b_{n}b1,,bn 均有
( j = 1 n a j b j ) 2 ( j = 1 n j a j 2 ) ( j = 1 n b j 2 j ) j = 1 n a j b j 2 j = 1 n j a j 2 j = 1 n b j 2 j (sum_(j=1)^(n)a_(j)b_(j))^(2) <= (sum_(j=1)^(n)ja_(j)^(2))(sum_(j=1)^(n)(b_(j)^(2))/(j))\left(\sum_{j=1}^{n} a_{j} b_{j}\right)^{2} \leq\left(\sum_{j=1}^{n} j a_{j}^{2}\right)\left(\sum_{j=1}^{n} \frac{b_{j}^{2}}{j}\right)(j=1najbj)2(j=1njaj2)(j=1nbj2j)
16 设 u , v V u , v V u,v in Vu, v \in Vu,vV 使得 u = 3 , u + v = 4 , u v = 6 u = 3 , u + v = 4 , u v = 6 ||u||=3,||u+v||=4,||u-v||=6\|u\|=3,\|u+v\|=4,\|u-v\|=6u=3,u+v=4,uv=6. v v ||v||\|v\|v 等于多少?
17 证明或反驳: R 2 R 2 R^(2)\mathbf{R}^{2}R2 上有一个内积使得该内积确定的范数为:对所有 ( x , y ) R 2 ( x , y ) R 2 (x,y)inR^(2)(x, y) \in \mathbf{R}^{2}(x,y)R2 ( x , y ) = max { | x | , | y | } ( x , y ) = max { | x | , | y | } ||(x,y)||=max{|x|,|y|}\|(x, y)\|=\max \{|x|,|y|\}(x,y)=max{|x|,|y|}.
18 设 p > 0 p > 0 p > 0p>0p>0. 证明 R 2 R 2 R^(2)\mathbf{R}^{2}R2 上有一个内积使得该内积确定的范数为
对所有 ( x , y ) R 2 ( x , y ) = ( | x | p + | y | p ) 1 / p  对所有  ( x , y ) R 2  有  ( x , y ) = | x | p + | y | p 1 / p " 对所有 "(x,y)inR^(2)" 有 "||(x,y)||=(|x|^(p)+|y|^(p))^(1//p)\text { 对所有 }(x, y) \in \mathbf{R}^{2} \text { 有 }\|(x, y)\|=\left(|x|^{p}+|y|^{p}\right)^{1 / p} 对所有 (x,y)R2 有 (x,y)=(|x|p+|y|p)1/p
当且仅当 p = 2 p = 2 p=2p=2p=2.
19 设 V V VVV 是实内积空间。证明对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有
u , v = u + v 2 u v 2 4 u , v = u + v 2 u v 2 4 (:u,v:)=(||u+v||^(2)-||u-v||^(2))/(4)\langle u, v\rangle=\frac{\|u+v\|^{2}-\|u-v\|^{2}}{4}u,v=u+v2uv24
20 设 V V VVV 是复内积空间。证明对所有 u , v V u , v V u,v in Vu, v \in Vu,vV 均有
u , v = u + v 2 u v 2 + u + i v 2 i u i v 2 i 4 u , v = u + v 2 u v 2 + u + i v 2 i u i v 2 i 4 (:u,v:)=(||u+v||^(2)-||u-v||^(2)+||u+iv||^(2)i-||u-iv||^(2)i)/(4)\langle u, v\rangle=\frac{\|u+v\|^{2}-\|u-v\|^{2}+\|u+\mathrm{i} v\|^{2} \mathrm{i}-\|u-\mathrm{i} v\|^{2} \mathrm{i}}{4}u,v=u+v2uv2+u+iv2iuiv2i4
21 向量空间 U U UUU 上的范数是满足以下条件的函数 : U [ 0 , ) : u = 0 : U [ 0 , ) : u = 0 ||||:U rarr[0,oo):||u||=0\|\|: U \rightarrow[0, \infty):\| u\|=0:U[0,):u=0 当且仅当 u = 0 u = 0 u=0u=0u=0, 对所有 α F α F alpha inF\alpha \in \mathbf{F}αF u U u U u in Uu \in UuU 均有 α u = | α | u α u = | α | u ||alpha u||=|alpha|||u||\|\alpha u\|=|\alpha|\|u\|αu=|α|u ,对所有 u , v U u , v U u,v in Uu, v \in Uu,vU 均有 u + v u + v u + v u + v ||u+v|| <= ||u||+||v||\|u+v\| \leq\|u\|+\|v\|u+vu+v. 证明满足平行四边形恒等式的范数均来自于内积(也就是说:若 ||||\|\| U U UUU 上的满足平行四边形恒等式的范数,则有 U U UUU 上的内积 〈,〉使得对所有 u U u U u in Uu \in UuU 均有 u = u , u 1 / 2 u = u , u 1 / 2 ||u||=(:u,u:)^(1//2)\|u\|=\langle u, u\rangle^{1 / 2}u=u,u1/2 )。
22 证明平均数的平方小于等于平方的平均数. 更确切地说, 若 a 1 , , a n R a 1 , , a n R a_(1),dots,a_(n)inRa_{1}, \ldots, a_{n} \in \mathbf{R}a1,,anR, 则 a 1 , , a n a 1 , , a n a_(1),dots,a_(n)a_{1}, \ldots, a_{n}a1,,an 的平均数的平方小于等于 a 1 2 , , a n 2 a 1 2 , , a n 2 a_(1)^(2),dots,a_(n)^(2)a_{1}{ }^{2}, \ldots, a_{n}{ }^{2}a12,,an2 的平均数。
23 设 V 1 , , V m V 1 , , V m V_(1),dots,V_(m)V_{1}, \ldots, V_{m}V1,,Vm 均为内积空间。证明等式
( u 1 , , u m ) , ( v 1 , , v m ) = u 1 , v 1 + + u m , v m u 1 , , u m , v 1 , , v m = u 1 , v 1 + + u m , v m (:(u_(1),dots,u_(m)),(v_(1),dots,v_(m)):)=(:u_(1),v_(1):)+cdots+(:u_(m),v_(m):)\left\langle\left(u_{1}, \ldots, u_{m}\right),\left(v_{1}, \ldots, v_{m}\right)\right\rangle=\left\langle u_{1}, v_{1}\right\rangle+\cdots+\left\langle u_{m}, v_{m}\right\rangle(u1,,um),(v1,,vm)=u1,v1++um,vm
定义了 V 1 × × V m V 1 × × V m V_(1)xx cdots xxV_(m)V_{1} \times \cdots \times V_{m}V1××Vm 上的内积。
在上面表达式的右端, u 1 , v 1 u 1 , v 1 (:u_(1),v_(1):)\left\langle u_{1}, v_{1}\right\rangleu1,v1 表示 V 1 V 1 V_(1)V_{1}V1 上的内积, , u m , v m , u m , v m dots,(:u_(m),v_(m):)\ldots,\left\langle u_{m}, v_{m}\right\rangle,um,vm 表示 V m V m V_(m)V_{m}Vm 上的内积。虽然这里使用了相同的记号,但各个空间 V 1 , , V m V 1 , , V m V_(1),dots,V_(m)V_{1}, \ldots, V_{m}V1,,Vm 可以有不同的内积。
24 设 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) V V VVV 上的一个单的算子。定义 , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1 如下:对 u , v V u , v V u,v in Vu, v \in Vu,vV u , v 1 = u , v 1 = (:u,v:)_(1)=\langle u, v\rangle_{1}=u,v1= S u , S v S u , S v (:Su,Sv:)\langle S u, S v\rangleSu,Sv 。证明 , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1 V V VVV 上的内积。
25 设 S L ( V ) S L ( V ) S inL(V)S \in \mathcal{L}(V)SL(V) 不是单的. 如上题那样定义 , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1. 说明为什么 , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1 不是 V V VVV 上的内积。
26 设 f , g f , g f,gf, gf,g R R R\mathbf{R}R R n R n R^(n)\mathbf{R}^{n}Rn 的可微函数。
(a) 证明 f ( t ) , g ( t ) = f ( t ) , g ( t ) + f ( t ) , g ( t ) f ( t ) , g ( t ) = f ( t ) , g ( t ) + f ( t ) , g ( t ) (:f(t),g(t):)^(')=(:f^(')(t),g(t):)+(:f(t),g^(')(t):)\langle f(t), g(t)\rangle^{\prime}=\left\langle f^{\prime}(t), g(t)\right\rangle+\left\langle f(t), g^{\prime}(t)\right\ranglef(t),g(t)=f(t),g(t)+f(t),g(t).
(b) 设 c > 0 c > 0 c > 0c>0c>0 且对每个 t R t R t inRt \in \mathbf{R}tR 均有 f ( t ) = c f ( t ) = c ||f(t)||=c\|f(t)\|=cf(t)=c 。证明对每个 t R t R t inRt \in \mathbf{R}tR 均有 f ( t ) , f ( t ) = 0 f ( t ) , f ( t ) = 0 (:f^(')(t),f(t):)=0\left\langle f^{\prime}(t), f(t)\right\rangle=0f(t),f(t)=0.
(c) 利用 R n R n R^(n)\mathbf{R}^{n}Rn 中以原点为中心的球面上的曲线的切向量给出 (b) 中结论的几何解释。
在本题中,函数 f : R R n f : R R n f:RrarrR^(n)f: \mathbf{R} \rightarrow \mathbf{R}^{n}f:RRn 称为是可微的是指存在 R R R\mathbf{R}R R R R\mathbf{R}R 的可微函数 f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn使得对每个 t R t R t inRt \in \mathbf{R}tR 均有 f ( t ) = ( f 1 ( t ) , , f n ( t ) ) f ( t ) = f 1 ( t ) , , f n ( t ) f(t)=(f_(1)(t),dots,f_(n)(t))f(t)=\left(f_{1}(t), \ldots, f_{n}(t)\right)f(t)=(f1(t),,fn(t)) 。另外, 对每个 t R t R t inRt \in \mathbf{R}tR, 导数 f ( t ) R n f ( t ) R n f^(')(t)inR^(n)f^{\prime}(t) \in \mathbf{R}^{n}f(t)Rn 定义为 f ( t ) = ( f 1 ( t ) , , f n ( t ) ) f ( t ) = f 1 ( t ) , , f n ( t ) f^(')(t)=(f_(1)^(')(t),dots,f_(n)^(')(t))f^{\prime}(t)=\left(f_{1}{ }^{\prime}(t), \ldots, f_{n}{ }^{\prime}(t)\right)f(t)=(f1(t),,fn(t)).
27 设 u , v , w V u , v , w V u,v,w in Vu, v, w \in Vu,v,wV 。证明
w 1 2 ( u + v ) 2 = w u 2 + w v 2 2 u v 2 4 w 1 2 ( u + v ) 2 = w u 2 + w v 2 2 u v 2 4 ||w-(1)/(2)(u+v)||^(2)=(||w-u||^(2)+||w-v||^(2))/(2)-(||u-v||^(2))/(4)\left\|w-\frac{1}{2}(u+v)\right\|^{2}=\frac{\|w-u\|^{2}+\|w-v\|^{2}}{2}-\frac{\|u-v\|^{2}}{4}w12(u+v)2=wu2+wv22uv24
28 设 C C CCC V V VVV 的子集使得 u , v C u , v C u,v in Cu, v \in Cu,vC 蕴涵 1 2 ( u + v ) C 1 2 ( u + v ) C (1)/(2)(u+v)in C\frac{1}{2}(u+v) \in C12(u+v)C. 设 w V w V w in Vw \in VwV. 证明 C C CCC 中距离 w w www 最近的点至多有一个. 也就是说至多有一个点 u C u C u in Cu \in CuC 使得对所有 v C v C v in Cv \in CvC 均有 w u w v w u w v ||w-u|| <= ||w-v||\|w-u\| \leq\|w-v\|wuwv.
提示:利用上题。
29 对于 u , v V u , v V u,v in Vu, v \in Vu,vV 定义 d ( u , v ) = u v d ( u , v ) = u v d(u,v)=||u-v||d(u, v)=\|u-v\|d(u,v)=uv.
(a) 证明 d d ddd V V VVV 上的一个度量.
(b) 证明若 V V VVV 是有限维的, 则 d d ddd V V VVV 上的完备度量(意思是每个柯西序列均收敛)。
(c) 证明 V V VVV 的每个有限维子空间都是 V V VVV 的(关于度量 d d ddd 的)闭子集.
30 固定正整数 n . R n n . R n n.R^(n)n . \mathbf{R}^{n}n.Rn 上二次可微函数 p p ppp 的拉普拉斯算子 Δ p Δ p Delta p\Delta pΔp R n R n R^(n)\mathbf{R}^{n}Rn 上的函数,定义如下:
Δ p = 2 p x 1 2 + + 2 p x n 2 Δ p = 2 p x 1 2 + + 2 p x n 2 Delta p=(del^(2)p)/(delx_(1)^(2))+cdots+(del^(2)p)/(delx_(n)^(2))\Delta p=\frac{\partial^{2} p}{\partial x_{1}^{2}}+\cdots+\frac{\partial^{2} p}{\partial x_{n}^{2}}Δp=2px12++2pxn2
如果 Δ p = 0 Δ p = 0 Delta p=0\Delta p=0Δp=0, 则称函数 p p ppp 是调和的.
R n R n R^(n)\mathbf{R}^{n}Rn 上的多项式是形如 x 1 m 1 x n m n x 1 m 1 x n m n x_(1)^(m_(1))cdotsx_(n)^(m_(n))x_{1}{ }^{m_{1}} \cdots x_{n}{ }^{m_{n}}x1m1xnmn 的函数的线性组合,其中 m 1 , , m n m 1 , , m n m_(1),dots,m_(n)m_{1}, \ldots, m_{n}m1,,mn 均为非负整数。
q q qqq R n R n R^(n)\mathbf{R}^{n}Rn 上的多项式。证明:存在 R n R n R^(n)\mathbf{R}^{n}Rn 上的调和多项式 p p ppp 使得对每个满足 x = 1 x = 1 ||x||=1\|x\|=1x=1 x R n x R n x inR^(n)x \in \mathbf{R}^{n}xRn 均有 p ( x ) = q ( x ) p ( x ) = q ( x ) p(x)=q(x)p(x)=q(x)p(x)=q(x)
对于这道习题,需要用到的关于调和函数的唯一一个事实是:若 p p ppp R n R n R^(n)\mathbf{R}^{n}Rn 上的调和函数且对所有满足 x = 1 x = 1 ||x||=1\|x\|=1x=1 x R n x R n x inR^(n)x \in \mathbf{R}^{n}xRn 均有 p ( x ) = 0 p ( x ) = 0 p(x)=0p(x)=0p(x)=0 ,则 p = 0 p = 0 p=0p=0p=0
提示:一个合理的推测是,要找的调和多项式 p p ppp 形如 q + ( 1 x 2 ) r q + 1 x 2 r q+(1-||x||^(2))rq+\left(1-\|x\|^{2}\right) rq+(1x2)r ,其中 r r rrr 是多项式. 在适当向量空间上定义算子 T T TTT
Tr = Δ ( ( 1 x 2 ) r ) Tr = Δ 1 x 2 r Tr=Delta((1-||x||^(2))r)\operatorname{Tr}=\Delta\left(\left(1-\|x\|^{2}\right) r\right)Tr=Δ((1x2)r)
再证 T T TTT 是单的, 因此是满的, 由此证明存在 R n R n R^(n)\mathbf{R}^{n}Rn 上的多项式 r r rrr 使得 q + ( 1 x 2 ) r q + 1 x 2 r q+(1-||x||^(2))rq+\left(1-\|x\|^{2}\right) rq+(1x2)r是调和的。
31 使用内积证明阿波罗尼奥斯恒等式:在边长为 a , b , c a , b , c a,b,ca, b, ca,b,c 的三角形中, 设 d d ddd 是长度为 c c ccc 的边的中点到对顶点的线段的长度. 则
a 2 + b 2 = 1 2 c 2 + 2 d 2 a 2 + b 2 = 1 2 c 2 + 2 d 2 a^(2)+b^(2)=(1)/(2)c^(2)+2d^(2)a^{2}+b^{2}=\frac{1}{2} c^{2}+2 d^{2}a2+b2=12c2+2d2

6.B 规范正交基

6.23 定义 规范正交的(orthonormal)

  • 如果一个向量组中每个向量的范数都是 1 且与其他向量正交, 则称这个向量组是规范正交的。
  • 也就是说, V V VVV 上的向量组 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 是规范正交的, 如果
e j , e k = { 1 , j = k , 0 , j k e j , e k = 1 ,       若  j = k , 0 ,       若  j k (:e_(j),e_(k):)={[1","," 若 "j=k","],[0","," 若 "j!=k]:}\left\langle e_{j}, e_{k}\right\rangle= \begin{cases}1, & \text { 若 } j=k, \\ 0, & \text { 若 } j \neq k\end{cases}ej,ek={1, 若 j=k,0, 若 jk

6.24 例 规范正交组

(a) F n F n F^(n)\mathrm{F}^{n}Fn 的标准基是规范正交组.
(b) ( 1 3 , 1 3 , 1 3 ) , ( 1 2 , 1 2 , 0 ) 1 3 , 1 3 , 1 3 , 1 2 , 1 2 , 0 ((1)/(sqrt3),(1)/(sqrt3),(1)/(sqrt3)),(-(1)/(sqrt2),(1)/(sqrt2),0)\left(\frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}\right),\left(-\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0\right)(13,13,13),(12,12,0) F 3 F 3 F^(3)\mathbf{F}^{3}F3 中的规范正交组.
(c) ( 1 3 , 1 3 , 1 3 ) , ( 1 2 , 1 2 , 0 ) , ( 1 6 , 1 6 , 2 6 ) 1 3 , 1 3 , 1 3 , 1 2 , 1 2 , 0 , 1 6 , 1 6 , 2 6 ((1)/(sqrt3),(1)/(sqrt3),(1)/(sqrt3)),(-(1)/(sqrt2),(1)/(sqrt2),0),((1)/(sqrt6),(1)/(sqrt6),-(2)/(sqrt6))\left(\frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}\right),\left(-\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0\right),\left(\frac{1}{\sqrt{6}}, \frac{1}{\sqrt{6}},-\frac{2}{\sqrt{6}}\right)(13,13,13),(12,12,0),(16,16,26) F 3 F 3 F^(3)\mathbf{F}^{3}F3 中的规范正交组.
下面的命题表明规范正交组特别容易处理.

6.25 规范正交线性组合的范数

e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em V V VVV 中的规范正交向量组, 则对所有 a 1 , , a m F a 1 , , a m F a_(1),dots,a_(m)inFa_{1}, \ldots, a_{m} \in \mathbf{F}a1,,amF 均有
a 1 e 1 + + a m e m 2 = | a 1 | 2 + + | a m | 2 a 1 e 1 + + a m e m 2 = a 1 2 + + a m 2 ||a_(1)e_(1)+cdots+a_(m)e_(m)||^(2)=|a_(1)|^(2)+cdots+|a_(m)|^(2)\left\|a_{1} e_{1}+\cdots+a_{m} e_{m}\right\|^{2}=\left|a_{1}\right|^{2}+\cdots+\left|a_{m}\right|^{2}a1e1++amem2=|a1|2++|am|2
证明 因为每个 e j e j e_(j)e_{j}ej 的范数都是 1, 通过反复使用勾股定理 6.13 容易证得.上述命题有如下重要推论。

6.26 规范正交组是线性无关的

每个规范正交向量组都是线性无关的.
证明 设 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em V V VVV 中的规范正交向量组, 并设 a 1 , , a m F a 1 , , a m F a_(1),dots,a_(m)inFa_{1}, \ldots, a_{m} \in \mathbf{F}a1,,amF 使得
a 1 e 1 + + a m e m = 0 a 1 e 1 + + a m e m = 0 a_(1)e_(1)+cdots+a_(m)e_(m)=0a_{1} e_{1}+\cdots+a_{m} e_{m}=0a1e1++amem=0
| a 1 | 2 + + | a m | 2 = 0 a 1 2 + + a m 2 = 0 |a_(1)|^(2)+cdots+|a_(m)|^(2)=0\left|a_{1}\right|^{2}+\cdots+\left|a_{m}\right|^{2}=0|a1|2++|am|2=0 (根据 6.25),这表明所有的 a j a j a_(j)a_{j}aj 均为 0 。因此 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 是线性无关的。

6.27 定义 规范正交基(orthonormal basis)

V V VVV 的规范正交基是 V V VVV 中的规范正交向量组构成的基.
例如, F n F n F^(n)\mathrm{F}^{n}Fn 的标准基是规范正交基。

6.28 适当长度的规范正交组是规范正交基

V V VVV 中每个长度为 dim V dim V dim V\operatorname{dim} VdimV 的规范正交向量组都是 V V VVV 的规范正交基.
证明 由 6.26, 任何这样的组都一定是线性无关的. 又因为它具有适当的长度, 所以它一定是基(见2.39)。
6.29 例 证明
( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , 1 2 , 1 2 ) 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 ((1)/(2),(1)/(2),(1)/(2),(1)/(2)),((1)/(2),(1)/(2),-(1)/(2),-(1)/(2)),((1)/(2),-(1)/(2),-(1)/(2),(1)/(2)),(-(1)/(2),(1)/(2),-(1)/(2),(1)/(2))\left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right),\left(\frac{1}{2}, \frac{1}{2},-\frac{1}{2},-\frac{1}{2}\right),\left(\frac{1}{2},-\frac{1}{2},-\frac{1}{2}, \frac{1}{2}\right),\left(-\frac{1}{2}, \frac{1}{2},-\frac{1}{2}, \frac{1}{2}\right)(12,12,12,12),(12,12,12,12),(12,12,12,12),(12,12,12,12)
F 4 F 4 F^(4)\mathbf{F}^{4}F4 的规范正交基.
证明 我们有
( 1 2 , 1 2 , 1 2 , 1 2 ) = ( 1 2 ) 2 + ( 1 2 ) 2 + ( 1 2 ) 2 + ( 1 2 ) 2 = 1 1 2 , 1 2 , 1 2 , 1 2 = 1 2 2 + 1 2 2 + 1 2 2 + 1 2 2 = 1 ||((1)/(2),(1)/(2),(1)/(2),(1)/(2))||=sqrt(((1)/(2))^(2)+((1)/(2))^(2)+((1)/(2))^(2)+((1)/(2))^(2))=1\left\|\left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right)\right\|=\sqrt{\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}}=1(12,12,12,12)=(12)2+(12)2+(12)2+(12)2=1
类似地,上面的组中其余三个向量的范数也都是 1 .
我们还有
( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , 1 2 , 1 2 ) = 1 2 1 2 + 1 2 1 2 + 1 2 ( 1 2 ) + 1 2 ( 1 2 ) = 0 . 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 , 1 2 = 1 2 1 2 + 1 2 1 2 + 1 2 1 2 + 1 2 1 2 = 0 . (:((1)/(2),(1)/(2),(1)/(2),(1)/(2)),((1)/(2),(1)/(2),-(1)/(2),-(1)/(2)):)=(1)/(2)*(1)/(2)+(1)/(2)*(1)/(2)+(1)/(2)*(-(1)/(2))+(1)/(2)*(-(1)/(2))=0.\left\langle\left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right),\left(\frac{1}{2}, \frac{1}{2},-\frac{1}{2},-\frac{1}{2}\right)\right\rangle=\frac{1}{2} \cdot \frac{1}{2}+\frac{1}{2} \cdot \frac{1}{2}+\frac{1}{2} \cdot\left(-\frac{1}{2}\right)+\frac{1}{2} \cdot\left(-\frac{1}{2}\right)=0 .(12,12,12,12),(12,12,12,12)=1212+1212+12(12)+12(12)=0.
类似地,上面的组中任意两个不同的向量的内积都等于 0 。
因此上面的组是规范正交的。由于这是四维向量空间 F 4 F 4 F^(4)\mathbf{F}^{4}F4 的一个长度为 4 的规范正交组,所以它是 F 4 F 4 F^(4)\mathbf{F}^{4}F4 的规范正交基(由于 6.28)。
一般地, 给定 V V VVV 的基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 和向量 v V v V v in Vv \in VvV ,我们知道有标量 a 1 , , a n F a 1 , , a n F a_(1),dots,a_(n)inFa_{1}, \ldots, a_{n} \in \mathbf{F}a1,,anF使得
v = a 1 e 1 + + a n e n v = a 1 e 1 + + a n e n v=a_(1)e_(1)+cdots+a_(n)e_(n)v=a_{1} e_{1}+\cdots+a_{n} e_{n}v=a1e1++anen
规范正交基的重要性主要缘于下面的命题。
V V VVV 的任意基求满足上述方程的 a 1 , , a n a 1 , , a n a_(1),dots,a_(n)a_{1}, \ldots, a_{n}a1,,an可能是困难的。然而,以下命题表明对于规范正交基这很容易:取 a j = v , e j a j = v , e j a_(j)=(:v,e_(j):)a_{j}=\left\langle v, e_{j}\right\rangleaj=v,ej 即可.

6.30 将向量写成规范正交基的线性组合

e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的规范正交基且 v V v V v in Vv \in VvV. 则
v = v , e 1 e 1 + + v , e n e n v = v , e 1 e 1 + + v , e n e n v=(:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n)v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n}v=v,e1e1++v,enen
v 2 = | v , e 1 | 2 + + | v , e n | 2 v 2 = v , e 1 2 + + v , e n 2 ||v||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(n):)|^(2)\|v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{n}\right\rangle\right|^{2}v2=|v,e1|2++|v,en|2
证明 因为 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的基, 所以存在标量 a 1 , , a n a 1 , , a n a_(1),dots,a_(n)a_{1}, \ldots, a_{n}a1,,an 使得
v = a 1 e 1 + + a n e n v = a 1 e 1 + + a n e n v=a_(1)e_(1)+cdots+a_(n)e_(n)v=a_{1} e_{1}+\cdots+a_{n} e_{n}v=a1e1++anen
由于 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 是规范正交的, 等式两端都和 e j e j e_(j)e_{j}ej 做内积得到 v , e j = a j v , e j = a j (:v,e_(j):)=a_(j)\left\langle v, e_{j}\right\rangle=a_{j}v,ej=aj. 于是 6.30的第一个等式成立。
由 6.30 的第一个等式和 6.25 立即可得 6.30 的第二个等式.
既然我们了解了规范正交基的用处,那么如何找到它们呢?例如,对于由区间 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的定积分所定义的内积(见 6.4(c)), P m ( R ) P m ( R ) P_(m)(R)\mathcal{P}_{m}(\mathbf{R})Pm(R) 有规范正交基吗?下面的命题将会给出这些问题的答案。
丹麦数学家约根 • 格 拉姆 (1850-1916)和德国数学家埃哈德 • 施密特(1876-1959)普及了这种构造规范正交基的算法。
下面证明中用到的算法称为格拉姆-施密特过程。这种方法可以把一个线性无关组转化成与原来的组有相同张成空间的规范正交组.

6.31 格拉姆-施密特过程

v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm V V VVV 中的线性无关向量组。设 e 1 = v 1 / v 1 e 1 = v 1 / v 1 e_(1)=v_(1)//||v_(1)||e_{1}=v_{1} /\left\|v_{1}\right\|e1=v1/v1 。对于 j = 2 , , m j = 2 , , m j=2,dots,mj=2, \ldots, mj=2,,m ,定义 e j e j e_(j)e_{j}ej 如下:
e j = v j v j , e 1 e 1 v j , e j 1 e j 1 v j v j , e 1 e 1 v j , e j 1 e j 1 e j = v j v j , e 1 e 1 v j , e j 1 e j 1 v j v j , e 1 e 1 v j , e j 1 e j 1 e_(j)=(v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||)e_{j}=\frac{v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|}ej=vjvj,e1e1vj,ej1ej1vjvj,e1e1vj,ej1ej1
e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em V V VVV 中的规范正交组,使得对 j = 1 , , m j = 1 , , m j=1,dots,mj=1, \ldots, mj=1,,m
span ( v 1 , , v j ) = span ( e 1 , , e j ) span v 1 , , v j = span e 1 , , e j span(v_(1),dots,v_(j))=span(e_(1),dots,e_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)=\operatorname{span}\left(e_{1}, \ldots, e_{j}\right)span(v1,,vj)=span(e1,,ej)
证明 我们将对 j j jjj 用归纳法来证明结论成立. 首先 j = 1 j = 1 j=1j=1j=1 时, 由 v 1 v 1 v_(1)v_{1}v1 e 1 e 1 e_(1)e_{1}e1 的正数倍知 span ( v 1 ) = span ( e 1 ) span v 1 = span e 1 span(v_(1))=span(e_(1))\operatorname{span}\left(v_{1}\right)=\operatorname{span}\left(e_{1}\right)span(v1)=span(e1).
1 < j < m 1 < j < m 1 < j < m1<j<m1<j<m 并假设已经有
6.32
span ( v 1 , , v j 1 ) = span ( e 1 , , e j 1 ) span v 1 , , v j 1 = span e 1 , , e j 1 span(v_(1),dots,v_(j-1))=span(e_(1),dots,e_(j-1))\operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)=\operatorname{span}\left(e_{1}, \ldots, e_{j-1}\right)span(v1,,vj1)=span(e1,,ej1)
注意 v j span ( v 1 , , v j 1 ) v j span v 1 , , v j 1 v_(j)!in span(v_(1),dots,v_(j-1))v_{j} \notin \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)vjspan(v1,,vj1) (因为 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm 是线性无关的)。于是 v j span ( e 1 , v j span e 1 , v_(j)!in span(e_(1),dots:}v_{j} \notin \operatorname{span}\left(e_{1}, \ldots\right.vjspan(e1,,, e j 1 e j 1 e_(j-1)e_{j-1}ej1 ). 因此在 6.31 的 e j e j e_(j)e_{j}ej 定义中的分母不为 0 . 用一个向量除以它的范数就得到一个范数为 1 的新向量. 因此 e j = 1 e j = 1 ||e_(j)||=1\left\|e_{j}\right\|=1ej=1
1 k < j 1 k < j 1 <= k < j1 \leq k<j1k<j. 则
e j , e k = v j v j , e 1 e 1 v j , e j 1 e j 1 v j v j , e 1 e 1 v j , e j 1 e j 1 , e k = v j , e k v j , e k v j v j , e 1 e 1 v j , e j 1 e j 1 = 0 e j , e k = v j v j , e 1 e 1 v j , e j 1 e j 1 v j v j , e 1 e 1 v j , e j 1 e j 1 , e k = v j , e k v j , e k v j v j , e 1 e 1 v j , e j 1 e j 1 = 0 {:[(:e_(j),e_(k):)=(:(v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||),e_(k):)],[=((:v_(j),e_(k):)-(:v_(j),e_(k):))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||)],[=0]:}\begin{aligned} \left\langle e_{j}, e_{k}\right\rangle & =\left\langle\frac{v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|}, e_{k}\right\rangle \\ & =\frac{\left\langle v_{j}, e_{k}\right\rangle-\left\langle v_{j}, e_{k}\right\rangle}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|} \\ & =0 \end{aligned}ej,ek=vjvj,e1e1vj,ej1ej1vjvj,e1e1vj,ej1ej1,ek=vj,ekvj,ekvjvj,e1e1vj,ej1ej1=0
因此 e 1 , , e j e 1 , , e j e_(1),dots,e_(j)e_{1}, \ldots, e_{j}e1,,ej 是规范正交组。
从 6.31 给出的 e j e j e_(j)e_{j}ej 的定义我们看到 v j span ( e 1 , , e j ) v j span e 1 , , e j v_(j)in span(e_(1),dots,e_(j))v_{j} \in \operatorname{span}\left(e_{1}, \ldots, e_{j}\right)vjspan(e1,,ej). 再结合 6.32 得
span ( v 1 , , v j ) span ( e 1 , , e j ) span v 1 , , v j span e 1 , , e j span(v_(1),dots,v_(j))sub span(e_(1),dots,e_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right) \subset \operatorname{span}\left(e_{1}, \ldots, e_{j}\right)span(v1,,vj)span(e1,,ej)
上面的这两个组都是线性无关的(这些 v k v k v_(k)v_{k}vk 的线性无关性是根据假设得到的,这些 e k e k e_(k)e_{k}ek的线性无关性是由规范正交性和 6.26 得到的)。因此上面两个子空间的维数都为 j j jjj ,从而一定相等。
6.33 例 求 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 的一个规范正交基, 这里的内积为 p , q = 1 1 p ( x ) q ( x ) d x p , q = 1 1 p ( x ) q ( x ) d x (:p,q:)=int_(-1)^(1)p(x)q(x)dx\langle p, q\rangle=\int_{-1}^{1} p(x) q(x) \mathrm{d} xp,q=11p(x)q(x)dx.
解 我们将对基 1 , x , x 2 1 , x , x 2 1,x,x^(2)1, x, x^{2}1,x,x2 应用格拉姆-施密特过程 6.31.
首先,我们有
1 2 = 1 1 1 2 d x = 2 1 2 = 1 1 1 2 d x = 2 ||1||^(2)=int_(-1)^(1)1^(2)dx=2\|1\|^{2}=\int_{-1}^{1} 1^{2} \mathrm{~d} x=212=1112 dx=2
于是 1 = 2 1 = 2 ||1||=sqrt2\|1\|=\sqrt{2}1=2, 所以 e 1 = 1 2 e 1 = 1 2 e_(1)=sqrt((1)/(2))e_{1}=\sqrt{\frac{1}{2}}e1=12.
现在 e 2 e 2 e_(2)e_{2}e2 的表达式中的分子为
x x , e 1 e 1 = x ( 1 1 x 1 2 d x ) 1 2 = x x x , e 1 e 1 = x 1 1 x 1 2 d x 1 2 = x x-(:x,e_(1):)e_(1)=x-(int_(-1)^(1)xsqrt((1)/(2))(d)x)sqrt((1)/(2))=xx-\left\langle x, e_{1}\right\rangle e_{1}=x-\left(\int_{-1}^{1} x \sqrt{\frac{1}{2}} \mathrm{~d} x\right) \sqrt{\frac{1}{2}}=xxx,e1e1=x(11x12 dx)12=x
我们有
x 2 = 1 1 x 2 d x = 2 3 . x 2 = 1 1 x 2 d x = 2 3 . ||x||^(2)=int_(-1)^(1)x^(2)dx=(2)/(3).\|x\|^{2}=\int_{-1}^{1} x^{2} \mathrm{~d} x=\frac{2}{3} .x2=11x2 dx=23.
于是 x = 2 3 x = 2 3 ||x||=sqrt((2)/(3))\|x\|=\sqrt{\frac{2}{3}}x=23, 所以 e 2 = 3 2 x e 2 = 3 2 x e_(2)=sqrt((3)/(2))xe_{2}=\sqrt{\frac{3}{2}} xe2=32x.
e 3 e 3 e_(3)e_{3}e3 表达式中的分子为
x 2 x 2 , e 1 e 1 x 2 , e 2 e 2 = x 2 ( 1 1 x 2 1 2 d x ) 1 2 ( 1 1 x 2 3 2 x d x ) 3 2 x = x 2 1 3 . x 2 x 2 , e 1 e 1 x 2 , e 2 e 2 = x 2 1 1 x 2 1 2 d x 1 2 1 1 x 2 3 2 x d x 3 2 x = x 2 1 3 . {:[x^(2)-(:x^(2),e_(1):)e_(1)-(:x^(2),e_(2):)e_(2)],[=x^(2)-(int_(-1)^(1)x^(2)sqrt((1)/(2))(d)x)sqrt((1)/(2))-(int_(-1)^(1)x^(2)sqrt((3)/(2))x(d)x)sqrt((3)/(2))x=x^(2)-(1)/(3).]:}\begin{aligned} x^{2} & -\left\langle x^{2}, e_{1}\right\rangle e_{1}-\left\langle x^{2}, e_{2}\right\rangle e_{2} \\ & =x^{2}-\left(\int_{-1}^{1} x^{2} \sqrt{\frac{1}{2}} \mathrm{~d} x\right) \sqrt{\frac{1}{2}}-\left(\int_{-1}^{1} x^{2} \sqrt{\frac{3}{2}} x \mathrm{~d} x\right) \sqrt{\frac{3}{2}} x=x^{2}-\frac{1}{3} . \end{aligned}x2x2,e1e1x2,e2e2=x2(11x212 dx)12(11x232x dx)32x=x213.
我们有
x 2 1 3 2 = 1 1 ( x 4 2 3 x 2 + 1 9 ) d x = 8 45 . x 2 1 3 2 = 1 1 x 4 2 3 x 2 + 1 9 d x = 8 45 . ||x^(2)-(1)/(3)||^(2)=int_(-1)^(1)(x^(4)-(2)/(3)x^(2)+(1)/(9))dx=(8)/(45).\left\|x^{2}-\frac{1}{3}\right\|^{2}=\int_{-1}^{1}\left(x^{4}-\frac{2}{3} x^{2}+\frac{1}{9}\right) \mathrm{d} x=\frac{8}{45} .x2132=11(x423x2+19)dx=845.
于是 x 2 1 3 = 8 45 x 2 1 3 = 8 45 ||x^(2)-(1)/(3)||=sqrt((8)/(45))\left\|x^{2}-\frac{1}{3}\right\|=\sqrt{\frac{8}{45}}x213=845, 所以 e 3 = 45 8 ( x 2 1 3 ) e 3 = 45 8 x 2 1 3 e_(3)=sqrt((45)/(8))(x^(2)-(1)/(3))e_{3}=\sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right)e3=458(x213).
因此
1 2 , 3 2 x , 45 8 ( x 2 1 3 ) 1 2 , 3 2 x , 45 8 x 2 1 3 sqrt((1)/(2)),sqrt((3)/(2))x,sqrt((45)/(8))(x^(2)-(1)/(3))\sqrt{\frac{1}{2}}, \sqrt{\frac{3}{2}} x, \sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right)12,32x,458(x213)
P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 中长度为 3 的规范正交组,由 6.28 可知这个规范正交组是 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 的规范正交基。
现在我们可以回答规范正交基的存在性问题了.

6.34 规范正交基的存在性

每个有限维内积空间都有规范正交基。
证明 设 V V VVV 是有限维的, 取 V V VVV 的一个基, 对它应用格拉姆-施密特过程6.31, 则得到一个长度为 dim V dim V dim V\operatorname{dim} VdimV 的规范正交组. 由 6.28 可知这个规范正交组是 V V VVV 的规范正交基.
有时我们必须知道,不仅规范正交基是存在的,而且任何规范正交组都可以扩充成规范正交基. 在下面的推论中, 格拉姆-施密特过程表明这种扩充总是可以做到的。

6.35 规范正交组扩充为规范正交基

V V VVV 是有限维的. 则 V V VVV 中每个规范正交向量组都可以扩充成 V V VVV 的规范正交基.
证明 设 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em V V VVV 中的规范正交组,则 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 是线性无关的(由于 6.26),所以可扩充成 V V VVV 的基 e 1 , , e m , v 1 , , v n e 1 , , e m , v 1 , , v n e_(1),dots,e_(m),v_(1),dots,v_(n)e_{1}, \ldots, e_{m}, v_{1}, \ldots, v_{n}e1,,em,v1,,vn (见 2.33)。现在对 e 1 , , e m , v 1 , , v n e 1 , , e m , v 1 , , v n e_(1),dots,e_(m),v_(1),dots,v_(n)e_{1}, \ldots, e_{m}, v_{1}, \ldots, v_{n}e1,,em,v1,,vn应用格拉姆-施密特过程6.31得到规范正交组

6.36

e 1 , , e m , f 1 , , f n e 1 , , e m , f 1 , , f n e_(1),dots,e_(m),f_(1),dots,f_(n)e_{1}, \ldots, e_{m}, f_{1}, \ldots, f_{n}e1,,em,f1,,fn
这里格拉姆-施密特过程的公式保持前 m m mmm 个向量不变, 因为它们已经是规范正交的.由 6.28 可知上面的这个组是 V V VVV 的规范正交基.
回想一下, 如果一个矩阵对角线下方的所有元素都等于 0 , 则称这个矩阵是上三角的. 也就是说,一个上三角矩阵形如
( 0 )                     0           ([**,,**],[,ddots,],[0,,**])\left(\begin{array}{lll} * & & * \\ & \ddots & \\ 0 & & * \end{array}\right)(0)
其中 0 表示对角线下方的所有元素都等于 0 , 星号表示对角线及其上方的元素.
在上一章我们证明了,如果 V V VVV 是有限维的复向量空间,则对 V V VVV 上的每个算子都存在一个基使得该算子关于这个基的矩阵是上三角的(参见 5.27)。既然现在讨论的是内积空间,我们想知道是否存在规范正交基使得算子关于这个基有上三角矩阵。
下面的命题表明,假设存在一个基使 T T TTT 关于这个基具有上三角矩阵,则存在一个规范正交基具有同样的性质。这个命题在实向量空间和复向量空间上都成立(尽管在实向量空间上,那个假设只对某些算子成立)。

6.37 关于规范正交基的上三角矩阵

T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 如果 T T TTT 关于 V V VVV 的某个基具有上三角矩阵,那么 T T TTT 关于 V V VVV 的某个规范正交基也具有上三角矩阵。
证明 设 T T TTT 关于 V V VVV 的基 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 具有上三角矩阵,则对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n 均有 span ( v 1 , , v j ) span v 1 , , v j span(v_(1),dots,v_(j))\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(v1,,vj) T T TTT 下不变(参见 5.26)。
v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn 应用格拉姆-施密特过程,得到 V V VVV 的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 。因为对每个 j j jjj 都有
span ( e 1 , , e j ) = span ( v 1 , , v j ) span e 1 , , e j = span v 1 , , v j span(e_(1),dots,e_(j))=span(v_(1),dots,v_(j))\operatorname{span}\left(e_{1}, \ldots, e_{j}\right)=\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)span(e1,,ej)=span(v1,,vj)
(参见 6.31),所以对每个 j = 1 , , n j = 1 , , n j=1,dots,nj=1, \ldots, nj=1,,n 均有 span ( e 1 , , e j ) span e 1 , , e j span(e_(1),dots,e_(j))\operatorname{span}\left(e_{1}, \ldots, e_{j}\right)span(e1,,ej) T T TTT 下不变。因此,由 5.26 可知, T T TTT 关于规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 具有上三角矩阵。
下面的定理是上述结果的重要应用。
1909 年德国数学家逸斋 • 舒尔 (1875-1941)发表了下述定理的第一个证明。

6.38 舒尔定理

V V VVV 是有限维的复向量空间且 T L ( V ) T L ( V ) T inL(V)T \in \mathcal{L}(V)TL(V). 则 T T TTT 关于 V V VVV 的某个规范正交基具有上三角矩阵。
证明 回顾一下 T T TTT 关于 V V VVV 的某个基具有上三角矩阵(见 5.27)。然后应用6.37.

内积空间上的线性泛函

由于映到标量域 F F F\mathbf{F}F 的线性映射起着特殊作用,我们在 3.F 节给它们起了一个特别的名字。由于你可能跳过 3.F 节,下面重复一下这个定义。

6.39 定义 线性泛函(linear functional)

V V VVV 上的线性泛函是从 V V VVV F F F\mathbf{F}F 的线性映射。 也就是说,线性泛函是 L ( V , F ) L ( V , F ) L(V,F)\mathcal{L}(V, \mathbf{F})L(V,F) 中的元素。
6.40 例 如下定义的函数 φ : F 3 F φ : F 3 F varphi:F^(3)rarrF\varphi: \mathbf{F}^{3} \rightarrow \mathbf{F}φ:F3F
φ ( z 1 , z 2 , z 3 ) = 2 z 1 5 z 2 + z 3 φ z 1 , z 2 , z 3 = 2 z 1 5 z 2 + z 3 varphi(z_(1),z_(2),z_(3))=2z_(1)-5z_(2)+z_(3)\varphi\left(z_{1}, z_{2}, z_{3}\right)=2 z_{1}-5 z_{2}+z_{3}φ(z1,z2,z3)=2z15z2+z3
F 3 F 3 F^(3)\mathbf{F}^{3}F3 上的线性泛函. 我们可以将这个线性泛函写成如下形式:对每个 z F 3 z F 3 z inF^(3)z \in \mathbf{F}^{3}zF3
φ ( z ) = z , u φ ( z ) = z , u varphi(z)=(:z,u:)\varphi(z)=\langle z, u\rangleφ(z)=z,u
其中 u = ( 2 , 5 , 1 ) u = ( 2 , 5 , 1 ) u=(2,-5,1)u=(2,-5,1)u=(2,5,1).
6.41 例 如下定义的函数 φ : P 2 ( R ) R φ : P 2 ( R ) R varphi:P_(2)(R)rarrR\varphi: \mathcal{P}_{2}(\mathbf{R}) \rightarrow \mathbf{R}φ:P2(R)R
φ ( p ) = 1 1 p ( t ) ( cos ( π t ) ) d t φ ( p ) = 1 1 p ( t ) ( cos ( π t ) ) d t varphi(p)=int_(-1)^(1)p(t)(cos(pi t))dt\varphi(p)=\int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} tφ(p)=11p(t)(cos(πt))dt
P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 上的线性泛函(这里 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 上的内积是 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的两个函数相乘后做定积分,见 6.33)。下面的事实并不显然:存在 u P 2 ( R ) u P 2 ( R ) u inP_(2)(R)u \in \mathcal{P}_{2}(\mathbf{R})uP2(R) 使得对任意 p P 2 ( R ) p P 2 ( R ) p inP_(2)(R)p \in \mathcal{P}_{2}(\mathbf{R})pP2(R) 均有
φ ( p ) = p , u φ ( p ) = p , u varphi(p)=(:p,u:)\varphi(p)=\langle p, u\rangleφ(p)=p,u
(我们不能取 u ( t ) = cos ( π t ) u ( t ) = cos ( π t ) u(t)=cos(pi t)u(t)=\cos (\pi t)u(t)=cos(πt) ,因为它不是 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 中的元素.)
如果 u V u V u in Vu \in VuV ,那么把 v v vvv 映成 v , u v , u (:v,u:)\langle v, u\ranglev,u 的映射是 V V VVV 上的线性泛函。下述定理表明, V V VVV 上的每个线性泛函都是这种形式的。上面的例 6.41 显示了下述定理的威力,因为对那个例子中的线性泛函, u u uuu 的取法并不明显。

6.42 里斯表示定理

V V VVV 是有限维的且 φ φ varphi\varphiφ V V VVV 上的线性泛函,则存在唯一的向量 u V u V u in Vu \in VuV 使得对每个 v V v V v in Vv \in VvV 均有 φ ( v ) = v , u φ ( v ) = v , u varphi(v)=(:v,u:)\varphi(v)=\langle v, u\rangleφ(v)=v,u
证明 先证明存在向量 u V u V u in Vu \in VuV 使得对每个 v V v V v in Vv \in VvV 均有 φ ( v ) = v , u φ ( v ) = v , u varphi(v)=(:v,u:)\varphi(v)=\langle v, u\rangleφ(v)=v,u 。设 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV的规范正交基,则对每个 v V v V v in Vv \in VvV 均有
φ ( v ) = φ ( v , e 1 e 1 + + v , e n e n ) = v , e 1 φ ( e 1 ) + + v , e n φ ( e n ) = v , φ ( e 1 ) e 1 + + φ ( e n ) e n φ ( v ) = φ v , e 1 e 1 + + v , e n e n = v , e 1 φ e 1 + + v , e n φ e n = v , φ e 1 ¯ e 1 + + φ e n ¯ e n {:[varphi(v)=varphi((:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n))],[=(:v,e_(1):)varphi(e_(1))+cdots+(:v,e_(n):)varphi(e_(n))],[=(:v, bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n):)]:}\begin{aligned} \varphi(v) & =\varphi\left(\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n}\right) \\ & =\left\langle v, e_{1}\right\rangle \varphi\left(e_{1}\right)+\cdots+\left\langle v, e_{n}\right\rangle \varphi\left(e_{n}\right) \\ & =\left\langle v, \overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n}\right\rangle \end{aligned}φ(v)=φ(v,e1e1++v,enen)=v,e1φ(e1)++v,enφ(en)=v,φ(e1)e1++φ(en)en
其中第一个等式由 6.30 得到. 因此, 取
6.43 u = φ ( e 1 ) e 1 + + φ ( e n ) e n 6.43 u = φ e 1 ¯ e 1 + + φ e n ¯ e n 6.43quad u= bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n)6.43 \quad u=\overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n}6.43u=φ(e1)e1++φ(en)en
则对每个 v V v V v in Vv \in VvV 都有 φ ( v ) = v , u φ ( v ) = v , u varphi(v)=(:v,u:)\varphi(v)=\langle v, u\rangleφ(v)=v,u.
现在来证明只有一个向量 u V u V u in Vu \in VuV 满足条件. 设 u 1 , u 2 V u 1 , u 2 V u_(1),u_(2)in Vu_{1}, u_{2} \in Vu1,u2V 使得对每个 v V v V v in Vv \in VvV 均有
φ ( v ) = v , u 1 = v , u 2 . φ ( v ) = v , u 1 = v , u 2 . varphi(v)=(:v,u_(1):)=(:v,u_(2):).\varphi(v)=\left\langle v, u_{1}\right\rangle=\left\langle v, u_{2}\right\rangle .φ(v)=v,u1=v,u2.
则对每个 v V v V v in Vv \in VvV 均有
0 = v , u 1 v , u 2 = v , u 1 u 2 . 0 = v , u 1 v , u 2 = v , u 1 u 2 . 0=(:v,u_(1):)-(:v,u_(2):)=(:v,u_(1)-u_(2):).0=\left\langle v, u_{1}\right\rangle-\left\langle v, u_{2}\right\rangle=\left\langle v, u_{1}-u_{2}\right\rangle .0=v,u1v,u2=v,u1u2.
v = u 1 u 2 v = u 1 u 2 v=u_(1)-u_(2)v=u_{1}-u_{2}v=u1u2 可得 u 1 u 2 = 0 u 1 u 2 = 0 u_(1)-u_(2)=0u_{1}-u_{2}=0u1u2=0, 即 u 1 = u 2 u 1 = u 2 u_(1)=u_(2)u_{1}=u_{2}u1=u2, 这就完成了唯一性的证明.
6.44 例 求 u P 2 ( R ) u P 2 ( R ) u inP_(2)(R)u \in \mathcal{P}_{2}(\mathbf{R})uP2(R) 使得对每个 p P 2 ( R ) p P 2 ( R ) p inP_(2)(R)p \in \mathcal{P}_{2}(\mathbf{R})pP2(R) 均有
1 1 p ( t ) ( cos ( π t ) ) d t = 1 1 p ( t ) u ( t ) d t . 1 1 p ( t ) ( cos ( π t ) ) d t = 1 1 p ( t ) u ( t ) d t . int_(-1)^(1)p(t)(cos(pi t))dt=int_(-1)^(1)p(t)u(t)dt.\int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} t=\int_{-1}^{1} p(t) u(t) \mathrm{d} t .11p(t)(cos(πt))dt=11p(t)u(t)dt.
解 设 φ ( p ) = 1 1 p ( t ) ( cos ( π t ) ) d t φ ( p ) = 1 1 p ( t ) ( cos ( π t ) ) d t varphi(p)=int_(-1)^(1)p(t)(cos(pi t))dt\varphi(p)=\int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} tφ(p)=11p(t)(cos(πt))dt. 应用上面证明中的公式 6.43 , 并使用例 6.33 中的规范正交基,可得
u ( x ) = ( 1 1 1 2 ( cos ( π t ) ) d t ) 1 2 + ( 1 1 3 2 t ( cos ( π t ) ) d t ) 3 2 x + ( 1 1 45 8 ( t 2 1 3 ) ( cos ( π t ) ) d t ) 45 8 ( x 2 1 3 ) u ( x ) = 1 1 1 2 ( cos ( π t ) ) d t 1 2 + 1 1 3 2 t ( cos ( π t ) ) d t 3 2 x + 1 1 45 8 t 2 1 3 ( cos ( π t ) ) d t 45 8 x 2 1 3 {:[u(x)=(int_(-1)^(1)sqrt((1)/(2))(cos(pi t))dt)sqrt((1)/(2))+(int_(-1)^(1)sqrt((3)/(2))t(cos(pi t))dt)sqrt((3)/(2))x],[+(int_(-1)^(1)sqrt((45)/(8))(t^(2)-(1)/(3))(cos(pi t))dt)sqrt((45)/(8))(x^(2)-(1)/(3))]:}\begin{aligned} u(x)= & \left(\int_{-1}^{1} \sqrt{\frac{1}{2}}(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{1}{2}}+\left(\int_{-1}^{1} \sqrt{\frac{3}{2}} t(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{3}{2}} x \\ & +\left(\int_{-1}^{1} \sqrt{\frac{45}{8}}\left(t^{2}-\frac{1}{3}\right)(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right) \end{aligned}u(x)=(1112(cos(πt))dt)12+(1132t(cos(πt))dt)32x+(11458(t213)(cos(πt))dt)458(x213)
计算可得
u ( x ) = 45 2 π 2 ( x 2 1 3 ) u ( x ) = 45 2 π 2 x 2 1 3 u(x)=-(45)/(2pi^(2))(x^(2)-(1)/(3))u(x)=-\frac{45}{2 \pi^{2}}\left(x^{2}-\frac{1}{3}\right)u(x)=452π2(x213)
V V VVV 是有限维的且 φ φ varphi\varphiφ V V VVV 上的线性泛函. 则 6.43 给出了求向量 u u uuu 的公式使其满足对所有 v V v V v in Vv \in VvV 均有 φ ( v ) = v , u φ ( v ) = v , u varphi(v)=(:v,u:)\varphi(v)=\langle v, u\rangleφ(v)=v,u. 具体来说, 就是
u = φ ( e 1 ) e 1 + + φ ( e n ) e n u = φ e 1 ¯ e 1 + + φ e n ¯ e n u= bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n)u=\overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n}u=φ(e1)e1++φ(en)en
看起来等式右端依赖于规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en φ φ varphi\varphiφ. 然而,定理6.42告诉我们 u u uuu 是由 φ φ varphi\varphiφ 唯一确定的。所以等式右端与 V V VVV 的规范正交基 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en 的选取无关.

习题 6.B

1 (a) 设 θ R θ R theta inR\theta \in \mathbf{R}θR. 证明
( cos θ , sin θ ) , ( sin θ , cos θ ) ( cos θ , sin θ ) , ( sin θ , cos θ ) ( cos θ , sin θ ) , ( sin θ , cos θ )  和  ( cos θ , sin θ ) , ( sin θ , cos θ ) (cos theta,sin theta),(-sin theta,cos theta)quad" 和 "quad(cos theta,sin theta),(sin theta,-cos theta)(\cos \theta, \sin \theta),(-\sin \theta, \cos \theta) \quad \text { 和 } \quad(\cos \theta, \sin \theta),(\sin \theta,-\cos \theta)(cosθ,sinθ),(sinθ,cosθ) 和 (cosθ,sinθ),(sinθ,cosθ)
都是 R 2 R 2 R^(2)\mathbf{R}^{2}R2 的规范正交基.
(b) 证明 R 2 R 2 R^(2)\mathbf{R}^{2}R2 的规范正交基必形如(a)中的二者之一。
2 设 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em V V VVV 的规范正交组. 设 v V v V v in Vv \in VvV. 证明
v 2 = | v , e 1 | 2 + + | v , e m | 2 v 2 = v , e 1 2 + + v , e m 2 ||v||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(m):)|^(2)\|v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{m}\right\rangle\right|^{2}v2=|v,e1|2++|v,em|2
当且仅当 v span ( e 1 , , e m ) v span e 1 , , e m v in span(e_(1),dots,e_(m))v \in \operatorname{span}\left(e_{1}, \ldots, e_{m}\right)vspan(e1,,em).
3 设 T L ( R 3 ) T L R 3 T inL(R^(3))T \in \mathcal{L}\left(\mathbf{R}^{3}\right)TL(R3) 关于基 ( 1 , 0 , 0 ) , ( 1 , 1 , 1 ) , ( 1 , 1 , 2 ) ( 1 , 0 , 0 ) , ( 1 , 1 , 1 ) , ( 1 , 1 , 2 ) (1,0,0),(1,1,1),(1,1,2)(1,0,0),(1,1,1),(1,1,2)(1,0,0),(1,1,1),(1,1,2) 具有上三角矩阵。求 R 3 R 3 R^(3)\mathbf{R}^{3}R3 的一个规范正交基(采用 R 3 R 3 R^(3)\mathbf{R}^{3}R3 上通常的内积)使得 T T TTT 关于这个基具有上三角矩阵。
4 设 n n nnn 是正整数. 证明
1 2 π , cos x π , cos 2 x π , , cos n x π , sin x π , sin 2 x π , , sin n x π 1 2 π , cos x π , cos 2 x π , , cos n x π , sin x π , sin 2 x π , , sin n x π (1)/(sqrt(2pi)),(cos x)/(sqrtpi),(cos 2x)/(sqrtpi),dots,(cos nx)/(sqrtpi),(sin x)/(sqrtpi),(sin 2x)/(sqrtpi),dots,(sin nx)/(sqrtpi)\frac{1}{\sqrt{2 \pi}}, \frac{\cos x}{\sqrt{\pi}}, \frac{\cos 2 x}{\sqrt{\pi}}, \ldots, \frac{\cos n x}{\sqrt{\pi}}, \frac{\sin x}{\sqrt{\pi}}, \frac{\sin 2 x}{\sqrt{\pi}}, \ldots, \frac{\sin n x}{\sqrt{\pi}}12π,cosxπ,cos2xπ,,cosnxπ,sinxπ,sin2xπ,,sinnxπ
C [ π , π ] C [ π , π ] C[-pi,pi]C[-\pi, \pi]C[π,π] 的规范正交组,这里 C [ π , π ] C [ π , π ] C[-pi,pi]C[-\pi, \pi]C[π,π] [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上的实值连续函数构成的向量空间,其上的内积为
f , g = π π f ( x ) g ( x ) d x f , g = π π f ( x ) g ( x ) d x (:f,g:)=int_(-pi)^(pi)f(x)g(x)dx\langle f, g\rangle=\int_{-\pi}^{\pi} f(x) g(x) \mathrm{d} xf,g=ππf(x)g(x)dx
上述规范正交组经常用来建立诸如潮洺等周期现象的数学模型.
5 在 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 上考虑内积
p , q = 0 1 p ( x ) q ( x ) d x p , q = 0 1 p ( x ) q ( x ) d x (:p,q:)=int_(0)^(1)p(x)q(x)dx\langle p, q\rangle=\int_{0}^{1} p(x) q(x) \mathrm{d} xp,q=01p(x)q(x)dx
对基 1 , x , x 2 1 , x , x 2 1,x,x^(2)1, x, x^{2}1,x,x2 应用格拉姆-施密特过程求 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 的一个规范正交基.
6 求 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 的一个规范正交基(采用习题 5 的内积)使得 P 2 ( R ) P 2 ( R ) P_(2)(R)\mathcal{P}_{2}(\mathbf{R})P2(R) 上的微分算子(即把 p p ppp 映成 p p p^(')p^{\prime}p 的算子)关于这个基具有上三角矩阵。
7 求多项式 q P 2 ( R ) q P 2 ( R ) q inP_(2)(R)q \in \mathcal{P}_{2}(\mathbf{R})qP2(R) 使得对每个 p P 2 ( R ) p P 2 ( R ) p inP_(2)(R)p \in \mathcal{P}_{2}(\mathbf{R})pP2(R) 均有
p ( 1 2 ) = 0 1 p ( x ) q ( x ) d x p 1 2 = 0 1 p ( x ) q ( x ) d x p((1)/(2))=int_(0)^(1)p(x)q(x)dxp\left(\frac{1}{2}\right)=\int_{0}^{1} p(x) q(x) \mathrm{d} xp(12)=01p(x)q(x)dx
8 求多项式 q P 2 ( R ) q P 2 ( R ) q inP_(2)(R)q \in \mathcal{P}_{2}(\mathbf{R})qP2(R) 使得对每个 p P 2 ( R ) p P 2 ( R ) p inP_(2)(R)p \in \mathcal{P}_{2}(\mathbf{R})pP2(R) 均有
0 1 p ( x ) ( cos π x ) d x = 0 1 p ( x ) q ( x ) d x . 0 1 p ( x ) ( cos π x ) d x = 0 1 p ( x ) q ( x ) d x . int_(0)^(1)p(x)(cos pi x)dx=int_(0)^(1)p(x)q(x)dx.\int_{0}^{1} p(x)(\cos \pi x) \mathrm{d} x=\int_{0}^{1} p(x) q(x) \mathrm{d} x .01p(x)(cosπx)dx=01p(x)q(x)dx.
9 对不是线性无关的向量组应用格拉姆-施密特过程结果会怎样?
10 设 V V VVV 是实内积空间且 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm V V VVV 中的线性无关向量组. 证明 V V VVV 中恰好有 2 m 2 m 2^(m)2^{m}2m 个规范正交组 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 使得对所有 j { 1 , , m } j { 1 , , m } j in{1,dots,m}j \in\{1, \ldots, m\}j{1,,m} 均有 span ( v 1 , , v j ) = span v 1 , , v j = span(v_(1),dots,v_(j))=\operatorname{span}\left(v_{1}, \ldots, v_{j}\right)=span(v1,,vj)= span ( e 1 , , e j ) span e 1 , , e j span(e_(1),dots,e_(j))\operatorname{span}\left(e_{1}, \ldots, e_{j}\right)span(e1,,ej).
11 设 , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1 , 2 , 2 (:*,*:)_(2)\langle\cdot, \cdot\rangle_{2},2 都是 V V VVV 上的内积使得 v , w 1 = 0 v , w 1 = 0 (:v,w:)_(1)=0\langle v, w\rangle_{1}=0v,w1=0 当且仅当 v , w 2 = 0 v , w 2 = 0 (:v,w:)_(2)=0\langle v, w\rangle_{2}=0v,w2=0. 证明存在正数 c c ccc 使得对任意 v , w V v , w V v,w in Vv, w \in Vv,wV 均有 v , w 1 = c v , w 2 v , w 1 = c v , w 2 (:v,w:)_(1)=c(:v,w:)_(2)\langle v, w\rangle_{1}=c\langle v, w\rangle_{2}v,w1=cv,w2.
12 设 V V VVV 是有限维的, , 1 , 1 (:*,*:)_(1)\langle\cdot, \cdot\rangle_{1},1 , 2 , 2 (:*,*:)_(2)\langle\cdot, \cdot\rangle_{2},2 都是 V V VVV 上的内积,对应的范数是 1 1 ||*||_(1)\|\cdot\|_{1}1 2 2 ||*||_(2)\|\cdot\|_{2}2.证明存在正数 c c ccc 使得对每个 v V v V v in Vv \in VvV 均有 v 1 c v 2 v 1 c v 2 ||v||_(1) <= c||v||_(2)\|v\|_{1} \leq c\|v\|_{2}v1cv2.
13 设 v 1 , , v m v 1 , , v m v_(1),dots,v_(m)v_{1}, \ldots, v_{m}v1,,vm V V VVV 中的线性无关向量组. 证明存在 w V w V w in Vw \in VwV 使得对所有 j j j inj \inj { 1 , , m } { 1 , , m } {1,dots,m}\{1, \ldots, m\}{1,,m} 均有 w , v j > 0 w , v j > 0 (:w,v_(j):) > 0\left\langle w, v_{j}\right\rangle>0w,vj>0
14 设 e 1 , , e n e 1 , , e n e_(1),dots,e_(n)e_{1}, \ldots, e_{n}e1,,en V V VVV 的规范正交基, 并设 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 中的向量使得对每个 j j jjj 均有
e j v j < 1 n e j v j < 1 n ||e_(j)-v_(j)|| < (1)/(sqrtn)\left\|e_{j}-v_{j}\right\|<\frac{1}{\sqrt{n}}ejvj<1n
证明 v 1 , , v n v 1 , , v n v_(1),dots,v_(n)v_{1}, \ldots, v_{n}v1,,vn V V VVV 的基.
15 设 C R ( [ 1 , 1 ] ) C R ( [ 1 , 1 ] ) C_(R)([-1,1])C_{\mathbf{R}}([-1,1])CR([1,1]) 是区间 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上的实值连续函数构成的向量空间, 其上的内积为:对于 f , g C R ( [ 1 , 1 ] ) f , g C R ( [ 1 , 1 ] ) f,g inC_(R)([-1,1])f, g \in C_{\mathbf{R}}([-1,1])f,gCR([1,1])
f , g = 1 1 f ( x ) g ( x ) d x f , g = 1 1 f ( x ) g ( x ) d x (:f,g:)=int_(-1)^(1)f(x)g(x)dx\langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} xf,g=11f(x)g(x)dx
φ φ varphi\varphiφ C R ( [ 1 , 1 ] ) C R ( [ 1 , 1 ] ) C_(R)([-1,1])C_{\mathbf{R}}([-1,1])CR([1,1]) 上由 φ ( f ) = f ( 0 ) φ ( f ) = f ( 0 ) varphi(f)=f(0)\varphi(f)=f(0)φ(f)=f(0) 定义的线性泛函. 证明:不存在 g g g ing \ing C R ( [ 1 , 1 ] ) C R ( [ 1 , 1 ] ) C_(R)([-1,1])C_{\mathbf{R}}([-1,1])CR([1,1]) 能使得对每个 f C R ( [ 1 , 1 ] ) f C R ( [ 1 , 1 ] ) f inC_(R)([-1,1])f \in C_{\mathbf{R}}([-1,1])fCR([1,1]) 均有 φ ( f ) = f , g φ ( f ) = f , g varphi(f)=(:f,g:)\varphi(f)=\langle f, g\rangleφ(f)=f,g
本题表明如果不对 V V VVV φ φ varphi\varphiφ 附加额外条件,那么里斯表示定理 6.42 对无限维限量空间不成立。
16 设 F = C , V F = C , V F=C,V\mathbf{F}=\mathbf{C}, VF=C,V 是有限维的, T L ( V ) , T T L ( V ) , T T inL(V),TT \in \mathcal{L}(V), TTL(V),T 的所有本征值的绝对值都小于 1 , ϵ > 0 ϵ > 0 epsilon > 0\epsilon>0ϵ>0. 证明存在正整数 m m mmm 使得对每个 v V v V v in Vv \in VvV 均有 T m v ϵ v T m v ϵ v ||T^(m)v|| <= epsilon||v||\left\|T^{m} v\right\| \leq \epsilon\|v\|Tmvϵv.
17 对于 u V u V u in Vu \in VuV Φ u Φ u Phi u\Phi uΦu 表示 V V VVV 上如下定义的线性泛函:对 v V v V v in Vv \in VvV
( Φ u ) ( v ) = v , u . ( Φ u ) ( v ) = v , u . (Phi u)(v)=(:v,u:).(\Phi u)(v)=\langle v, u\rangle .(Φu)(v)=v,u.
(a)证明:若 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R ,则 Φ Φ Phi\PhiΦ 是从 V V VVV V V V^(')V^{\prime}V 的线性映射。(回想一下,在 3.F节中我们定义 V = L ( V , F ) , V V = L ( V , F ) , V V^(')=L(V,F),V^(')V^{\prime}=\mathcal{L}(V, \mathbf{F}), V^{\prime}V=L(V,F),V 称为 V V VVV 的对偶空间。)
(b) 证明: 若 F = C F = C F=C\mathbf{F}=\mathbf{C}F=C V { 0 } V { 0 } V!={0}V \neq\{0\}V{0} ,则 Φ Φ Phi\PhiΦ 不是线性映射.
(c) 证明 Φ Φ Phi\PhiΦ 是单的.
(d) 设 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R V V VVV 是有限维的. 利用 (a) 和 (c) 以及维数计算(但不用 6.42)来证明 Φ Φ Phi\PhiΦ 是从 V V VVV V V V^(')V^{\prime}V 的同构。
(d)给出了里斯表示定理6.42 在 F = R F = R F=R\mathbf{F}=\mathbf{R}F=R 情形的另一个证明,也给出了有限维实内积空间到其对偶空间的一个自然同构("自然"的意思是与基的选取无关)。

6.C 正交补与极小化问题

正交补

6.45 定义 正交补 (orthogonal complement), U U U^(_|_)U^{\perp}U
U U UUU V V VVV 的子集,则 U U UUU 的正交补(记作 U U U^(_|_)U^{\perp}U )是由 V V VVV 中与 U U UUU 的每个向量都正交的那些向量组成的集合:
U = { v V : 对每个 u U 均有 v , u = 0 } . U = { v V :  对每个  u U  均有  v , u = 0 } U^(_|_)={v in V:" 对每个 "u in U" 均有 "(:v,u:)=0}". "U^{\perp}=\{v \in V: \text { 对每个 } u \in U \text { 均有 }\langle v, u\rangle=0\} \text {. }U={vV: 对每个 uU 均有 v,u=0}
例如,若 U U UUU R 3 R 3 R^(3)\mathbf{R}^{3}R3 中的直线,则 U U U^(_|_)U^{\perp}U 是垂直于 U U UUU 且包含原点的平面. 若 U U UUU R 3 R 3 R^(3)\mathbf{R}^{3}R3中的平面,则 U U U^(_|_)U^{\perp}U 是垂直于 U U UUU 且包含原点的直线。

6.46 正交补的基本性质

(a) 若 U U UUU V V VVV 的子集,则 U U U^(_|_)U^{\perp}U V V VVV 的子空间.
(b) { 0 } = V { 0 } = V {0}^(_|_)=V\{0\}^{\perp}=V{0}=V.
(c) V = { 0 } V = { 0 } V^(_|_)={0}V^{\perp}=\{0\}V={0}.
(d) 若 U U UUU V V VVV 的子集,则 U U { 0 } U U { 0 } U nnU^(_|_)sub{0}U \cap U^{\perp} \subset\{0\}UU{0}.
(e) 若 U U UUU W W WWW 均为 V V VVV 的子集且 U W U W U sub WU \subset WUW ,则 W U W U W^(_|_)subU^(_|_)W^{\perp} \subset U^{\perp}WU

证明

(a) 设 U U UUU V V VVV 的子集. 则对每个 u U u U u in Uu \in UuU 均有 0 , u = 0 0 , u = 0 (:0,u:)=0\langle 0, u\rangle=00,u=0, 于是 0 U 0 U 0inU^(_|_)0 \in U^{\perp}0U.设 v , w U v , w U v,w inU^(_|_)v, w \in U^{\perp}v,wU. 若 u U u U u in Uu \in UuU, 则
v + w , u = v , u + w , u = 0 + 0 = 0 . v + w , u = v , u + w , u = 0 + 0 = 0 . (:v+w,u:)=(:v,u:)+(:w,u:)=0+0=0.\langle v+w, u\rangle=\langle v, u\rangle+\langle w, u\rangle=0+0=0 .v+w,u=v,u+w,u=0+0=0.
于是 v + w U v + w U v+w inU^(_|_)v+w \in U^{\perp}v+wU. 也就是说 U U U^(_|_)U^{\perp}U 在加法下是封闭的.
类似地, 设 λ F λ F lambda inF\lambda \in \mathbf{F}λF v U v U v inU^(_|_)v \in U^{\perp}vU 。若 u U u U u in Uu \in UuU, 则
λ v , u = λ v , u = λ 0 = 0 λ v , u = λ v , u = λ 0 = 0 (:lambda v,u:)=lambda(:v,u:)=lambda*0=0\langle\lambda v, u\rangle=\lambda\langle v, u\rangle=\lambda \cdot 0=0λv,u=λv,u=λ0=0
于是 λ v U λ v U lambda v inU^(_|_)\lambda v \in U^{\perp}λvU. 也就是说 U U U^(_|_)U^{\perp}U 在标量乘法下是封闭的. 因此 U U U^(_|_)U^{\perp}U V V VVV 的子空间.
(b) 假定 v V v V v in Vv \in VvV. 则 v , 0 = 0 v , 0 = 0 (:v,0:)=0\langle v, 0\rangle=0v,0=0, 这表明 v { 0 } v { 0 } v in{0}^(_|_)v \in\{0\}^{\perp}v{0}. 于是 { 0 } = V { 0 } = V {0}^(_|_)=V\{0\}^{\perp}=V{0}=V.
(c) 设 v V v V v inV^(_|_)v \in V^{\perp}vV. 则 v , v = 0 v , v = 0 (:v,v:)=0\langle v, v\rangle=0v,v=0 ,这表明 v = 0 v = 0 v=0v=0v=0 。于是 V = { 0 } V = { 0 } V^(_|_)={0}V^{\perp}=\{0\}V={0}.
(d) 设 U U UUU V V VVV 的子集且 v U U v U U v in U nnU^(_|_)v \in U \cap U^{\perp}vUU. 则 v , v = 0 v , v = 0 (:v,v:)=0\langle v, v\rangle=0v,v=0, 这表明 v = 0 v = 0 v=0v=0v=0. 于是 U U { 0 } U U { 0 } U nnU^(_|_)sub{0}U \cap U^{\perp} \subset\{0\}UU{0}.
(e) 设 U U UUU W W WWW 均为 V V VVV 的子集且 U W U W U sub WU \subset WUW. 设 v W v W v inW^(_|_)v \in W^{\perp}vW. 则对每个 u W u W u in Wu \in WuW 均有 v , u = 0 v , u = 0 (:v,u:)=0\langle v, u\rangle=0v,u=0, 这表明对每个 u U u U u in Uu \in UuU 均有 v , u = 0 v , u = 0 (:v,u:)=0\langle v, u\rangle=0v,u=0. 所以 v U v U v inU^(_|_)v \in U^{\perp}vU. 因此 W U W U W^(_|_)subU^(_|_)W^{\perp} \subset U^{\perp}WU.
回想一下, 若 U U UUU W W WWW 均为 V V VVV 的子空间, 并且 V V VVV 中每个元素都可以唯一地写成 U U UUU 中的一个向量与 W W WWW 中的一个向量的和,则 V V VVV U U UUU W W WWW 的直和(记为 V = U W V = U W V=U o+WV=U \oplus WV=UW )(见1.40)。
以下定理表明, V V VVV 的每个有限维子空间都导致了 V V VVV 的一个自然的直和分解.

6.47 子空间与其正交补的直和

U U UUU V V VVV 的有限维子空间,则 V = U U V = U U V=U o+U^(_|_)V=U \oplus U^{\perp}V=UU.
证明 首先证明
6.48
V = U + U V = U + U V=U+U^(_|_)V=U+U^{\perp}V=U+U
为此,设 v V v V v in Vv \in VvV ,并设 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em U U UUU 的规范正交基. 显然
6.49
v = v , e 1 e 1 + + v , e m e m u + v v , e 1 e 1 v , e m e m w v = v , e 1 e 1 + + v , e m e m u + v v , e 1 e 1 v , e m e m w v=ubrace((:v,e_(1):)e_(1)+cdots+(:v,e_(m):)e_(m)ubrace)_(u)+ubrace(v-(:v,e_(1):)e_(1)-cdots-(:v,e_(m):)e_(m)ubrace)_(w)v=\underbrace{\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{m}\right\rangle e_{m}}_{u}+\underbrace{v-\left\langle v, e_{1}\right\rangle e_{1}-\cdots-\left\langle v, e_{m}\right\rangle e_{m}}_{w}v=v,e1e1++v,ememu+vv,e1e1v,ememw
u u uuu w w www 如上式. 很明显 u U u U u in Uu \in UuU. 因为 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 是一个规范正交组, 所以对每个 j = 1 , , m j = 1 , , m j=1,dots,mj=1, \ldots, mj=1,,m 均有
w , e j = v , e j v , e j = 0 w , e j = v , e j v , e j = 0 (:w,e_(j):)=(:v,e_(j):)-(:v,e_(j):)=0\left\langle w, e_{j}\right\rangle=\left\langle v, e_{j}\right\rangle-\left\langle v, e_{j}\right\rangle=0w,ej=v,ejv,ej=0
于是 w w www 正交于 span ( e 1 , , e m ) span e 1 , , e m span(e_(1),dots,e_(m))\operatorname{span}\left(e_{1}, \ldots, e_{m}\right)span(e1,,em) 中的每个向量. 也就是说 w U w U w inU^(_|_)w \in U^{\perp}wU 。于是 v = u + w v = u + w v=u+wv=u+wv=u+w,其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU ,这就证明了 6.48 。
由 6.46(d) 有 U U = { 0 } U U = { 0 } U nnU^(_|_)={0}U \cap U^{\perp}=\{0\}UU={0}. 再由 6.48 有 V = U U V = U U V=U o+U^(_|_)V=U \oplus U^{\perp}V=UU (见 1.45)。
现在可以看到如何利用 dim U dim U dim U\operatorname{dim} UdimU 来计算 dim U dim U dimU^(_|_)\operatorname{dim} U^{\perp}dimU.

6.50 正交补的维数

V V VVV 是有限维的且 U U UUU V V VVV 的子空间,则 dim U = dim V dim U dim U = dim V dim U dimU^(_|_)=dim V-dim U\operatorname{dim} U^{\perp}=\operatorname{dim} V-\operatorname{dim} UdimU=dimVdimU.
证明 由 6.47 和 3.78 立即可得 dim U dim U dimU^(_|_)\operatorname{dim} U^{\perp}dimU 的公式.
下面的命题是 6.47 的一个重要推论.

6.51 正交补的正交补

U U UUU V V VVV 的有限维子空间,则 U = ( U ) U = U U=(U^(_|_))^(_|_)U=\left(U^{\perp}\right)^{\perp}U=(U).
证明 首先证明
6.52
U ( U ) U U U sub(U^(_|_))^(_|_)U \subset\left(U^{\perp}\right)^{\perp}U(U)
为此, 设 u U u U u in Uu \in UuU. 则对每个 v U v U v inU^(_|_)v \in U^{\perp}vU 均有 u , v = 0 u , v = 0 (:u,v:)=0\langle u, v\rangle=0u,v=0 (由 U U U^(_|_)U^{\perp}U 的定义)。因为 u u uuu 正交于 U U U^(_|_)U^{\perp}U 中的每个向量, 所以 u ( U ) u U u in(U^(_|_))^(_|_)u \in\left(U^{\perp}\right)^{\perp}u(U), 这就证明了 6.52.
要证明另一个方向的包含关系,设 v ( U ) v U v in(U^(_|_))^(_|_)v \in\left(U^{\perp}\right)^{\perp}v(U) 。由 6.47 可得 v = u + w v = u + w v=u+wv=u+wv=u+w ,其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU 。从而 v u = w U v u = w U v-u=w inU^(_|_)v-u=w \in U^{\perp}vu=wU 。因为 v ( U ) v U v in(U^(_|_))^(_|_)v \in\left(U^{\perp}\right)^{\perp}v(U) u ( U ) u U u in(U^(_|_))^(_|_)u \in\left(U^{\perp}\right)^{\perp}u(U) (由于6.52),所以 v u ( U ) v u U v-u in(U^(_|_))^(_|_)v-u \in\left(U^{\perp}\right)^{\perp}vu(U) 。于是 v u U ( U ) v u U U v-u inU^(_|_)nn(U^(_|_))^(_|_)v-u \in U^{\perp} \cap\left(U^{\perp}\right)^{\perp}vuU(U), 这表明 ( v u ) ( v u ) (v-u)(v-u)(vu) 与自身正交, 从而 v u = 0 v u = 0 v-u=0v-u=0vu=0, 即 v = u v = u v=uv=uv=u, 于是 v U v U v in Uv \in UvU. 因此 ( U ) U U U (U^(_|_))^(_|_)sub U\left(U^{\perp}\right)^{\perp} \subset U(U)U, 再结合 6.52 就完成了证明.
现在我们对 V V VVV 的每个有限维子空间定义一个算子 P U P U P_(U)\mathcal{P}_{U}PU.

6.53 定义 正交投影(orthogonal projection), P U P U P_(U)P_{U}PU

U U UUU V V VVV 的有限维子空间。定义 V V VVV U U UUU 上的正交投影为如下算子 P U L ( V ) P U L ( V ) P_(U)inL(V)P_{U} \in \mathcal{L}(V)PUL(V) :对 v V v V v in Vv \in VvV, 将其写成 v = u + w v = u + w v=u+wv=u+wv=u+w, 其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU, 则 P U v = u P U v = u P_(U)v=uP_{U} v=uPUv=u.
6.47 中给出的直和分解 V = U U V = U U V=U o+U^(_|_)V=U \oplus U^{\perp}V=UU 表明每个 v V v V v in Vv \in VvV 均可唯一地写成 v = u + w v = u + w v=u+wv=u+wv=u+w,其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU 。于是 P U v P U v P_(U)vP_{U} vPUv 定义合理。
6.54 例 设 x V , x 0 x V , x 0 x in V,x!=0x \in V, x \neq 0xV,x0 U = span ( x ) U = span ( x ) U=span(x)U=\operatorname{span}(x)U=span(x). 证明对每个 v V v V v in Vv \in VvV 均有
P U v = v , x x 2 x P U v = v , x x 2 x P_(U)v=((:v,x:))/(||x||^(2))xP_{U} v=\frac{\langle v, x\rangle}{\|x\|^{2}} xPUv=v,xx2x
证明 设 v V v V v in Vv \in VvV. 则
v = v , x x 2 x + ( v v , x x 2 x ) v = v , x x 2 x + v v , x x 2 x v=((:v,x:))/(||x||^(2))x+(v-((:v,x:))/(||x||^(2))x)v=\frac{\langle v, x\rangle}{\|x\|^{2}} x+\left(v-\frac{\langle v, x\rangle}{\|x\|^{2}} x\right)v=v,xx2x+(vv,xx2x)
其中右端的第一项属于 span ( x ) span ( x ) span(x)\operatorname{span}(x)span(x) (从而属于 U U UUU ), 第二项正交于 x x xxx (从而属于 U U U^(_|_)U^{\perp}U )。因此 P U v P U v P_(U)vP_{U} vPUv 等于右端的第一项。

6.55 正交投影 P U P U P_(U)P_{U}PU 的性质

U U UUU V V VVV 的有限维子空间且 v V v V v in Vv \in VvV. 则
(a) P U L ( V ) P U L ( V ) P_(U)inL(V)P_{U} \in \mathcal{L}(V)PUL(V);
(b) 对每个 u U u U u in Uu \in UuU 均有 P U u = u P U u = u P_(U)u=uP_{U} u=uPUu=u;
(c) 对每个 w U w U w inU^(_|_)w \in U^{\perp}wU 均有 P U w = 0 P U w = 0 P_(U)w=0P_{U} w=0PUw=0;
(d) range P U = U P U = U P_(U)=UP_{U}=UPU=U;
(e) null P U = U P U = U P_(U)=U^(_|_)P_{U}=U^{\perp}PU=U;
(f) v P U v U v P U v U v-P_(U)v inU^(_|_)v-P_{U} v \in U^{\perp}vPUvU;
(g) P U 2 = P U P U 2 = P U P_(U)^(2)=P_(U)P_{U}{ }^{2}=P_{U}PU2=PU
(h) P U v v P U v v ||P_(U)v|| <= ||v||\left\|P_{U} v\right\| \leq\|v\|PUvv;
(i) 对 U U UUU 的每个规范正交基 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em 均有 P U v = v , e 1 e 1 + + v , e m e m P U v = v , e 1 e 1 + + v , e m e m P_(U)v=(:v,e_(1):)e_(1)+cdots+(:v,e_(m):)e_(m)P_{U} v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{m}\right\rangle e_{m}PUv=v,e1e1++v,emem.

证明

(a) 为了证明 P U P U P_(U)P_{U}PU V V VVV 上的线性映射,设 v 1 , v 2 V v 1 , v 2 V v_(1),v_(2)in Vv_{1}, v_{2} \in Vv1,v2V. 设
v 1 = u 1 + w 1 , v 2 = u 2 + w 2 , v 1 = u 1 + w 1 , v 2 = u 2 + w 2 , v_(1)=u_(1)+w_(1),quadv_(2)=u_(2)+w_(2),v_{1}=u_{1}+w_{1}, \quad v_{2}=u_{2}+w_{2},v1=u1+w1,v2=u2+w2,
其中 u 1 , u 2 U , w 1 , w 2 U u 1 , u 2 U , w 1 , w 2 U u_(1),u_(2)in U,w_(1),w_(2)inU^(_|_)u_{1}, u_{2} \in U, w_{1}, w_{2} \in U^{\perp}u1,u2U,w1,w2U. 则 P U v 1 = u 1 P U v 1 = u 1 P_(U)v_(1)=u_(1)P_{U} v_{1}=u_{1}PUv1=u1 P U v 2 = u 2 P U v 2 = u 2 P_(U)v_(2)=u_(2)P_{U} v_{2}=u_{2}PUv2=u2. 从而
v 1 + v 2 = ( u 1 + u 2 ) + ( w 1 + w 2 ) v 1 + v 2 = u 1 + u 2 + w 1 + w 2 v_(1)+v_(2)=(u_(1)+u_(2))+(w_(1)+w_(2))v_{1}+v_{2}=\left(u_{1}+u_{2}\right)+\left(w_{1}+w_{2}\right)v1+v2=(u1+u2)+(w1+w2)
其中 u 1 + u 2 U u 1 + u 2 U u_(1)+u_(2)in Uu_{1}+u_{2} \in Uu1+u2U w 1 + w 2 U w 1 + w 2 U w_(1)+w_(2)inU^(_|_)w_{1}+w_{2} \in U^{\perp}w1+w2U. 因此
P U ( v 1 + v 2 ) = u 1 + u 2 = P U v 1 + P U v 2 . P U v 1 + v 2 = u 1 + u 2 = P U v 1 + P U v 2 . P_(U)(v_(1)+v_(2))=u_(1)+u_(2)=P_(U)v_(1)+P_(U)v_(2).P_{U}\left(v_{1}+v_{2}\right)=u_{1}+u_{2}=P_{U} v_{1}+P_{U} v_{2} .PU(v1+v2)=u1+u2=PUv1+PUv2.
类似地, 设 λ F λ F lambda inF\lambda \in \mathbf{F}λF. 若 v = u + w v = u + w v=u+wv=u+wv=u+w, 其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU, 则 λ v = λ u + λ w λ v = λ u + λ w lambda v=lambda u+lambda w\lambda v=\lambda u+\lambda wλv=λu+λw, 其中 λ u U λ u U lambda u in U\lambda u \in UλuU λ w U λ w U lambda w inU^(_|_)\lambda w \in U^{\perp}λwU 。于是 P U ( λ v ) = λ u = λ P U v P U ( λ v ) = λ u = λ P U v P_(U)(lambda v)=lambda u=lambdaP_(U)vP_{U}(\lambda v)=\lambda u=\lambda P_{U} vPU(λv)=λu=λPUv.
因此 P U P U P_(U)P_{U}PU V V VVV V V VVV 的线性映射。
(b) 设 u U u U u in Uu \in UuU. 则 u = u + 0 u = u + 0 u=u+0u=u+0u=u+0, 其中 u U u U u in Uu \in UuU 0 U 0 U 0inU^(_|_)0 \in U^{\perp}0U. 于是 P U u = u P U u = u P_(U)u=uP_{U} u=uPUu=u.
(c) 设 w U w U w inU^(_|_)w \in U^{\perp}wU. 则 w = 0 + w w = 0 + w w=0+ww=0+ww=0+w, 其中 0 U 0 U 0in U0 \in U0U w U w U w inU^(_|_)w \in U^{\perp}wU. 于是 P U w = 0 P U w = 0 P_(U)w=0P_{U} w=0PUw=0.
(d) 由 P U P U P_(U)P_{U}PU 的定义可知 range P U U P U U P_(U)sub UP_{U} \subset UPUU 。由 (b) 可知 U U U subU \subsetU range P U P U P_(U)P_{U}PU. 于是 range P U P U P_(U)P_{U}PU = U = U =U=U=U.
(e) 由 (c) 可知 U U U^(_|_)subU^{\perp} \subsetU null P U P U P_(U)P_{U}PU. 为了证明另一个方向的包含关系, 注意若 v v v inv \inv null P U P U P_(U)P_{U}PU则 6.47 中给出的分解一定是 v = 0 + v v = 0 + v v=0+vv=0+vv=0+v ,其中 0 U 0 U 0in U0 \in U0U v U v U v inU^(_|_)v \in U^{\perp}vU 。因此 null P U P U P_(U)subP_{U} \subsetPU U U U^(_|_)U^{\perp}U
(f) 若 v = u + w v = u + w v=u+wv=u+wv=u+w, 其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU, 则
v P U v = v u = w U v P U v = v u = w U v-P_(U)v=v-u=w inU^(_|_)v-P_{U} v=v-u=w \in U^{\perp}vPUv=vu=wU
(g)若 v = u + w v = u + w v=u+wv=u+wv=u+w ,其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU ,则
( P U 2 ) v = P U ( P U v ) = P U u = u = P U v P U 2 v = P U P U v = P U u = u = P U v (P_(U)^(2))v=P_(U)(P_(U)v)=P_(U)u=u=P_(U)v\left(P_{U}^{2}\right) v=P_{U}\left(P_{U} v\right)=P_{U} u=u=P_{U} v(PU2)v=PU(PUv)=PUu=u=PUv
(h) 若 v = u + w v = u + w v=u+wv=u+wv=u+w, 其中 u U u U u in Uu \in UuU w U w U w inU^(_|_)w \in U^{\perp}wU, 则
P U v 2 = u 2 u 2 + w 2 = v 2 P U v 2 = u 2 u 2 + w 2 = v 2 ||P_(U)v||^(2)=||u||^(2) <= ||u||^(2)+||w||^(2)=||v||^(2)\left\|P_{U} v\right\|^{2}=\|u\|^{2} \leq\|u\|^{2}+\|w\|^{2}=\|v\|^{2}PUv2=u2u2+w2=v2
这里最后一个等号是根据勾股定理.
(i) 利用定理 6.47 证明中的等式 6.49 可得 P U v P U v P_(U)vP_{U} vPUv 的公式.

极小化问题

经常会遇到这样的问题:给定 V V VVV 的子空间 U U UUU 和点 v V v V v in Vv \in VvV, 求点 u U u U u in Uu \in UuU 使得 v u v u ||v-u||\|v-u\|vu 最小.下面的命题表明,通过取 u = P U v u = P U v u=P_(U)vu=P_{U} vu=PUv 就可以解决
极小化问题的求解非常简单,这导致了内积空间在纯数学之外的很多重要应用。
这个极小化问题。

6.56 到子空间的最小距离

U U UUU V V VVV 的有限维子空间, v V v V v in Vv \in VvV u U u U u in Uu \in UuU. 则
v P U v v u v P U v v u ||v-P_(U)v|| <= ||v-u||\left\|v-P_{U} v\right\| \leq\|v-u\|vPUvvu
进一步, 等号成立当且仅当 u = P U v u = P U v u=P_(U)vu=P_{U} vu=PUv.
证明 我们有
6.57 v P U v 2 v P U v 2 + P U v u 2 6.57 v P U v 2 v P U v 2 + P U v u 2 6.57quad||v-P_(U)v||^(2) <= ||v-P_(U)v||^(2)+||P_(U)v-u||^(2)6.57 \quad\left\|v-P_{U} v\right\|^{2} \leq\left\|v-P_{U} v\right\|^{2}+\left\|P_{U} v-u\right\|^{2}6.57vPUv2vPUv2+PUvu2
= ( v P U v ) + ( P U v u ) 2 = v u 2 = v P U v + P U v u 2 = v u 2 {:[=||(v-P_(U)v)+(P_(U)v-u)||^(2)],[=||v-u||^(2)]:}\begin{aligned} & =\left\|\left(v-P_{U} v\right)+\left(P_{U} v-u\right)\right\|^{2} \\ & =\|v-u\|^{2} \end{aligned}=(vPUv)+(PUvu)2=vu2
其中第一行成立是由于 0 P U v u 2 0 P U v u 2 0 <= ||P_(U)v-u||^(2)0 \leq\left\|P_{U} v-u\right\|^{2}0PUvu2 ,第二行是利用勾股定理(可以这样用是因为由 6.55(f) 知 v P U v U v P U v U v-P_(U)v inU^(_|_)v-P_{U} v \in U^{\perp}vPUvU ,而且我们还有 P U v u U P U v u U P_(U)v-u in UP_{U} v-u \in UPUvuU ),第三行成立是简单的计算。再开方即得要证的不等式.
等号成立当且仅当 6.57 是等式,当且仅当 P U v u = 0 P U v u = 0 ||P_(U)v-u||=0\left\|P_{U} \mathcal{v}-u\right\|=0PUvu=0, 当且仅当 u = P U v u = P U v u=P_(U)vu=P_{U} vu=PUv
  • P U v P U v quadP_(U)v\quad P_{U} vPUv U U UUU 中距离 v v vvv 最近的点
上述命题通常与公式 6.55(i) 结合起来计算极小化问题的显式解.
6.58 例 求一个次数不超过 5 的实系数多项式 u u uuu 使其在区间 [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上尽量好地逼近 sin x sin x sin x\sin xsinx, 即使得
π π | sin x u ( x ) | 2 d x π π | sin x u ( x ) | 2 d x int_(-pi)^(pi)|sin x-u(x)|^(2)dx\int_{-\pi}^{\pi}|\sin x-u(x)|^{2} \mathrm{~d} xππ|sinxu(x)|2 dx
最小. 对比你的结果与泰勒级数逼近.
解 设 C R [ π , π ] C R [ π , π ] C_(R)[-pi,pi]C_{\mathbf{R}}[-\pi, \pi]CR[π,π] 表示由 [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上的实值连续函数构成的实内积空间,其内积为:
6.59
f , g = π π f ( x ) g ( x ) d x f , g = π π f ( x ) g ( x ) d x (:f,g:)=int_(-pi)^(pi)f(x)g(x)dx\langle f, g\rangle=\int_{-\pi}^{\pi} f(x) g(x) \mathrm{d} xf,g=ππf(x)g(x)dx
v C R [ π , π ] v C R [ π , π ] v inC_(R)[-pi,pi]v \in C_{\mathbf{R}}[-\pi, \pi]vCR[π,π] 是由 v ( x ) = sin x v ( x ) = sin x v(x)=sin xv(x)=\sin xv(x)=sinx 定义的函数。令 U U UUU 表示由次数不超过 5 的实系数多项式构成的 C R [ π , π ] C R [ π , π ] C_(R)[-pi,pi]C_{\mathbf{R}}[-\pi, \pi]CR[π,π] 的子空间. 现在问题可以重述为:
u U u U u in Uu \in UuU 使得 v u v u ||v-u||\|v-u\|vu 最小.
能够演算积分的计算机在这里是很有用的。

6.60

u ( x ) = 0.987862 x 0.155271 x 3 + 0.00564312 x 5 u ( x ) = 0.987862 x 0.155271 x 3 + 0.00564312 x 5 u(x)=0.987862 x-0.155271x^(3)+0.00564312x^(5)u(x)=0.987862 x-0.155271 x^{3}+0.00564312 x^{5}u(x)=0.987862x0.155271x3+0.00564312x5
此处我们把精确解中出现的那些 π π pi\piπ 换成了适当的十进制的近似值。
由 6.56, 上面的多项式 u u uuu sin x sin x sin x\sin xsinx 在区间 [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上最佳的 5 次多项式逼近(此处 "最佳逼近" 的意思是 π π | sin x u ( x ) | 2 d x π π | sin x u ( x ) | 2 d x int_(-pi)^(pi)|sin x-u(x)|^(2)dx\int_{-\pi}^{\pi}|\sin x-u(x)|^{2} \mathrm{~d} xππ|sinxu(x)|2 dx 达到最小). 要看出这个逼近有多好,下图显示了 sin x sin x sin x\sin xsinx 和我们在 6.60 中给出的逼近 u ( x ) u ( x ) u(x)u(x)u(x) 在区间 [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上的图像.
[ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] sin x sin x sin x\sin xsinx 的图像(蓝色)和 6.60 给出的逼近 u ( x ) u ( x ) u(x)u(x)u(x) 的图像(红色)
我们的逼近 6.60 非常精确,以至于两个图形几乎重合——肉眼只能看到一个图像!蓝图几乎完全覆盖了红图。如果你是在电子设备上看这个图, (1) 请尽量放大图片,特别是在 3 和 -3 附近,以便观察两个图像的微小差别。
sin x sin x sin x\sin xsinx 的另一个熟知的 5 次多项式逼近是由泰勒多项式
6.61
x x 3 3 ! + x 5 5 ! x x 3 3 ! + x 5 5 ! x-(x^(3))/(3!)+(x^(5))/(5!)x-\frac{x^{3}}{3!}+\frac{x^{5}}{5!}xx33!+x55!
给出的. 我们来看一下这个逼近的精确度如何,下图显示了 sin x sin x sin x\sin xsinx 和泰勒多项式 6.61在区间 [ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] 上的图像。
[ π , π ] [ π , π ] [-pi,pi][-\pi, \pi][π,π] sin x sin x sin x\sin xsinx 的图像 (蓝色) 和泰勒多项式 6.61 的图像(红色)
泰勒多项式在 0 附近对 sin x sin x sin x\sin xsinx 有极好的逼近。但上图表明对 | x | > 2 | x | > 2 |x| > 2|x|>2|x|>2 泰勒多项式并不怎么精确,特别是与 6.60 相比较。例如,取 x = 3 x = 3 x=3x=3x=3 ,我们的逼近 6.60 对 sin 3 sin 3 sin 3\sin 3sin3 估计的误差大概是 0.001 ,但是泰勒级数 6.61 对 sin 3 sin 3 sin 3\sin 3sin3 估计的误差大概是 0.4 . 因此对于 x = 3 x = 3 x=3x=3x=3 泰勒级数的误差比 6.60 的误差大几百倍。线性代数帮助我们发现了 sin x sin x sin x\sin xsinx 的一个逼近,这个逼近改进了我们在微积分中学到的逼近!

习题 6.C

1 设 v 1 , , v m V v 1 , , v m V v_(1),dots,v_(m)in Vv_{1}, \ldots, v_{m} \in Vv1,,vmV 。证明 { v 1 , , v m } = ( span ( v 1 , , v m ) ) v 1 , , v m = span v 1 , , v m {v_(1),dots,v_(m)}^(_|_)=(span(v_(1),dots,v_(m)))^(_|_)\left\{v_{1}, \ldots, v_{m}\right\}^{\perp}=\left(\operatorname{span}\left(v_{1}, \ldots, v_{m}\right)\right)^{\perp}{v1,,vm}=(span(v1,,vm)).
2 设 U U UUU V V VVV 的有限维子空间。证明 U = { 0 } U = { 0 } U^(_|_)={0}U^{\perp}=\{0\}U={0} 当且仅当 U = V U = V U=VU=VU=V.
习题 14(a)表明,如果去掉 " U U UUU 是有限维的" 这一假设,则上面的结果不成立。
3 设 U U UUU V V VVV 的子空间,设 u 1 , , u m u 1 , , u m u_(1),dots,u_(m)u_{1}, \ldots, u_{m}u1,,um U U UUU 的基,且
u 1 , , u m , w 1 , , w n u 1 , , u m , w 1 , , w n u_(1),dots,u_(m),w_(1),dots,w_(n)u_{1}, \ldots, u_{m}, w_{1}, \ldots, w_{n}u1,,um,w1,,wn
V V VVV 的基。证明若对 V V VVV 的上述基应用格拉姆-施密特过程得到组 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em, f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn, 则 e 1 , , e m e 1 , , e m e_(1),dots,e_(m)e_{1}, \ldots, e_{m}e1,,em U U UUU 的规范正交基, f 1 , , f n f 1 , , f n f_(1),dots,f_(n)f_{1}, \ldots, f_{n}f1,,fn U U U^(_|_)U^{\perp}U 的规范正交基.
4 给定 R 4 R 4 R^(4)\mathbf{R}^{4}R4 的子空间
U = span ( ( 1 , 2 , 3 , 4 ) , ( 5 , 4 , 3 , 2 ) ) U = span ( ( 1 , 2 , 3 , 4 ) , ( 5 , 4 , 3 , 2 ) ) U=span((1,2,3,-4),(-5,4,3,2))U=\operatorname{span}((1,2,3,-4),(-5,4,3,2))U=span((1,2,3,4),(5,4,3,2))
U U UUU 的一个规范正交基和 U U U^(_|_)U^{\perp}U 的一个规范正交基.
5 设 V V VVV 是有限维的且 U U UUU V V VVV 的子空间。证明 P U = I P U P U = I P U P_(U _|_)=I-P_(U)P_{U \perp}=I-P_{U}PU=IPU ,这里 I I III V V VVV 上的恒等算子。
6 设 U U UUU W W WWW 均为 V V VVV 的有限维子空间。证明 P U P W = 0 P U P W = 0 P_(U)P_(W)=0P_{U} P_{W}=0PUPW=0 当且仅当对所有 u U u U u in Uu \in UuU w W w W w in Ww \in WwW 均有 u , w = 0 u , w = 0 (:u,w:)=0\langle u, w\rangle=0u,w=0
7 设 V V VVV 是有限维的, P L ( V ) P L ( V ) P inL(V)P \in \mathcal{L}(V)PL(V) 使得 P 2 = P P 2 = P P^(2)=PP^{2}=PP2=P 且 null P P PPP 中的向量与 range P P PPP 中的向量都正交. 证明有 V V VVV 的子空间 U U UUU 使得 P = P U P = P U P=P_(U)P=P_{U}P=PU.
8 设 V V VVV 是有限维的, P L ( V ) P L ( V ) P inL(V)P \in \mathcal{L}(V)PL(V) 使得 P 2 = P P 2 = P P^(2)=PP^{2}=PP2=P 且对每个 v V v V v in Vv \in VvV 均有 P v v P v v ||Pv|| <= ||v||\|P v\| \leq\|v\|Pvv. 证明存在 V V VVV 的子空间 U U UUU 使得 P = P U P = P U P=P_(U)P=P_{U}P=PU.
9 设 T L ( V ) , U T L ( V ) , U T inL(V),UT \in \mathcal{L}(V), UTL(V),U V V VVV 的有限维子空间。证明 U U UUU T T TTT 下不变当且仅当 P U T P U = P U T P U = P_(U)TP_(U)=P_{U} T P_{U}=PUTPU= T P U T P U TP_(U)T P_{U}TPU.
10 设 V V VVV 是有限维的, T L ( V ) , U T L ( V ) , U T inL(V),UT \in \mathcal{L}(V), UTL(V),U V V VVV 的子空间。证明 U U UUU U U U^(_|_)U^{\perp}U 都在 T T TTT 下不变当且仅当 P U T = T P U P U T = T P U P_(U)T=TP_(U)P_{U} T=T P_{U}PUT=TPU
11 在 R 4 R 4 R^(4)\mathbf{R}^{4}R4 中设 U = span ( ( 1 , 1 , 0 , 0 ) , ( 1 , 1 , 1 , 2 ) ) U = span ( ( 1 , 1 , 0 , 0 ) , ( 1 , 1 , 1 , 2 ) ) U=span((1,1,0,0),(1,1,1,2))U=\operatorname{span}((1,1,0,0),(1,1,1,2))U=span((1,1,0,0),(1,1,1,2)). 求 u U u U u in Uu \in UuU 使得 u ( 1 , 2 , 3 , 4 ) u ( 1 , 2 , 3 , 4 ) ||u-(1,2,3,4)||\|u-(1,2,3,4)\|u(1,2,3,4) 最小.
12 求 p P 3 ( R ) p P 3 ( R ) p inP_(3)(R)p \in \mathcal{P}_{3}(\mathbf{R})pP3(R) 使得 p ( 0 ) = 0 , p ( 0 ) = 0 p ( 0 ) = 0 , p ( 0 ) = 0 p(0)=0,p^(')(0)=0p(0)=0, p^{\prime}(0)=0p(0)=0,p(0)=0, 而且
0 1 | 2 + 3 x p ( x ) | 2 d x 0 1 | 2 + 3 x p ( x ) | 2 d x int_(0)^(1)|2+3x-p(x)|^(2)dx\int_{0}^{1}|2+3 x-p(x)|^{2} \mathrm{~d} x01|2+3xp(x)|2 dx
最小.
13 求 p P 5 ( R ) p P 5 ( R ) p inP_(5)(R)p \in \mathcal{P}_{5}(\mathbf{R})pP5(R) 使得
π π | sin x p ( x ) | 2 d x π π | sin x p ( x ) | 2 d x int_(-pi)^(pi)|sin x-p(x)|^(2)dx\int_{-\pi}^{\pi}|\sin x-p(x)|^{2} \mathrm{~d} xππ|sinxp(x)|2 dx
最小。
多项式 6.60 是本题的一个极好的近似解,但是这里要找的是包含 π π pi\piπ 的幕的精确解. 可以使用能演算符号积分的计算机。
14 设 C R ( [ 1 , 1 ] ) C R ( [ 1 , 1 ] ) C_(R)([-1,1])C_{\mathbf{R}}([-1,1])CR([1,1]) 是区间 [ 1 , 1 ] [ 1 , 1 ] [-1,1][-1,1][1,1] 上实值连续函数构成的向量空间, 且其上的内积为:对 f , g C R ( [ 1 , 1 ] ) f , g C R ( [ 1 , 1 ] ) f,g inC_(R)([-1,1])f, g \in C_{\mathbf{R}}([-1,1])f,gCR([1,1])
f , g = 1 1 f ( x ) g ( x ) d x f , g = 1 1 f ( x ) g ( x ) d x (:f,g:)=int_(-1)^(1)f(x)g(x)dx\langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} xf,g=11f(x)g(x)dx
给定 C R ( [ 1 , 1 ] ) C R ( [ 1 , 1 ] ) C_(R)([-1,1])C_{\mathbf{R}}([-1,1])CR([1,1]) 的子空间 U = { f C R ( [ 1 , 1 ] ) : f ( 0 ) = 0 } U = f C R ( [ 1 , 1 ] ) : f ( 0 ) = 0 U={f inC_(R)([-1,1]):f(0)=0}U=\left\{f \in C_{\mathbf{R}}([-1,1]): f(0)=0\right\}U={fCR([1,1]):f(0)=0}.
(a) 证明 U = { 0 } U = { 0 } U^(_|_)={0}U^{\perp}=\{0\}U={0}
(b) 证明当没有 "有限维" 这一假设时, 6.47 和 6.51 不成立.

  1. (1) 该图和下一幅图可从图灵社区本书页面的"随书下载"获取. ——编者注