第6章
讲授几何的女人,摘自十四世纪版的欧几里得《几何原本》。
内积空间
我们在定义向量空间时推广了
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 和
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 的线性结构(加法和标量乘法),而忽略了其他的重要特征,例如长度和角度的概念。这些思想隐含于我们现在要研究的内积的概念中。
我们总采用如下假定:
6.1 记号 F、V
F
F
F \mathbf{F} F 表示
R
R
R \mathbf{R} R 或
C
C
C \mathbf{C} C 。
V
V
V V V 表示
F
F
F \mathbf{F} F 上的向量空间。
本章的学习目标
柯西-施瓦茨不等式
格拉姆-施密特过程
内积空间上的线性泛函
■ 计算到子空间的最小距离
6.A 内积与范数
内积
为了说明引入内积概念的动机,我们把
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 和
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中的向量看作始于原点的箭头.
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 或
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中向量
x
x
x x x 的长度称为
x
x
x x x 的范数 (norm),记为
‖
x
‖
‖
x
‖
||x|| \|x\| ‖ x ‖ . 因此对于
x
=
(
x
1
,
x
2
)
∈
R
2
x
=
x
1
,
x
2
∈
R
2
x=(x_(1),x_(2))inR^(2) x=\left(x_{1}, x_{2}\right) \in \mathbf{R}^{2} x = ( x 1 , x 2 ) ∈ R 2 有
‖
x
‖
=
x
1
2
+
x
2
2
‖
x
‖
=
x
1
2
+
x
2
2
||x||=sqrt(x_(1)^(2)+x_(2)^(2)) \|x\|=\sqrt{x_{1}{ }^{2}+x_{2}{ }^{2}} ‖ x ‖ = x 1 2 + x 2 2 .
类似地, 若
x
=
(
x
1
,
x
2
,
x
3
)
∈
R
3
x
=
x
1
,
x
2
,
x
3
∈
R
3
x=(x_(1),x_(2),x_(3))inR^(3) x=\left(x_{1}, x_{2}, x_{3}\right) \in \mathbf{R}^{3} x = ( x 1 , x 2 , x 3 ) ∈ R 3 , 则
向量
x
x
x x x 的长度是
x
1
2
+
x
2
2
x
1
2
+
x
2
2
sqrt(x_(1)^(2)+x_(2)^(2)) \sqrt{x_{1}^{2}+x_{2}^{2}} x 1 2 + x 2 2
‖
x
‖
=
x
1
2
+
x
2
2
+
x
3
2
‖
x
‖
=
x
1
2
+
x
2
2
+
x
3
2
||x||=sqrt(x_(1)^(2)+x_(2)^(2)+x_(3)^(2)) \|x\|=\sqrt{x_{1}^{2}+x_{2}^{2}+x_{3}^{2}} ‖ x ‖ = x 1 2 + x 2 2 + x 3 2 .
虽然我们画不出高维的图形,但是范数在
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的推广是显然的:定义
x
=
x
=
x= x= x =
(
x
1
,
…
,
x
n
)
∈
R
n
x
1
,
…
,
x
n
∈
R
n
(x_(1),dots,x_(n))inR^(n) \left(x_{1}, \ldots, x_{n}\right) \in \mathbf{R}^{n} ( x 1 , … , x n ) ∈ R n 的范数为
‖
x
‖
=
x
1
2
+
⋯
+
x
n
2
.
‖
x
‖
=
x
1
2
+
⋯
+
x
n
2
.
||x||=sqrt(x_(1)^(2)+cdots+x_(n)^(2)). \|x\|=\sqrt{x_{1}^{2}+\cdots+x_{n}^{2}} . ‖ x ‖ = x 1 2 + ⋯ + x n 2 .
范数在
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上不是线性的. 为了把线性引入讨论, 我们引入点积.
6.2 定义 点积 (dot product)
对于
x
,
y
∈
R
n
,
x
x
,
y
∈
R
n
,
x
x,y inR^(n),x x, y \in \mathbf{R}^{n}, x x , y ∈ R n , x 和
y
y
y y y 的点积(记作
x
⋅
y
x
⋅
y
x*y x \cdot y x ⋅ y )定义为
x
⋅
y
=
x
1
y
1
+
⋯
+
x
n
y
n
,
x
⋅
y
=
x
1
y
1
+
⋯
+
x
n
y
n
,
x*y=x_(1)y_(1)+cdots+x_(n)y_(n), x \cdot y=x_{1} y_{1}+\cdots+x_{n} y_{n}, x ⋅ y = x 1 y 1 + ⋯ + x n y n ,
其中
x
=
(
x
1
,
…
,
x
n
)
,
y
=
(
y
1
,
…
,
y
n
)
x
=
x
1
,
…
,
x
n
,
y
=
y
1
,
…
,
y
n
x=(x_(1),dots,x_(n)),y=(y_(1),dots,y_(n)) x=\left(x_{1}, \ldots, x_{n}\right), y=\left(y_{1}, \ldots, y_{n}\right) x = ( x 1 , … , x n ) , y = ( y 1 , … , y n ) .
注意,
R
n
R
n
R^(n) \mathbf{R}^{n} R n 中两个向量的点积是一个数,而不是一个向量. 显然对所有
x
∈
R
n
x
∈
R
n
x inR^(n) x \in \mathbf{R}^{n} x ∈ R n 有
x
⋅
x
=
‖
x
‖
2
.
R
n
x
⋅
x
=
‖
x
‖
2
.
R
n
x*x=||x||^(2).R^(n) x \cdot x=\|x\|^{2} . \mathbf{R}^{n} x ⋅ x = ‖ x ‖ 2 . R n 上的点积具有以下性质:
如果我们把向量看作点,而不是箭头, 那么
‖
x
‖
‖
x
‖
||x|| \|x\| ‖ x ‖ 应该解释成从原点到点
x
x
x x x 的距离。
对所有
x
∈
R
n
x
∈
R
n
x inR^(n) x \in \mathbf{R}^{n} x ∈ R n 均有
x
⋅
x
≥
0
x
⋅
x
≥
0
x*x >= 0 x \cdot x \geq 0 x ⋅ x ≥ 0 ;
x
⋅
x
=
0
x
⋅
x
=
0
x*x=0 x \cdot x=0 x ⋅ x = 0 当且仅当
x
=
0
x
=
0
x=0 x=0 x = 0 ;
对于固定的
y
∈
R
n
,
R
n
y
∈
R
n
,
R
n
y inR^(n),R^(n) y \in \mathbf{R}^{n}, \mathbf{R}^{n} y ∈ R n , R n 到
R
R
R \mathbf{R} R 的将
x
∈
R
n
x
∈
R
n
x inR^(n) x \in \mathbf{R}^{n} x ∈ R n 变为
x
⋅
y
x
⋅
y
x*y x \cdot y x ⋅ y 的映射是线性的;
对所有
x
,
y
∈
R
n
x
,
y
∈
R
n
x,y inR^(n) x, y \in \mathbf{R}^{n} x , y ∈ R n 均有
x
⋅
y
=
y
⋅
x
x
⋅
y
=
y
⋅
x
x*y=y*x x \cdot y=y \cdot x x ⋅ y = y ⋅ x .
内积是点积的推广. 现在你可能会猜到, 定义内积就是把上一段所讨论的点积的性质抽象化. 这种猜测对实向量空间是正确的。为了使定义对实向量空间和复向量空间都可用,在给出定义之前,我们需要考察复数的情形。
回想一下, 若
λ
=
a
+
b
i
λ
=
a
+
b
i
lambda=a+bi \lambda=a+b \mathbf{i} λ = a + b i , 其中
a
,
b
∈
R
a
,
b
∈
R
a,b inR a, b \in \mathbf{R} a , b ∈ R , 则
λ
λ
lambda \lambda λ 的绝对值(记作
|
λ
|
|
λ
|
|lambda| |\lambda| | λ | )定义为
|
λ
|
=
a
2
+
b
2
|
λ
|
=
a
2
+
b
2
|lambda|=sqrt(a^(2)+b^(2)) |\lambda|=\sqrt{a^{2}+b^{2}} | λ | = a 2 + b 2 ;
λ
λ
lambda \lambda λ 的复共轭(记作
λ
¯
λ
¯
bar(lambda) \bar{\lambda} λ ¯ )定义为
λ
¯
=
a
−
b
j
λ
¯
=
a
−
b
j
bar(lambda)=a-bj \bar{\lambda}=a-b \mathbf{j} λ ¯ = a − b j ;
|
λ
|
2
=
λ
λ
¯
|
λ
|
2
=
λ
λ
¯
|lambda|^(2)=lambda bar(lambda) |\lambda|^{2}=\lambda \bar{\lambda} | λ | 2 = λ λ ¯ .
关于绝对值和复共轭的定义和基本性质,见第4章。
对于
z
=
(
z
1
,
…
,
z
n
)
∈
C
n
z
=
z
1
,
…
,
z
n
∈
C
n
z=(z_(1),dots,z_(n))inC^(n) z=\left(z_{1}, \ldots, z_{n}\right) \in \mathbf{C}^{n} z = ( z 1 , … , z n ) ∈ C n , 定义
z
z
z z z 的范数为
‖
z
‖
=
|
z
1
|
2
+
⋯
+
|
z
n
|
2
.
‖
z
‖
=
z
1
2
+
⋯
+
z
n
2
.
||z||=sqrt(|z_(1)|^(2)+cdots+|z_(n)|^(2)). \|z\|=\sqrt{\left|z_{1}\right|^{2}+\cdots+\left|z_{n}\right|^{2}} . ‖ z ‖ = | z 1 | 2 + ⋯ + | z n | 2 .
因为我们希望
‖
z
‖
‖
z
‖
||z|| \|z\| ‖ z ‖ 是非负数, 所以上式中的绝对值是必要的. 注意
‖
z
‖
2
=
z
1
z
1
―
+
⋯
+
z
n
z
n
―
‖
z
‖
2
=
z
1
z
1
¯
+
⋯
+
z
n
z
n
¯
||z||^(2)=z_(1) bar(z_(1))+cdots+z_(n) bar(z_(n)) \|z\|^{2}=z_{1} \overline{z_{1}}+\cdots+z_{n} \overline{z_{n}} ‖ z ‖ 2 = z 1 z 1 ― + ⋯ + z n z n ―
我们想把
‖
z
‖
2
‖
z
‖
2
||z||^(2) \|z\|^{2} ‖ z ‖ 2 看作
z
z
z z z 与自身的内积, 就像在
R
n
R
n
R^(n) \mathbf{R}^{n} R n 中一样. 因此, 上面的等式提示我们,
w
=
(
w
1
,
…
,
w
n
)
∈
C
n
w
=
w
1
,
…
,
w
n
∈
C
n
w=(w_(1),dots,w_(n))inC^(n) w=\left(w_{1}, \ldots, w_{n}\right) \in \mathbf{C}^{n} w = ( w 1 , … , w n ) ∈ C n 与
z
z
z z z 的内积应该等于
w
1
z
1
―
+
⋯
+
w
n
z
n
―
.
w
1
z
1
¯
+
⋯
+
w
n
z
n
¯
.
w_(1) bar(z_(1))+cdots+w_(n) bar(z_(n)). w_{1} \overline{z_{1}}+\cdots+w_{n} \overline{z_{n}} . w 1 z 1 ― + ⋯ + w n z n ― .
要是互换
w
w
w w w 和
z
z
z z z 的角色,上面的表达式就要用它的复共轭来代替。也就是说,
w
w
w w w 和
z
z
z z z 的内积应该等于
z
z
z z z 和
w
w
w w w 的内积的复共轭。有了这样的启示, 我们现在就可以定义
V
V
V V V 上的内积了,这里
V
V
V V V 可以是实向量空间或者复向量空间.
关于下面定义中记号的两点说明:
若
λ
λ
lambda \lambda λ 是复数, 则记号
λ
≥
0
λ
≥
0
lambda >= 0 \lambda \geq 0 λ ≥ 0 表示
λ
λ
lambda \lambda λ 是实数并且是非负的.
我们使用通用的记号(尖括号)
⟨
u
,
v
⟩
⟨
u
,
v
⟩
(:u,v:) \langle u, v\rangle ⟨ u , v ⟩ 表示内积。有些人使用圆括号,但
(
u
,
v
)
(
u
,
v
)
(u,v) (u, v) ( u , v ) 这个记号比较含糊, 它既可以表示有序对, 又可以表示内积.
6.3 定义 内积(inner product)
V
V
V V V 上的内积就是一个函数,它把
V
V
V V V 中元素的每个有序对
(
u
,
v
)
(
u
,
v
)
(u,v) (u, v) ( u , v ) 都映成一个数
⟨
u
,
v
⟩
∈
F
⟨
u
,
v
⟩
∈
F
(:u,v:)inF \langle u, v\rangle \in \mathbf{F} ⟨ u , v ⟩ ∈ F , 并且具有下列性质:
正性(positivity)
对所有
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
⟨
v
,
v
⟩
≥
0
⟨
v
,
v
⟩
≥
0
(:v,v:) >= 0 \langle v, v\rangle \geq 0 ⟨ v , v ⟩ ≥ 0 ;
定性(definiteness)
⟨
v
,
v
⟩
=
0
⟨
v
,
v
⟩
=
0
(:v,v:)=0 \langle v, v\rangle=0 ⟨ v , v ⟩ = 0 当且仅当
v
=
0
;
v
=
0
;
v=0; v=0 ; v = 0 ;
第一个位置的加性(additivity in first slot)
对所有
u
,
v
,
w
∈
V
u
,
v
,
w
∈
V
u,v,w in V u, v, w \in V u , v , w ∈ V 均有
⟨
u
+
v
,
w
⟩
=
⟨
u
,
w
⟩
+
⟨
v
,
w
⟩
⟨
u
+
v
,
w
⟩
=
⟨
u
,
w
⟩
+
⟨
v
,
w
⟩
(:u+v,w:)=(:u,w:)+(:v,w:) \langle u+v, w\rangle=\langle u, w\rangle+\langle v, w\rangle ⟨ u + v , w ⟩ = ⟨ u , w ⟩ + ⟨ v , w ⟩ ;
第一个位置的齐性(homogeneity in first slot)
对所有
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 和所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
λ
u
,
v
⟩
=
λ
⟨
u
,
v
⟩
⟨
λ
u
,
v
⟩
=
λ
⟨
u
,
v
⟩
(:lambda u,v:)=lambda(:u,v:) \langle\lambda u, v\rangle=\lambda\langle u, v\rangle ⟨ λ u , v ⟩ = λ ⟨ u , v ⟩ ;
共轭对称性 (conjugate symmetry)
对所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
,
v
⟩
=
⟨
v
,
u
⟩
―
⟨
u
,
v
⟩
=
⟨
v
,
u
⟩
¯
(:u,v:)= bar((:v,u:)) \langle u, v\rangle=\overline{\langle v, u\rangle} ⟨ u , v ⟩ = ⟨ v , u ⟩ ― .
虽然大多数数学家按上面的方式定义内积,但是很多物理学家在定义内积时要求的是第二个位置的齐性,而不是第一个位置。
每个实数都等于它的复共轭。因此在处理实向量空间时,可以忽略上面最后一个条件中的复共轭而直接说:对所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
,
v
⟩
=
⟨
v
,
u
⟩
⟨
u
,
v
⟩
=
⟨
v
,
u
⟩
(:u,v:)=(:v,u:) \langle u, v\rangle=\langle v, u\rangle ⟨ u , v ⟩ = ⟨ v , u ⟩ .
6.4 例 内积
(a)
F
n
F
n
F^(n) \mathrm{F}^{n} F n 上的欧几里得内积定义为
⟨
(
w
1
,
…
,
w
n
)
,
(
z
1
,
…
,
z
n
)
⟩
=
w
1
z
1
―
+
⋯
+
w
n
z
n
―
w
1
,
…
,
w
n
,
z
1
,
…
,
z
n
=
w
1
z
1
¯
+
⋯
+
w
n
z
n
¯
(:(w_(1),dots,w_(n)),(z_(1),dots,z_(n)):)=w_(1) bar(z_(1))+cdots+w_(n) bar(z_(n)) \left\langle\left(w_{1}, \ldots, w_{n}\right),\left(z_{1}, \ldots, z_{n}\right)\right\rangle=w_{1} \overline{z_{1}}+\cdots+w_{n} \overline{z_{n}} ⟨ ( w 1 , … , w n ) , ( z 1 , … , z n ) ⟩ = w 1 z 1 ― + ⋯ + w n z n ―
(b) 若
c
1
,
…
,
c
n
c
1
,
…
,
c
n
c_(1),dots,c_(n) c_{1}, \ldots, c_{n} c 1 , … , c n 均为正数, 则可以定义
F
n
F
n
F^(n) \mathbf{F}^{n} F n 上的内积如下:
⟨
(
w
1
,
…
,
w
n
)
,
(
z
1
,
…
,
z
n
)
⟩
=
c
1
w
1
z
1
―
+
⋯
+
c
n
w
n
z
n
―
w
1
,
…
,
w
n
,
z
1
,
…
,
z
n
=
c
1
w
1
z
1
¯
+
⋯
+
c
n
w
n
z
n
¯
(:(w_(1),dots,w_(n)),(z_(1),dots,z_(n)):)=c_(1)w_(1) bar(z_(1))+cdots+c_(n)w_(n) bar(z_(n)) \left\langle\left(w_{1}, \ldots, w_{n}\right),\left(z_{1}, \ldots, z_{n}\right)\right\rangle=c_{1} w_{1} \overline{z_{1}}+\cdots+c_{n} w_{n} \overline{z_{n}} ⟨ ( w 1 , … , w n ) , ( z 1 , … , z n ) ⟩ = c 1 w 1 z 1 ― + ⋯ + c n w n z n ―
(c) 在定义在区间
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的实值连续函数构成的向量空间上可定义内积如下:
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
(:f,g:)=int_(-1)^(1)f(x)g(x)dx \langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} x ⟨ f , g ⟩ = ∫ − 1 1 f ( x ) g ( x ) d x
(d) 在
P
(
R
)
P
(
R
)
P(R) \mathcal{P}(\mathbf{R}) P ( R ) 上可定义内积如下:
⟨
p
,
q
⟩
=
∫
0
∞
p
(
x
)
q
(
x
)
e
−
x
d
x
⟨
p
,
q
⟩
=
∫
0
∞
p
(
x
)
q
(
x
)
e
−
x
d
x
(:p,q:)=int_(0)^(oo)p(x)q(x)e^(-x)dx \langle p, q\rangle=\int_{0}^{\infty} p(x) q(x) e^{-x} \mathrm{~d} x ⟨ p , q ⟩ = ∫ 0 ∞ p ( x ) q ( x ) e − x d x
6.5 定义 内积空间(inner product space)
内积空间就是带有内积的向量空间
V
V
V V V .
内积空间最重要的例子是
F
n
F
n
F^(n) \mathbf{F}^{n} F n ,带有上面例子中(a)所定义的欧几里得内积. 当我们说
F
n
F
n
F^(n) \mathbf{F}^{n} F n 是内积空间时,除非特别指明,总假设采用的是欧几里得内积。
为避免不断重复
V
V
V V V 是内积空间这一假设,在本章余下部分我们做如下假设:
6.6 记号
V
V
V V V
在本章的余下部分,
V
V
V V V 表示
F
F
F \mathbf{F} F 上的内积空间.
注意这里稍稍有点滥用术语. 内积空间是带有内积的向量空间. 当我们说向量空间
V
V
V V V 是一个内积空间时,我们也隐含假定了
V
V
V V V 上的内积,或者从上下文中可以看出采用的是哪个内积(如果向量空间是
F
n
F
n
F^(n) \mathbf{F}^{n} F n ,总是采用欧几里得内积)。
6.7 内积的基本性质
(a) 对每个取定的
u
∈
V
u
∈
V
u in V u \in V u ∈ V ,将
v
v
v v v 变为
⟨
v
,
u
⟩
⟨
v
,
u
⟩
(:v,u:) \langle v, u\rangle ⟨ v , u ⟩ 的函数是
V
V
V V V 到
F
F
F \mathbf{F} F 的线性映射.
(b) 对每个
u
∈
V
u
∈
V
u in V u \in V u ∈ V 均有
⟨
0
,
u
⟩
=
0
⟨
0
,
u
⟩
=
0
(:0,u:)=0 \langle 0, u\rangle=0 ⟨ 0 , u ⟩ = 0 .
(c) 对每个
u
∈
V
u
∈
V
u in V u \in V u ∈ V 均有
⟨
u
,
0
⟩
=
0
⟨
u
,
0
⟩
=
0
(:u,0:)=0 \langle u, 0\rangle=0 ⟨ u , 0 ⟩ = 0 .
(d) 对所有
u
,
v
,
w
∈
V
u
,
v
,
w
∈
V
u,v,w in V u, v, w \in V u , v , w ∈ V 均有
⟨
u
,
v
+
w
⟩
=
⟨
u
,
v
⟩
+
⟨
u
,
w
⟩
⟨
u
,
v
+
w
⟩
=
⟨
u
,
v
⟩
+
⟨
u
,
w
⟩
(:u,v+w:)=(:u,v:)+(:u,w:) \langle u, v+w\rangle=\langle u, v\rangle+\langle u, w\rangle ⟨ u , v + w ⟩ = ⟨ u , v ⟩ + ⟨ u , w ⟩ .
(e) 对所有
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 和所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
,
λ
v
⟩
=
λ
¯
⟨
u
,
v
⟩
⟨
u
,
λ
v
⟩
=
λ
¯
⟨
u
,
v
⟩
(:u,lambda v:)= bar(lambda)(:u,v:) \langle u, \lambda v\rangle=\bar{\lambda}\langle u, v\rangle ⟨ u , λ v ⟩ = λ ¯ ⟨ u , v ⟩ .
证明
(a)由内积定义中关于第一个位置的加性和齐性可知(a)成立。
(b) 由(a)及线性映射将 0 变为 0 知 (b) 成立。
(c) 由(a)及内积定义中的共轭对称性知(c)成立。
(d) 设
u
,
v
,
w
∈
V
u
,
v
,
w
∈
V
u,v,w in V u, v, w \in V u , v , w ∈ V . 则
⟨
u
,
v
+
w
⟩
=
⟨
v
+
w
,
u
⟩
―
=
⟨
v
,
u
⟩
+
⟨
w
,
u
⟩
―
=
⟨
v
,
u
⟩
―
+
⟨
w
,
u
⟩
―
=
⟨
u
,
v
⟩
+
⟨
u
,
w
⟩
.
⟨
u
,
v
+
w
⟩
=
⟨
v
+
w
,
u
⟩
¯
=
⟨
v
,
u
⟩
+
⟨
w
,
u
⟩
¯
=
⟨
v
,
u
⟩
¯
+
⟨
w
,
u
⟩
¯
=
⟨
u
,
v
⟩
+
⟨
u
,
w
⟩
.
{:[(:u","v+w:)= bar((:v+w,u:))],[= bar((:v,u:)+(:w,u:))],[= bar((:v,u:))+ bar((:w,u:))],[=(:u","v:)+(:u","w:).]:} \begin{aligned}
\langle u, v+w\rangle & =\overline{\langle v+w, u\rangle} \\
& =\overline{\langle v, u\rangle+\langle w, u\rangle} \\
& =\overline{\langle v, u\rangle}+\overline{\langle w, u\rangle} \\
& =\langle u, v\rangle+\langle u, w\rangle .
\end{aligned} ⟨ u , v + w ⟩ = ⟨ v + w , u ⟩ ― = ⟨ v , u ⟩ + ⟨ w , u ⟩ ― = ⟨ v , u ⟩ ― + ⟨ w , u ⟩ ― = ⟨ u , v ⟩ + ⟨ u , w ⟩ .
(e) 设
λ
∈
F
,
u
,
v
∈
V
λ
∈
F
,
u
,
v
∈
V
lambda inF,u,v in V \lambda \in \mathbf{F}, u, v \in V λ ∈ F , u , v ∈ V . 则
⟨
u
,
λ
v
⟩
=
⟨
λ
v
,
u
⟩
―
=
λ
⟨
v
,
u
⟩
―
=
λ
¯
⟨
v
,
u
⟩
―
=
λ
¯
⟨
u
,
v
⟩
.
⟨
u
,
λ
v
⟩
=
⟨
λ
v
,
u
⟩
¯
=
λ
⟨
v
,
u
⟩
¯
=
λ
¯
⟨
v
,
u
⟩
¯
=
λ
¯
⟨
u
,
v
⟩
.
{:[(:u","lambda v:)= bar((:lambda v,u:))],[= bar(lambda(:v,u:))],[= bar(lambda) bar((:v,u:))],[= bar(lambda)(:u","v:).]:} \begin{aligned}
\langle u, \lambda v\rangle & =\overline{\langle\lambda v, u\rangle} \\
& =\overline{\lambda\langle v, u\rangle} \\
& =\bar{\lambda} \overline{\langle v, u\rangle} \\
& =\bar{\lambda}\langle u, v\rangle .
\end{aligned} ⟨ u , λ v ⟩ = ⟨ λ v , u ⟩ ― = λ ⟨ v , u ⟩ ― = λ ¯ ⟨ v , u ⟩ ― = λ ¯ ⟨ u , v ⟩ .
证毕.
范数
我们定义内积的动机最初来自于
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 和
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中向量的范数. 下面我们会看到每个内积都确定了一种范数。
6.8 定义 范数 (norm),
‖
v
‖
‖
v
‖
||v|| \|v\| ‖ v ‖
对于
v
∈
V
,
v
v
∈
V
,
v
v in V,v v \in V, v v ∈ V , v 的范数(记作
‖
v
‖
‖
v
‖
||v|| \|v\| ‖ v ‖ )定义为
‖
v
‖
=
⟨
v
,
v
⟩
‖
v
‖
=
⟨
v
,
v
⟩
||v||=sqrt((:v,v:)) \|v\|=\sqrt{\langle v, v\rangle} ‖ v ‖ = ⟨ v , v ⟩ .
6.9 例 范数
(a) 若
(
z
1
,
…
,
z
n
)
∈
F
n
z
1
,
…
,
z
n
∈
F
n
(z_(1),dots,z_(n))inF^(n) \left(z_{1}, \ldots, z_{n}\right) \in \mathbf{F}^{n} ( z 1 , … , z n ) ∈ F n (取欧几里得内积), 则
‖
(
z
1
,
…
,
z
n
)
‖
=
|
z
1
|
2
+
⋯
+
|
z
n
|
2
z
1
,
…
,
z
n
=
z
1
2
+
⋯
+
z
n
2
||(z_(1),dots,z_(n))||=sqrt(|z_(1)|^(2)+cdots+|z_(n)|^(2)) \left\|\left(z_{1}, \ldots, z_{n}\right)\right\|=\sqrt{\left|z_{1}\right|^{2}+\cdots+\left|z_{n}\right|^{2}} ‖ ( z 1 , … , z n ) ‖ = | z 1 | 2 + ⋯ + | z n | 2
(b) 在
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的实值连续函数构成的向量空间中(取例 6.4(c) 中定义的内积)有
‖
f
‖
=
∫
−
1
1
(
f
(
x
)
)
2
d
x
‖
f
‖
=
∫
−
1
1
(
f
(
x
)
)
2
d
x
||f||=sqrt(int_(-1)^(1)(f(x))^(2)dx) \|f\|=\sqrt{\int_{-1}^{1}(f(x))^{2} \mathrm{~d} x} ‖ f ‖ = ∫ − 1 1 ( f ( x ) ) 2 d x
6.10 范数的基本性质
设
v
∈
V
v
∈
V
v in V v \in V v ∈ V .
(a)
‖
v
‖
=
0
‖
v
‖
=
0
||v||=0 \|v\|=0 ‖ v ‖ = 0 当且仅当
v
=
0
v
=
0
v=0 v=0 v = 0 。
(b) 对所有
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 均有
‖
λ
v
‖
=
|
λ
|
‖
v
‖
‖
λ
v
‖
=
|
λ
|
‖
v
‖
||lambda v||=|lambda|||v|| \|\lambda v\|=|\lambda|\|v\| ‖ λ v ‖ = | λ | ‖ v ‖ .
证明
(a)由于
⟨
v
,
v
⟩
=
0
⟨
v
,
v
⟩
=
0
(:v,v:)=0 \langle v, v\rangle=0 ⟨ v , v ⟩ = 0 当且仅当
v
=
0
v
=
0
v=0 v=0 v = 0 , 故结论成立.
(b) 设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F . 则
‖
λ
v
‖
2
=
⟨
λ
v
,
λ
v
⟩
=
λ
⟨
v
,
λ
v
⟩
=
λ
λ
¯
⟨
v
,
v
⟩
=
|
λ
|
2
‖
v
‖
2
.
‖
λ
v
‖
2
=
⟨
λ
v
,
λ
v
⟩
=
λ
⟨
v
,
λ
v
⟩
=
λ
λ
¯
⟨
v
,
v
⟩
=
|
λ
|
2
‖
v
‖
2
.
{:[||lambda v||^(2)=(:lambda v","lambda v:)],[=lambda(:v","lambda v:)],[=lambda bar(lambda)(:v","v:)],[=|lambda|^(2)||v||^(2).]:} \begin{aligned}
\|\lambda v\|^{2} & =\langle\lambda v, \lambda v\rangle \\
& =\lambda\langle v, \lambda v\rangle \\
& =\lambda \bar{\lambda}\langle v, v\rangle \\
& =|\lambda|^{2}\|v\|^{2} .
\end{aligned} ‖ λ v ‖ 2 = ⟨ λ v , λ v ⟩ = λ ⟨ v , λ v ⟩ = λ λ ¯ ⟨ v , v ⟩ = | λ | 2 ‖ v ‖ 2 .
开平方即得要证的等式。
上面 (b) 的这个证明阐明了一个普遍原理:处理范数的平方通常比直接处理范数更容易。
现在给出一个关键的定义。
6.11 定义 正交(orthogonal)
两个向量
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 称为是正交的, 如果
⟨
u
,
v
⟩
=
0
⟨
u
,
v
⟩
=
0
(:u,v:)=0 \langle u, v\rangle=0 ⟨ u , v ⟩ = 0 .
在上述定义中向量的次序无关紧要,因为
⟨
u
,
v
⟩
=
0
⟨
u
,
v
⟩
=
0
(:u,v:)=0 \langle u, v\rangle=0 ⟨ u , v ⟩ = 0 当且仅当
⟨
v
,
u
⟩
=
0
⟨
v
,
u
⟩
=
0
(:v,u:)=0 \langle v, u\rangle=0 ⟨ v , u ⟩ = 0 . 有时候我们说
u
u
u u u 正交于
v
v
v v v ,而不说
u
u
u u u 和
v
v
v v v 是正交的。
习题 13 表明,若
u
,
v
u
,
v
u,v u, v u , v 是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 中的非零向量,则
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
cos
θ
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
cos
θ
(:u,v:)=||u||||v||cos theta \langle u, v\rangle=\|u\|\|v\| \cos \theta ⟨ u , v ⟩ = ‖ u ‖ ‖ v ‖ cos θ
其中
θ
θ
theta \theta θ 是
u
u
u u u 和
v
v
v v v 间的夹角(把
u
u
u u u 和
v
v
v v v 看成始于原点的箭头)。于是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 中的两个向量是正交的(按照通常的欧几里得内积)当且仅当它们之间夹角的余弦是 0 ,当且仅当这两个向量在平面几何通常的意义下是垂直的. 因此正交是一个很酷的词, 意思就是垂直(perpendicular)。
我们从下面的简单结果开始研究正交性.
6.12 正交性与 0
(a) 0 正交于
V
V
V V V 中的任意向量.
(b) 0 是
V
V
V V V 中唯一一个与自身正交的向量.
证明
(a) 6.7(b)表明对每个
u
∈
V
u
∈
V
u in V u \in V u ∈ V 均有
⟨
0
,
u
⟩
=
0
⟨
0
,
u
⟩
=
0
(:0,u:)=0 \langle 0, u\rangle=0 ⟨ 0 , u ⟩ = 0 。
(b) 若
v
∈
V
v
∈
V
v in V v \in V v ∈ V 且
⟨
v
,
v
⟩
=
0
⟨
v
,
v
⟩
=
0
(:v,v:)=0 \langle v, v\rangle=0 ⟨ v , v ⟩ = 0 ,则
v
=
0
v
=
0
v=0 v=0 v = 0 (由内积的定义)。
下面的定理是对于
V
=
R
2
V
=
R
2
V=R^(2) V=\mathbf{R}^{2} V = R 2 的特殊情况,已经有 2500 多年历史了。当然, 这里给出的证明并不是原始的证明。
正交一词来源自希腊语的 orthogonios, 后者的意思是直角的.
6.13 勾股定理(又称毕达哥拉斯定理)
设
u
u
u u u 和
v
v
v v v 是
V
V
V V V 中的正交向量,则
‖
u
+
v
‖
2
=
‖
u
‖
2
+
‖
v
‖
2
‖
u
+
v
‖
2
=
‖
u
‖
2
+
‖
v
‖
2
||u+v||^(2)=||u||^(2)+||v||^(2) \|u+v\|^{2}=\|u\|^{2}+\|v\|^{2} ‖ u + v ‖ 2 = ‖ u ‖ 2 + ‖ v ‖ 2 .
证明
‖
u
+
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
=
⟨
u
,
u
⟩
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
+
⟨
v
,
v
⟩
=
‖
u
‖
2
+
‖
v
‖
2
.
‖
u
+
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
=
⟨
u
,
u
⟩
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
+
⟨
v
,
v
⟩
=
‖
u
‖
2
+
‖
v
‖
2
.
{:[||u+v||^(2)=(:u+v","u+v:)],[=(:u","u:)+(:u","v:)+(:v","u:)+(:v","v:)],[=||u||^(2)+||v||^(2).]:} \begin{aligned}
\|u+v\|^{2} & =\langle u+v, u+v\rangle \\
& =\langle u, u\rangle+\langle u, v\rangle+\langle v, u\rangle+\langle v, v\rangle \\
& =\|u\|^{2}+\|v\|^{2} .
\end{aligned} ‖ u + v ‖ 2 = ⟨ u + v , u + v ⟩ = ⟨ u , u ⟩ + ⟨ u , v ⟩ + ⟨ v , u ⟩ + ⟨ v , v ⟩ = ‖ u ‖ 2 + ‖ v ‖ 2 .
上面给出的勾股定理证明表明,结论成立当且仅当
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
=
0
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
=
0
(:u,v:)+(:v,u:)=0 \langle u, v\rangle+\langle v, u\rangle=0 ⟨ u , v ⟩ + ⟨ v , u ⟩ = 0 ,即
2
Re
⟨
u
,
v
⟩
=
0
2
Re
⟨
u
,
v
⟩
=
0
2Re(:u,v:)=0 2 \operatorname{Re}\langle u, v\rangle=0 2 Re ⟨ u , v ⟩ = 0 . 因此勾股定理的逆命题在实内积空间中成立。
设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 且
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 。我们想把
u
u
u u u 写成
v
v
v v v 的标量倍加上一个正交于
v
v
v v v 的向量
w
w
w w w ,如左下图所示。
正交分解
为了揭示如何将
u
u
u u u 写成
v
v
v v v 的标量倍加上一个正交于
v
v
v v v 的向量,令
c
∈
F
c
∈
F
c inF c \in \mathbf{F} c ∈ F 表示一个标量,则
u
=
c
v
+
(
u
−
c
v
)
u
=
c
v
+
(
u
−
c
v
)
u=cv+(u-cv) u=c v+(u-c v) u = c v + ( u − c v )
因此需要选取
c
c
c c c 使得
v
v
v v v 正交于
(
u
−
c
v
)
(
u
−
c
v
)
(u-cv) (u-c v) ( u − c v ) . 也就是说,我们希望
0
=
⟨
u
−
c
v
,
v
⟩
=
⟨
u
,
v
⟩
−
c
‖
v
‖
2
0
=
⟨
u
−
c
v
,
v
⟩
=
⟨
u
,
v
⟩
−
c
‖
v
‖
2
0=(:u-cv,v:)=(:u,v:)-c||v||^(2) 0=\langle u-c v, v\rangle=\langle u, v\rangle-c\|v\|^{2} 0 = ⟨ u − c v , v ⟩ = ⟨ u , v ⟩ − c ‖ v ‖ 2
上式表明
c
c
c c c 应取成
⟨
u
,
v
⟩
/
‖
v
‖
2
⟨
u
,
v
⟩
/
‖
v
‖
2
(:u,v:)//||v||^(2) \langle u, v\rangle /\|v\|^{2} ⟨ u , v ⟩ / ‖ v ‖ 2 。从而
u
=
⟨
u
,
v
⟩
‖
v
‖
2
v
+
(
u
−
⟨
u
,
v
⟩
‖
v
‖
2
v
)
.
u
=
⟨
u
,
v
⟩
‖
v
‖
2
v
+
u
−
⟨
u
,
v
⟩
‖
v
‖
2
v
.
u=((:u,v:))/(||v||^(2))v+(u-((:u,v:))/(||v||^(2))v). u=\frac{\langle u, v\rangle}{\|v\|^{2}} v+\left(u-\frac{\langle u, v\rangle}{\|v\|^{2}} v\right) . u = ⟨ u , v ⟩ ‖ v ‖ 2 v + ( u − ⟨ u , v ⟩ ‖ v ‖ 2 v ) .
上式把
u
u
u u u 写成了
v
v
v v v 的标量倍加上一个正交于
v
v
v v v 的向量(请自行验证)。也就是说,我们证明了以下命题。
6.14 正交分解
设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 且
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 . 令
c
=
⟨
u
,
v
⟩
‖
v
‖
2
,
w
=
u
−
⟨
u
,
v
⟩
‖
v
‖
2
v
c
=
⟨
u
,
v
⟩
‖
v
‖
2
,
w
=
u
−
⟨
u
,
v
⟩
‖
v
‖
2
v
c=((:u,v:))/(||v||^(2)),w=u-((:u,v:))/(||v||^(2))v c=\frac{\langle u, v\rangle}{\|v\|^{2}}, w=u-\frac{\langle u, v\rangle}{\|v\|^{2}} v c = ⟨ u , v ⟩ ‖ v ‖ 2 , w = u − ⟨ u , v ⟩ ‖ v ‖ 2 v . 则
⟨
w
,
v
⟩
=
0
⟨
w
,
v
⟩
=
0
(:w,v:)=0 \langle w, v\rangle=0 ⟨ w , v ⟩ = 0 且
u
=
c
v
+
w
u
=
c
v
+
w
u=cv+w u=c v+w u = c v + w .
1821 年,法国数学家奥古斯丁-路易 • 柯西(1789-1857)证明了 6.17(a). 1886年,德国数学家赫尔曼 • 施瓦茨(1843-1921)证明了 6.17(b).
正交分解 6.14 将被用于证明下面的定理 (柯西-施瓦茨不等式),它是数学中最重要的不等式之一。
6.15 柯西-施瓦茨不等式
设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V . 则
|
⟨
u
,
v
⟩
|
≤
‖
u
‖
‖
v
‖
|
⟨
u
,
v
⟩
|
≤
‖
u
‖
‖
v
‖
|(:u,v:)| <= ||u||||v|| |\langle u, v\rangle| \leq\|u\|\|v\| | ⟨ u , v ⟩ | ≤ ‖ u ‖ ‖ v ‖ . 等号成立当且仅当
u
,
v
u
,
v
u,v u, v u , v 之一是另一个的标量倍。
证明 若
v
=
0
v
=
0
v=0 v=0 v = 0 ,则不等式的两端都等于 0 。因此可以假设
v
≠
0
v
≠
0
v!=0 v \neq 0 v ≠ 0 . 考虑 6.14 中给出的正交分解
u
=
⟨
u
,
v
⟩
‖
v
‖
2
v
+
w
u
=
⟨
u
,
v
⟩
‖
v
‖
2
v
+
w
u=((:u,v:))/(||v||^(2))v+w u=\frac{\langle u, v\rangle}{\|v\|^{2}} v+w u = ⟨ u , v ⟩ ‖ v ‖ 2 v + w
其中
w
w
w w w 正交于
v
v
v v v 。由勾股定理我们有
6.16
‖
u
‖
2
=
‖
⟨
u
,
v
⟩
‖
v
‖
2
v
‖
2
+
‖
w
‖
2
=
|
⟨
u
,
v
⟩
|
2
‖
v
‖
2
+
‖
w
‖
2
≥
|
⟨
u
,
v
⟩
|
2
‖
v
‖
2
‖
u
‖
2
=
⟨
u
,
v
⟩
‖
v
‖
2
v
2
+
‖
w
‖
2
=
|
⟨
u
,
v
⟩
|
2
‖
v
‖
2
+
‖
w
‖
2
≥
|
⟨
u
,
v
⟩
|
2
‖
v
‖
2
{:[||u||^(2)=||((:u,v:))/(||v||^(2))v||^(2)+||w||^(2)],[=(|(:u,v:)|^(2))/(||v||^(2))+||w||^(2)],[ >= (|(:u,v:)|^(2))/(||v||^(2))]:} \begin{aligned}
\|u\|^{2} & =\left\|\frac{\langle u, v\rangle}{\|v\|^{2}} v\right\|^{2}+\|w\|^{2} \\
& =\frac{|\langle u, v\rangle|^{2}}{\|v\|^{2}}+\|w\|^{2} \\
& \geq \frac{|\langle u, v\rangle|^{2}}{\|v\|^{2}}
\end{aligned} ‖ u ‖ 2 = ‖ ⟨ u , v ⟩ ‖ v ‖ 2 v ‖ 2 + ‖ w ‖ 2 = | ⟨ u , v ⟩ | 2 ‖ v ‖ 2 + ‖ w ‖ 2 ≥ | ⟨ u , v ⟩ | 2 ‖ v ‖ 2
在这个不等式两端都乘以
‖
v
‖
2
‖
v
‖
2
||v||^(2) \|v\|^{2} ‖ v ‖ 2 ,再开平方即得所要证的不等式。
从上一段的证明可以看出柯西一施瓦茨不等式成为等式当且仅当 6.16 是等式. 显然,这成立当且仅当
w
=
0
w
=
0
w=0 w=0 w = 0 。而
w
=
0
w
=
0
w=0 w=0 w = 0 当且仅当
u
u
u u u 是
v
v
v v v 的标量倍(参见6.14). 因此,柯西-施瓦茨不等式是等式当且仅当
u
u
u u u 是
v
v
v v v 的标量倍或
v
v
v v v 是
u
u
u u u 的标量倍(或二者都成立. 这样措辞是为了涵盖
u
u
u u u 或
v
v
v v v 等于 0 的情况)。
6.17 例 柯西-施瓦茨不等式的例子
(a) 若
x
1
,
…
,
x
n
,
y
1
,
…
,
y
n
∈
R
x
1
,
…
,
x
n
,
y
1
,
…
,
y
n
∈
R
x_(1),dots,x_(n),y_(1),dots,y_(n)inR x_{1}, \ldots, x_{n}, y_{1}, \ldots, y_{n} \in \mathbf{R} x 1 , … , x n , y 1 , … , y n ∈ R ,则
|
x
1
y
1
+
⋯
+
x
n
y
n
|
2
≤
(
x
1
2
+
⋯
+
x
n
2
)
(
y
1
2
+
⋯
+
y
n
2
)
.
x
1
y
1
+
⋯
+
x
n
y
n
2
≤
x
1
2
+
⋯
+
x
n
2
y
1
2
+
⋯
+
y
n
2
.
|x_(1)y_(1)+cdots+x_(n)y_(n)|^(2) <= (x_(1)^(2)+cdots+x_(n)^(2))(y_(1)^(2)+cdots+y_(n)^(2)). \left|x_{1} y_{1}+\cdots+x_{n} y_{n}\right|^{2} \leq\left(x_{1}^{2}+\cdots+x_{n}^{2}\right)\left(y_{1}^{2}+\cdots+y_{n}{ }^{2}\right) . | x 1 y 1 + ⋯ + x n y n | 2 ≤ ( x 1 2 + ⋯ + x n 2 ) ( y 1 2 + ⋯ + y n 2 ) .
(b) 若
f
,
g
f
,
g
f,g f, g f , g 均为
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的实值连续函数, 则
|
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
|
2
≤
(
∫
−
1
1
(
f
(
x
)
)
2
d
x
)
(
∫
−
1
1
(
g
(
x
)
)
2
d
x
)
.
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
2
≤
∫
−
1
1
(
f
(
x
)
)
2
d
x
∫
−
1
1
(
g
(
x
)
)
2
d
x
.
|int_(-1)^(1)f(x)g(x)dx|^(2) <= (int_(-1)^(1)(f(x))^(2)(d)x)(int_(-1)^(1)(g(x))^(2)(d)x). \left|\int_{-1}^{1} f(x) g(x) \mathrm{d} x\right|^{2} \leq\left(\int_{-1}^{1}(f(x))^{2} \mathrm{~d} x\right)\left(\int_{-1}^{1}(g(x))^{2} \mathrm{~d} x\right) . | ∫ − 1 1 f ( x ) g ( x ) d x | 2 ≤ ( ∫ − 1 1 ( f ( x ) ) 2 d x ) ( ∫ − 1 1 ( g ( x ) ) 2 d x ) .
下面的命题称为三角不等式,它有如下的几何解释:三角形任意一边的长度小于另外两边的长度之和。
三角不等式表明两点之间的最短路线是直线.
6.18 三角不等式
设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V . 则
‖
u
+
v
‖
≤
‖
u
‖
+
‖
v
‖
‖
u
+
v
‖
≤
‖
u
‖
+
‖
v
‖
||u+v|| <= ||u||+||v|| \|u+v\| \leq\|u\|+\|v\| ‖ u + v ‖ ≤ ‖ u ‖ + ‖ v ‖ . 等号成立当且仅当
u
,
v
u
,
v
u,v u, v u , v 之一是另一个的非负标量倍。
证明 我们有
‖
u
+
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
=
⟨
u
,
u
⟩
+
⟨
v
,
v
⟩
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
=
⟨
u
,
u
⟩
+
⟨
v
,
v
⟩
+
⟨
u
,
v
⟩
+
⟨
u
,
v
⟩
―
‖
u
+
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
=
⟨
u
,
u
⟩
+
⟨
v
,
v
⟩
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
=
⟨
u
,
u
⟩
+
⟨
v
,
v
⟩
+
⟨
u
,
v
⟩
+
⟨
u
,
v
⟩
¯
{:[||u+v||^(2)=(:u+v","u+v:)],[=(:u","u:)+(:v","v:)+(:u","v:)+(:v","u:)],[=(:u","u:)+(:v","v:)+(:u","v:)+ bar((:u,v:))]:} \begin{aligned}
\|u+v\|^{2} & =\langle u+v, u+v\rangle \\
& =\langle u, u\rangle+\langle v, v\rangle+\langle u, v\rangle+\langle v, u\rangle \\
& =\langle u, u\rangle+\langle v, v\rangle+\langle u, v\rangle+\overline{\langle u, v\rangle}
\end{aligned} ‖ u + v ‖ 2 = ⟨ u + v , u + v ⟩ = ⟨ u , u ⟩ + ⟨ v , v ⟩ + ⟨ u , v ⟩ + ⟨ v , u ⟩ = ⟨ u , u ⟩ + ⟨ v , v ⟩ + ⟨ u , v ⟩ + ⟨ u , v ⟩ ―
6.19
=
‖
u
‖
2
+
‖
v
‖
2
+
2
Re
⟨
u
,
v
⟩
=
‖
u
‖
2
+
‖
v
‖
2
+
2
Re
⟨
u
,
v
⟩
=||u||^(2)+||v||^(2)+2Re(:u,v:) =\|u\|^{2}+\|v\|^{2}+2 \operatorname{Re}\langle u, v\rangle = ‖ u ‖ 2 + ‖ v ‖ 2 + 2 Re ⟨ u , v ⟩
≤
‖
u
‖
2
+
‖
v
‖
2
+
2
|
⟨
u
,
v
⟩
|
≤
‖
u
‖
2
+
‖
v
‖
2
+
2
|
⟨
u
,
v
⟩
|
<= ||u||^(2)+||v||^(2)+2|(:u,v:)| \leq\|u\|^{2}+\|v\|^{2}+2|\langle u, v\rangle| ≤ ‖ u ‖ 2 + ‖ v ‖ 2 + 2 | ⟨ u , v ⟩ |
6.20
≤
‖
u
‖
2
+
‖
v
‖
2
+
2
‖
u
‖
‖
v
‖
=
(
‖
u
‖
+
‖
v
‖
)
2
≤
‖
u
‖
2
+
‖
v
‖
2
+
2
‖
u
‖
‖
v
‖
=
(
‖
u
‖
+
‖
v
‖
)
2
{:[ <= ||u||^(2)+||v||^(2)+2||u||||v||],[=(||u||+||v||)^(2)]:} \begin{aligned}
& \leq\|u\|^{2}+\|v\|^{2}+2\|u\|\|v\| \\
& =(\|u\|+\|v\|)^{2}
\end{aligned} ≤ ‖ u ‖ 2 + ‖ v ‖ 2 + 2 ‖ u ‖ ‖ v ‖ = ( ‖ u ‖ + ‖ v ‖ ) 2
其中 6.20 是利用柯西-施瓦茨不等式 6.15. 上面的不等式两端开平方即得所要证的不等式。
上面的证明表明,三角不等式是等式当且仅当 6.19 和 6.20 均为等式. 因此, 三角不等式是等式当且仅当
6.21
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
.
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
.
(:u,v:)=||u||||v||. \langle u, v\rangle=\|u\|\|v\| . ⟨ u , v ⟩ = ‖ u ‖ ‖ v ‖ .
请自行验证,如果
u
,
v
u
,
v
u,v u, v u , v 之一是另一个的非负标量倍,那么 6.21 成立. 反之,设 6.21成立,则由柯西-施瓦茨不等式 6.15 为等式的条件可知,
u
,
v
u
,
v
u,v u, v u , v 之一必定是另一个的标量倍,再由 6.21 知这个标量显然是非负的。
下面的命题称为平行四边形恒等式,因为它的几何解释为:在任意平行四边形中,对角线长度的平方和等于四条边长度的平方和。
平行四边形恒等式
6.22 平行四边形恒等式
设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V . 则
‖
u
+
v
‖
2
+
‖
u
−
v
‖
2
=
2
(
‖
u
‖
2
+
‖
v
‖
2
)
‖
u
+
v
‖
2
+
‖
u
−
v
‖
2
=
2
‖
u
‖
2
+
‖
v
‖
2
||u+v||^(2)+||u-v||^(2)=2(||u||^(2)+||v||^(2)) \|u+v\|^{2}+\|u-v\|^{2}=2\left(\|u\|^{2}+\|v\|^{2}\right) ‖ u + v ‖ 2 + ‖ u − v ‖ 2 = 2 ( ‖ u ‖ 2 + ‖ v ‖ 2 ) .
证明
‖
u
+
v
‖
2
+
‖
u
−
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
+
⟨
u
−
v
,
u
−
v
⟩
=
‖
u
‖
2
+
‖
v
‖
2
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
+
‖
u
‖
2
+
‖
v
‖
2
−
⟨
u
,
v
⟩
−
⟨
v
,
u
⟩
=
2
(
‖
u
‖
2
+
‖
v
‖
2
)
.
‖
u
+
v
‖
2
+
‖
u
−
v
‖
2
=
⟨
u
+
v
,
u
+
v
⟩
+
⟨
u
−
v
,
u
−
v
⟩
=
‖
u
‖
2
+
‖
v
‖
2
+
⟨
u
,
v
⟩
+
⟨
v
,
u
⟩
+
‖
u
‖
2
+
‖
v
‖
2
−
⟨
u
,
v
⟩
−
⟨
v
,
u
⟩
=
2
‖
u
‖
2
+
‖
v
‖
2
.
{:[||u+v||^(2)+||u-v||^(2)=(:u+v","u+v:)+(:u-v","u-v:)],[=||u||^(2)+||v||^(2)+(:u","v:)+(:v","u:)],[+||u||^(2)+||v||^(2)-(:u","v:)-(:v","u:)],[=2(||u||^(2)+||v||^(2)).]:} \begin{aligned}
\|u+v\|^{2}+\|u-v\|^{2}= & \langle u+v, u+v\rangle+\langle u-v, u-v\rangle \\
= & \|u\|^{2}+\|v\|^{2}+\langle u, v\rangle+\langle v, u\rangle \\
& +\|u\|^{2}+\|v\|^{2}-\langle u, v\rangle-\langle v, u\rangle \\
= & 2\left(\|u\|^{2}+\|v\|^{2}\right) .
\end{aligned} ‖ u + v ‖ 2 + ‖ u − v ‖ 2 = ⟨ u + v , u + v ⟩ + ⟨ u − v , u − v ⟩ = ‖ u ‖ 2 + ‖ v ‖ 2 + ⟨ u , v ⟩ + ⟨ v , u ⟩ + ‖ u ‖ 2 + ‖ v ‖ 2 − ⟨ u , v ⟩ − ⟨ v , u ⟩ = 2 ( ‖ u ‖ 2 + ‖ v ‖ 2 ) .
2010 年, 法学教授理查德 • 弗里德曼上诉到最高法院的一个案子:
弗里德曼先生:我认为那个议题和这个议题完全正交.
因为州政府承认——
罗伯茨首席大法官:对不起。完全什么?
弗里德曼先生:正交的.直角的.不相干的.无关的.
罗伯茨首席大法官:哦。
斯卡利亚大法官:那个形容词是什么?我喜欢它。
弗里德曼先生:正交的。
罗伯茨首席大法官:正交的。
弗里德曼先生:对,对。
斯卡利亚大法官:正交的,嚯。(大笑.)
肯尼迪大法官:我意识到这个案子给我们提出了一个问题。(大笑.)
习题 6.
1 证明将
(
(
x
1
,
x
2
)
,
(
y
1
,
y
2
)
)
∈
R
2
×
R
2
x
1
,
x
2
,
y
1
,
y
2
∈
R
2
×
R
2
((x_(1),x_(2)),(y_(1),y_(2)))inR^(2)xxR^(2) \left(\left(x_{1}, x_{2}\right),\left(y_{1}, y_{2}\right)\right) \in \mathbf{R}^{2} \times \mathbf{R}^{2} ( ( x 1 , x 2 ) , ( y 1 , y 2 ) ) ∈ R 2 × R 2 变为
|
x
1
y
1
|
+
|
x
2
y
2
|
x
1
y
1
+
x
2
y
2
|x_(1)y_(1)|+|x_(2)y_(2)| \left|x_{1} y_{1}\right|+\left|x_{2} y_{2}\right| | x 1 y 1 | + | x 2 y 2 | 的函数不是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 上的内积。
2 证明将
(
(
x
1
,
x
2
,
x
3
)
,
(
y
1
,
y
2
,
y
3
)
)
∈
R
3
×
R
3
x
1
,
x
2
,
x
3
,
y
1
,
y
2
,
y
3
∈
R
3
×
R
3
((x_(1),x_(2),x_(3)),(y_(1),y_(2),y_(3)))inR^(3)xxR^(3) \left(\left(x_{1}, x_{2}, x_{3}\right),\left(y_{1}, y_{2}, y_{3}\right)\right) \in \mathbf{R}^{3} \times \mathbf{R}^{3} ( ( x 1 , x 2 , x 3 ) , ( y 1 , y 2 , y 3 ) ) ∈ R 3 × R 3 变为
x
1
y
1
+
x
3
y
3
x
1
y
1
+
x
3
y
3
x_(1)y_(1)+x_(3)y_(3) x_{1} y_{1}+x_{3} y_{3} x 1 y 1 + x 3 y 3 的函数不是
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 上的内积。
3 设
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 且
V
≠
{
0
}
V
≠
{
0
}
V!={0} V \neq\{0\} V ≠ { 0 } 。将内积定义 6.3 中的正性条件(对所有
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
⟨
v
,
v
⟩
≥
0
⟨
v
,
v
⟩
≥
0
(:v,v:) >= 0 \langle v, v\rangle \geq 0 ⟨ v , v ⟩ ≥ 0 )改为对某个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 有
⟨
v
,
v
⟩
>
0
⟨
v
,
v
⟩
>
0
(:v,v:) > 0 \langle v, v\rangle>0 ⟨ v , v ⟩ > 0 。证明定义中的这个变化并不改变定义了
V
V
V V V 上内积的那些从
V
×
V
V
×
V
V xx V V \times V V × V 到
R
R
R \mathbf{R} R 的函数所构成的集合。
4 设
V
V
V V V 是一个实内积空间。
(a) 证明对所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
+
v
,
u
−
v
⟩
=
‖
u
‖
2
−
‖
v
‖
2
⟨
u
+
v
,
u
−
v
⟩
=
‖
u
‖
2
−
‖
v
‖
2
(:u+v,u-v:)=||u||^(2)-||v||^(2) \langle u+v, u-v\rangle=\|u\|^{2}-\|v\|^{2} ⟨ u + v , u − v ⟩ = ‖ u ‖ 2 − ‖ v ‖ 2 .
(b) 证明若
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 具有相同的范数, 则
u
+
v
u
+
v
u+v u+v u + v 正交于
u
−
v
u
−
v
u-v u-v u − v .
(c) 利用 (b) 证明菱形的对角线相互垂直.
5 设
V
V
V V V 是有限维向量空间,并设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
‖
T
v
‖
≤
‖
v
‖
‖
T
v
‖
≤
‖
v
‖
||Tv|| <= ||v|| \|T v\| \leq\|v\| ‖ T v ‖ ≤ ‖ v ‖ . 证明
(
T
−
2
I
)
(
T
−
2
I
)
(T-sqrt2I) (T-\sqrt{2} I) ( T − 2 I ) 是可逆的。
6 设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V . 证明
⟨
u
,
v
⟩
=
0
⟨
u
,
v
⟩
=
0
(:u,v:)=0 \langle u, v\rangle=0 ⟨ u , v ⟩ = 0 当且仅当对所有
a
∈
F
a
∈
F
a inF a \in \mathbf{F} a ∈ F 均有
‖
u
‖
≤
‖
u
+
a
v
‖
‖
u
‖
≤
‖
u
+
a
v
‖
||u|| <= ||u+av|| \|u\| \leq\|u+a v\| ‖ u ‖ ≤ ‖ u + a v ‖ .
7 设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 。证明
‖
a
u
+
b
v
‖
=
‖
b
u
+
a
v
‖
‖
a
u
+
b
v
‖
=
‖
b
u
+
a
v
‖
||au+bv||=||bu+av|| \|a u+b v\|=\|b u+a v\| ‖ a u + b v ‖ = ‖ b u + a v ‖ 对所有
a
,
b
∈
R
a
,
b
∈
R
a,b inR a, b \in \mathbf{R} a , b ∈ R 均成立当且仅当
‖
u
‖
=
‖
v
‖
‖
u
‖
=
‖
v
‖
||u||=||v|| \|u\|=\|v\| ‖ u ‖ = ‖ v ‖ .
8 设
u
,
v
∈
V
,
‖
u
‖
=
‖
v
‖
=
1
u
,
v
∈
V
,
‖
u
‖
=
‖
v
‖
=
1
u,v in V,||u||=||v||=1 u, v \in V,\|u\|=\|v\|=1 u , v ∈ V , ‖ u ‖ = ‖ v ‖ = 1 且
⟨
u
,
v
⟩
=
1
⟨
u
,
v
⟩
=
1
(:u,v:)=1 \langle u, v\rangle=1 ⟨ u , v ⟩ = 1 . 证明
u
=
v
u
=
v
u=v u=v u = v 。
9 设
u
,
v
∈
V
,
‖
u
‖
≤
1
u
,
v
∈
V
,
‖
u
‖
≤
1
u,v in V,||u|| <= 1 u, v \in V,\|u\| \leq 1 u , v ∈ V , ‖ u ‖ ≤ 1 且
‖
v
‖
≤
1
‖
v
‖
≤
1
||v|| <= 1 \|v\| \leq 1 ‖ v ‖ ≤ 1 。证明
1
−
‖
u
‖
2
1
−
‖
v
‖
2
≤
1
−
|
⟨
u
,
v
⟩
|
1
−
‖
u
‖
2
1
−
‖
v
‖
2
≤
1
−
|
⟨
u
,
v
⟩
|
sqrt(1-||u||^(2))sqrt(1-||v||^(2)) <= 1-|(:u,v:)| \sqrt{1-\|u\|^{2}} \sqrt{1-\|v\|^{2}} \leq 1-|\langle u, v\rangle| 1 − ‖ u ‖ 2 1 − ‖ v ‖ 2 ≤ 1 − | ⟨ u , v ⟩ | .
10 求向量
u
,
v
∈
R
2
u
,
v
∈
R
2
u,v inR^(2) u, v \in \mathbf{R}^{2} u , v ∈ R 2 使得
u
u
u u u 是
(
1
,
3
)
(
1
,
3
)
(1,3) (1,3) ( 1 , 3 ) 的标量倍,
v
v
v v v 正交于
(
1
,
3
)
(
1
,
3
)
(1,3) (1,3) ( 1 , 3 ) 且
(
1
,
2
)
=
u
+
v
(
1
,
2
)
=
u
+
v
(1,2)=u+v (1,2)=u+v ( 1 , 2 ) = u + v .
11 证明对所有正数
a
,
b
,
c
,
d
a
,
b
,
c
,
d
a,b,c,d a, b, c, d a , b , c , d 均有
16
≤
(
a
+
b
+
c
+
d
)
(
1
a
+
1
b
+
1
c
+
1
d
)
16
≤
(
a
+
b
+
c
+
d
)
1
a
+
1
b
+
1
c
+
1
d
16 <= (a+b+c+d)((1)/(a)+(1)/(b)+(1)/(c)+(1)/(d)) 16 \leq(a+b+c+d)\left(\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}\right) 16 ≤ ( a + b + c + d ) ( 1 a + 1 b + 1 c + 1 d ) .
12 证明对所有正整数
n
n
n n n 和实数
x
1
,
…
,
x
n
x
1
,
…
,
x
n
x_(1),dots,x_(n) x_{1}, \ldots, x_{n} x 1 , … , x n 均有
(
x
1
+
⋯
+
x
n
)
2
≤
n
(
x
1
2
+
⋯
+
x
n
2
)
x
1
+
⋯
+
x
n
2
≤
n
x
1
2
+
⋯
+
x
n
2
(x_(1)+cdots+x_(n))^(2) <= n(x_(1)^(2)+cdots+x_(n)^(2)) \left(x_{1}+\cdots+x_{n}\right)^{2} \leq n\left(x_{1}{ }^{2}+\cdots+x_{n}{ }^{2}\right) ( x 1 + ⋯ + x n ) 2 ≤ n ( x 1 2 + ⋯ + x n 2 ) .
13 设
u
,
v
u
,
v
u,v u, v u , v 是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 中的非零向量。证明
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
cos
θ
⟨
u
,
v
⟩
=
‖
u
‖
‖
v
‖
cos
θ
(:u,v:)=||u||||v||cos theta \langle u, v\rangle=\|u\|\|v\| \cos \theta ⟨ u , v ⟩ = ‖ u ‖ ‖ v ‖ cos θ , 其中
θ
θ
theta \theta θ 是
u
u
u u u 和
v
v
v v v 的夹角 (将
u
u
u u u 和
v
v
v v v 看作始于原点的箭头)。
提示:画出
u
、
v
u
、
v
u、v u 、 v 、 u 、 v 和
u
−
v
u
−
v
u-v u-v u − v 形成的三角形,然后利用余弦定理。
14
R
2
14
R
2
14R^(2) 14 \mathbf{R}^{2} 14 R 2 或
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中两个向量(视为始于原点的箭头)的夹角可以用几何的方法来定义。但是对
n
>
3
,
R
n
n
>
3
,
R
n
n > 3,R^(n) n>3, \mathbf{R}^{n} n > 3 , R n 中的几何是不明确的。所以两个非零向量
x
,
y
∈
R
n
x
,
y
∈
R
n
x,y inR^(n) x, y \in \mathbf{R}^{n} x , y ∈ R n 的夹角定义为
arccos
⟨
x
,
y
⟩
‖
x
‖
‖
y
‖
arccos
⟨
x
,
y
⟩
‖
x
‖
‖
y
‖
arccos(((:x,y:))/(||x||||y||)) \arccos \frac{\langle x, y\rangle}{\|x\|\|y\|} arccos ⟨ x , y ⟩ ‖ x ‖ ‖ y ‖ ,此定义的动机来自于上题。解释一下为什么证明上述定义有意义需要用到柯西一施瓦茨不等式。
15 证明对所有实数
a
1
,
…
,
a
n
a
1
,
…
,
a
n
a_(1),dots,a_(n) a_{1}, \ldots, a_{n} a 1 , … , a n 和
b
1
,
…
,
b
n
b
1
,
…
,
b
n
b_(1),dots,b_(n) b_{1}, \ldots, b_{n} b 1 , … , b n 均有
(
∑
j
=
1
n
a
j
b
j
)
2
≤
(
∑
j
=
1
n
j
a
j
2
)
(
∑
j
=
1
n
b
j
2
j
)
∑
j
=
1
n
a
j
b
j
2
≤
∑
j
=
1
n
j
a
j
2
∑
j
=
1
n
b
j
2
j
(sum_(j=1)^(n)a_(j)b_(j))^(2) <= (sum_(j=1)^(n)ja_(j)^(2))(sum_(j=1)^(n)(b_(j)^(2))/(j)) \left(\sum_{j=1}^{n} a_{j} b_{j}\right)^{2} \leq\left(\sum_{j=1}^{n} j a_{j}^{2}\right)\left(\sum_{j=1}^{n} \frac{b_{j}^{2}}{j}\right) ( ∑ j = 1 n a j b j ) 2 ≤ ( ∑ j = 1 n j a j 2 ) ( ∑ j = 1 n b j 2 j )
16 设
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 使得
‖
u
‖
=
3
,
‖
u
+
v
‖
=
4
,
‖
u
−
v
‖
=
6
‖
u
‖
=
3
,
‖
u
+
v
‖
=
4
,
‖
u
−
v
‖
=
6
||u||=3,||u+v||=4,||u-v||=6 \|u\|=3,\|u+v\|=4,\|u-v\|=6 ‖ u ‖ = 3 , ‖ u + v ‖ = 4 , ‖ u − v ‖ = 6 .
‖
v
‖
‖
v
‖
||v|| \|v\| ‖ v ‖ 等于多少?
17 证明或反驳:
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 上有一个内积使得该内积确定的范数为:对所有
(
x
,
y
)
∈
R
2
(
x
,
y
)
∈
R
2
(x,y)inR^(2) (x, y) \in \mathbf{R}^{2} ( x , y ) ∈ R 2 有
‖
(
x
,
y
)
‖
=
max
{
|
x
|
,
|
y
|
}
‖
(
x
,
y
)
‖
=
max
{
|
x
|
,
|
y
|
}
||(x,y)||=max{|x|,|y|} \|(x, y)\|=\max \{|x|,|y|\} ‖ ( x , y ) ‖ = max { | x | , | y | } .
18 设
p
>
0
p
>
0
p > 0 p>0 p > 0 . 证明
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 上有一个内积使得该内积确定的范数为
对所有
(
x
,
y
)
∈
R
2
有
‖
(
x
,
y
)
‖
=
(
|
x
|
p
+
|
y
|
p
)
1
/
p
对所有
(
x
,
y
)
∈
R
2
有
‖
(
x
,
y
)
‖
=
|
x
|
p
+
|
y
|
p
1
/
p
" 对所有 "(x,y)inR^(2)" 有 "||(x,y)||=(|x|^(p)+|y|^(p))^(1//p) \text { 对所有 }(x, y) \in \mathbf{R}^{2} \text { 有 }\|(x, y)\|=\left(|x|^{p}+|y|^{p}\right)^{1 / p} 对 所 有 有 对所有 ( x , y ) ∈ R 2 有 ‖ ( x , y ) ‖ = ( | x | p + | y | p ) 1 / p
当且仅当
p
=
2
p
=
2
p=2 p=2 p = 2 .
19 设
V
V
V V V 是实内积空间。证明对所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
,
v
⟩
=
‖
u
+
v
‖
2
−
‖
u
−
v
‖
2
4
⟨
u
,
v
⟩
=
‖
u
+
v
‖
2
−
‖
u
−
v
‖
2
4
(:u,v:)=(||u+v||^(2)-||u-v||^(2))/(4) \langle u, v\rangle=\frac{\|u+v\|^{2}-\|u-v\|^{2}}{4} ⟨ u , v ⟩ = ‖ u + v ‖ 2 − ‖ u − v ‖ 2 4
20 设
V
V
V V V 是复内积空间。证明对所有
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 均有
⟨
u
,
v
⟩
=
‖
u
+
v
‖
2
−
‖
u
−
v
‖
2
+
‖
u
+
i
v
‖
2
i
−
‖
u
−
i
v
‖
2
i
4
⟨
u
,
v
⟩
=
‖
u
+
v
‖
2
−
‖
u
−
v
‖
2
+
‖
u
+
i
v
‖
2
i
−
‖
u
−
i
v
‖
2
i
4
(:u,v:)=(||u+v||^(2)-||u-v||^(2)+||u+iv||^(2)i-||u-iv||^(2)i)/(4) \langle u, v\rangle=\frac{\|u+v\|^{2}-\|u-v\|^{2}+\|u+\mathrm{i} v\|^{2} \mathrm{i}-\|u-\mathrm{i} v\|^{2} \mathrm{i}}{4} ⟨ u , v ⟩ = ‖ u + v ‖ 2 − ‖ u − v ‖ 2 + ‖ u + i v ‖ 2 i − ‖ u − i v ‖ 2 i 4
21 向量空间
U
U
U U U 上的范数是满足以下条件的函数
‖
‖
:
U
→
[
0
,
∞
)
:
‖
u
‖
=
0
‖
‖
:
U
→
[
0
,
∞
)
:
‖
u
‖
=
0
||||:U rarr[0,oo):||u||=0 \|\|: U \rightarrow[0, \infty):\| u\|=0 ‖ ‖ : U → [ 0 , ∞ ) : ‖ u ‖ = 0 当且仅当
u
=
0
u
=
0
u=0 u=0 u = 0 , 对所有
α
∈
F
α
∈
F
alpha inF \alpha \in \mathbf{F} α ∈ F 和
u
∈
U
u
∈
U
u in U u \in U u ∈ U 均有
‖
α
u
‖
=
|
α
|
‖
u
‖
‖
α
u
‖
=
|
α
|
‖
u
‖
||alpha u||=|alpha|||u|| \|\alpha u\|=|\alpha|\|u\| ‖ α u ‖ = | α | ‖ u ‖ ,对所有
u
,
v
∈
U
u
,
v
∈
U
u,v in U u, v \in U u , v ∈ U 均有
‖
u
+
v
‖
≤
‖
u
‖
+
‖
v
‖
‖
u
+
v
‖
≤
‖
u
‖
+
‖
v
‖
||u+v|| <= ||u||+||v|| \|u+v\| \leq\|u\|+\|v\| ‖ u + v ‖ ≤ ‖ u ‖ + ‖ v ‖ . 证明满足平行四边形恒等式的范数均来自于内积(也就是说:若
‖
‖
‖
‖
|||| \|\| ‖ ‖ 是
U
U
U U U 上的满足平行四边形恒等式的范数,则有
U
U
U U U 上的内积 〈,〉使得对所有
u
∈
U
u
∈
U
u in U u \in U u ∈ U 均有
‖
u
‖
=
⟨
u
,
u
⟩
1
/
2
‖
u
‖
=
⟨
u
,
u
⟩
1
/
2
||u||=(:u,u:)^(1//2) \|u\|=\langle u, u\rangle^{1 / 2} ‖ u ‖ = ⟨ u , u ⟩ 1 / 2 )。
22 证明平均数的平方小于等于平方的平均数. 更确切地说, 若
a
1
,
…
,
a
n
∈
R
a
1
,
…
,
a
n
∈
R
a_(1),dots,a_(n)inR a_{1}, \ldots, a_{n} \in \mathbf{R} a 1 , … , a n ∈ R , 则
a
1
,
…
,
a
n
a
1
,
…
,
a
n
a_(1),dots,a_(n) a_{1}, \ldots, a_{n} a 1 , … , a n 的平均数的平方小于等于
a
1
2
,
…
,
a
n
2
a
1
2
,
…
,
a
n
2
a_(1)^(2),dots,a_(n)^(2) a_{1}{ }^{2}, \ldots, a_{n}{ }^{2} a 1 2 , … , a n 2 的平均数。
23 设
V
1
,
…
,
V
m
V
1
,
…
,
V
m
V_(1),dots,V_(m) V_{1}, \ldots, V_{m} V 1 , … , V m 均为内积空间。证明等式
⟨
(
u
1
,
…
,
u
m
)
,
(
v
1
,
…
,
v
m
)
⟩
=
⟨
u
1
,
v
1
⟩
+
⋯
+
⟨
u
m
,
v
m
⟩
u
1
,
…
,
u
m
,
v
1
,
…
,
v
m
=
u
1
,
v
1
+
⋯
+
u
m
,
v
m
(:(u_(1),dots,u_(m)),(v_(1),dots,v_(m)):)=(:u_(1),v_(1):)+cdots+(:u_(m),v_(m):) \left\langle\left(u_{1}, \ldots, u_{m}\right),\left(v_{1}, \ldots, v_{m}\right)\right\rangle=\left\langle u_{1}, v_{1}\right\rangle+\cdots+\left\langle u_{m}, v_{m}\right\rangle ⟨ ( u 1 , … , u m ) , ( v 1 , … , v m ) ⟩ = ⟨ u 1 , v 1 ⟩ + ⋯ + ⟨ u m , v m ⟩
定义了
V
1
×
⋯
×
V
m
V
1
×
⋯
×
V
m
V_(1)xx cdots xxV_(m) V_{1} \times \cdots \times V_{m} V 1 × ⋯ × V m 上的内积。
在上面表达式的右端,
⟨
u
1
,
v
1
⟩
u
1
,
v
1
(:u_(1),v_(1):) \left\langle u_{1}, v_{1}\right\rangle ⟨ u 1 , v 1 ⟩ 表示
V
1
V
1
V_(1) V_{1} V 1 上的内积,
…
,
⟨
u
m
,
v
m
⟩
…
,
u
m
,
v
m
dots,(:u_(m),v_(m):) \ldots,\left\langle u_{m}, v_{m}\right\rangle … , ⟨ u m , v m ⟩ 表示
V
m
V
m
V_(m) V_{m} V m 上的内积。虽然这里使用了相同的记号,但各个空间
V
1
,
…
,
V
m
V
1
,
…
,
V
m
V_(1),dots,V_(m) V_{1}, \ldots, V_{m} V 1 , … , V m 可以有不同的内积。
24 设
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 是
V
V
V V V 上的一个单的算子。定义
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 如下:对
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 有
⟨
u
,
v
⟩
1
=
⟨
u
,
v
⟩
1
=
(:u,v:)_(1)= \langle u, v\rangle_{1}= ⟨ u , v ⟩ 1 =
⟨
S
u
,
S
v
⟩
⟨
S
u
,
S
v
⟩
(:Su,Sv:) \langle S u, S v\rangle ⟨ S u , S v ⟩ 。证明
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 是
V
V
V V V 上的内积。
25 设
S
∈
L
(
V
)
S
∈
L
(
V
)
S inL(V) S \in \mathcal{L}(V) S ∈ L ( V ) 不是单的. 如上题那样定义
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 . 说明为什么
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 不是
V
V
V V V 上的内积。
26 设
f
,
g
f
,
g
f,g f, g f , g 是
R
R
R \mathbf{R} R 到
R
n
R
n
R^(n) \mathbf{R}^{n} R n 的可微函数。
(a) 证明
⟨
f
(
t
)
,
g
(
t
)
⟩
′
=
⟨
f
′
(
t
)
,
g
(
t
)
⟩
+
⟨
f
(
t
)
,
g
′
(
t
)
⟩
⟨
f
(
t
)
,
g
(
t
)
⟩
′
=
f
′
(
t
)
,
g
(
t
)
+
f
(
t
)
,
g
′
(
t
)
(:f(t),g(t):)^(')=(:f^(')(t),g(t):)+(:f(t),g^(')(t):) \langle f(t), g(t)\rangle^{\prime}=\left\langle f^{\prime}(t), g(t)\right\rangle+\left\langle f(t), g^{\prime}(t)\right\rangle ⟨ f ( t ) , g ( t ) ⟩ ′ = ⟨ f ′ ( t ) , g ( t ) ⟩ + ⟨ f ( t ) , g ′ ( t ) ⟩ .
(b) 设
c
>
0
c
>
0
c > 0 c>0 c > 0 且对每个
t
∈
R
t
∈
R
t inR t \in \mathbf{R} t ∈ R 均有
‖
f
(
t
)
‖
=
c
‖
f
(
t
)
‖
=
c
||f(t)||=c \|f(t)\|=c ‖ f ( t ) ‖ = c 。证明对每个
t
∈
R
t
∈
R
t inR t \in \mathbf{R} t ∈ R 均有
⟨
f
′
(
t
)
,
f
(
t
)
⟩
=
0
f
′
(
t
)
,
f
(
t
)
=
0
(:f^(')(t),f(t):)=0 \left\langle f^{\prime}(t), f(t)\right\rangle=0 ⟨ f ′ ( t ) , f ( t ) ⟩ = 0 .
(c) 利用
R
n
R
n
R^(n) \mathbf{R}^{n} R n 中以原点为中心的球面上的曲线的切向量给出 (b) 中结论的几何解释。
在本题中,函数
f
:
R
→
R
n
f
:
R
→
R
n
f:RrarrR^(n) f: \mathbf{R} \rightarrow \mathbf{R}^{n} f : R → R n 称为是可微的是指存在
R
R
R \mathbf{R} R 到
R
R
R \mathbf{R} R 的可微函数
f
1
,
…
,
f
n
f
1
,
…
,
f
n
f_(1),dots,f_(n) f_{1}, \ldots, f_{n} f 1 , … , f n 使得对每个
t
∈
R
t
∈
R
t inR t \in \mathbf{R} t ∈ R 均有
f
(
t
)
=
(
f
1
(
t
)
,
…
,
f
n
(
t
)
)
f
(
t
)
=
f
1
(
t
)
,
…
,
f
n
(
t
)
f(t)=(f_(1)(t),dots,f_(n)(t)) f(t)=\left(f_{1}(t), \ldots, f_{n}(t)\right) f ( t ) = ( f 1 ( t ) , … , f n ( t ) ) 。另外, 对每个
t
∈
R
t
∈
R
t inR t \in \mathbf{R} t ∈ R , 导数
f
′
(
t
)
∈
R
n
f
′
(
t
)
∈
R
n
f^(')(t)inR^(n) f^{\prime}(t) \in \mathbf{R}^{n} f ′ ( t ) ∈ R n 定义为
f
′
(
t
)
=
(
f
1
′
(
t
)
,
…
,
f
n
′
(
t
)
)
f
′
(
t
)
=
f
1
′
(
t
)
,
…
,
f
n
′
(
t
)
f^(')(t)=(f_(1)^(')(t),dots,f_(n)^(')(t)) f^{\prime}(t)=\left(f_{1}{ }^{\prime}(t), \ldots, f_{n}{ }^{\prime}(t)\right) f ′ ( t ) = ( f 1 ′ ( t ) , … , f n ′ ( t ) ) .
27 设
u
,
v
,
w
∈
V
u
,
v
,
w
∈
V
u,v,w in V u, v, w \in V u , v , w ∈ V 。证明
‖
w
−
1
2
(
u
+
v
)
‖
2
=
‖
w
−
u
‖
2
+
‖
w
−
v
‖
2
2
−
‖
u
−
v
‖
2
4
w
−
1
2
(
u
+
v
)
2
=
‖
w
−
u
‖
2
+
‖
w
−
v
‖
2
2
−
‖
u
−
v
‖
2
4
||w-(1)/(2)(u+v)||^(2)=(||w-u||^(2)+||w-v||^(2))/(2)-(||u-v||^(2))/(4) \left\|w-\frac{1}{2}(u+v)\right\|^{2}=\frac{\|w-u\|^{2}+\|w-v\|^{2}}{2}-\frac{\|u-v\|^{2}}{4} ‖ w − 1 2 ( u + v ) ‖ 2 = ‖ w − u ‖ 2 + ‖ w − v ‖ 2 2 − ‖ u − v ‖ 2 4
28 设
C
C
C C C 是
V
V
V V V 的子集使得
u
,
v
∈
C
u
,
v
∈
C
u,v in C u, v \in C u , v ∈ C 蕴涵
1
2
(
u
+
v
)
∈
C
1
2
(
u
+
v
)
∈
C
(1)/(2)(u+v)in C \frac{1}{2}(u+v) \in C 1 2 ( u + v ) ∈ C . 设
w
∈
V
w
∈
V
w in V w \in V w ∈ V . 证明
C
C
C C C 中距离
w
w
w w w 最近的点至多有一个. 也就是说至多有一个点
u
∈
C
u
∈
C
u in C u \in C u ∈ C 使得对所有
v
∈
C
v
∈
C
v in C v \in C v ∈ C 均有
‖
w
−
u
‖
≤
‖
w
−
v
‖
‖
w
−
u
‖
≤
‖
w
−
v
‖
||w-u|| <= ||w-v|| \|w-u\| \leq\|w-v\| ‖ w − u ‖ ≤ ‖ w − v ‖ .
提示:利用上题。
29 对于
u
,
v
∈
V
u
,
v
∈
V
u,v in V u, v \in V u , v ∈ V 定义
d
(
u
,
v
)
=
‖
u
−
v
‖
d
(
u
,
v
)
=
‖
u
−
v
‖
d(u,v)=||u-v|| d(u, v)=\|u-v\| d ( u , v ) = ‖ u − v ‖ .
(a) 证明
d
d
d d d 是
V
V
V V V 上的一个度量.
(b) 证明若
V
V
V V V 是有限维的, 则
d
d
d d d 是
V
V
V V V 上的完备度量(意思是每个柯西序列均收敛)。
(c) 证明
V
V
V V V 的每个有限维子空间都是
V
V
V V V 的(关于度量
d
d
d d d 的)闭子集.
30 固定正整数
n
.
R
n
n
.
R
n
n.R^(n) n . \mathbf{R}^{n} n . R n 上二次可微函数
p
p
p p p 的拉普拉斯算子
Δ
p
Δ
p
Delta p \Delta p Δ p 是
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的函数,定义如下:
Δ
p
=
∂
2
p
∂
x
1
2
+
⋯
+
∂
2
p
∂
x
n
2
Δ
p
=
∂
2
p
∂
x
1
2
+
⋯
+
∂
2
p
∂
x
n
2
Delta p=(del^(2)p)/(delx_(1)^(2))+cdots+(del^(2)p)/(delx_(n)^(2)) \Delta p=\frac{\partial^{2} p}{\partial x_{1}^{2}}+\cdots+\frac{\partial^{2} p}{\partial x_{n}^{2}} Δ p = ∂ 2 p ∂ x 1 2 + ⋯ + ∂ 2 p ∂ x n 2
如果
Δ
p
=
0
Δ
p
=
0
Delta p=0 \Delta p=0 Δ p = 0 , 则称函数
p
p
p p p 是调和的.
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的多项式是形如
x
1
m
1
⋯
x
n
m
n
x
1
m
1
⋯
x
n
m
n
x_(1)^(m_(1))cdotsx_(n)^(m_(n)) x_{1}{ }^{m_{1}} \cdots x_{n}{ }^{m_{n}} x 1 m 1 ⋯ x n m n 的函数的线性组合,其中
m
1
,
…
,
m
n
m
1
,
…
,
m
n
m_(1),dots,m_(n) m_{1}, \ldots, m_{n} m 1 , … , m n 均为非负整数。
设
q
q
q q q 是
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的多项式。证明:存在
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的调和多项式
p
p
p p p 使得对每个满足
‖
x
‖
=
1
‖
x
‖
=
1
||x||=1 \|x\|=1 ‖ x ‖ = 1 的
x
∈
R
n
x
∈
R
n
x inR^(n) x \in \mathbf{R}^{n} x ∈ R n 均有
p
(
x
)
=
q
(
x
)
p
(
x
)
=
q
(
x
)
p(x)=q(x) p(x)=q(x) p ( x ) = q ( x ) 。
对于这道习题,需要用到的关于调和函数的唯一一个事实是:若
p
p
p p p 是
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的调和函数且对所有满足
‖
x
‖
=
1
‖
x
‖
=
1
||x||=1 \|x\|=1 ‖ x ‖ = 1 的
x
∈
R
n
x
∈
R
n
x inR^(n) x \in \mathbf{R}^{n} x ∈ R n 均有
p
(
x
)
=
0
p
(
x
)
=
0
p(x)=0 p(x)=0 p ( x ) = 0 ,则
p
=
0
p
=
0
p=0 p=0 p = 0 。
提示:一个合理的推测是,要找的调和多项式
p
p
p p p 形如
q
+
(
1
−
‖
x
‖
2
)
r
q
+
1
−
‖
x
‖
2
r
q+(1-||x||^(2))r q+\left(1-\|x\|^{2}\right) r q + ( 1 − ‖ x ‖ 2 ) r ,其中
r
r
r r r 是多项式. 在适当向量空间上定义算子
T
T
T T T :
Tr
=
Δ
(
(
1
−
‖
x
‖
2
)
r
)
Tr
=
Δ
1
−
‖
x
‖
2
r
Tr=Delta((1-||x||^(2))r) \operatorname{Tr}=\Delta\left(\left(1-\|x\|^{2}\right) r\right) Tr = Δ ( ( 1 − ‖ x ‖ 2 ) r )
再证
T
T
T T T 是单的, 因此是满的, 由此证明存在
R
n
R
n
R^(n) \mathbf{R}^{n} R n 上的多项式
r
r
r r r 使得
q
+
(
1
−
‖
x
‖
2
)
r
q
+
1
−
‖
x
‖
2
r
q+(1-||x||^(2))r q+\left(1-\|x\|^{2}\right) r q + ( 1 − ‖ x ‖ 2 ) r 是调和的。
31 使用内积证明阿波罗尼奥斯恒等式:在边长为
a
,
b
,
c
a
,
b
,
c
a,b,c a, b, c a , b , c 的三角形中, 设
d
d
d d d 是长度为
c
c
c c c 的边的中点到对顶点的线段的长度. 则
a
2
+
b
2
=
1
2
c
2
+
2
d
2
a
2
+
b
2
=
1
2
c
2
+
2
d
2
a^(2)+b^(2)=(1)/(2)c^(2)+2d^(2) a^{2}+b^{2}=\frac{1}{2} c^{2}+2 d^{2} a 2 + b 2 = 1 2 c 2 + 2 d 2
6.B 规范正交基
6.23 定义 规范正交的(orthonormal)
如果一个向量组中每个向量的范数都是 1 且与其他向量正交, 则称这个向量组是规范正交的。
也就是说,
V
V
V V V 上的向量组
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是规范正交的, 如果
⟨
e
j
,
e
k
⟩
=
{
1
,
若
j
=
k
,
0
,
若
j
≠
k
e
j
,
e
k
=
1
,
若
j
=
k
,
0
,
若
j
≠
k
(:e_(j),e_(k):)={[1","," 若 "j=k","],[0","," 若 "j!=k]:} \left\langle e_{j}, e_{k}\right\rangle= \begin{cases}1, & \text { 若 } j=k, \\ 0, & \text { 若 } j \neq k\end{cases} 若 若 ⟨ e j , e k ⟩ = { 1 , 若 j = k , 0 , 若 j ≠ k
6.24 例 规范正交组
(a)
F
n
F
n
F^(n) \mathrm{F}^{n} F n 的标准基是规范正交组.
(b)
(
1
3
,
1
3
,
1
3
)
,
(
−
1
2
,
1
2
,
0
)
1
3
,
1
3
,
1
3
,
−
1
2
,
1
2
,
0
((1)/(sqrt3),(1)/(sqrt3),(1)/(sqrt3)),(-(1)/(sqrt2),(1)/(sqrt2),0) \left(\frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}\right),\left(-\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0\right) ( 1 3 , 1 3 , 1 3 ) , ( − 1 2 , 1 2 , 0 ) 是
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 中的规范正交组.
(c)
(
1
3
,
1
3
,
1
3
)
,
(
−
1
2
,
1
2
,
0
)
,
(
1
6
,
1
6
,
−
2
6
)
1
3
,
1
3
,
1
3
,
−
1
2
,
1
2
,
0
,
1
6
,
1
6
,
−
2
6
((1)/(sqrt3),(1)/(sqrt3),(1)/(sqrt3)),(-(1)/(sqrt2),(1)/(sqrt2),0),((1)/(sqrt6),(1)/(sqrt6),-(2)/(sqrt6)) \left(\frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}, \frac{1}{\sqrt{3}}\right),\left(-\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0\right),\left(\frac{1}{\sqrt{6}}, \frac{1}{\sqrt{6}},-\frac{2}{\sqrt{6}}\right) ( 1 3 , 1 3 , 1 3 ) , ( − 1 2 , 1 2 , 0 ) , ( 1 6 , 1 6 , − 2 6 ) 是
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 中的规范正交组.
下面的命题表明规范正交组特别容易处理.
6.25 规范正交线性组合的范数
若
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
V
V
V V V 中的规范正交向量组, 则对所有
a
1
,
…
,
a
m
∈
F
a
1
,
…
,
a
m
∈
F
a_(1),dots,a_(m)inF a_{1}, \ldots, a_{m} \in \mathbf{F} a 1 , … , a m ∈ F 均有
‖
a
1
e
1
+
⋯
+
a
m
e
m
‖
2
=
|
a
1
|
2
+
⋯
+
|
a
m
|
2
a
1
e
1
+
⋯
+
a
m
e
m
2
=
a
1
2
+
⋯
+
a
m
2
||a_(1)e_(1)+cdots+a_(m)e_(m)||^(2)=|a_(1)|^(2)+cdots+|a_(m)|^(2) \left\|a_{1} e_{1}+\cdots+a_{m} e_{m}\right\|^{2}=\left|a_{1}\right|^{2}+\cdots+\left|a_{m}\right|^{2} ‖ a 1 e 1 + ⋯ + a m e m ‖ 2 = | a 1 | 2 + ⋯ + | a m | 2
证明 因为每个
e
j
e
j
e_(j) e_{j} e j 的范数都是 1, 通过反复使用勾股定理 6.13 容易证得.上述命题有如下重要推论。
6.26 规范正交组是线性无关的
每个规范正交向量组都是线性无关的.
证明 设
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
V
V
V V V 中的规范正交向量组, 并设
a
1
,
…
,
a
m
∈
F
a
1
,
…
,
a
m
∈
F
a_(1),dots,a_(m)inF a_{1}, \ldots, a_{m} \in \mathbf{F} a 1 , … , a m ∈ F 使得
a
1
e
1
+
⋯
+
a
m
e
m
=
0
a
1
e
1
+
⋯
+
a
m
e
m
=
0
a_(1)e_(1)+cdots+a_(m)e_(m)=0 a_{1} e_{1}+\cdots+a_{m} e_{m}=0 a 1 e 1 + ⋯ + a m e m = 0
则
|
a
1
|
2
+
⋯
+
|
a
m
|
2
=
0
a
1
2
+
⋯
+
a
m
2
=
0
|a_(1)|^(2)+cdots+|a_(m)|^(2)=0 \left|a_{1}\right|^{2}+\cdots+\left|a_{m}\right|^{2}=0 | a 1 | 2 + ⋯ + | a m | 2 = 0 (根据 6.25),这表明所有的
a
j
a
j
a_(j) a_{j} a j 均为 0 。因此
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是线性无关的。
6.27 定义 规范正交基(orthonormal basis)
V
V
V V V 的规范正交基是
V
V
V V V 中的规范正交向量组构成的基.
例如,
F
n
F
n
F^(n) \mathrm{F}^{n} F n 的标准基是规范正交基。
6.28 适当长度的规范正交组是规范正交基
V
V
V V V 中每个长度为
dim
V
dim
V
dim V \operatorname{dim} V dim V 的规范正交向量组都是
V
V
V V V 的规范正交基.
证明 由 6.26, 任何这样的组都一定是线性无关的. 又因为它具有适当的长度, 所以它一定是基(见2.39)。
6.29 例 证明
(
1
2
,
1
2
,
1
2
,
1
2
)
,
(
1
2
,
1
2
,
−
1
2
,
−
1
2
)
,
(
1
2
,
−
1
2
,
−
1
2
,
1
2
)
,
(
−
1
2
,
1
2
,
−
1
2
,
1
2
)
1
2
,
1
2
,
1
2
,
1
2
,
1
2
,
1
2
,
−
1
2
,
−
1
2
,
1
2
,
−
1
2
,
−
1
2
,
1
2
,
−
1
2
,
1
2
,
−
1
2
,
1
2
((1)/(2),(1)/(2),(1)/(2),(1)/(2)),((1)/(2),(1)/(2),-(1)/(2),-(1)/(2)),((1)/(2),-(1)/(2),-(1)/(2),(1)/(2)),(-(1)/(2),(1)/(2),-(1)/(2),(1)/(2)) \left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right),\left(\frac{1}{2}, \frac{1}{2},-\frac{1}{2},-\frac{1}{2}\right),\left(\frac{1}{2},-\frac{1}{2},-\frac{1}{2}, \frac{1}{2}\right),\left(-\frac{1}{2}, \frac{1}{2},-\frac{1}{2}, \frac{1}{2}\right) ( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , − 1 2 , − 1 2 ) , ( 1 2 , − 1 2 , − 1 2 , 1 2 ) , ( − 1 2 , 1 2 , − 1 2 , 1 2 )
是
F
4
F
4
F^(4) \mathbf{F}^{4} F 4 的规范正交基.
证明 我们有
‖
(
1
2
,
1
2
,
1
2
,
1
2
)
‖
=
(
1
2
)
2
+
(
1
2
)
2
+
(
1
2
)
2
+
(
1
2
)
2
=
1
1
2
,
1
2
,
1
2
,
1
2
=
1
2
2
+
1
2
2
+
1
2
2
+
1
2
2
=
1
||((1)/(2),(1)/(2),(1)/(2),(1)/(2))||=sqrt(((1)/(2))^(2)+((1)/(2))^(2)+((1)/(2))^(2)+((1)/(2))^(2))=1 \left\|\left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right)\right\|=\sqrt{\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}+\left(\frac{1}{2}\right)^{2}}=1 ‖ ( 1 2 , 1 2 , 1 2 , 1 2 ) ‖ = ( 1 2 ) 2 + ( 1 2 ) 2 + ( 1 2 ) 2 + ( 1 2 ) 2 = 1
类似地,上面的组中其余三个向量的范数也都是 1 .
我们还有
⟨
(
1
2
,
1
2
,
1
2
,
1
2
)
,
(
1
2
,
1
2
,
−
1
2
,
−
1
2
)
⟩
=
1
2
⋅
1
2
+
1
2
⋅
1
2
+
1
2
⋅
(
−
1
2
)
+
1
2
⋅
(
−
1
2
)
=
0
.
1
2
,
1
2
,
1
2
,
1
2
,
1
2
,
1
2
,
−
1
2
,
−
1
2
=
1
2
⋅
1
2
+
1
2
⋅
1
2
+
1
2
⋅
−
1
2
+
1
2
⋅
−
1
2
=
0
.
(:((1)/(2),(1)/(2),(1)/(2),(1)/(2)),((1)/(2),(1)/(2),-(1)/(2),-(1)/(2)):)=(1)/(2)*(1)/(2)+(1)/(2)*(1)/(2)+(1)/(2)*(-(1)/(2))+(1)/(2)*(-(1)/(2))=0. \left\langle\left(\frac{1}{2}, \frac{1}{2}, \frac{1}{2}, \frac{1}{2}\right),\left(\frac{1}{2}, \frac{1}{2},-\frac{1}{2},-\frac{1}{2}\right)\right\rangle=\frac{1}{2} \cdot \frac{1}{2}+\frac{1}{2} \cdot \frac{1}{2}+\frac{1}{2} \cdot\left(-\frac{1}{2}\right)+\frac{1}{2} \cdot\left(-\frac{1}{2}\right)=0 . ⟨ ( 1 2 , 1 2 , 1 2 , 1 2 ) , ( 1 2 , 1 2 , − 1 2 , − 1 2 ) ⟩ = 1 2 ⋅ 1 2 + 1 2 ⋅ 1 2 + 1 2 ⋅ ( − 1 2 ) + 1 2 ⋅ ( − 1 2 ) = 0 .
类似地,上面的组中任意两个不同的向量的内积都等于 0 。
因此上面的组是规范正交的。由于这是四维向量空间
F
4
F
4
F^(4) \mathbf{F}^{4} F 4 的一个长度为 4 的规范正交组,所以它是
F
4
F
4
F^(4) \mathbf{F}^{4} F 4 的规范正交基(由于 6.28)。
一般地, 给定
V
V
V V V 的基
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 和向量
v
∈
V
v
∈
V
v in V v \in V v ∈ V ,我们知道有标量
a
1
,
…
,
a
n
∈
F
a
1
,
…
,
a
n
∈
F
a_(1),dots,a_(n)inF a_{1}, \ldots, a_{n} \in \mathbf{F} a 1 , … , a n ∈ F 使得
v
=
a
1
e
1
+
⋯
+
a
n
e
n
v
=
a
1
e
1
+
⋯
+
a
n
e
n
v=a_(1)e_(1)+cdots+a_(n)e_(n) v=a_{1} e_{1}+\cdots+a_{n} e_{n} v = a 1 e 1 + ⋯ + a n e n
规范正交基的重要性主要缘于下面的命题。
对
V
V
V V V 的任意基求满足上述方程的
a
1
,
…
,
a
n
a
1
,
…
,
a
n
a_(1),dots,a_(n) a_{1}, \ldots, a_{n} a 1 , … , a n 可能是困难的。然而,以下命题表明对于规范正交基这很容易:取
a
j
=
⟨
v
,
e
j
⟩
a
j
=
v
,
e
j
a_(j)=(:v,e_(j):) a_{j}=\left\langle v, e_{j}\right\rangle a j = ⟨ v , e j ⟩ 即可.
6.30 将向量写成规范正交基的线性组合
设
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是
V
V
V V V 的规范正交基且
v
∈
V
v
∈
V
v in V v \in V v ∈ V . 则
v
=
⟨
v
,
e
1
⟩
e
1
+
⋯
+
⟨
v
,
e
n
⟩
e
n
v
=
v
,
e
1
e
1
+
⋯
+
v
,
e
n
e
n
v=(:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n) v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n} v = ⟨ v , e 1 ⟩ e 1 + ⋯ + ⟨ v , e n ⟩ e n
且
‖
v
‖
2
=
|
⟨
v
,
e
1
⟩
|
2
+
⋯
+
|
⟨
v
,
e
n
⟩
|
2
‖
v
‖
2
=
v
,
e
1
2
+
⋯
+
v
,
e
n
2
||v||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(n):)|^(2) \|v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{n}\right\rangle\right|^{2} ‖ v ‖ 2 = | ⟨ v , e 1 ⟩ | 2 + ⋯ + | ⟨ v , e n ⟩ | 2
证明 因为
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是
V
V
V V V 的基, 所以存在标量
a
1
,
…
,
a
n
a
1
,
…
,
a
n
a_(1),dots,a_(n) a_{1}, \ldots, a_{n} a 1 , … , a n 使得
v
=
a
1
e
1
+
⋯
+
a
n
e
n
v
=
a
1
e
1
+
⋯
+
a
n
e
n
v=a_(1)e_(1)+cdots+a_(n)e_(n) v=a_{1} e_{1}+\cdots+a_{n} e_{n} v = a 1 e 1 + ⋯ + a n e n
由于
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是规范正交的, 等式两端都和
e
j
e
j
e_(j) e_{j} e j 做内积得到
⟨
v
,
e
j
⟩
=
a
j
v
,
e
j
=
a
j
(:v,e_(j):)=a_(j) \left\langle v, e_{j}\right\rangle=a_{j} ⟨ v , e j ⟩ = a j . 于是 6.30的第一个等式成立。
由 6.30 的第一个等式和 6.25 立即可得 6.30 的第二个等式.
既然我们了解了规范正交基的用处,那么如何找到它们呢?例如,对于由区间
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的定积分所定义的内积(见 6.4(c)),
P
m
(
R
)
P
m
(
R
)
P_(m)(R) \mathcal{P}_{m}(\mathbf{R}) P m ( R ) 有规范正交基吗?下面的命题将会给出这些问题的答案。
丹麦数学家约根 • 格 拉姆 (1850-1916)和德国数学家埃哈德 • 施密特(1876-1959)普及了这种构造规范正交基的算法。
下面证明中用到的算法称为格拉姆-施密特过程。这种方法可以把一个线性无关组转化成与原来的组有相同张成空间的规范正交组.
6.31 格拉姆-施密特过程
设
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是
V
V
V V V 中的线性无关向量组。设
e
1
=
v
1
/
‖
v
1
‖
e
1
=
v
1
/
v
1
e_(1)=v_(1)//||v_(1)|| e_{1}=v_{1} /\left\|v_{1}\right\| e 1 = v 1 / ‖ v 1 ‖ 。对于
j
=
2
,
…
,
m
j
=
2
,
…
,
m
j=2,dots,m j=2, \ldots, m j = 2 , … , m ,定义
e
j
e
j
e_(j) e_{j} e j 如下:
e
j
=
v
j
−
⟨
v
j
,
e
1
⟩
e
1
−
⋯
−
⟨
v
j
,
e
j
−
1
⟩
e
j
−
1
‖
v
j
−
⟨
v
j
,
e
1
⟩
e
1
−
⋯
−
⟨
v
j
,
e
j
−
1
⟩
e
j
−
1
‖
e
j
=
v
j
−
v
j
,
e
1
e
1
−
⋯
−
v
j
,
e
j
−
1
e
j
−
1
v
j
−
v
j
,
e
1
e
1
−
⋯
−
v
j
,
e
j
−
1
e
j
−
1
e_(j)=(v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||) e_{j}=\frac{v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|} e j = v j − ⟨ v j , e 1 ⟩ e 1 − ⋯ − ⟨ v j , e j − 1 ⟩ e j − 1 ‖ v j − ⟨ v j , e 1 ⟩ e 1 − ⋯ − ⟨ v j , e j − 1 ⟩ e j − 1 ‖
则
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
V
V
V V V 中的规范正交组,使得对
j
=
1
,
…
,
m
j
=
1
,
…
,
m
j=1,dots,m j=1, \ldots, m j = 1 , … , m 有
span
(
v
1
,
…
,
v
j
)
=
span
(
e
1
,
…
,
e
j
)
span
v
1
,
…
,
v
j
=
span
e
1
,
…
,
e
j
span(v_(1),dots,v_(j))=span(e_(1),dots,e_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)=\operatorname{span}\left(e_{1}, \ldots, e_{j}\right) span ( v 1 , … , v j ) = span ( e 1 , … , e j )
证明 我们将对
j
j
j j j 用归纳法来证明结论成立. 首先
j
=
1
j
=
1
j=1 j=1 j = 1 时, 由
v
1
v
1
v_(1) v_{1} v 1 是
e
1
e
1
e_(1) e_{1} e 1 的正数倍知
span
(
v
1
)
=
span
(
e
1
)
span
v
1
=
span
e
1
span(v_(1))=span(e_(1)) \operatorname{span}\left(v_{1}\right)=\operatorname{span}\left(e_{1}\right) span ( v 1 ) = span ( e 1 ) .
设
1
<
j
<
m
1
<
j
<
m
1 < j < m 1<j<m 1 < j < m 并假设已经有
6.32
span
(
v
1
,
…
,
v
j
−
1
)
=
span
(
e
1
,
…
,
e
j
−
1
)
span
v
1
,
…
,
v
j
−
1
=
span
e
1
,
…
,
e
j
−
1
span(v_(1),dots,v_(j-1))=span(e_(1),dots,e_(j-1)) \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right)=\operatorname{span}\left(e_{1}, \ldots, e_{j-1}\right) span ( v 1 , … , v j − 1 ) = span ( e 1 , … , e j − 1 )
注意
v
j
∉
span
(
v
1
,
…
,
v
j
−
1
)
v
j
∉
span
v
1
,
…
,
v
j
−
1
v_(j)!in span(v_(1),dots,v_(j-1)) v_{j} \notin \operatorname{span}\left(v_{1}, \ldots, v_{j-1}\right) v j ∉ span ( v 1 , … , v j − 1 ) (因为
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是线性无关的)。于是
v
j
∉
span
(
e
1
,
…
v
j
∉
span
e
1
,
…
v_(j)!in span(e_(1),dots:} v_{j} \notin \operatorname{span}\left(e_{1}, \ldots\right. v j ∉ span ( e 1 , … ,,
e
j
−
1
e
j
−
1
e_(j-1) e_{j-1} e j − 1 ). 因此在 6.31 的
e
j
e
j
e_(j) e_{j} e j 定义中的分母不为 0 . 用一个向量除以它的范数就得到一个范数为 1 的新向量. 因此
‖
e
j
‖
=
1
e
j
=
1
||e_(j)||=1 \left\|e_{j}\right\|=1 ‖ e j ‖ = 1 。
设
1
≤
k
<
j
1
≤
k
<
j
1 <= k < j 1 \leq k<j 1 ≤ k < j . 则
⟨
e
j
,
e
k
⟩
=
⟨
v
j
−
⟨
v
j
,
e
1
⟩
e
1
−
⋯
−
⟨
v
j
,
e
j
−
1
⟩
e
j
−
1
‖
v
j
−
⟨
v
j
,
e
1
⟩
e
1
−
⋯
−
⟨
v
j
,
e
j
−
1
⟩
e
j
−
1
‖
,
e
k
⟩
=
⟨
v
j
,
e
k
⟩
−
⟨
v
j
,
e
k
⟩
‖
v
j
−
⟨
v
j
,
e
1
⟩
e
1
−
⋯
−
⟨
v
j
,
e
j
−
1
⟩
e
j
−
1
‖
=
0
e
j
,
e
k
=
v
j
−
v
j
,
e
1
e
1
−
⋯
−
v
j
,
e
j
−
1
e
j
−
1
v
j
−
v
j
,
e
1
e
1
−
⋯
−
v
j
,
e
j
−
1
e
j
−
1
,
e
k
=
v
j
,
e
k
−
v
j
,
e
k
v
j
−
v
j
,
e
1
e
1
−
⋯
−
v
j
,
e
j
−
1
e
j
−
1
=
0
{:[(:e_(j),e_(k):)=(:(v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||),e_(k):)],[=((:v_(j),e_(k):)-(:v_(j),e_(k):))/(||v_(j)-(:v_(j),e_(1):)e_(1)-cdots-(:v_(j),e_(j-1):)e_(j-1)||)],[=0]:} \begin{aligned}
\left\langle e_{j}, e_{k}\right\rangle & =\left\langle\frac{v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|}, e_{k}\right\rangle \\
& =\frac{\left\langle v_{j}, e_{k}\right\rangle-\left\langle v_{j}, e_{k}\right\rangle}{\left\|v_{j}-\left\langle v_{j}, e_{1}\right\rangle e_{1}-\cdots-\left\langle v_{j}, e_{j-1}\right\rangle e_{j-1}\right\|} \\
& =0
\end{aligned} ⟨ e j , e k ⟩ = ⟨ v j − ⟨ v j , e 1 ⟩ e 1 − ⋯ − ⟨ v j , e j − 1 ⟩ e j − 1 ‖ v j − ⟨ v j , e 1 ⟩ e 1 − ⋯ − ⟨ v j , e j − 1 ⟩ e j − 1 ‖ , e k ⟩ = ⟨ v j , e k ⟩ − ⟨ v j , e k ⟩ ‖ v j − ⟨ v j , e 1 ⟩ e 1 − ⋯ − ⟨ v j , e j − 1 ⟩ e j − 1 ‖ = 0
因此
e
1
,
…
,
e
j
e
1
,
…
,
e
j
e_(1),dots,e_(j) e_{1}, \ldots, e_{j} e 1 , … , e j 是规范正交组。
从 6.31 给出的
e
j
e
j
e_(j) e_{j} e j 的定义我们看到
v
j
∈
span
(
e
1
,
…
,
e
j
)
v
j
∈
span
e
1
,
…
,
e
j
v_(j)in span(e_(1),dots,e_(j)) v_{j} \in \operatorname{span}\left(e_{1}, \ldots, e_{j}\right) v j ∈ span ( e 1 , … , e j ) . 再结合 6.32 得
span
(
v
1
,
…
,
v
j
)
⊂
span
(
e
1
,
…
,
e
j
)
span
v
1
,
…
,
v
j
⊂
span
e
1
,
…
,
e
j
span(v_(1),dots,v_(j))sub span(e_(1),dots,e_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) \subset \operatorname{span}\left(e_{1}, \ldots, e_{j}\right) span ( v 1 , … , v j ) ⊂ span ( e 1 , … , e j )
上面的这两个组都是线性无关的(这些
v
k
v
k
v_(k) v_{k} v k 的线性无关性是根据假设得到的,这些
e
k
e
k
e_(k) e_{k} e k 的线性无关性是由规范正交性和 6.26 得到的)。因此上面两个子空间的维数都为
j
j
j j j ,从而一定相等。
6.33 例 求
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 的一个规范正交基, 这里的内积为
⟨
p
,
q
⟩
=
∫
−
1
1
p
(
x
)
q
(
x
)
d
x
⟨
p
,
q
⟩
=
∫
−
1
1
p
(
x
)
q
(
x
)
d
x
(:p,q:)=int_(-1)^(1)p(x)q(x)dx \langle p, q\rangle=\int_{-1}^{1} p(x) q(x) \mathrm{d} x ⟨ p , q ⟩ = ∫ − 1 1 p ( x ) q ( x ) d x .
解 我们将对基
1
,
x
,
x
2
1
,
x
,
x
2
1,x,x^(2) 1, x, x^{2} 1 , x , x 2 应用格拉姆-施密特过程 6.31.
首先,我们有
‖
1
‖
2
=
∫
−
1
1
1
2
d
x
=
2
‖
1
‖
2
=
∫
−
1
1
1
2
d
x
=
2
||1||^(2)=int_(-1)^(1)1^(2)dx=2 \|1\|^{2}=\int_{-1}^{1} 1^{2} \mathrm{~d} x=2 ‖ 1 ‖ 2 = ∫ − 1 1 1 2 d x = 2
于是
‖
1
‖
=
2
‖
1
‖
=
2
||1||=sqrt2 \|1\|=\sqrt{2} ‖ 1 ‖ = 2 , 所以
e
1
=
1
2
e
1
=
1
2
e_(1)=sqrt((1)/(2)) e_{1}=\sqrt{\frac{1}{2}} e 1 = 1 2 .
现在
e
2
e
2
e_(2) e_{2} e 2 的表达式中的分子为
x
−
⟨
x
,
e
1
⟩
e
1
=
x
−
(
∫
−
1
1
x
1
2
d
x
)
1
2
=
x
x
−
x
,
e
1
e
1
=
x
−
∫
−
1
1
x
1
2
d
x
1
2
=
x
x-(:x,e_(1):)e_(1)=x-(int_(-1)^(1)xsqrt((1)/(2))(d)x)sqrt((1)/(2))=x x-\left\langle x, e_{1}\right\rangle e_{1}=x-\left(\int_{-1}^{1} x \sqrt{\frac{1}{2}} \mathrm{~d} x\right) \sqrt{\frac{1}{2}}=x x − ⟨ x , e 1 ⟩ e 1 = x − ( ∫ − 1 1 x 1 2 d x ) 1 2 = x
我们有
‖
x
‖
2
=
∫
−
1
1
x
2
d
x
=
2
3
.
‖
x
‖
2
=
∫
−
1
1
x
2
d
x
=
2
3
.
||x||^(2)=int_(-1)^(1)x^(2)dx=(2)/(3). \|x\|^{2}=\int_{-1}^{1} x^{2} \mathrm{~d} x=\frac{2}{3} . ‖ x ‖ 2 = ∫ − 1 1 x 2 d x = 2 3 .
于是
‖
x
‖
=
2
3
‖
x
‖
=
2
3
||x||=sqrt((2)/(3)) \|x\|=\sqrt{\frac{2}{3}} ‖ x ‖ = 2 3 , 所以
e
2
=
3
2
x
e
2
=
3
2
x
e_(2)=sqrt((3)/(2))x e_{2}=\sqrt{\frac{3}{2}} x e 2 = 3 2 x .
而
e
3
e
3
e_(3) e_{3} e 3 表达式中的分子为
x
2
−
⟨
x
2
,
e
1
⟩
e
1
−
⟨
x
2
,
e
2
⟩
e
2
=
x
2
−
(
∫
−
1
1
x
2
1
2
d
x
)
1
2
−
(
∫
−
1
1
x
2
3
2
x
d
x
)
3
2
x
=
x
2
−
1
3
.
x
2
−
x
2
,
e
1
e
1
−
x
2
,
e
2
e
2
=
x
2
−
∫
−
1
1
x
2
1
2
d
x
1
2
−
∫
−
1
1
x
2
3
2
x
d
x
3
2
x
=
x
2
−
1
3
.
{:[x^(2)-(:x^(2),e_(1):)e_(1)-(:x^(2),e_(2):)e_(2)],[=x^(2)-(int_(-1)^(1)x^(2)sqrt((1)/(2))(d)x)sqrt((1)/(2))-(int_(-1)^(1)x^(2)sqrt((3)/(2))x(d)x)sqrt((3)/(2))x=x^(2)-(1)/(3).]:} \begin{aligned}
x^{2} & -\left\langle x^{2}, e_{1}\right\rangle e_{1}-\left\langle x^{2}, e_{2}\right\rangle e_{2} \\
& =x^{2}-\left(\int_{-1}^{1} x^{2} \sqrt{\frac{1}{2}} \mathrm{~d} x\right) \sqrt{\frac{1}{2}}-\left(\int_{-1}^{1} x^{2} \sqrt{\frac{3}{2}} x \mathrm{~d} x\right) \sqrt{\frac{3}{2}} x=x^{2}-\frac{1}{3} .
\end{aligned} x 2 − ⟨ x 2 , e 1 ⟩ e 1 − ⟨ x 2 , e 2 ⟩ e 2 = x 2 − ( ∫ − 1 1 x 2 1 2 d x ) 1 2 − ( ∫ − 1 1 x 2 3 2 x d x ) 3 2 x = x 2 − 1 3 .
我们有
‖
x
2
−
1
3
‖
2
=
∫
−
1
1
(
x
4
−
2
3
x
2
+
1
9
)
d
x
=
8
45
.
x
2
−
1
3
2
=
∫
−
1
1
x
4
−
2
3
x
2
+
1
9
d
x
=
8
45
.
||x^(2)-(1)/(3)||^(2)=int_(-1)^(1)(x^(4)-(2)/(3)x^(2)+(1)/(9))dx=(8)/(45). \left\|x^{2}-\frac{1}{3}\right\|^{2}=\int_{-1}^{1}\left(x^{4}-\frac{2}{3} x^{2}+\frac{1}{9}\right) \mathrm{d} x=\frac{8}{45} . ‖ x 2 − 1 3 ‖ 2 = ∫ − 1 1 ( x 4 − 2 3 x 2 + 1 9 ) d x = 8 45 .
于是
‖
x
2
−
1
3
‖
=
8
45
x
2
−
1
3
=
8
45
||x^(2)-(1)/(3)||=sqrt((8)/(45)) \left\|x^{2}-\frac{1}{3}\right\|=\sqrt{\frac{8}{45}} ‖ x 2 − 1 3 ‖ = 8 45 , 所以
e
3
=
45
8
(
x
2
−
1
3
)
e
3
=
45
8
x
2
−
1
3
e_(3)=sqrt((45)/(8))(x^(2)-(1)/(3)) e_{3}=\sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right) e 3 = 45 8 ( x 2 − 1 3 ) .
因此
1
2
,
3
2
x
,
45
8
(
x
2
−
1
3
)
1
2
,
3
2
x
,
45
8
x
2
−
1
3
sqrt((1)/(2)),sqrt((3)/(2))x,sqrt((45)/(8))(x^(2)-(1)/(3)) \sqrt{\frac{1}{2}}, \sqrt{\frac{3}{2}} x, \sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right) 1 2 , 3 2 x , 45 8 ( x 2 − 1 3 )
是
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 中长度为 3 的规范正交组,由 6.28 可知这个规范正交组是
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 的规范正交基。
现在我们可以回答规范正交基的存在性问题了.
6.34 规范正交基的存在性
每个有限维内积空间都有规范正交基。
证明 设
V
V
V V V 是有限维的, 取
V
V
V V V 的一个基, 对它应用格拉姆-施密特过程6.31, 则得到一个长度为
dim
V
dim
V
dim V \operatorname{dim} V dim V 的规范正交组. 由 6.28 可知这个规范正交组是
V
V
V V V 的规范正交基.
有时我们必须知道,不仅规范正交基是存在的,而且任何规范正交组都可以扩充成规范正交基. 在下面的推论中, 格拉姆-施密特过程表明这种扩充总是可以做到的。
6.35 规范正交组扩充为规范正交基
设
V
V
V V V 是有限维的. 则
V
V
V V V 中每个规范正交向量组都可以扩充成
V
V
V V V 的规范正交基.
证明 设
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
V
V
V V V 中的规范正交组,则
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是线性无关的(由于 6.26),所以可扩充成
V
V
V V V 的基
e
1
,
…
,
e
m
,
v
1
,
…
,
v
n
e
1
,
…
,
e
m
,
v
1
,
…
,
v
n
e_(1),dots,e_(m),v_(1),dots,v_(n) e_{1}, \ldots, e_{m}, v_{1}, \ldots, v_{n} e 1 , … , e m , v 1 , … , v n (见 2.33)。现在对
e
1
,
…
,
e
m
,
v
1
,
…
,
v
n
e
1
,
…
,
e
m
,
v
1
,
…
,
v
n
e_(1),dots,e_(m),v_(1),dots,v_(n) e_{1}, \ldots, e_{m}, v_{1}, \ldots, v_{n} e 1 , … , e m , v 1 , … , v n 应用格拉姆-施密特过程6.31得到规范正交组
6.36
e
1
,
…
,
e
m
,
f
1
,
…
,
f
n
e
1
,
…
,
e
m
,
f
1
,
…
,
f
n
e_(1),dots,e_(m),f_(1),dots,f_(n) e_{1}, \ldots, e_{m}, f_{1}, \ldots, f_{n} e 1 , … , e m , f 1 , … , f n
这里格拉姆-施密特过程的公式保持前
m
m
m m m 个向量不变, 因为它们已经是规范正交的.由 6.28 可知上面的这个组是
V
V
V V V 的规范正交基.
回想一下, 如果一个矩阵对角线下方的所有元素都等于 0 , 则称这个矩阵是上三角的. 也就是说,一个上三角矩阵形如
(
∗
∗
⋱
0
∗
)
∗
∗
⋱
0
∗
([**,,**],[,ddots,],[0,,**]) \left(\begin{array}{lll}
* & & * \\
& \ddots & \\
0 & & *
\end{array}\right) ( ∗ ∗ ⋱ 0 ∗ )
其中 0 表示对角线下方的所有元素都等于 0 , 星号表示对角线及其上方的元素.
在上一章我们证明了,如果
V
V
V V V 是有限维的复向量空间,则对
V
V
V V V 上的每个算子都存在一个基使得该算子关于这个基的矩阵是上三角的(参见 5.27)。既然现在讨论的是内积空间,我们想知道是否存在规范正交基使得算子关于这个基有上三角矩阵。
下面的命题表明,假设存在一个基使
T
T
T T T 关于这个基具有上三角矩阵,则存在一个规范正交基具有同样的性质。这个命题在实向量空间和复向量空间上都成立(尽管在实向量空间上,那个假设只对某些算子成立)。
6.37 关于规范正交基的上三角矩阵
设
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 如果
T
T
T T T 关于
V
V
V V V 的某个基具有上三角矩阵,那么
T
T
T T T 关于
V
V
V V V 的某个规范正交基也具有上三角矩阵。
证明 设
T
T
T T T 关于
V
V
V V V 的基
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 具有上三角矩阵,则对每个
j
=
1
,
…
,
n
j
=
1
,
…
,
n
j=1,dots,n j=1, \ldots, n j = 1 , … , n 均有
span
(
v
1
,
…
,
v
j
)
span
v
1
,
…
,
v
j
span(v_(1),dots,v_(j)) \operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( v 1 , … , v j ) 在
T
T
T T T 下不变(参见 5.26)。
对
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 应用格拉姆-施密特过程,得到
V
V
V V V 的规范正交基
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 。因为对每个
j
j
j j j 都有
span
(
e
1
,
…
,
e
j
)
=
span
(
v
1
,
…
,
v
j
)
span
e
1
,
…
,
e
j
=
span
v
1
,
…
,
v
j
span(e_(1),dots,e_(j))=span(v_(1),dots,v_(j)) \operatorname{span}\left(e_{1}, \ldots, e_{j}\right)=\operatorname{span}\left(v_{1}, \ldots, v_{j}\right) span ( e 1 , … , e j ) = span ( v 1 , … , v j )
(参见 6.31),所以对每个
j
=
1
,
…
,
n
j
=
1
,
…
,
n
j=1,dots,n j=1, \ldots, n j = 1 , … , n 均有
span
(
e
1
,
…
,
e
j
)
span
e
1
,
…
,
e
j
span(e_(1),dots,e_(j)) \operatorname{span}\left(e_{1}, \ldots, e_{j}\right) span ( e 1 , … , e j ) 在
T
T
T T T 下不变。因此,由 5.26 可知,
T
T
T T T 关于规范正交基
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 具有上三角矩阵。
下面的定理是上述结果的重要应用。
1909 年德国数学家逸斋 • 舒尔 (1875-1941)发表了下述定理的第一个证明。
6.38 舒尔定理
设
V
V
V V V 是有限维的复向量空间且
T
∈
L
(
V
)
T
∈
L
(
V
)
T inL(V) T \in \mathcal{L}(V) T ∈ L ( V ) . 则
T
T
T T T 关于
V
V
V V V 的某个规范正交基具有上三角矩阵。
证明 回顾一下
T
T
T T T 关于
V
V
V V V 的某个基具有上三角矩阵(见 5.27)。然后应用6.37.
内积空间上的线性泛函
由于映到标量域
F
F
F \mathbf{F} F 的线性映射起着特殊作用,我们在 3.F 节给它们起了一个特别的名字。由于你可能跳过 3.F 节,下面重复一下这个定义。
6.39 定义 线性泛函(linear functional)
V
V
V V V 上的线性泛函是从
V
V
V V V 到
F
F
F \mathbf{F} F 的线性映射。 也就是说,线性泛函是
L
(
V
,
F
)
L
(
V
,
F
)
L(V,F) \mathcal{L}(V, \mathbf{F}) L ( V , F ) 中的元素。
6.40 例 如下定义的函数
φ
:
F
3
→
F
φ
:
F
3
→
F
varphi:F^(3)rarrF \varphi: \mathbf{F}^{3} \rightarrow \mathbf{F} φ : F 3 → F
φ
(
z
1
,
z
2
,
z
3
)
=
2
z
1
−
5
z
2
+
z
3
φ
z
1
,
z
2
,
z
3
=
2
z
1
−
5
z
2
+
z
3
varphi(z_(1),z_(2),z_(3))=2z_(1)-5z_(2)+z_(3) \varphi\left(z_{1}, z_{2}, z_{3}\right)=2 z_{1}-5 z_{2}+z_{3} φ ( z 1 , z 2 , z 3 ) = 2 z 1 − 5 z 2 + z 3
是
F
3
F
3
F^(3) \mathbf{F}^{3} F 3 上的线性泛函. 我们可以将这个线性泛函写成如下形式:对每个
z
∈
F
3
z
∈
F
3
z inF^(3) z \in \mathbf{F}^{3} z ∈ F 3
φ
(
z
)
=
⟨
z
,
u
⟩
φ
(
z
)
=
⟨
z
,
u
⟩
varphi(z)=(:z,u:) \varphi(z)=\langle z, u\rangle φ ( z ) = ⟨ z , u ⟩
其中
u
=
(
2
,
−
5
,
1
)
u
=
(
2
,
−
5
,
1
)
u=(2,-5,1) u=(2,-5,1) u = ( 2 , − 5 , 1 ) .
6.41 例 如下定义的函数
φ
:
P
2
(
R
)
→
R
φ
:
P
2
(
R
)
→
R
varphi:P_(2)(R)rarrR \varphi: \mathcal{P}_{2}(\mathbf{R}) \rightarrow \mathbf{R} φ : P 2 ( R ) → R
φ
(
p
)
=
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
φ
(
p
)
=
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
varphi(p)=int_(-1)^(1)p(t)(cos(pi t))dt \varphi(p)=\int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} t φ ( p ) = ∫ − 1 1 p ( t ) ( cos ( π t ) ) d t
是
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 上的线性泛函(这里
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 上的内积是
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的两个函数相乘后做定积分,见 6.33)。下面的事实并不显然:存在
u
∈
P
2
(
R
)
u
∈
P
2
(
R
)
u inP_(2)(R) u \in \mathcal{P}_{2}(\mathbf{R}) u ∈ P 2 ( R ) 使得对任意
p
∈
P
2
(
R
)
p
∈
P
2
(
R
)
p inP_(2)(R) p \in \mathcal{P}_{2}(\mathbf{R}) p ∈ P 2 ( R ) 均有
φ
(
p
)
=
⟨
p
,
u
⟩
φ
(
p
)
=
⟨
p
,
u
⟩
varphi(p)=(:p,u:) \varphi(p)=\langle p, u\rangle φ ( p ) = ⟨ p , u ⟩
(我们不能取
u
(
t
)
=
cos
(
π
t
)
u
(
t
)
=
cos
(
π
t
)
u(t)=cos(pi t) u(t)=\cos (\pi t) u ( t ) = cos ( π t ) ,因为它不是
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 中的元素.)
如果
u
∈
V
u
∈
V
u in V u \in V u ∈ V ,那么把
v
v
v v v 映成
⟨
v
,
u
⟩
⟨
v
,
u
⟩
(:v,u:) \langle v, u\rangle ⟨ v , u ⟩ 的映射是
V
V
V V V 上的线性泛函。下述定理表明,
V
V
V V V 上的每个线性泛函都是这种形式的。上面的例 6.41 显示了下述定理的威力,因为对那个例子中的线性泛函,
u
u
u u u 的取法并不明显。
6.42 里斯表示定理
设
V
V
V V V 是有限维的且
φ
φ
varphi \varphi φ 是
V
V
V V V 上的线性泛函,则存在唯一的向量
u
∈
V
u
∈
V
u in V u \in V u ∈ V 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
φ
(
v
)
=
⟨
v
,
u
⟩
φ
(
v
)
=
⟨
v
,
u
⟩
varphi(v)=(:v,u:) \varphi(v)=\langle v, u\rangle φ ( v ) = ⟨ v , u ⟩ 。
证明 先证明存在向量
u
∈
V
u
∈
V
u in V u \in V u ∈ V 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
φ
(
v
)
=
⟨
v
,
u
⟩
φ
(
v
)
=
⟨
v
,
u
⟩
varphi(v)=(:v,u:) \varphi(v)=\langle v, u\rangle φ ( v ) = ⟨ v , u ⟩ 。设
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是
V
V
V V V 的规范正交基,则对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
φ
(
v
)
=
φ
(
⟨
v
,
e
1
⟩
e
1
+
⋯
+
⟨
v
,
e
n
⟩
e
n
)
=
⟨
v
,
e
1
⟩
φ
(
e
1
)
+
⋯
+
⟨
v
,
e
n
⟩
φ
(
e
n
)
=
⟨
v
,
φ
(
e
1
)
―
e
1
+
⋯
+
φ
(
e
n
)
―
e
n
⟩
φ
(
v
)
=
φ
v
,
e
1
e
1
+
⋯
+
v
,
e
n
e
n
=
v
,
e
1
φ
e
1
+
⋯
+
v
,
e
n
φ
e
n
=
v
,
φ
e
1
¯
e
1
+
⋯
+
φ
e
n
¯
e
n
{:[varphi(v)=varphi((:v,e_(1):)e_(1)+cdots+(:v,e_(n):)e_(n))],[=(:v,e_(1):)varphi(e_(1))+cdots+(:v,e_(n):)varphi(e_(n))],[=(:v, bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n):)]:} \begin{aligned}
\varphi(v) & =\varphi\left(\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{n}\right\rangle e_{n}\right) \\
& =\left\langle v, e_{1}\right\rangle \varphi\left(e_{1}\right)+\cdots+\left\langle v, e_{n}\right\rangle \varphi\left(e_{n}\right) \\
& =\left\langle v, \overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n}\right\rangle
\end{aligned} φ ( v ) = φ ( ⟨ v , e 1 ⟩ e 1 + ⋯ + ⟨ v , e n ⟩ e n ) = ⟨ v , e 1 ⟩ φ ( e 1 ) + ⋯ + ⟨ v , e n ⟩ φ ( e n ) = ⟨ v , φ ( e 1 ) ― e 1 + ⋯ + φ ( e n ) ― e n ⟩
其中第一个等式由 6.30 得到. 因此, 取
6.43
u
=
φ
(
e
1
)
―
e
1
+
⋯
+
φ
(
e
n
)
―
e
n
6.43
u
=
φ
e
1
¯
e
1
+
⋯
+
φ
e
n
¯
e
n
6.43quad u= bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n) 6.43 \quad u=\overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n} 6.43 u = φ ( e 1 ) ― e 1 + ⋯ + φ ( e n ) ― e n
则对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 都有
φ
(
v
)
=
⟨
v
,
u
⟩
φ
(
v
)
=
⟨
v
,
u
⟩
varphi(v)=(:v,u:) \varphi(v)=\langle v, u\rangle φ ( v ) = ⟨ v , u ⟩ .
现在来证明只有一个向量
u
∈
V
u
∈
V
u in V u \in V u ∈ V 满足条件. 设
u
1
,
u
2
∈
V
u
1
,
u
2
∈
V
u_(1),u_(2)in V u_{1}, u_{2} \in V u 1 , u 2 ∈ V 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
φ
(
v
)
=
⟨
v
,
u
1
⟩
=
⟨
v
,
u
2
⟩
.
φ
(
v
)
=
v
,
u
1
=
v
,
u
2
.
varphi(v)=(:v,u_(1):)=(:v,u_(2):). \varphi(v)=\left\langle v, u_{1}\right\rangle=\left\langle v, u_{2}\right\rangle . φ ( v ) = ⟨ v , u 1 ⟩ = ⟨ v , u 2 ⟩ .
则对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
0
=
⟨
v
,
u
1
⟩
−
⟨
v
,
u
2
⟩
=
⟨
v
,
u
1
−
u
2
⟩
.
0
=
v
,
u
1
−
v
,
u
2
=
v
,
u
1
−
u
2
.
0=(:v,u_(1):)-(:v,u_(2):)=(:v,u_(1)-u_(2):). 0=\left\langle v, u_{1}\right\rangle-\left\langle v, u_{2}\right\rangle=\left\langle v, u_{1}-u_{2}\right\rangle . 0 = ⟨ v , u 1 ⟩ − ⟨ v , u 2 ⟩ = ⟨ v , u 1 − u 2 ⟩ .
取
v
=
u
1
−
u
2
v
=
u
1
−
u
2
v=u_(1)-u_(2) v=u_{1}-u_{2} v = u 1 − u 2 可得
u
1
−
u
2
=
0
u
1
−
u
2
=
0
u_(1)-u_(2)=0 u_{1}-u_{2}=0 u 1 − u 2 = 0 , 即
u
1
=
u
2
u
1
=
u
2
u_(1)=u_(2) u_{1}=u_{2} u 1 = u 2 , 这就完成了唯一性的证明.
6.44 例 求
u
∈
P
2
(
R
)
u
∈
P
2
(
R
)
u inP_(2)(R) u \in \mathcal{P}_{2}(\mathbf{R}) u ∈ P 2 ( R ) 使得对每个
p
∈
P
2
(
R
)
p
∈
P
2
(
R
)
p inP_(2)(R) p \in \mathcal{P}_{2}(\mathbf{R}) p ∈ P 2 ( R ) 均有
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
=
∫
−
1
1
p
(
t
)
u
(
t
)
d
t
.
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
=
∫
−
1
1
p
(
t
)
u
(
t
)
d
t
.
int_(-1)^(1)p(t)(cos(pi t))dt=int_(-1)^(1)p(t)u(t)dt. \int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} t=\int_{-1}^{1} p(t) u(t) \mathrm{d} t . ∫ − 1 1 p ( t ) ( cos ( π t ) ) d t = ∫ − 1 1 p ( t ) u ( t ) d t .
解 设
φ
(
p
)
=
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
φ
(
p
)
=
∫
−
1
1
p
(
t
)
(
cos
(
π
t
)
)
d
t
varphi(p)=int_(-1)^(1)p(t)(cos(pi t))dt \varphi(p)=\int_{-1}^{1} p(t)(\cos (\pi t)) \mathrm{d} t φ ( p ) = ∫ − 1 1 p ( t ) ( cos ( π t ) ) d t . 应用上面证明中的公式 6.43 , 并使用例 6.33 中的规范正交基,可得
u
(
x
)
=
(
∫
−
1
1
1
2
(
cos
(
π
t
)
)
d
t
)
1
2
+
(
∫
−
1
1
3
2
t
(
cos
(
π
t
)
)
d
t
)
3
2
x
+
(
∫
−
1
1
45
8
(
t
2
−
1
3
)
(
cos
(
π
t
)
)
d
t
)
45
8
(
x
2
−
1
3
)
u
(
x
)
=
∫
−
1
1
1
2
(
cos
(
π
t
)
)
d
t
1
2
+
∫
−
1
1
3
2
t
(
cos
(
π
t
)
)
d
t
3
2
x
+
∫
−
1
1
45
8
t
2
−
1
3
(
cos
(
π
t
)
)
d
t
45
8
x
2
−
1
3
{:[u(x)=(int_(-1)^(1)sqrt((1)/(2))(cos(pi t))dt)sqrt((1)/(2))+(int_(-1)^(1)sqrt((3)/(2))t(cos(pi t))dt)sqrt((3)/(2))x],[+(int_(-1)^(1)sqrt((45)/(8))(t^(2)-(1)/(3))(cos(pi t))dt)sqrt((45)/(8))(x^(2)-(1)/(3))]:} \begin{aligned}
u(x)= & \left(\int_{-1}^{1} \sqrt{\frac{1}{2}}(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{1}{2}}+\left(\int_{-1}^{1} \sqrt{\frac{3}{2}} t(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{3}{2}} x \\
& +\left(\int_{-1}^{1} \sqrt{\frac{45}{8}}\left(t^{2}-\frac{1}{3}\right)(\cos (\pi t)) \mathrm{d} t\right) \sqrt{\frac{45}{8}}\left(x^{2}-\frac{1}{3}\right)
\end{aligned} u ( x ) = ( ∫ − 1 1 1 2 ( cos ( π t ) ) d t ) 1 2 + ( ∫ − 1 1 3 2 t ( cos ( π t ) ) d t ) 3 2 x + ( ∫ − 1 1 45 8 ( t 2 − 1 3 ) ( cos ( π t ) ) d t ) 45 8 ( x 2 − 1 3 )
计算可得
u
(
x
)
=
−
45
2
π
2
(
x
2
−
1
3
)
u
(
x
)
=
−
45
2
π
2
x
2
−
1
3
u(x)=-(45)/(2pi^(2))(x^(2)-(1)/(3)) u(x)=-\frac{45}{2 \pi^{2}}\left(x^{2}-\frac{1}{3}\right) u ( x ) = − 45 2 π 2 ( x 2 − 1 3 )
设
V
V
V V V 是有限维的且
φ
φ
varphi \varphi φ 是
V
V
V V V 上的线性泛函. 则 6.43 给出了求向量
u
u
u u u 的公式使其满足对所有
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
φ
(
v
)
=
⟨
v
,
u
⟩
φ
(
v
)
=
⟨
v
,
u
⟩
varphi(v)=(:v,u:) \varphi(v)=\langle v, u\rangle φ ( v ) = ⟨ v , u ⟩ . 具体来说, 就是
u
=
φ
(
e
1
)
―
e
1
+
⋯
+
φ
(
e
n
)
―
e
n
u
=
φ
e
1
¯
e
1
+
⋯
+
φ
e
n
¯
e
n
u= bar(varphi(e_(1)))e_(1)+cdots+ bar(varphi(e_(n)))e_(n) u=\overline{\varphi\left(e_{1}\right)} e_{1}+\cdots+\overline{\varphi\left(e_{n}\right)} e_{n} u = φ ( e 1 ) ― e 1 + ⋯ + φ ( e n ) ― e n
看起来等式右端依赖于规范正交基
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 和
φ
φ
varphi \varphi φ . 然而,定理6.42告诉我们
u
u
u u u 是由
φ
φ
varphi \varphi φ 唯一确定的。所以等式右端与
V
V
V V V 的规范正交基
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 的选取无关.
习题 6.B
1 (a) 设
θ
∈
R
θ
∈
R
theta inR \theta \in \mathbf{R} θ ∈ R . 证明
(
cos
θ
,
sin
θ
)
,
(
−
sin
θ
,
cos
θ
)
和
(
cos
θ
,
sin
θ
)
,
(
sin
θ
,
−
cos
θ
)
(
cos
θ
,
sin
θ
)
,
(
−
sin
θ
,
cos
θ
)
和
(
cos
θ
,
sin
θ
)
,
(
sin
θ
,
−
cos
θ
)
(cos theta,sin theta),(-sin theta,cos theta)quad" 和 "quad(cos theta,sin theta),(sin theta,-cos theta) (\cos \theta, \sin \theta),(-\sin \theta, \cos \theta) \quad \text { 和 } \quad(\cos \theta, \sin \theta),(\sin \theta,-\cos \theta) 和 ( cos θ , sin θ ) , ( − sin θ , cos θ ) 和 ( cos θ , sin θ ) , ( sin θ , − cos θ )
都是
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 的规范正交基.
(b) 证明
R
2
R
2
R^(2) \mathbf{R}^{2} R 2 的规范正交基必形如(a)中的二者之一。
2 设
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
V
V
V V V 的规范正交组. 设
v
∈
V
v
∈
V
v in V v \in V v ∈ V . 证明
‖
v
‖
2
=
|
⟨
v
,
e
1
⟩
|
2
+
⋯
+
|
⟨
v
,
e
m
⟩
|
2
‖
v
‖
2
=
v
,
e
1
2
+
⋯
+
v
,
e
m
2
||v||^(2)=|(:v,e_(1):)|^(2)+cdots+|(:v,e_(m):)|^(2) \|v\|^{2}=\left|\left\langle v, e_{1}\right\rangle\right|^{2}+\cdots+\left|\left\langle v, e_{m}\right\rangle\right|^{2} ‖ v ‖ 2 = | ⟨ v , e 1 ⟩ | 2 + ⋯ + | ⟨ v , e m ⟩ | 2
当且仅当
v
∈
span
(
e
1
,
…
,
e
m
)
v
∈
span
e
1
,
…
,
e
m
v in span(e_(1),dots,e_(m)) v \in \operatorname{span}\left(e_{1}, \ldots, e_{m}\right) v ∈ span ( e 1 , … , e m ) .
3 设
T
∈
L
(
R
3
)
T
∈
L
R
3
T inL(R^(3)) T \in \mathcal{L}\left(\mathbf{R}^{3}\right) T ∈ L ( R 3 ) 关于基
(
1
,
0
,
0
)
,
(
1
,
1
,
1
)
,
(
1
,
1
,
2
)
(
1
,
0
,
0
)
,
(
1
,
1
,
1
)
,
(
1
,
1
,
2
)
(1,0,0),(1,1,1),(1,1,2) (1,0,0),(1,1,1),(1,1,2) ( 1 , 0 , 0 ) , ( 1 , 1 , 1 ) , ( 1 , 1 , 2 ) 具有上三角矩阵。求
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 的一个规范正交基(采用
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 上通常的内积)使得
T
T
T T T 关于这个基具有上三角矩阵。
1
2
π
,
cos
x
π
,
cos
2
x
π
,
…
,
cos
n
x
π
,
sin
x
π
,
sin
2
x
π
,
…
,
sin
n
x
π
1
2
π
,
cos
x
π
,
cos
2
x
π
,
…
,
cos
n
x
π
,
sin
x
π
,
sin
2
x
π
,
…
,
sin
n
x
π
(1)/(sqrt(2pi)),(cos x)/(sqrtpi),(cos 2x)/(sqrtpi),dots,(cos nx)/(sqrtpi),(sin x)/(sqrtpi),(sin 2x)/(sqrtpi),dots,(sin nx)/(sqrtpi) \frac{1}{\sqrt{2 \pi}}, \frac{\cos x}{\sqrt{\pi}}, \frac{\cos 2 x}{\sqrt{\pi}}, \ldots, \frac{\cos n x}{\sqrt{\pi}}, \frac{\sin x}{\sqrt{\pi}}, \frac{\sin 2 x}{\sqrt{\pi}}, \ldots, \frac{\sin n x}{\sqrt{\pi}} 1 2 π , cos x π , cos 2 x π , … , cos n x π , sin x π , sin 2 x π , … , sin n x π
是
C
[
−
π
,
π
]
C
[
−
π
,
π
]
C[-pi,pi] C[-\pi, \pi] C [ − π , π ] 的规范正交组,这里
C
[
−
π
,
π
]
C
[
−
π
,
π
]
C[-pi,pi] C[-\pi, \pi] C [ − π , π ] 是
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上的实值连续函数构成的向量空间,其上的内积为
⟨
f
,
g
⟩
=
∫
−
π
π
f
(
x
)
g
(
x
)
d
x
⟨
f
,
g
⟩
=
∫
−
π
π
f
(
x
)
g
(
x
)
d
x
(:f,g:)=int_(-pi)^(pi)f(x)g(x)dx \langle f, g\rangle=\int_{-\pi}^{\pi} f(x) g(x) \mathrm{d} x ⟨ f , g ⟩ = ∫ − π π f ( x ) g ( x ) d x
上述规范正交组经常用来建立诸如潮洺等周期现象的数学模型.
5 在
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 上考虑内积
⟨
p
,
q
⟩
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
⟨
p
,
q
⟩
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
(:p,q:)=int_(0)^(1)p(x)q(x)dx \langle p, q\rangle=\int_{0}^{1} p(x) q(x) \mathrm{d} x ⟨ p , q ⟩ = ∫ 0 1 p ( x ) q ( x ) d x
对基
1
,
x
,
x
2
1
,
x
,
x
2
1,x,x^(2) 1, x, x^{2} 1 , x , x 2 应用格拉姆-施密特过程求
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 的一个规范正交基.
6 求
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 的一个规范正交基(采用习题 5 的内积)使得
P
2
(
R
)
P
2
(
R
)
P_(2)(R) \mathcal{P}_{2}(\mathbf{R}) P 2 ( R ) 上的微分算子(即把
p
p
p p p 映成
p
′
p
′
p^(') p^{\prime} p ′ 的算子)关于这个基具有上三角矩阵。
7 求多项式
q
∈
P
2
(
R
)
q
∈
P
2
(
R
)
q inP_(2)(R) q \in \mathcal{P}_{2}(\mathbf{R}) q ∈ P 2 ( R ) 使得对每个
p
∈
P
2
(
R
)
p
∈
P
2
(
R
)
p inP_(2)(R) p \in \mathcal{P}_{2}(\mathbf{R}) p ∈ P 2 ( R ) 均有
p
(
1
2
)
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
p
1
2
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
p((1)/(2))=int_(0)^(1)p(x)q(x)dx p\left(\frac{1}{2}\right)=\int_{0}^{1} p(x) q(x) \mathrm{d} x p ( 1 2 ) = ∫ 0 1 p ( x ) q ( x ) d x
8 求多项式
q
∈
P
2
(
R
)
q
∈
P
2
(
R
)
q inP_(2)(R) q \in \mathcal{P}_{2}(\mathbf{R}) q ∈ P 2 ( R ) 使得对每个
p
∈
P
2
(
R
)
p
∈
P
2
(
R
)
p inP_(2)(R) p \in \mathcal{P}_{2}(\mathbf{R}) p ∈ P 2 ( R ) 均有
∫
0
1
p
(
x
)
(
cos
π
x
)
d
x
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
.
∫
0
1
p
(
x
)
(
cos
π
x
)
d
x
=
∫
0
1
p
(
x
)
q
(
x
)
d
x
.
int_(0)^(1)p(x)(cos pi x)dx=int_(0)^(1)p(x)q(x)dx. \int_{0}^{1} p(x)(\cos \pi x) \mathrm{d} x=\int_{0}^{1} p(x) q(x) \mathrm{d} x . ∫ 0 1 p ( x ) ( cos π x ) d x = ∫ 0 1 p ( x ) q ( x ) d x .
9 对不是线性无关的向量组应用格拉姆-施密特过程结果会怎样?
10 设
V
V
V V V 是实内积空间且
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是
V
V
V V V 中的线性无关向量组. 证明
V
V
V V V 中恰好有
2
m
2
m
2^(m) 2^{m} 2 m 个规范正交组
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 使得对所有
j
∈
{
1
,
…
,
m
}
j
∈
{
1
,
…
,
m
}
j in{1,dots,m} j \in\{1, \ldots, m\} j ∈ { 1 , … , m } 均有
span
(
v
1
,
…
,
v
j
)
=
span
v
1
,
…
,
v
j
=
span(v_(1),dots,v_(j))= \operatorname{span}\left(v_{1}, \ldots, v_{j}\right)= span ( v 1 , … , v j ) =
span
(
e
1
,
…
,
e
j
)
span
e
1
,
…
,
e
j
span(e_(1),dots,e_(j)) \operatorname{span}\left(e_{1}, \ldots, e_{j}\right) span ( e 1 , … , e j ) .
11 设
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 和
⟨
⋅
,
⋅
⟩
2
⟨
⋅
,
⋅
⟩
2
(:*,*:)_(2) \langle\cdot, \cdot\rangle_{2} ⟨ ⋅ , ⋅ ⟩ 2 都是
V
V
V V V 上的内积使得
⟨
v
,
w
⟩
1
=
0
⟨
v
,
w
⟩
1
=
0
(:v,w:)_(1)=0 \langle v, w\rangle_{1}=0 ⟨ v , w ⟩ 1 = 0 当且仅当
⟨
v
,
w
⟩
2
=
0
⟨
v
,
w
⟩
2
=
0
(:v,w:)_(2)=0 \langle v, w\rangle_{2}=0 ⟨ v , w ⟩ 2 = 0 . 证明存在正数
c
c
c c c 使得对任意
v
,
w
∈
V
v
,
w
∈
V
v,w in V v, w \in V v , w ∈ V 均有
⟨
v
,
w
⟩
1
=
c
⟨
v
,
w
⟩
2
⟨
v
,
w
⟩
1
=
c
⟨
v
,
w
⟩
2
(:v,w:)_(1)=c(:v,w:)_(2) \langle v, w\rangle_{1}=c\langle v, w\rangle_{2} ⟨ v , w ⟩ 1 = c ⟨ v , w ⟩ 2 .
12 设
V
V
V V V 是有限维的,
⟨
⋅
,
⋅
⟩
1
⟨
⋅
,
⋅
⟩
1
(:*,*:)_(1) \langle\cdot, \cdot\rangle_{1} ⟨ ⋅ , ⋅ ⟩ 1 和
⟨
⋅
,
⋅
⟩
2
⟨
⋅
,
⋅
⟩
2
(:*,*:)_(2) \langle\cdot, \cdot\rangle_{2} ⟨ ⋅ , ⋅ ⟩ 2 都是
V
V
V V V 上的内积,对应的范数是
‖
⋅
‖
1
‖
⋅
‖
1
||*||_(1) \|\cdot\|_{1} ‖ ⋅ ‖ 1 和
‖
⋅
‖
2
‖
⋅
‖
2
||*||_(2) \|\cdot\|_{2} ‖ ⋅ ‖ 2 .证明存在正数
c
c
c c c 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
‖
v
‖
1
≤
c
‖
v
‖
2
‖
v
‖
1
≤
c
‖
v
‖
2
||v||_(1) <= c||v||_(2) \|v\|_{1} \leq c\|v\|_{2} ‖ v ‖ 1 ≤ c ‖ v ‖ 2 .
13 设
v
1
,
…
,
v
m
v
1
,
…
,
v
m
v_(1),dots,v_(m) v_{1}, \ldots, v_{m} v 1 , … , v m 是
V
V
V V V 中的线性无关向量组. 证明存在
w
∈
V
w
∈
V
w in V w \in V w ∈ V 使得对所有
j
∈
j
∈
j in j \in j ∈
{
1
,
…
,
m
}
{
1
,
…
,
m
}
{1,dots,m} \{1, \ldots, m\} { 1 , … , m } 均有
⟨
w
,
v
j
⟩
>
0
w
,
v
j
>
0
(:w,v_(j):) > 0 \left\langle w, v_{j}\right\rangle>0 ⟨ w , v j ⟩ > 0 。
14 设
e
1
,
…
,
e
n
e
1
,
…
,
e
n
e_(1),dots,e_(n) e_{1}, \ldots, e_{n} e 1 , … , e n 是
V
V
V V V 的规范正交基, 并设
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 中的向量使得对每个
j
j
j j j 均有
‖
e
j
−
v
j
‖
<
1
n
e
j
−
v
j
<
1
n
||e_(j)-v_(j)|| < (1)/(sqrtn) \left\|e_{j}-v_{j}\right\|<\frac{1}{\sqrt{n}} ‖ e j − v j ‖ < 1 n
证明
v
1
,
…
,
v
n
v
1
,
…
,
v
n
v_(1),dots,v_(n) v_{1}, \ldots, v_{n} v 1 , … , v n 是
V
V
V V V 的基.
15 设
C
R
(
[
−
1
,
1
]
)
C
R
(
[
−
1
,
1
]
)
C_(R)([-1,1]) C_{\mathbf{R}}([-1,1]) C R ( [ − 1 , 1 ] ) 是区间
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上的实值连续函数构成的向量空间, 其上的内积为:对于
f
,
g
∈
C
R
(
[
−
1
,
1
]
)
f
,
g
∈
C
R
(
[
−
1
,
1
]
)
f,g inC_(R)([-1,1]) f, g \in C_{\mathbf{R}}([-1,1]) f , g ∈ C R ( [ − 1 , 1 ] )
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
(:f,g:)=int_(-1)^(1)f(x)g(x)dx \langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} x ⟨ f , g ⟩ = ∫ − 1 1 f ( x ) g ( x ) d x
设
φ
φ
varphi \varphi φ 是
C
R
(
[
−
1
,
1
]
)
C
R
(
[
−
1
,
1
]
)
C_(R)([-1,1]) C_{\mathbf{R}}([-1,1]) C R ( [ − 1 , 1 ] ) 上由
φ
(
f
)
=
f
(
0
)
φ
(
f
)
=
f
(
0
)
varphi(f)=f(0) \varphi(f)=f(0) φ ( f ) = f ( 0 ) 定义的线性泛函. 证明:不存在
g
∈
g
∈
g in g \in g ∈
C
R
(
[
−
1
,
1
]
)
C
R
(
[
−
1
,
1
]
)
C_(R)([-1,1]) C_{\mathbf{R}}([-1,1]) C R ( [ − 1 , 1 ] ) 能使得对每个
f
∈
C
R
(
[
−
1
,
1
]
)
f
∈
C
R
(
[
−
1
,
1
]
)
f inC_(R)([-1,1]) f \in C_{\mathbf{R}}([-1,1]) f ∈ C R ( [ − 1 , 1 ] ) 均有
φ
(
f
)
=
⟨
f
,
g
⟩
φ
(
f
)
=
⟨
f
,
g
⟩
varphi(f)=(:f,g:) \varphi(f)=\langle f, g\rangle φ ( f ) = ⟨ f , g ⟩ 。
本题表明如果不对
V
V
V V V 和
φ
φ
varphi \varphi φ 附加额外条件,那么里斯表示定理 6.42 对无限维限量空间不成立。
16 设
F
=
C
,
V
F
=
C
,
V
F=C,V \mathbf{F}=\mathbf{C}, V F = C , V 是有限维的,
T
∈
L
(
V
)
,
T
T
∈
L
(
V
)
,
T
T inL(V),T T \in \mathcal{L}(V), T T ∈ L ( V ) , T 的所有本征值的绝对值都小于 1 ,
ϵ
>
0
ϵ
>
0
epsilon > 0 \epsilon>0 ϵ > 0 . 证明存在正整数
m
m
m m m 使得对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
‖
T
m
v
‖
≤
ϵ
‖
v
‖
T
m
v
≤
ϵ
‖
v
‖
||T^(m)v|| <= epsilon||v|| \left\|T^{m} v\right\| \leq \epsilon\|v\| ‖ T m v ‖ ≤ ϵ ‖ v ‖ .
17 对于
u
∈
V
u
∈
V
u in V u \in V u ∈ V 设
Φ
u
Φ
u
Phi u \Phi u Φ u 表示
V
V
V V V 上如下定义的线性泛函:对
v
∈
V
v
∈
V
v in V v \in V v ∈ V
(
Φ
u
)
(
v
)
=
⟨
v
,
u
⟩
.
(
Φ
u
)
(
v
)
=
⟨
v
,
u
⟩
.
(Phi u)(v)=(:v,u:). (\Phi u)(v)=\langle v, u\rangle . ( Φ u ) ( v ) = ⟨ v , u ⟩ .
(a)证明:若
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R ,则
Φ
Φ
Phi \Phi Φ 是从
V
V
V V V 到
V
′
V
′
V^(') V^{\prime} V ′ 的线性映射。(回想一下,在 3.F节中我们定义
V
′
=
L
(
V
,
F
)
,
V
′
V
′
=
L
(
V
,
F
)
,
V
′
V^(')=L(V,F),V^(') V^{\prime}=\mathcal{L}(V, \mathbf{F}), V^{\prime} V ′ = L ( V , F ) , V ′ 称为
V
V
V V V 的对偶空间。)
(b) 证明: 若
F
=
C
F
=
C
F=C \mathbf{F}=\mathbf{C} F = C 且
V
≠
{
0
}
V
≠
{
0
}
V!={0} V \neq\{0\} V ≠ { 0 } ,则
Φ
Φ
Phi \Phi Φ 不是线性映射.
(c) 证明
Φ
Φ
Phi \Phi Φ 是单的.
(d) 设
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 且
V
V
V V V 是有限维的. 利用 (a) 和 (c) 以及维数计算(但不用 6.42)来证明
Φ
Φ
Phi \Phi Φ 是从
V
V
V V V 到
V
′
V
′
V^(') V^{\prime} V ′ 的同构。
(d)给出了里斯表示定理6.42 在
F
=
R
F
=
R
F=R \mathbf{F}=\mathbf{R} F = R 情形的另一个证明,也给出了有限维实内积空间到其对偶空间的一个自然同构("自然"的意思是与基的选取无关)。
6.C 正交补与极小化问题
正交补
6.45 定义 正交补 (orthogonal complement),
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥
设
U
U
U U U 是
V
V
V V V 的子集,则
U
U
U U U 的正交补(记作
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ )是由
V
V
V V V 中与
U
U
U U U 的每个向量都正交的那些向量组成的集合:
U
⊥
=
{
v
∈
V
:
对每个
u
∈
U
均有
⟨
v
,
u
⟩
=
0
}
.
U
⊥
=
{
v
∈
V
:
对每个
u
∈
U
均有
⟨
v
,
u
⟩
=
0
}
.
U^(_|_)={v in V:" 对每个 "u in U" 均有 "(:v,u:)=0}". " U^{\perp}=\{v \in V: \text { 对每个 } u \in U \text { 均有 }\langle v, u\rangle=0\} \text {. } 对 每 个 均 有 U ⊥ = { v ∈ V : 对每个 u ∈ U 均有 ⟨ v , u ⟩ = 0 } .
例如,若
U
U
U U U 是
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中的直线,则
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 是垂直于
U
U
U U U 且包含原点的平面. 若
U
U
U U U 是
R
3
R
3
R^(3) \mathbf{R}^{3} R 3 中的平面,则
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 是垂直于
U
U
U U U 且包含原点的直线。
6.46 正交补的基本性质
(a) 若
U
U
U U U 是
V
V
V V V 的子集,则
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 是
V
V
V V V 的子空间.
(b)
{
0
}
⊥
=
V
{
0
}
⊥
=
V
{0}^(_|_)=V \{0\}^{\perp}=V { 0 } ⊥ = V .
(c)
V
⊥
=
{
0
}
V
⊥
=
{
0
}
V^(_|_)={0} V^{\perp}=\{0\} V ⊥ = { 0 } .
(d) 若
U
U
U U U 是
V
V
V V V 的子集,则
U
∩
U
⊥
⊂
{
0
}
U
∩
U
⊥
⊂
{
0
}
U nnU^(_|_)sub{0} U \cap U^{\perp} \subset\{0\} U ∩ U ⊥ ⊂ { 0 } .
(e) 若
U
U
U U U 和
W
W
W W W 均为
V
V
V V V 的子集且
U
⊂
W
U
⊂
W
U sub W U \subset W U ⊂ W ,则
W
⊥
⊂
U
⊥
W
⊥
⊂
U
⊥
W^(_|_)subU^(_|_) W^{\perp} \subset U^{\perp} W ⊥ ⊂ U ⊥ 。
证明
(a) 设
U
U
U U U 是
V
V
V V V 的子集. 则对每个
u
∈
U
u
∈
U
u in U u \in U u ∈ U 均有
⟨
0
,
u
⟩
=
0
⟨
0
,
u
⟩
=
0
(:0,u:)=0 \langle 0, u\rangle=0 ⟨ 0 , u ⟩ = 0 , 于是
0
∈
U
⊥
0
∈
U
⊥
0inU^(_|_) 0 \in U^{\perp} 0 ∈ U ⊥ .设
v
,
w
∈
U
⊥
v
,
w
∈
U
⊥
v,w inU^(_|_) v, w \in U^{\perp} v , w ∈ U ⊥ . 若
u
∈
U
u
∈
U
u in U u \in U u ∈ U , 则
⟨
v
+
w
,
u
⟩
=
⟨
v
,
u
⟩
+
⟨
w
,
u
⟩
=
0
+
0
=
0
.
⟨
v
+
w
,
u
⟩
=
⟨
v
,
u
⟩
+
⟨
w
,
u
⟩
=
0
+
0
=
0
.
(:v+w,u:)=(:v,u:)+(:w,u:)=0+0=0. \langle v+w, u\rangle=\langle v, u\rangle+\langle w, u\rangle=0+0=0 . ⟨ v + w , u ⟩ = ⟨ v , u ⟩ + ⟨ w , u ⟩ = 0 + 0 = 0 .
于是
v
+
w
∈
U
⊥
v
+
w
∈
U
⊥
v+w inU^(_|_) v+w \in U^{\perp} v + w ∈ U ⊥ . 也就是说
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 在加法下是封闭的.
类似地, 设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F 且
v
∈
U
⊥
v
∈
U
⊥
v inU^(_|_) v \in U^{\perp} v ∈ U ⊥ 。若
u
∈
U
u
∈
U
u in U u \in U u ∈ U , 则
⟨
λ
v
,
u
⟩
=
λ
⟨
v
,
u
⟩
=
λ
⋅
0
=
0
⟨
λ
v
,
u
⟩
=
λ
⟨
v
,
u
⟩
=
λ
⋅
0
=
0
(:lambda v,u:)=lambda(:v,u:)=lambda*0=0 \langle\lambda v, u\rangle=\lambda\langle v, u\rangle=\lambda \cdot 0=0 ⟨ λ v , u ⟩ = λ ⟨ v , u ⟩ = λ ⋅ 0 = 0
于是
λ
v
∈
U
⊥
λ
v
∈
U
⊥
lambda v inU^(_|_) \lambda v \in U^{\perp} λ v ∈ U ⊥ . 也就是说
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 在标量乘法下是封闭的. 因此
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 是
V
V
V V V 的子空间.
(b) 假定
v
∈
V
v
∈
V
v in V v \in V v ∈ V . 则
⟨
v
,
0
⟩
=
0
⟨
v
,
0
⟩
=
0
(:v,0:)=0 \langle v, 0\rangle=0 ⟨ v , 0 ⟩ = 0 , 这表明
v
∈
{
0
}
⊥
v
∈
{
0
}
⊥
v in{0}^(_|_) v \in\{0\}^{\perp} v ∈ { 0 } ⊥ . 于是
{
0
}
⊥
=
V
{
0
}
⊥
=
V
{0}^(_|_)=V \{0\}^{\perp}=V { 0 } ⊥ = V .
(c) 设
v
∈
V
⊥
v
∈
V
⊥
v inV^(_|_) v \in V^{\perp} v ∈ V ⊥ . 则
⟨
v
,
v
⟩
=
0
⟨
v
,
v
⟩
=
0
(:v,v:)=0 \langle v, v\rangle=0 ⟨ v , v ⟩ = 0 ,这表明
v
=
0
v
=
0
v=0 v=0 v = 0 。于是
V
⊥
=
{
0
}
V
⊥
=
{
0
}
V^(_|_)={0} V^{\perp}=\{0\} V ⊥ = { 0 } .
(d) 设
U
U
U U U 是
V
V
V V V 的子集且
v
∈
U
∩
U
⊥
v
∈
U
∩
U
⊥
v in U nnU^(_|_) v \in U \cap U^{\perp} v ∈ U ∩ U ⊥ . 则
⟨
v
,
v
⟩
=
0
⟨
v
,
v
⟩
=
0
(:v,v:)=0 \langle v, v\rangle=0 ⟨ v , v ⟩ = 0 , 这表明
v
=
0
v
=
0
v=0 v=0 v = 0 . 于是
U
∩
U
⊥
⊂
{
0
}
U
∩
U
⊥
⊂
{
0
}
U nnU^(_|_)sub{0} U \cap U^{\perp} \subset\{0\} U ∩ U ⊥ ⊂ { 0 } .
(e) 设
U
U
U U U 和
W
W
W W W 均为
V
V
V V V 的子集且
U
⊂
W
U
⊂
W
U sub W U \subset W U ⊂ W . 设
v
∈
W
⊥
v
∈
W
⊥
v inW^(_|_) v \in W^{\perp} v ∈ W ⊥ . 则对每个
u
∈
W
u
∈
W
u in W u \in W u ∈ W 均有
⟨
v
,
u
⟩
=
0
⟨
v
,
u
⟩
=
0
(:v,u:)=0 \langle v, u\rangle=0 ⟨ v , u ⟩ = 0 , 这表明对每个
u
∈
U
u
∈
U
u in U u \in U u ∈ U 均有
⟨
v
,
u
⟩
=
0
⟨
v
,
u
⟩
=
0
(:v,u:)=0 \langle v, u\rangle=0 ⟨ v , u ⟩ = 0 . 所以
v
∈
U
⊥
v
∈
U
⊥
v inU^(_|_) v \in U^{\perp} v ∈ U ⊥ . 因此
W
⊥
⊂
U
⊥
W
⊥
⊂
U
⊥
W^(_|_)subU^(_|_) W^{\perp} \subset U^{\perp} W ⊥ ⊂ U ⊥ .
回想一下, 若
U
U
U U U 和
W
W
W W W 均为
V
V
V V V 的子空间, 并且
V
V
V V V 中每个元素都可以唯一地写成
U
U
U U U 中的一个向量与
W
W
W W W 中的一个向量的和,则
V
V
V V V 是
U
U
U U U 和
W
W
W W W 的直和(记为
V
=
U
⊕
W
V
=
U
⊕
W
V=U o+W V=U \oplus W V = U ⊕ W )(见1.40)。
以下定理表明,
V
V
V V V 的每个有限维子空间都导致了
V
V
V V V 的一个自然的直和分解.
6.47 子空间与其正交补的直和
设
U
U
U U U 是
V
V
V V V 的有限维子空间,则
V
=
U
⊕
U
⊥
V
=
U
⊕
U
⊥
V=U o+U^(_|_) V=U \oplus U^{\perp} V = U ⊕ U ⊥ .
证明 首先证明
6.48
V
=
U
+
U
⊥
V
=
U
+
U
⊥
V=U+U^(_|_) V=U+U^{\perp} V = U + U ⊥
为此,设
v
∈
V
v
∈
V
v in V v \in V v ∈ V ,并设
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
U
U
U U U 的规范正交基. 显然
6.49
v
=
⟨
v
,
e
1
⟩
e
1
+
⋯
+
⟨
v
,
e
m
⟩
e
m
⏟
u
+
v
−
⟨
v
,
e
1
⟩
e
1
−
⋯
−
⟨
v
,
e
m
⟩
e
m
⏟
w
v
=
v
,
e
1
e
1
+
⋯
+
v
,
e
m
e
m
⏟
u
+
v
−
v
,
e
1
e
1
−
⋯
−
v
,
e
m
e
m
⏟
w
v=ubrace((:v,e_(1):)e_(1)+cdots+(:v,e_(m):)e_(m)ubrace)_(u)+ubrace(v-(:v,e_(1):)e_(1)-cdots-(:v,e_(m):)e_(m)ubrace)_(w) v=\underbrace{\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{m}\right\rangle e_{m}}_{u}+\underbrace{v-\left\langle v, e_{1}\right\rangle e_{1}-\cdots-\left\langle v, e_{m}\right\rangle e_{m}}_{w} v = ⟨ v , e 1 ⟩ e 1 + ⋯ + ⟨ v , e m ⟩ e m ⏟ u + v − ⟨ v , e 1 ⟩ e 1 − ⋯ − ⟨ v , e m ⟩ e m ⏟ w
设
u
u
u u u 和
w
w
w w w 如上式. 很明显
u
∈
U
u
∈
U
u in U u \in U u ∈ U . 因为
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是一个规范正交组, 所以对每个
j
=
1
,
…
,
m
j
=
1
,
…
,
m
j=1,dots,m j=1, \ldots, m j = 1 , … , m 均有
⟨
w
,
e
j
⟩
=
⟨
v
,
e
j
⟩
−
⟨
v
,
e
j
⟩
=
0
w
,
e
j
=
v
,
e
j
−
v
,
e
j
=
0
(:w,e_(j):)=(:v,e_(j):)-(:v,e_(j):)=0 \left\langle w, e_{j}\right\rangle=\left\langle v, e_{j}\right\rangle-\left\langle v, e_{j}\right\rangle=0 ⟨ w , e j ⟩ = ⟨ v , e j ⟩ − ⟨ v , e j ⟩ = 0
于是
w
w
w w w 正交于
span
(
e
1
,
…
,
e
m
)
span
e
1
,
…
,
e
m
span(e_(1),dots,e_(m)) \operatorname{span}\left(e_{1}, \ldots, e_{m}\right) span ( e 1 , … , e m ) 中的每个向量. 也就是说
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ 。于是
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w ,其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ ,这就证明了 6.48 。
由 6.46(d) 有
U
∩
U
⊥
=
{
0
}
U
∩
U
⊥
=
{
0
}
U nnU^(_|_)={0} U \cap U^{\perp}=\{0\} U ∩ U ⊥ = { 0 } . 再由 6.48 有
V
=
U
⊕
U
⊥
V
=
U
⊕
U
⊥
V=U o+U^(_|_) V=U \oplus U^{\perp} V = U ⊕ U ⊥ (见 1.45)。
现在可以看到如何利用
dim
U
dim
U
dim U \operatorname{dim} U dim U 来计算
dim
U
⊥
dim
U
⊥
dimU^(_|_) \operatorname{dim} U^{\perp} dim U ⊥ .
6.50 正交补的维数
设
V
V
V V V 是有限维的且
U
U
U U U 是
V
V
V V V 的子空间,则
dim
U
⊥
=
dim
V
−
dim
U
dim
U
⊥
=
dim
V
−
dim
U
dimU^(_|_)=dim V-dim U \operatorname{dim} U^{\perp}=\operatorname{dim} V-\operatorname{dim} U dim U ⊥ = dim V − dim U .
证明 由 6.47 和 3.78 立即可得
dim
U
⊥
dim
U
⊥
dimU^(_|_) \operatorname{dim} U^{\perp} dim U ⊥ 的公式.
下面的命题是 6.47 的一个重要推论.
6.51 正交补的正交补
设
U
U
U U U 是
V
V
V V V 的有限维子空间,则
U
=
(
U
⊥
)
⊥
U
=
U
⊥
⊥
U=(U^(_|_))^(_|_) U=\left(U^{\perp}\right)^{\perp} U = ( U ⊥ ) ⊥ .
证明 首先证明
6.52
U
⊂
(
U
⊥
)
⊥
U
⊂
U
⊥
⊥
U sub(U^(_|_))^(_|_) U \subset\left(U^{\perp}\right)^{\perp} U ⊂ ( U ⊥ ) ⊥
为此, 设
u
∈
U
u
∈
U
u in U u \in U u ∈ U . 则对每个
v
∈
U
⊥
v
∈
U
⊥
v inU^(_|_) v \in U^{\perp} v ∈ U ⊥ 均有
⟨
u
,
v
⟩
=
0
⟨
u
,
v
⟩
=
0
(:u,v:)=0 \langle u, v\rangle=0 ⟨ u , v ⟩ = 0 (由
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 的定义)。因为
u
u
u u u 正交于
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 中的每个向量, 所以
u
∈
(
U
⊥
)
⊥
u
∈
U
⊥
⊥
u in(U^(_|_))^(_|_) u \in\left(U^{\perp}\right)^{\perp} u ∈ ( U ⊥ ) ⊥ , 这就证明了 6.52.
要证明另一个方向的包含关系,设
v
∈
(
U
⊥
)
⊥
v
∈
U
⊥
⊥
v in(U^(_|_))^(_|_) v \in\left(U^{\perp}\right)^{\perp} v ∈ ( U ⊥ ) ⊥ 。由 6.47 可得
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w ,其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ 。从而
v
−
u
=
w
∈
U
⊥
v
−
u
=
w
∈
U
⊥
v-u=w inU^(_|_) v-u=w \in U^{\perp} v − u = w ∈ U ⊥ 。因为
v
∈
(
U
⊥
)
⊥
v
∈
U
⊥
⊥
v in(U^(_|_))^(_|_) v \in\left(U^{\perp}\right)^{\perp} v ∈ ( U ⊥ ) ⊥ 且
u
∈
(
U
⊥
)
⊥
u
∈
U
⊥
⊥
u in(U^(_|_))^(_|_) u \in\left(U^{\perp}\right)^{\perp} u ∈ ( U ⊥ ) ⊥ (由于6.52),所以
v
−
u
∈
(
U
⊥
)
⊥
v
−
u
∈
U
⊥
⊥
v-u in(U^(_|_))^(_|_) v-u \in\left(U^{\perp}\right)^{\perp} v − u ∈ ( U ⊥ ) ⊥ 。于是
v
−
u
∈
U
⊥
∩
(
U
⊥
)
⊥
v
−
u
∈
U
⊥
∩
U
⊥
⊥
v-u inU^(_|_)nn(U^(_|_))^(_|_) v-u \in U^{\perp} \cap\left(U^{\perp}\right)^{\perp} v − u ∈ U ⊥ ∩ ( U ⊥ ) ⊥ , 这表明
(
v
−
u
)
(
v
−
u
)
(v-u) (v-u) ( v − u ) 与自身正交, 从而
v
−
u
=
0
v
−
u
=
0
v-u=0 v-u=0 v − u = 0 , 即
v
=
u
v
=
u
v=u v=u v = u , 于是
v
∈
U
v
∈
U
v in U v \in U v ∈ U . 因此
(
U
⊥
)
⊥
⊂
U
U
⊥
⊥
⊂
U
(U^(_|_))^(_|_)sub U \left(U^{\perp}\right)^{\perp} \subset U ( U ⊥ ) ⊥ ⊂ U , 再结合 6.52 就完成了证明.
现在我们对
V
V
V V V 的每个有限维子空间定义一个算子
P
U
P
U
P_(U) \mathcal{P}_{U} P U .
6.53 定义 正交投影(orthogonal projection),
P
U
P
U
P_(U) P_{U} P U
设
U
U
U U U 是
V
V
V V V 的有限维子空间。定义
V
V
V V V 到
U
U
U U U 上的正交投影为如下算子
P
U
∈
L
(
V
)
P
U
∈
L
(
V
)
P_(U)inL(V) P_{U} \in \mathcal{L}(V) P U ∈ L ( V ) :对
v
∈
V
v
∈
V
v in V v \in V v ∈ V , 将其写成
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w , 其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ , 则
P
U
v
=
u
P
U
v
=
u
P_(U)v=u P_{U} v=u P U v = u .
6.47 中给出的直和分解
V
=
U
⊕
U
⊥
V
=
U
⊕
U
⊥
V=U o+U^(_|_) V=U \oplus U^{\perp} V = U ⊕ U ⊥ 表明每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均可唯一地写成
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w ,其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ 。于是
P
U
v
P
U
v
P_(U)v P_{U} v P U v 定义合理。
6.54 例 设
x
∈
V
,
x
≠
0
x
∈
V
,
x
≠
0
x in V,x!=0 x \in V, x \neq 0 x ∈ V , x ≠ 0 且
U
=
span
(
x
)
U
=
span
(
x
)
U=span(x) U=\operatorname{span}(x) U = span ( x ) . 证明对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
P
U
v
=
⟨
v
,
x
⟩
‖
x
‖
2
x
P
U
v
=
⟨
v
,
x
⟩
‖
x
‖
2
x
P_(U)v=((:v,x:))/(||x||^(2))x P_{U} v=\frac{\langle v, x\rangle}{\|x\|^{2}} x P U v = ⟨ v , x ⟩ ‖ x ‖ 2 x
证明 设
v
∈
V
v
∈
V
v in V v \in V v ∈ V . 则
v
=
⟨
v
,
x
⟩
‖
x
‖
2
x
+
(
v
−
⟨
v
,
x
⟩
‖
x
‖
2
x
)
v
=
⟨
v
,
x
⟩
‖
x
‖
2
x
+
v
−
⟨
v
,
x
⟩
‖
x
‖
2
x
v=((:v,x:))/(||x||^(2))x+(v-((:v,x:))/(||x||^(2))x) v=\frac{\langle v, x\rangle}{\|x\|^{2}} x+\left(v-\frac{\langle v, x\rangle}{\|x\|^{2}} x\right) v = ⟨ v , x ⟩ ‖ x ‖ 2 x + ( v − ⟨ v , x ⟩ ‖ x ‖ 2 x )
其中右端的第一项属于
span
(
x
)
span
(
x
)
span(x) \operatorname{span}(x) span ( x ) (从而属于
U
U
U U U ), 第二项正交于
x
x
x x x (从而属于
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ )。因此
P
U
v
P
U
v
P_(U)v P_{U} v P U v 等于右端的第一项。
6.55 正交投影
P
U
P
U
P_(U) P_{U} P U 的性质
设
U
U
U U U 是
V
V
V V V 的有限维子空间且
v
∈
V
v
∈
V
v in V v \in V v ∈ V . 则
(a)
P
U
∈
L
(
V
)
P
U
∈
L
(
V
)
P_(U)inL(V) P_{U} \in \mathcal{L}(V) P U ∈ L ( V ) ;
(b) 对每个
u
∈
U
u
∈
U
u in U u \in U u ∈ U 均有
P
U
u
=
u
P
U
u
=
u
P_(U)u=u P_{U} u=u P U u = u ;
(c) 对每个
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ 均有
P
U
w
=
0
P
U
w
=
0
P_(U)w=0 P_{U} w=0 P U w = 0 ;
(d) range
P
U
=
U
P
U
=
U
P_(U)=U P_{U}=U P U = U ;
(e) null
P
U
=
U
⊥
P
U
=
U
⊥
P_(U)=U^(_|_) P_{U}=U^{\perp} P U = U ⊥ ;
(f)
v
−
P
U
v
∈
U
⊥
v
−
P
U
v
∈
U
⊥
v-P_(U)v inU^(_|_) v-P_{U} v \in U^{\perp} v − P U v ∈ U ⊥ ;
(g)
P
U
2
=
P
U
P
U
2
=
P
U
P_(U)^(2)=P_(U) P_{U}{ }^{2}=P_{U} P U 2 = P U ;
(h)
‖
P
U
v
‖
≤
‖
v
‖
P
U
v
≤
‖
v
‖
||P_(U)v|| <= ||v|| \left\|P_{U} v\right\| \leq\|v\| ‖ P U v ‖ ≤ ‖ v ‖ ;
(i) 对
U
U
U U U 的每个规范正交基
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 均有
P
U
v
=
⟨
v
,
e
1
⟩
e
1
+
⋯
+
⟨
v
,
e
m
⟩
e
m
P
U
v
=
v
,
e
1
e
1
+
⋯
+
v
,
e
m
e
m
P_(U)v=(:v,e_(1):)e_(1)+cdots+(:v,e_(m):)e_(m) P_{U} v=\left\langle v, e_{1}\right\rangle e_{1}+\cdots+\left\langle v, e_{m}\right\rangle e_{m} P U v = ⟨ v , e 1 ⟩ e 1 + ⋯ + ⟨ v , e m ⟩ e m .
证明
(a) 为了证明
P
U
P
U
P_(U) P_{U} P U 是
V
V
V V V 上的线性映射,设
v
1
,
v
2
∈
V
v
1
,
v
2
∈
V
v_(1),v_(2)in V v_{1}, v_{2} \in V v 1 , v 2 ∈ V . 设
v
1
=
u
1
+
w
1
,
v
2
=
u
2
+
w
2
,
v
1
=
u
1
+
w
1
,
v
2
=
u
2
+
w
2
,
v_(1)=u_(1)+w_(1),quadv_(2)=u_(2)+w_(2), v_{1}=u_{1}+w_{1}, \quad v_{2}=u_{2}+w_{2}, v 1 = u 1 + w 1 , v 2 = u 2 + w 2 ,
其中
u
1
,
u
2
∈
U
,
w
1
,
w
2
∈
U
⊥
u
1
,
u
2
∈
U
,
w
1
,
w
2
∈
U
⊥
u_(1),u_(2)in U,w_(1),w_(2)inU^(_|_) u_{1}, u_{2} \in U, w_{1}, w_{2} \in U^{\perp} u 1 , u 2 ∈ U , w 1 , w 2 ∈ U ⊥ . 则
P
U
v
1
=
u
1
P
U
v
1
=
u
1
P_(U)v_(1)=u_(1) P_{U} v_{1}=u_{1} P U v 1 = u 1 且
P
U
v
2
=
u
2
P
U
v
2
=
u
2
P_(U)v_(2)=u_(2) P_{U} v_{2}=u_{2} P U v 2 = u 2 . 从而
v
1
+
v
2
=
(
u
1
+
u
2
)
+
(
w
1
+
w
2
)
v
1
+
v
2
=
u
1
+
u
2
+
w
1
+
w
2
v_(1)+v_(2)=(u_(1)+u_(2))+(w_(1)+w_(2)) v_{1}+v_{2}=\left(u_{1}+u_{2}\right)+\left(w_{1}+w_{2}\right) v 1 + v 2 = ( u 1 + u 2 ) + ( w 1 + w 2 )
其中
u
1
+
u
2
∈
U
u
1
+
u
2
∈
U
u_(1)+u_(2)in U u_{1}+u_{2} \in U u 1 + u 2 ∈ U 且
w
1
+
w
2
∈
U
⊥
w
1
+
w
2
∈
U
⊥
w_(1)+w_(2)inU^(_|_) w_{1}+w_{2} \in U^{\perp} w 1 + w 2 ∈ U ⊥ . 因此
P
U
(
v
1
+
v
2
)
=
u
1
+
u
2
=
P
U
v
1
+
P
U
v
2
.
P
U
v
1
+
v
2
=
u
1
+
u
2
=
P
U
v
1
+
P
U
v
2
.
P_(U)(v_(1)+v_(2))=u_(1)+u_(2)=P_(U)v_(1)+P_(U)v_(2). P_{U}\left(v_{1}+v_{2}\right)=u_{1}+u_{2}=P_{U} v_{1}+P_{U} v_{2} . P U ( v 1 + v 2 ) = u 1 + u 2 = P U v 1 + P U v 2 .
类似地, 设
λ
∈
F
λ
∈
F
lambda inF \lambda \in \mathbf{F} λ ∈ F . 若
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w , 其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ , 则
λ
v
=
λ
u
+
λ
w
λ
v
=
λ
u
+
λ
w
lambda v=lambda u+lambda w \lambda v=\lambda u+\lambda w λ v = λ u + λ w , 其中
λ
u
∈
U
λ
u
∈
U
lambda u in U \lambda u \in U λ u ∈ U 且
λ
w
∈
U
⊥
λ
w
∈
U
⊥
lambda w inU^(_|_) \lambda w \in U^{\perp} λ w ∈ U ⊥ 。于是
P
U
(
λ
v
)
=
λ
u
=
λ
P
U
v
P
U
(
λ
v
)
=
λ
u
=
λ
P
U
v
P_(U)(lambda v)=lambda u=lambdaP_(U)v P_{U}(\lambda v)=\lambda u=\lambda P_{U} v P U ( λ v ) = λ u = λ P U v .
因此
P
U
P
U
P_(U) P_{U} P U 是
V
V
V V V 到
V
V
V V V 的线性映射。
(b) 设
u
∈
U
u
∈
U
u in U u \in U u ∈ U . 则
u
=
u
+
0
u
=
u
+
0
u=u+0 u=u+0 u = u + 0 , 其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
0
∈
U
⊥
0
∈
U
⊥
0inU^(_|_) 0 \in U^{\perp} 0 ∈ U ⊥ . 于是
P
U
u
=
u
P
U
u
=
u
P_(U)u=u P_{U} u=u P U u = u .
(c) 设
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ . 则
w
=
0
+
w
w
=
0
+
w
w=0+w w=0+w w = 0 + w , 其中
0
∈
U
0
∈
U
0in U 0 \in U 0 ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ . 于是
P
U
w
=
0
P
U
w
=
0
P_(U)w=0 P_{U} w=0 P U w = 0 .
(d) 由
P
U
P
U
P_(U) P_{U} P U 的定义可知 range
P
U
⊂
U
P
U
⊂
U
P_(U)sub U P_{U} \subset U P U ⊂ U 。由 (b) 可知
U
⊂
U
⊂
U sub U \subset U ⊂ range
P
U
P
U
P_(U) P_{U} P U . 于是 range
P
U
P
U
P_(U) P_{U} P U
=
U
=
U
=U =U = U .
(e) 由 (c) 可知
U
⊥
⊂
U
⊥
⊂
U^(_|_)sub U^{\perp} \subset U ⊥ ⊂ null
P
U
P
U
P_(U) P_{U} P U . 为了证明另一个方向的包含关系, 注意若
v
∈
v
∈
v in v \in v ∈ null
P
U
P
U
P_(U) P_{U} P U 则 6.47 中给出的分解一定是
v
=
0
+
v
v
=
0
+
v
v=0+v v=0+v v = 0 + v ,其中
0
∈
U
0
∈
U
0in U 0 \in U 0 ∈ U 且
v
∈
U
⊥
v
∈
U
⊥
v inU^(_|_) v \in U^{\perp} v ∈ U ⊥ 。因此 null
P
U
⊂
P
U
⊂
P_(U)sub P_{U} \subset P U ⊂
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 。
(f) 若
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w , 其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ , 则
v
−
P
U
v
=
v
−
u
=
w
∈
U
⊥
v
−
P
U
v
=
v
−
u
=
w
∈
U
⊥
v-P_(U)v=v-u=w inU^(_|_) v-P_{U} v=v-u=w \in U^{\perp} v − P U v = v − u = w ∈ U ⊥
(g)若
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w ,其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ ,则
(
P
U
2
)
v
=
P
U
(
P
U
v
)
=
P
U
u
=
u
=
P
U
v
P
U
2
v
=
P
U
P
U
v
=
P
U
u
=
u
=
P
U
v
(P_(U)^(2))v=P_(U)(P_(U)v)=P_(U)u=u=P_(U)v \left(P_{U}^{2}\right) v=P_{U}\left(P_{U} v\right)=P_{U} u=u=P_{U} v ( P U 2 ) v = P U ( P U v ) = P U u = u = P U v
(h) 若
v
=
u
+
w
v
=
u
+
w
v=u+w v=u+w v = u + w , 其中
u
∈
U
u
∈
U
u in U u \in U u ∈ U 且
w
∈
U
⊥
w
∈
U
⊥
w inU^(_|_) w \in U^{\perp} w ∈ U ⊥ , 则
‖
P
U
v
‖
2
=
‖
u
‖
2
≤
‖
u
‖
2
+
‖
w
‖
2
=
‖
v
‖
2
P
U
v
2
=
‖
u
‖
2
≤
‖
u
‖
2
+
‖
w
‖
2
=
‖
v
‖
2
||P_(U)v||^(2)=||u||^(2) <= ||u||^(2)+||w||^(2)=||v||^(2) \left\|P_{U} v\right\|^{2}=\|u\|^{2} \leq\|u\|^{2}+\|w\|^{2}=\|v\|^{2} ‖ P U v ‖ 2 = ‖ u ‖ 2 ≤ ‖ u ‖ 2 + ‖ w ‖ 2 = ‖ v ‖ 2
这里最后一个等号是根据勾股定理.
(i) 利用定理 6.47 证明中的等式 6.49 可得
P
U
v
P
U
v
P_(U)v P_{U} v P U v 的公式.
极小化问题
经常会遇到这样的问题:给定
V
V
V V V 的子空间
U
U
U U U 和点
v
∈
V
v
∈
V
v in V v \in V v ∈ V , 求点
u
∈
U
u
∈
U
u in U u \in U u ∈ U 使得
‖
v
−
u
‖
‖
v
−
u
‖
||v-u|| \|v-u\| ‖ v − u ‖ 最小.下面的命题表明,通过取
u
=
P
U
v
u
=
P
U
v
u=P_(U)v u=P_{U} v u = P U v 就可以解决
极小化问题的求解非常简单,这导致了内积空间在纯数学之外的很多重要应用。
这个极小化问题。
6.56 到子空间的最小距离
设
U
U
U U U 是
V
V
V V V 的有限维子空间,
v
∈
V
v
∈
V
v in V v \in V v ∈ V 且
u
∈
U
u
∈
U
u in U u \in U u ∈ U . 则
‖
v
−
P
U
v
‖
≤
‖
v
−
u
‖
v
−
P
U
v
≤
‖
v
−
u
‖
||v-P_(U)v|| <= ||v-u|| \left\|v-P_{U} v\right\| \leq\|v-u\| ‖ v − P U v ‖ ≤ ‖ v − u ‖
进一步, 等号成立当且仅当
u
=
P
U
v
u
=
P
U
v
u=P_(U)v u=P_{U} v u = P U v .
证明 我们有
6.57
‖
v
−
P
U
v
‖
2
≤
‖
v
−
P
U
v
‖
2
+
‖
P
U
v
−
u
‖
2
6.57
v
−
P
U
v
2
≤
v
−
P
U
v
2
+
P
U
v
−
u
2
6.57quad||v-P_(U)v||^(2) <= ||v-P_(U)v||^(2)+||P_(U)v-u||^(2) 6.57 \quad\left\|v-P_{U} v\right\|^{2} \leq\left\|v-P_{U} v\right\|^{2}+\left\|P_{U} v-u\right\|^{2} 6.57 ‖ v − P U v ‖ 2 ≤ ‖ v − P U v ‖ 2 + ‖ P U v − u ‖ 2
=
‖
(
v
−
P
U
v
)
+
(
P
U
v
−
u
)
‖
2
=
‖
v
−
u
‖
2
=
v
−
P
U
v
+
P
U
v
−
u
2
=
‖
v
−
u
‖
2
{:[=||(v-P_(U)v)+(P_(U)v-u)||^(2)],[=||v-u||^(2)]:} \begin{aligned}
& =\left\|\left(v-P_{U} v\right)+\left(P_{U} v-u\right)\right\|^{2} \\
& =\|v-u\|^{2}
\end{aligned} = ‖ ( v − P U v ) + ( P U v − u ) ‖ 2 = ‖ v − u ‖ 2
其中第一行成立是由于
0
≤
‖
P
U
v
−
u
‖
2
0
≤
P
U
v
−
u
2
0 <= ||P_(U)v-u||^(2) 0 \leq\left\|P_{U} v-u\right\|^{2} 0 ≤ ‖ P U v − u ‖ 2 ,第二行是利用勾股定理(可以这样用是因为由 6.55(f) 知
v
−
P
U
v
∈
U
⊥
v
−
P
U
v
∈
U
⊥
v-P_(U)v inU^(_|_) v-P_{U} v \in U^{\perp} v − P U v ∈ U ⊥ ,而且我们还有
P
U
v
−
u
∈
U
P
U
v
−
u
∈
U
P_(U)v-u in U P_{U} v-u \in U P U v − u ∈ U ),第三行成立是简单的计算。再开方即得要证的不等式.
等号成立当且仅当 6.57 是等式,当且仅当
‖
P
U
v
−
u
‖
=
0
P
U
v
−
u
=
0
||P_(U)v-u||=0 \left\|P_{U} \mathcal{v}-u\right\|=0 ‖ P U v − u ‖ = 0 , 当且仅当
u
=
P
U
v
u
=
P
U
v
u=P_(U)v u=P_{U} v u = P U v 。
P
U
v
P
U
v
quadP_(U)v \quad P_{U} v P U v 是
U
U
U U U 中距离
v
v
v v v 最近的点
上述命题通常与公式 6.55(i) 结合起来计算极小化问题的显式解.
6.58 例 求一个次数不超过 5 的实系数多项式
u
u
u u u 使其在区间
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上尽量好地逼近
sin
x
sin
x
sin x \sin x sin x , 即使得
∫
−
π
π
|
sin
x
−
u
(
x
)
|
2
d
x
∫
−
π
π
|
sin
x
−
u
(
x
)
|
2
d
x
int_(-pi)^(pi)|sin x-u(x)|^(2)dx \int_{-\pi}^{\pi}|\sin x-u(x)|^{2} \mathrm{~d} x ∫ − π π | sin x − u ( x ) | 2 d x
最小. 对比你的结果与泰勒级数逼近.
解 设
C
R
[
−
π
,
π
]
C
R
[
−
π
,
π
]
C_(R)[-pi,pi] C_{\mathbf{R}}[-\pi, \pi] C R [ − π , π ] 表示由
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上的实值连续函数构成的实内积空间,其内积为:
6.59
⟨
f
,
g
⟩
=
∫
−
π
π
f
(
x
)
g
(
x
)
d
x
⟨
f
,
g
⟩
=
∫
−
π
π
f
(
x
)
g
(
x
)
d
x
(:f,g:)=int_(-pi)^(pi)f(x)g(x)dx \langle f, g\rangle=\int_{-\pi}^{\pi} f(x) g(x) \mathrm{d} x ⟨ f , g ⟩ = ∫ − π π f ( x ) g ( x ) d x
设
v
∈
C
R
[
−
π
,
π
]
v
∈
C
R
[
−
π
,
π
]
v inC_(R)[-pi,pi] v \in C_{\mathbf{R}}[-\pi, \pi] v ∈ C R [ − π , π ] 是由
v
(
x
)
=
sin
x
v
(
x
)
=
sin
x
v(x)=sin x v(x)=\sin x v ( x ) = sin x 定义的函数。令
U
U
U U U 表示由次数不超过 5 的实系数多项式构成的
C
R
[
−
π
,
π
]
C
R
[
−
π
,
π
]
C_(R)[-pi,pi] C_{\mathbf{R}}[-\pi, \pi] C R [ − π , π ] 的子空间. 现在问题可以重述为:
求
u
∈
U
u
∈
U
u in U u \in U u ∈ U 使得
‖
v
−
u
‖
‖
v
−
u
‖
||v-u|| \|v-u\| ‖ v − u ‖ 最小.
能够演算积分的计算机在这里是很有用的。
6.60
u
(
x
)
=
0.987862
x
−
0.155271
x
3
+
0.00564312
x
5
u
(
x
)
=
0.987862
x
−
0.155271
x
3
+
0.00564312
x
5
u(x)=0.987862 x-0.155271x^(3)+0.00564312x^(5) u(x)=0.987862 x-0.155271 x^{3}+0.00564312 x^{5} u ( x ) = 0.987862 x − 0.155271 x 3 + 0.00564312 x 5
此处我们把精确解中出现的那些
π
π
pi \pi π 换成了适当的十进制的近似值。
由 6.56, 上面的多项式
u
u
u u u 是
sin
x
sin
x
sin x \sin x sin x 在区间
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上最佳的 5 次多项式逼近(此处 "最佳逼近" 的意思是
∫
−
π
π
|
sin
x
−
u
(
x
)
|
2
d
x
∫
−
π
π
|
sin
x
−
u
(
x
)
|
2
d
x
int_(-pi)^(pi)|sin x-u(x)|^(2)dx \int_{-\pi}^{\pi}|\sin x-u(x)|^{2} \mathrm{~d} x ∫ − π π | sin x − u ( x ) | 2 d x 达到最小). 要看出这个逼近有多好,下图显示了
sin
x
sin
x
sin x \sin x sin x 和我们在 6.60 中给出的逼近
u
(
x
)
u
(
x
)
u(x) u(x) u ( x ) 在区间
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上的图像.
在
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上
sin
x
sin
x
sin x \sin x sin x 的图像(蓝色)和 6.60 给出的逼近
u
(
x
)
u
(
x
)
u(x) u(x) u ( x ) 的图像(红色)
我们的逼近 6.60 非常精确,以至于两个图形几乎重合——肉眼只能看到一个图像!蓝图几乎完全覆盖了红图。如果你是在电子设备上看这个图, (1) 请尽量放大图片,特别是在 3 和 -3 附近,以便观察两个图像的微小差别。
sin
x
sin
x
sin x \sin x sin x 的另一个熟知的 5 次多项式逼近是由泰勒多项式
6.61
x
−
x
3
3
!
+
x
5
5
!
x
−
x
3
3
!
+
x
5
5
!
x-(x^(3))/(3!)+(x^(5))/(5!) x-\frac{x^{3}}{3!}+\frac{x^{5}}{5!} x − x 3 3 ! + x 5 5 !
给出的. 我们来看一下这个逼近的精确度如何,下图显示了
sin
x
sin
x
sin x \sin x sin x 和泰勒多项式 6.61在区间
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上的图像。
在
[
−
π
,
π
]
[
−
π
,
π
]
[-pi,pi] [-\pi, \pi] [ − π , π ] 上
sin
x
sin
x
sin x \sin x sin x 的图像 (蓝色) 和泰勒多项式 6.61 的图像(红色)
泰勒多项式在 0 附近对
sin
x
sin
x
sin x \sin x sin x 有极好的逼近。但上图表明对
|
x
|
>
2
|
x
|
>
2
|x| > 2 |x|>2 | x | > 2 泰勒多项式并不怎么精确,特别是与 6.60 相比较。例如,取
x
=
3
x
=
3
x=3 x=3 x = 3 ,我们的逼近 6.60 对
sin
3
sin
3
sin 3 \sin 3 sin 3 估计的误差大概是 0.001 ,但是泰勒级数 6.61 对
sin
3
sin
3
sin 3 \sin 3 sin 3 估计的误差大概是 0.4 . 因此对于
x
=
3
x
=
3
x=3 x=3 x = 3 泰勒级数的误差比 6.60 的误差大几百倍。线性代数帮助我们发现了
sin
x
sin
x
sin x \sin x sin x 的一个逼近,这个逼近改进了我们在微积分中学到的逼近!
习题 6.C
1 设
v
1
,
…
,
v
m
∈
V
v
1
,
…
,
v
m
∈
V
v_(1),dots,v_(m)in V v_{1}, \ldots, v_{m} \in V v 1 , … , v m ∈ V 。证明
{
v
1
,
…
,
v
m
}
⊥
=
(
span
(
v
1
,
…
,
v
m
)
)
⊥
v
1
,
…
,
v
m
⊥
=
span
v
1
,
…
,
v
m
⊥
{v_(1),dots,v_(m)}^(_|_)=(span(v_(1),dots,v_(m)))^(_|_) \left\{v_{1}, \ldots, v_{m}\right\}^{\perp}=\left(\operatorname{span}\left(v_{1}, \ldots, v_{m}\right)\right)^{\perp} { v 1 , … , v m } ⊥ = ( span ( v 1 , … , v m ) ) ⊥ .
2 设
U
U
U U U 是
V
V
V V V 的有限维子空间。证明
U
⊥
=
{
0
}
U
⊥
=
{
0
}
U^(_|_)={0} U^{\perp}=\{0\} U ⊥ = { 0 } 当且仅当
U
=
V
U
=
V
U=V U=V U = V .
习题 14(a)表明,如果去掉 "
U
U
U U U 是有限维的" 这一假设,则上面的结果不成立。
3 设
U
U
U U U 是
V
V
V V V 的子空间,设
u
1
,
…
,
u
m
u
1
,
…
,
u
m
u_(1),dots,u_(m) u_{1}, \ldots, u_{m} u 1 , … , u m 是
U
U
U U U 的基,且
u
1
,
…
,
u
m
,
w
1
,
…
,
w
n
u
1
,
…
,
u
m
,
w
1
,
…
,
w
n
u_(1),dots,u_(m),w_(1),dots,w_(n) u_{1}, \ldots, u_{m}, w_{1}, \ldots, w_{n} u 1 , … , u m , w 1 , … , w n
是
V
V
V V V 的基。证明若对
V
V
V V V 的上述基应用格拉姆-施密特过程得到组
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m ,
f
1
,
…
,
f
n
f
1
,
…
,
f
n
f_(1),dots,f_(n) f_{1}, \ldots, f_{n} f 1 , … , f n , 则
e
1
,
…
,
e
m
e
1
,
…
,
e
m
e_(1),dots,e_(m) e_{1}, \ldots, e_{m} e 1 , … , e m 是
U
U
U U U 的规范正交基,
f
1
,
…
,
f
n
f
1
,
…
,
f
n
f_(1),dots,f_(n) f_{1}, \ldots, f_{n} f 1 , … , f n 是
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 的规范正交基.
4 给定
R
4
R
4
R^(4) \mathbf{R}^{4} R 4 的子空间
U
=
span
(
(
1
,
2
,
3
,
−
4
)
,
(
−
5
,
4
,
3
,
2
)
)
U
=
span
(
(
1
,
2
,
3
,
−
4
)
,
(
−
5
,
4
,
3
,
2
)
)
U=span((1,2,3,-4),(-5,4,3,2)) U=\operatorname{span}((1,2,3,-4),(-5,4,3,2)) U = span ( ( 1 , 2 , 3 , − 4 ) , ( − 5 , 4 , 3 , 2 ) )
求
U
U
U U U 的一个规范正交基和
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 的一个规范正交基.
5 设
V
V
V V V 是有限维的且
U
U
U U U 是
V
V
V V V 的子空间。证明
P
U
⊥
=
I
−
P
U
P
U
⊥
=
I
−
P
U
P_(U _|_)=I-P_(U) P_{U \perp}=I-P_{U} P U ⊥ = I − P U ,这里
I
I
I I I 是
V
V
V V V 上的恒等算子。
6 设
U
U
U U U 和
W
W
W W W 均为
V
V
V V V 的有限维子空间。证明
P
U
P
W
=
0
P
U
P
W
=
0
P_(U)P_(W)=0 P_{U} P_{W}=0 P U P W = 0 当且仅当对所有
u
∈
U
u
∈
U
u in U u \in U u ∈ U 和
w
∈
W
w
∈
W
w in W w \in W w ∈ W 均有
⟨
u
,
w
⟩
=
0
⟨
u
,
w
⟩
=
0
(:u,w:)=0 \langle u, w\rangle=0 ⟨ u , w ⟩ = 0 。
7 设
V
V
V V V 是有限维的,
P
∈
L
(
V
)
P
∈
L
(
V
)
P inL(V) P \in \mathcal{L}(V) P ∈ L ( V ) 使得
P
2
=
P
P
2
=
P
P^(2)=P P^{2}=P P 2 = P 且 null
P
P
P P P 中的向量与 range
P
P
P P P 中的向量都正交. 证明有
V
V
V V V 的子空间
U
U
U U U 使得
P
=
P
U
P
=
P
U
P=P_(U) P=P_{U} P = P U .
8 设
V
V
V V V 是有限维的,
P
∈
L
(
V
)
P
∈
L
(
V
)
P inL(V) P \in \mathcal{L}(V) P ∈ L ( V ) 使得
P
2
=
P
P
2
=
P
P^(2)=P P^{2}=P P 2 = P 且对每个
v
∈
V
v
∈
V
v in V v \in V v ∈ V 均有
‖
P
v
‖
≤
‖
v
‖
‖
P
v
‖
≤
‖
v
‖
||Pv|| <= ||v|| \|P v\| \leq\|v\| ‖ P v ‖ ≤ ‖ v ‖ . 证明存在
V
V
V V V 的子空间
U
U
U U U 使得
P
=
P
U
P
=
P
U
P=P_(U) P=P_{U} P = P U .
9 设
T
∈
L
(
V
)
,
U
T
∈
L
(
V
)
,
U
T inL(V),U T \in \mathcal{L}(V), U T ∈ L ( V ) , U 是
V
V
V V V 的有限维子空间。证明
U
U
U U U 在
T
T
T T T 下不变当且仅当
P
U
T
P
U
=
P
U
T
P
U
=
P_(U)TP_(U)= P_{U} T P_{U}= P U T P U =
T
P
U
T
P
U
TP_(U) T P_{U} T P U .
10 设
V
V
V V V 是有限维的,
T
∈
L
(
V
)
,
U
T
∈
L
(
V
)
,
U
T inL(V),U T \in \mathcal{L}(V), U T ∈ L ( V ) , U 是
V
V
V V V 的子空间。证明
U
U
U U U 和
U
⊥
U
⊥
U^(_|_) U^{\perp} U ⊥ 都在
T
T
T T T 下不变当且仅当
P
U
T
=
T
P
U
P
U
T
=
T
P
U
P_(U)T=TP_(U) P_{U} T=T P_{U} P U T = T P U 。
11 在
R
4
R
4
R^(4) \mathbf{R}^{4} R 4 中设
U
=
span
(
(
1
,
1
,
0
,
0
)
,
(
1
,
1
,
1
,
2
)
)
U
=
span
(
(
1
,
1
,
0
,
0
)
,
(
1
,
1
,
1
,
2
)
)
U=span((1,1,0,0),(1,1,1,2)) U=\operatorname{span}((1,1,0,0),(1,1,1,2)) U = span ( ( 1 , 1 , 0 , 0 ) , ( 1 , 1 , 1 , 2 ) ) . 求
u
∈
U
u
∈
U
u in U u \in U u ∈ U 使得
‖
u
−
(
1
,
2
,
3
,
4
)
‖
‖
u
−
(
1
,
2
,
3
,
4
)
‖
||u-(1,2,3,4)|| \|u-(1,2,3,4)\| ‖ u − ( 1 , 2 , 3 , 4 ) ‖ 最小.
12 求
p
∈
P
3
(
R
)
p
∈
P
3
(
R
)
p inP_(3)(R) p \in \mathcal{P}_{3}(\mathbf{R}) p ∈ P 3 ( R ) 使得
p
(
0
)
=
0
,
p
′
(
0
)
=
0
p
(
0
)
=
0
,
p
′
(
0
)
=
0
p(0)=0,p^(')(0)=0 p(0)=0, p^{\prime}(0)=0 p ( 0 ) = 0 , p ′ ( 0 ) = 0 , 而且
∫
0
1
|
2
+
3
x
−
p
(
x
)
|
2
d
x
∫
0
1
|
2
+
3
x
−
p
(
x
)
|
2
d
x
int_(0)^(1)|2+3x-p(x)|^(2)dx \int_{0}^{1}|2+3 x-p(x)|^{2} \mathrm{~d} x ∫ 0 1 | 2 + 3 x − p ( x ) | 2 d x
最小.
13 求
p
∈
P
5
(
R
)
p
∈
P
5
(
R
)
p inP_(5)(R) p \in \mathcal{P}_{5}(\mathbf{R}) p ∈ P 5 ( R ) 使得
∫
−
π
π
|
sin
x
−
p
(
x
)
|
2
d
x
∫
−
π
π
|
sin
x
−
p
(
x
)
|
2
d
x
int_(-pi)^(pi)|sin x-p(x)|^(2)dx \int_{-\pi}^{\pi}|\sin x-p(x)|^{2} \mathrm{~d} x ∫ − π π | sin x − p ( x ) | 2 d x
最小。
多项式 6.60 是本题的一个极好的近似解,但是这里要找的是包含
π
π
pi \pi π 的幕的精确解. 可以使用能演算符号积分的计算机。
14 设
C
R
(
[
−
1
,
1
]
)
C
R
(
[
−
1
,
1
]
)
C_(R)([-1,1]) C_{\mathbf{R}}([-1,1]) C R ( [ − 1 , 1 ] ) 是区间
[
−
1
,
1
]
[
−
1
,
1
]
[-1,1] [-1,1] [ − 1 , 1 ] 上实值连续函数构成的向量空间, 且其上的内积为:对
f
,
g
∈
C
R
(
[
−
1
,
1
]
)
f
,
g
∈
C
R
(
[
−
1
,
1
]
)
f,g inC_(R)([-1,1]) f, g \in C_{\mathbf{R}}([-1,1]) f , g ∈ C R ( [ − 1 , 1 ] )
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
⟨
f
,
g
⟩
=
∫
−
1
1
f
(
x
)
g
(
x
)
d
x
(:f,g:)=int_(-1)^(1)f(x)g(x)dx \langle f, g\rangle=\int_{-1}^{1} f(x) g(x) \mathrm{d} x ⟨ f , g ⟩ = ∫ − 1 1 f ( x ) g ( x ) d x
给定
C
R
(
[
−
1
,
1
]
)
C
R
(
[
−
1
,
1
]
)
C_(R)([-1,1]) C_{\mathbf{R}}([-1,1]) C R ( [ − 1 , 1 ] ) 的子空间
U
=
{
f
∈
C
R
(
[
−
1
,
1
]
)
:
f
(
0
)
=
0
}
U
=
f
∈
C
R
(
[
−
1
,
1
]
)
:
f
(
0
)
=
0
U={f inC_(R)([-1,1]):f(0)=0} U=\left\{f \in C_{\mathbf{R}}([-1,1]): f(0)=0\right\} U = { f ∈ C R ( [ − 1 , 1 ] ) : f ( 0 ) = 0 } .
(a) 证明
U
⊥
=
{
0
}
U
⊥
=
{
0
}
U^(_|_)={0} U^{\perp}=\{0\} U ⊥ = { 0 } 。
(b) 证明当没有 "有限维" 这一假设时, 6.47 和 6.51 不成立.