线性代数应该这样学10

第10章

英国数学家和计算机科学先驱艾达 • 洛夫莱斯（1815-1852），1840 年阿尔弗雷德 •沙隆绘制。

迹与行列式

本书的重点始终是线性映射和算子，而不是矩阵。本章对矩阵的关注要多一些，因为我们将定义并讨论算子的迹和行列式, 然后把这些概念与矩阵的相应概念联系起来. 本书在最后解释了行列式在体积和积分理论中所起到的重要作用.本章作如下假设：

10.1 记号 F、V

$F$ 表示 $R$ 或 $C$ .
$V$ 是 $F$ 上的有限维非零向量空间。

本章的学习目标

基变换及其对算子的矩阵的影响
算子的迹和矩阵的迹
算子的行列式和矩阵的行列式
行列式和体积

10.A 迹

为了研究迹和行列式, 我们需要了解在基变更时算子的矩阵是如何变化的. 因此我们先给出关于基变更的必要材料。

基的变更

恒等算子

I \in L (V)

关于

V

的任意基的矩阵都是对角线上元素是 1 其余位置元素是 0 的对角矩阵。如下面的定义，我们仍用符号

I

表示这个矩阵。

10.2 定义单位矩阵（identity matrix）， I

设

n

是正整数.

n \times n

对角矩阵

(\begin{array}{lll} 1 & 0 \\ ⋱ \\ 0 & 1 \end{array})

称为单位矩阵, 记作

I

注意，我们用符号

I

表示（所有向量空间上的）恒等算子和（所有可能大小的）单位矩阵。你应该能从上下文中确定

I

指的是什么. 例如, 考虑等式

M (I) = I

, 左端的

I

代表恒等算子，右端的

I

代表单位矩阵。

如果

A

是与

I

大小相同的方阵（像通常一样，其中的元素属于

F

）, 则

A I =

I A = A

（请自行验证）。
10.3 定义可逆的（invertible）、逆（inverse），

A^{- 1}

方阵

A

称为可逆的, 如果存在一个同样大小的方阵

B

使得

A B = B A = I

. 称

B

是

A

的逆，记作

A^{- 1}

。

有些数学家使用术语非奇异的和奇异的，意思分别与可逆的和不可逆的相同。

如同 3.54 中的证明那样，我们可以得到：如果

A

是可逆的方阵，则存在唯一的矩阵

B

使得

A B = B A = I

（因此记号

B = A^{- 1}

是合理的）。

在 3.C 节，我们定义了从一个向量空间到另一个向量空间的线性映射关于两个基（一个是第一个向量空间的基，另一个是第二个向量空间的基）的矩阵。算子是一个向量空间到自身的线性映射，我们在讨论算子时几乎总是对两个向量空间使用同一个基（毕竟所讨论的两个向量空间是相同的）。因此，我们通常说一个算子关于某个基的矩阵，并且最多显示一个基，因为我们在这两个相同的向量空间中使用同一个基。

以下定理是一种少见的情况，即使对于将向量空间映到其自身的算子，我们也要用到两个不同的基. 它只是 3.43 的一个确切的重述（取

U

和

W

都等于

V

），但现在

我们更仔细地把这些基明确地包含在记号中. 定理成立是根据矩阵乘法的定义（参见 3.43 及其前面的内容).

10.4 线性映射之积的矩阵

假设

u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

以及

w_{1}, \dots, w_{n}

都是

V

的基。设

S, T \in L (V)

. 则

\begin{aligned} M (S T, (u_{1}, \dots, u_{n}), (w_{1}, \dots, w_{n})) = \\ M (S, (v_{1}, \dots, v_{n}), (w_{1}, \dots, w_{n})) M (T, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n})) \end{aligned}

以下定理讨论的是恒等算子

I

关于两个不同的基的矩阵。注意，把

u_{k}

写成

v_{1}, \dots, v_{n}

的线性组合，所用的标量就构成

M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

的第

k

列。

10.5 恒等算子关于两个基的矩阵

设

u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

都是

V

的基。则矩阵

M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

和

M (I, (v_{1}, \dots, v_{n}), (u_{1}, \dots, u_{n}))

都是可逆的，且它们互为逆。

证明在10.4中, 用

u_{j}

代替

w_{j}

, 用

I

代替

S

和

T

, 可得

I = M (I, (v_{1}, \dots, v_{n}), (u_{1}, \dots, u_{n})) M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

互换诸

u

和诸

v

的角色，可得

I = M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n})) M (I, (v_{1}, \dots, v_{n}), (u_{1}, \dots, u_{n}))

由这两个等式即得所要的结果.
10.6 例考虑

F^{2}

的基

(4, 2), (5, 3)

和

(1, 0), (0, 1)

。显然

M (I, ((4, 2), (5, 3)), ((1, 0), (0, 1))) = (\begin{array}{ll} 4 & 5 \\ 2 & 3 \end{array}),

因为

I (4, 2) = 4 (1, 0) + 2 (0, 1)

且

I (5, 3) = 5 (1, 0) + 3 (0, 1)

.
请自行验证，上面矩阵的逆是

(\begin{array}{cc} \frac{3}{2} & - \frac{5}{2} \\ - 1 & 2 \end{array})

于是由 10.5 可得

M (I, ((1, 0), (0, 1)), ((4, 2), (5, 3))) = (\begin{array}{cc} \frac{3}{2} & - \frac{5}{2} \\ - 1 & 2 \end{array}) .

现在我们可以看到在基变更时

T

的矩阵是怎样变化的。在以下定理中, 我们有

V

的两个不同的基。回忆一下，记号

M (T, (u_{1}, \dots, u_{n}))

是

M (T, (u_{1}, \dots, u_{n}), (u_{1}, \dots

，

u_{n})

)的缩写。

10.7 基变更公式

设

T \in L (V)

。令

u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

是

V

的基.

A = M (I, (u_{1}, \dots, u_{n})

，

(v_{1}, \dots, v_{n}))

。则

M (T, (u_{1}, \dots, u_{n})) = A^{- 1} M (T, (v_{1}, \dots, v_{n})) A

证明在 10.4 中, 用

u_{j}

代替

w_{j}

, 用

I

代替

S

, 得到

10.8 M (T, (u_{1}, \dots, u_{n})) = A^{- 1} M (T, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

,
其中用到了 10.5 .
再利用 10.4 , 此时用

v_{j}

代替

w_{j}

。同时也用

I

代替

T

, 用

T

代替

S

, 得到

M (T, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n})) = M (T, (v_{1}, \dots, v_{n})) A

将上面的等式代入 10.8 即得所要的结果.

迹: 算子与矩阵间的联系

假设

T \in L (V), λ

是

T

的本征值. 令

n = \dim V

。回忆一下, 我们定义

λ

的重数为广义的本征空间

G (λ, T)

的维数（参见 8.24 ），且这个重数等于

dimnull (T - λ I)^{n}

（参见 8.11）。再回忆一下，若

V

是复向量空间，则

T

的所有本征值的重数之和等于

n

（参见 8.26）。

在下面的定义中，"按重数重复" 的全体本征值之和指的是，若

λ_{1}, \dots, λ_{m}

是

T

的互不相同的本征值（或

T_{C}

的互不相同的本征值，若

V

是实向量空间），且其重数分别为

d_{1}, \dots, d_{m}

，则这个和为

d_{1} λ_{1} + \dots + d_{m} λ_{m}

或者, 如果你更喜欢将本征值按其重数重复地列出来, 全体本征值可记为

λ_{1}, \dots, λ_{n}

（其中

n

等于

\dim V

），则 "按重数重复" 的全体本征值之和等于

λ_{1} + \dots + λ_{n}

10.9 定义算子的迹（trace of an operator）

设

T \in L (V)

若 $F = C$ ，则 $T$ 的迹等于 $T$ 的按重数重复的全体本征值之和。
若 $F = R$ ，则 $T$ 的迹等于 $T_{C}$ 的按重数重复的全体本征值之和。
$T$ 的迹记为 trace $T$ 。
10.10 例设算子 $T \in L (C^{3})$ 的矩阵为

(\begin{array}{ccc} 3 & - 1 & - 2 \\ 3 & 2 & - 3 \\ 1 & 2 & 0 \end{array})

于是,

T

的本征值是

1, 2 + 3 i, 2 - 3 i

, 重数都为 1 (请自行验证). 计算所有本征值之和得到

trace T = 1 + (2 + 3 i) + (2 - 3 i)

. 也就是说

trace T = 5

。

迹和特征多项式联系紧密。设

λ_{1}, \dots, λ_{n}

是

T

的本征值（或

T_{C}

的本征值，如果

V

是实向量空间），其中每个本征值按重数重复。则由定义（参见 8.34 和 9.21），

T

的特征多项式等于

(z - λ_{1}) \dots (z - λ_{n})

展开上面的多项式，

T

的特征多项式可以写成
10.11

z^{n} - (λ_{1} + \dots + λ_{n}) z^{n - 1} + \dots + (- 1)^{n} (λ_{1} \dots λ_{n})

由上面的表达式立即得到以下定理。

10.12 迹和特征多项式

设

T \in L (V), n = \dim V

。则

trace T

等于

T

的特征多项式中

z^{n - 1}

的系数的相反数。

本节的其余部分主要讨论如何利用

T

（关于任意一个基）的矩阵来计算

trace T

。
首先考虑最容易的情形。设

V

是复向量空间，

T \in L (V)

，如在 8.29 中那样取

V

的一个基。关于这个基

T

有上三角矩阵，其对角线元素恰好是

T

的按重数重复的全体本征值。于是 trace

T

等于

T

关于这个基的矩阵

M (T)

的对角线元素之和。

同样的公式也适用于例 10.10 中的算子

T \in L (C^{3})

，它的迹等于 5 。在那个例子中, 矩阵不是上三角形式. 然而, 那个例子中的矩阵的对角元素之和等于 5 , 这也是算子

T

的迹。

现在你应该能猜到， trace

T

等于

T

关于任意基的矩阵的对角线元素之和。值得注意的是，这个猜测被证明是对的。为给出证明，我们先给出下面的定义。

10.13 定义矩阵的迹（trace of a matrix）

定义方阵

A

的迹为其对角线元素之和，记作 trace

A

.
现在我们已经定义了算子的迹和方阵的迹，在两个不同的环境中用了相同的词 "迹"。只有证明两个概念本质上是一样的，这个术语才是合适的。我们将会看到，

trace T = trace M (T, (v_{1}, \dots, v_{n}))

确实是对的，其中

v_{1}, \dots, v_{n}

是

V

的任意一个基。在证明中将需要以下引理。

10.14 $A B$ 的迹等于 $B A$ 的迹

如果

A

和

B

是相同阶数的方阵, 则

trace (A B) = trace (B A)

.
证明假设

A = (\begin{array}{ccc} A_{1, 1} & \dots & A_{1, n} \\ ⋮ & ⋮ \\ A_{n, 1} & \dots & A_{n, n} \end{array}), B = (\begin{array}{ccc} B_{1, 1} & \dots & B_{1, n} \\ ⋮ & ⋮ \\ B_{n, 1} & \dots & B_{n, n} \end{array})

A B

的对角线上的第

j

项等于

\sum_{k = 1}^{n} A_{j, k} B_{k, j}

因此

\begin{aligned} trace (A B) & = \sum_{j = 1}^{n} \sum_{k = 1}^{n} A_{j, k} B_{k, j} \\ = \sum_{k = 1}^{n} \sum_{j = 1}^{n} B_{k, j} A_{j, k} \\ = \sum_{k = 1}^{n} (B A 对角线上的第 k 项) \\ = trace (B A) . \end{aligned}

证毕.
现在可以证明，算子关于某个基的矩阵的对角线元素之和并不依赖于这个基.

10.15 算子的矩阵的迹不依赖于基

设

T \in L (V)

. 如果

u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

都是

V

的基, 则

trace M (T, (u_{1}, \dots, u_{n})) = trace M (T, (v_{1}, \dots, v_{n}))

证明设

A = M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

. 则

\begin{aligned} trace M (T, (u_{1}, \dots, u_{n})) & = trace (A^{- 1} (M (T, (v_{1}, \dots, v_{n})) A)) \\ = trace ((M (T, (v_{1}, \dots, v_{n})) A) A^{- 1}) \\ = trace M (T, (v_{1}, \dots, v_{n})) \end{aligned}

其中第一个等式由 10.7 得到，第二个等式由 10.14 得到。
以下定理是本节最重要的结果, 说的是算子的迹等于该算子的矩阵的对角线元素之和。这个定理没有指明所用到的基，因为根据上面的结果，对每个基来说，算子的矩阵的对角线元素之和都相同。

10.16 算子的迹等于其矩阵的迹

若

T \in L (V)

. 则

trace T = trace M (T)

.
证明由于 10.15,

trace M (T)

与

V

的基的选取无关. 因此, 要证明对

V

的每个基都有

trace T = trace M (T)

只需证明上式对

V

的某个基成立。
我们已经讨论过，若

V

是复向量空间，选取 8.29 中的那个基就能得出所要的结果. 若

V

是实向量空间，则把复的情况应用到复化

T_{C}

上（其被用于定义 trace

T

）就能得出所要的结果。

如果知道了复向量空间上一个算子的矩阵, 利用上述定理, 不求算子的任何本征值就可以求出所有本征值的和，如下例所示。
10.17 例考虑

C^{5}

上的一个算子，它的矩阵是

(\begin{array}{ccccc} 0 & 0 & 0 & 0 & - 3 \\ 1 & 0 & 0 & 0 & 6 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 & 0 \end{array})

我们不知道这个算子的任何本征值的精确公式，但却知道它的本征值之和等于 0 ，因为上面矩阵的对角线元素之和等于 0 。

通过转换成矩阵的迹的语言，我们可以利用 10.16 给出算子的迹的一些有用性质的简单证明，其中有些性质是已经证明过的，或者是显然的。以下定理的证明是这种方法的一个例子。一般来说，

S + T

的本征值不能通过将

S

和

T

的本征值相加得出。因此，如果不用 10.16 以下定理将很难证明。

10.18 迹是可加的

若

S, T \in L (V)

. 则

trace (S + T) = trace S + trace T

.
证明取

V

的一个基. 则

\begin{aligned} trace (S + T) & = trace M (S + T) \\ = trace (M (S) + M (T)) \\ = trace M (S) + trace M (T) \\ = trace S + trace T \end{aligned}

其中第一个和最后一个等式由 10.16 得到。根据矩阵的迹的定义，第三个等式是显然的.

以下定理的叙述并未涉及迹，但其简短证明却用到了迹。在数学中一旦有类似的事情发生，我们可以确信背后一定隐藏着一个很好的定义。

利用前面这些方法可以得到下面的奇妙结果。这个结果在无限维向量空间上的推广可以导出现代物理（特别是量子理论）的一些重要结论.

10.19 恒等算子不是 $S T$ 与 $T S$ 之差

不存在算子

S, T \in L (V)

使得

S T - T S = I

.
证明设

S, T \in L (V)

. 取

V

的一个基. 则

\begin{aligned} trace (S T - T S) & = trace (S T) - trace (T S) \\ = trace M (S T) - trace M (T S) \\ = trace (M (S) M (T)) - trace (M (T) M (S)) \\ = 0 \end{aligned}

第一个等式由 10.18 得到, 第二个等式由 10.16 得到, 第三个等式由 3.43 得到, 第四个等式由 10.14 得到。显然

I

的迹等于

\dim V

，不等于 0 。因为

S T - T S

和

I

有不同的迹，所以它们不相等。

习题 10.A

1 设

T \in L (V), v_{1}, \dots, v_{n}

是

V

的基. 证明：矩阵

M (T, (v_{1}, \dots, v_{n}))

是可逆的当且仅当

T

是可逆的。

2 设

A

和

B

是大小相同的方阵且

A B = I

. 证明

B A = I

.
3 设

T \in L (V)

关于

V

的每个基的矩阵都相同。证明

T

是恒等算子的标量倍。
4 设

u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

都是

V

的基。设算子

T \in L (V)

使得对

k = 1, \dots, n

都有

T v_{k} = u_{k}

. 证明：

M (T, (v_{1}, \dots, v_{n})) = M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n})) .

5 设

B

是复方阵，证明：存在可逆的复方阵

A

使得

A^{- 1} B A

是上三角矩阵。
6 找出一个实向量空间

V

及

T \in L (V)

的例子，使得

trace (T^{2}) < 0

。
7 设

V

是实向量空间，

T \in L (V), V

有一个由

T

的本征向量组成的基. 证明

trace (T^{2}) \geq 0

。
8 设

V

是内积空间，

v, w \in V

。定义

T \in L (V)

为

T u = ⟨ u, v ⟩ w

. 求 trace

T

.
9 设

P \in L (V)

满足

P^{2} = P

。证明 trace

P = \dim

range

P

。

10 设

V

是内积空间，

T \in L (V)

。证明 trace

T^{*} = \overset{―}{trace T}

.
11 设

V

是内积空间，

T \in L (V)

是正算子，

trace T = 0

。证明

T = 0

.
12 设

V

是内积空间，

P, Q \in L (V)

是正交投影。证明

trace (P Q) \geq 0

.
13 设算子

T \in L (C^{3})

的矩阵是

(\begin{array}{ccc} 51 & - 12 & - 21 \\ 60 & - 40 & - 28 \\ 57 & - 68 & 1 \end{array})

已知 -48 和 24 是

T

的本征值. 不用计算机也不用纸和笔, 求

T

第三个本征值.
14 设

T \in L (V), c \in F

。证明

trace (c T) = c trace T

。
15 设

S, T \in L (V)

。证明

trace (S T) = trace (T S)

。
16 证明或给出反例：若

S, T \in L (V)

则

trace (S T) = (trace S) (trace T)

.
17 设

T \in L (V)

使得对所有

S \in L (V)

都有

trace (S T) = 0

。证明

T = 0

.
18 设

V

是内积空间，

e_{1}, \dots, e_{n}

是

V

的规范正交基，

T \in L (V)

. 证明:

trace (T^{*} T) = {‖ T e_{1} ‖}^{2} + \dots + {‖ T e_{n} ‖}^{2}

试说明上式右端与

V

的规范正交基

e_{1}, \dots, e_{n}

的选取无关。
19 设

V

是内积空间。证明：

⟨ S, T ⟩ = trace (S T^{*})

定义了

L (V)

上的一个内积。
20 设

V

是复内积空间，

T \in L (V), λ_{1}, \dots, λ_{n}

是

T

的按重数重复的全体本征值. 设

(\begin{array}{ccc} A_{1, 1} & \dots & A_{1, n} \\ ⋮ & ⋮ \\ A_{n, 1} & \dots & A_{n, n} \end{array})

是

T

关于

V

的某个规范正交基的矩阵. 证明：

{| λ_{1} |}^{2} + \dots + {| λ_{n} |}^{2} \leq \sum_{k = 1}^{n} \sum_{j = 1}^{n} {| A_{j, k} |}^{2}

21 设

V

是内积空间，

T \in L (V)

，对每个

v \in V

都有

‖ T^{*} v ‖ \leq ‖ T v ‖

。证明

T

是正规的。
本题对无限维内积空间不成立, 从而引出所谓的亚正规算子, 其理论已经比较成熟。

10.B 行列式

算子的行列式

现在可以定义算子的行列式了。注意下面的定义仿照定义迹的方法, 用本征值之积代替了本征值之和。
10.20 定义算子的行列式（determinant of an operator），

\det T

设

T \in L (V)

若 $F = C$ ，则 $T$ 的行列式是 $T$ 的按重数重复的全体本征值之积。
若 $F = R$ , 则 $T$ 的行列式是 $T_{C}$ 的按重数重复的全体本征值之积.
$T$ 的行列式记为 $\det T$ 。

设

λ_{1}, \dots, λ_{m}

是

T

的全体互不相同的本征值（或

T_{C}

的全体互不相同的本征值，如果

V

是实向量空间），且其重数分别为

d_{1}, \dots, d_{m}

，上面的定义表明

\det T = λ_{1}^{d_{1}} \dots λ_{m}^{d_{m}}

或者，如果你更喜欢将本征值按其重数重复地列出来，全体本征值可记为

λ_{1}, \dots, λ_{n}

（其中

n

等于

\dim V

），上面的定义表明

\det T = λ_{1} \dots λ_{n}

10.21 例设算子

T \in L (C^{3})

的矩阵是

(\begin{array}{ccc} 3 & - 1 & - 2 \\ 3 & 2 & - 3 \\ 1 & 2 & 0 \end{array})

T

的本征值为

1, 2 + 3 i, 2 - 3 i

, 并且重数都是 1 (请自行验证)。计算这些本征值的乘积得

\det T = 1 \cdot (2 + 3 i) \cdot (2 - 3 i)

, 即

\det T = 13

行列式和特征多项式联系紧密。设

λ_{1}, \dots, λ_{n}

是

T

按重数重复的全体本征值（或

T_{C}

的本征值，如果

V

是实向量空间）。则由 10.11 给出的

T

的特征多项式的表达式给出了以下定理。

10.22 行列式和特征多项式

设

T \in L (V), n = \dim V

. 则

\det T

等于

(- 1)^{n}

乘以

T

的特征多项式的常数项.
把上述定理和 10.12 结合起来，得到以下结论。

10.23 特征多项式、迹和行列式

设

T \in L (V)

. 则

T

的特征多项式可写为

z^{n} - (trace T) z^{n - 1} + \dots + (- 1)^{n} (\det T)

.
现在我们要证明行列式的一些简单而重要的性质。下一小节介绍利用

T

（关于任意基）的矩阵计算

\det T

的方法。

由于我们的定义，下面这个重要定理就有了一个简单的证明。

10.24 可逆等价于行列式非零

V

上的算子是可逆的当且仅当它的行列式是非零的.
证明首先，设

V

是复向量空间，

T \in L (V)

。算子

T

是可逆的当且仅当 0 不是

T

的本征值. 显然, 这个条件成立当且仅当

T

的本征值的乘积不等于 0 。因此,

T

是可逆的当且仅当

\det T \neq 0

。

现在考虑

V

是实向量空间且

T \in L (V)

的情况。此时仍有

T

是可逆的当且仅当 0不是

T

的本征值，这个条件成立当且仅当 0 不是

T_{C}

的本征值（由于

9.11, T_{C}

和

T

有相同的实本征值）。因此我们再次得到

T

是可逆的当且仅当

\det T \neq 0

。

有些教科书把以下定理作为特征多项式的定义，而把我们的特征多项式定义作为结果。
10.25

T

的特征多项式等于

\det (z I - T)

设

T \in L (V)

. 则

T

的特征多项式等于

\det (z I - T)

.
证明首先设

V

是复向量空间。若

λ, z \in C

，则

λ

是

T

的本征值当且仅当

(z - λ)

是

(z I - T)

的本征值，这是因为

- (T - λ I) = (z I - T) - (z - λ) I

等式两端同时取

\dim V

次幂，然后再取零空间可知，

λ

作为

T

的本征值的重数等于

(z - λ)

作为

(z I - T)

的本征值的重数。

令

λ_{1}, \dots, λ_{n}

表示

T

的按重数重复的全体本征值。上一段表明，对

z \in C

，

(z I - T)

的按重数重复的全体本征值为

z - λ_{1}, \dots, z - λ_{n}

。而

(z I - T)

的行列式就是这些本征值的乘积。也就是说

\det (z I - T) = (z - λ_{1}) \dots (z - λ_{n})

根据定义，上式右端即

T

的特征多项式，这就完成了

T

是复向量空间的情形的证明。

若

V

是实向量空间，把复向量空间的情况应用到

T_{C}

上即得所要的结果.

矩阵的行列式

我们的下一个任务是找到利用

T

（关于任意基）的矩阵来计算

\det T

的方法。首先讨论最简单的情形。设

V

是复向量空间，

T \in L (V)

，并如 8.29 那样取

V

的一个基使得

T

关于这个基有上三角矩阵，且矩阵的对角线恰好包含

T

的按重数重复的全体本征值。于是关于这个基，

\det T

等于

M (T)

的全体对角线元素之积。

在上一节处理迹时，我们发现公式 "迹 = 对角线元素之和"对8.29 给出的上三角矩阵成立，而且关于任意基都成立。对行列式也是这样吗？也就是说，算子的行列式等于算子关于任意基的矩阵的对角线元素之积吗？

遗憾的是，行列式要比迹复杂得多。特别地，

\det T

未必等于

T

关于任何基的矩阵

M (T)

的对角线元素之积。例如，例 10.21 中的算子的行列式等于 13 ，但是那个矩阵的对角线元素之积却等于 0 。

对于每个方阵

A

，我们想定义

A

的行列式（记作

\det A

）使得无论用哪个基来计算

M (T)

都有

\det T = \det M (T)

。为了寻找矩阵的行列式的正确定义，先来计算某些特殊算子的行列式。
10.26 例设

a_{1}, \dots, a_{n} \in F

. 令

A = (\begin{array}{ccccc} 0 & a_{n} \\ a_{1} & 0 \\ a_{2} & 0 \\ ⋱ & ⋱ \\ a_{n - 1} & 0 \end{array})

在这个矩阵中，除了右上角的元素和紧位于对角线之下的那条直线上的元素之外，其余元素都等于 0 。设

v_{1}, \dots, v_{n}

是

V

的基，

T \in L (V)

使得

M (T, (v_{1}, \dots, v_{n})) = A

。我们来求

T

的行列式。

解首先设对每个

j = 1, \dots, n - 1

均有

a_{j} \neq 0

. 注意到组

v_{1}, T v_{1}, T^{2} v_{1}, \dots, T^{n - 1} v_{1}

等于

v_{1}, a_{1} v_{2}, a_{1} a_{2} v_{3}, \dots, a_{1} \dots a_{n - 1} v_{n}

。

正如此例，计算极小多项式通常是求特征多项式的有效方法。

于是

v_{1}, T v_{1}, \dots, T^{n - 1} v_{1}

是线性无关的（因为所有的

a_{j}

都非零）。因此，若

p

是次数不超过

n - 1

的首一多项式，则

p (T) v_{1} \neq 0

。因此

T

的极小多项式的次数不可能小于

n

.
请自行验证，对每个

j

都有

T^{n} v_{j} = a_{1} \dots a_{n} v_{j}

。所以

T^{n} = a_{1} \dots a_{n} I

。因此

z^{n} - a_{1} \dots a_{n}

是

T

的极小多项式。因为

n = \dim V

，并且特征多项式是极小多项式 9.26 的多项式倍，所以

z^{n} - a_{1} \dots a_{n}

也是

T

的特征多项式。

因此由 10.22 可得

\det T = (- 1)^{n - 1} a_{1} \dots a_{n}

如果某个

a_{j}

等于 0 , 则对某个

j

有

T v_{j} = 0

, 由此可知 0 是

T

的一个本征值, 因此

\det T = 0

. 也就是说，上面的公式在某个

a_{j}

等于 0 时也成立。

因此，为使

\det T = \det M (T)

，我们必须让例10.26中的矩阵的行列式等于

(- 1)^{n - 1} a_{1} \dots a_{n}

。但我们现在还没有足够的证据来对任意方阵的行列式的定义做出一个合理的猜想。

为了计算一类更复杂的算子的行列式，我们引入排列的概念。

10.27 定义排列（permutation）， perm $n$

$(1, \dots, n)$ 的一个排列是一个组 $(m_{1}, \dots, m_{n}), 1, \dots, n$ 中的每个数恰好在其中出现一次。
$(1, \dots, n)$ 的所有排列组成的集合记为 $perm n$ .

例如,

(2, 3, 4, 5, 1) \in perm 5

. 可以把

perm n

的元素看作前

n

个正整数的一个重排。
10.28 例设

a_{1}, \dots, a_{n} \in F, v_{1}, \dots, v_{n}

是

V

的基. 考虑如下排列

(p_{1}, \dots, p_{n}) \in

perm

n

：将

(1, \dots, n)

拆成连续整数的组，然后把每组的第一项移到该组的最后。例如，取

n = 9

，则排列

(2, 3, 1, 5, 6, 7, 4, 9, 8)

可以这样得到：将

(1, 2, 3), (4, 5, 6, 7), (8, 9)

各组中的第一项移到最后, 得到

(2, 3, 1)

(5, 6, 7, 4), (9, 8)

, 然后再把它们放在一起即得上面的排列.

设算子

T \in L (V)

使得对

k = 1, \dots, n

有

T v_{k} = a_{k} v_{p_{k}}

。求

\det T

.
解如果

(p_{1}, \dots, p_{n})

是排列

(2, 3, \dots, n, 1)

，则我们的算子

T

与例 10.26 定义的算子

T

是相同的，因此本例推广了例 10.26.

算子

T

关于基

v_{1}, \dots, v_{n}

的矩阵是分块对角矩阵

A = (\begin{array}{ccc} A_{1} & 0 \\ ⋱ \\ 0 & A_{M} \end{array})

其中每个块都形如 10.26 中的方阵。
相应地，我们有

V = V_{1} \oplus \dots \oplus V_{M}

，其中每个

V_{j}

在

T

下不变，每个

{T |}_{V_{j}}

形如 10.26 中的算子。由于

\det T = ({\det T |}_{V_{1}}) \dots ({\det T |}_{V_{M}})

（因为

V_{j}

的广义本征空间的维数之和等于

\dim V)

，我们有

\det T = (- 1)^{n_{1} - 1} \dots (- 1)^{n_{M} - 1} a_{1} \dots a_{n}

其中

V_{j}

的维数为

n_{j}

(相应地每个

A_{j}

的大小为

n_{j} \times n_{j}

), 这里我们用到了 10.26 中的结果。

上面出现的数

(- 1)^{n_{1} - 1} \dots (- 1)^{n_{M} - 1}

称为相应排列

(p_{1}, \dots, p_{n})

的符号，记为

sign (p_{1}, \dots, p_{n})

（这只是一个临时的定义，等到我们定义了任意排列的符号之后将改用一个等价的定义）。

为将其写成不依赖于特殊排列

(p_{1}, \dots, p_{n})

的形式，令

A_{j, k}

表示例10.28 中矩阵

A

的第

j

行第

k

列元素。则

A_{j, k} = {\begin{cases} 0, & 若 j \neq p_{k}, \\ a_{k}, & 若 j = p_{k} . \end{cases}

例 10.28 给出我们要得到的

10.29 \det A = \sum_{(m_{1}, \dots, m_{n}) \in perm n} (sign (m_{1}, \dots, m_{n})) A_{m_{1}, 1} \dots A_{m_{n}, n}

,
注意除了对应于排列

(p_{1}, \dots, p_{n})

的那个和项之外，其余的每个和项都等于 0 （这也是其他排列的符号尚未定义却没有关系的原因）。

现在我们可以猜测对任意方阵

A, \det A

应该定义为 10.29. 这将被证明是对的.现在我们可以忽略动机，开始更加正式的推导. 首先需要定义任意排列的符号.

10.30 定义排列的符号（ sign of a permutation）

如果在组 $(m_{1}, \dots, m_{n})$ 中使得 $1 ⩽ j < k ⩽ n$ 且 $j$ 出现在 $k$ 后面的整数对 $(j, k)$ 的个数是偶数, 那么排列 $(m_{1}, \dots, m_{n})$ 的符号定义为 1 ；如果这种数对的个数是奇数, 则定义为 -1 .
也就是说，排列的符号等于 1 ，如果自然顺序被改变了偶数次；等于 -1 ，如果自然顺序被改变了奇数次。

10.31 例排列的符号

在组 $(2, 1, 3, 4)$ 中, 使得 $j < k$ 并且 $j$ 出现在 $k$ 之后的整数对 $(j, k)$ 只有 $(1, 2)$ .所以排列 $(2, 1, 3, 4)$ 的符号等于 -1 .
在排列 $(2, 3, \dots, n, 1)$ 中，使得 $j < k$ 并反序出现的整数对 $(j, k)$ 只有 $(1, 2)$ , $(1, 3), \dots, (1, n)$ . 因为这样的对共有 $n - 1$ 个, 所以这个排列的符号等于 $(- 1)^{n - 1}$ (注意, 这与例 10.26 中出现的量一致).

以下定理表明，交换一个排列中的两个元素将改变该排列的符号。

10.32 交换排列中的两个元素

交换一个排列中的两个元素，该排列的符号将乘以 -1 .
证明假设有两个排列，其中第二个排列是通过交换第一个排列中的两个元素得到的。如果那两个被交换元素在第一个排列中是自然顺序，则它们在第二个排列中就不再是自然顺序，反之亦然。现在我们看到的非自然顺序数对的数目的净改变量为 1 或 -1 （两者都是奇数）。

有些教科书采用术语符号函数，它与符号同义。

考虑介于那两个被交换的元素之间的每一个元素。如果一个中间元素最初和那两个被交换的元素都是自然顺序，则现在它与那两个被交换的元素都不是自然顺序。类似地，如果一个中间元素最初与那两个被交换的元素

都不是自然顺序, 则现在它和那两个被交换的元素都是自然顺序. 如果一个中间元素最初只与那两个被交换的元素之一是自然顺序，则结果仍是如此. 于是，对于中间的每个元素来说，非自然顺序数对的数目的净改变量为

2 、 - 2

或 0 (都是偶数).

对于所有其他的元素，非自然顺序数对的数量没有变化. 所以非自然顺序数对的数量的变化总量是一个奇数。于是第二个排列的符号等于 -1 乘以第一个排列的符号。

下一个定义的动机来自 10.29.
10.33 定义矩阵的行列式（determinant of a matrix）,

\det A

n \times n

矩阵

A = (\begin{array}{ccc} A_{1, 1} & \dots & A_{1, n} \\ ⋮ & ⋮ \\ A_{n, 1} & \dots & A_{n, n} \end{array})

的行列式（记作

\det A

）定义为

\det A = \sum_{(m_{1}, \dots, m_{n}) \in perm n} (sign (m_{1}, \dots, m_{n})) A_{m_{1}, 1} \dots A_{m_{n}, n}

10.34 例行列式

若 $A$ 是 $1 \times 1$ 矩阵 $(A_{1, 1})$ , 则 $\det A = A_{1, 1}$ , 因为 perm 1 只有一个元素, 即 (1), 所以它的符号是1.
显然 perm 2 有两个元素, 即 $(1, 2)$ 和 $(2, 1)$ . 其符号分别是 1 和 -1 . 因此

\det (\begin{array}{cc} A_{1, 1} & A_{1, 2} \\ A_{2, 1} & A_{2, 2} \end{array}) = A_{1, 1} A_{2, 2} - A_{2, 1} A_{1, 2}

为保证理解这个过程，你应该仅用上面给出的定义找出任意

3 \times 3

矩阵的行列式公式.
perm 3 有 6 个元素。一般来说,

perm n

有

n

! 个元素。注意，随着

n

的增大，

n!

迅速增大。
10.35 例计算上三角矩阵

A = (\begin{array}{ccc} A_{1, 1} & * \\ ⋱ \\ 0 & A_{n, n} \end{array})

的行列式。
解排列

(1, 2, \dots, n)

的符号为 1 , 因此对 10.33 中定义

\det A

的求和式贡献了一项

A_{1, 1} \dots A_{n, n}

。任意其他的排列

(m_{1}, \dots, m_{n}) \in perm n

至少包含一个元素

m_{j}

使得

m_{j} > j

，所以

A_{m_{j}, j} = 0

(因为

A

是上三角矩阵). 于是 10.33 中其他的每个项对求和都没有贡献。

因此

\det A = A_{1, 1} \dots A_{n, n}

. 也就是说，上三角矩阵的行列式等于对角线元素的乘积。

设

V

是复向量空间，

T \in L (V)

，如 8.29 那样取

V

的一个基，

T

关于这个基有一个上三角矩阵，对角线元素刚好包含

T

的按重数重复的全体本征值。因此例10.35告诉我们

\det T = \det M (T)

，其中的矩阵是关于那个基的矩阵。

我们的目标是证明

\det T = \det M (T)

对

V

的每个基都成立，而不只是对 8.29 中的基。为此，需要给出行列式的一些性质。以下定理是其中的第一个性质。

10.36 交换矩阵的两列

设

A

是方阵，

B

是通过交换

A

的两列得到的矩阵. 则

\det A = - \det B

.
证明考虑 10.33 中

\det A

的定义中那个求和式和

\det B

的定义中相应的求和式。这两个和式中出现的那些

A_{j, k}

的乘积是相同的，只是相应的排列不同。

\det B

中相应于一个给定的

A_{j, k}

的乘积的排列是通过交换

\det A

的相应排列中的两个元素得到的，所以

\det B

的排列的符号等于

\det A

的相应排列的符号乘以 -1 （参见 10.32）。因此我们有

\det A = - \det B

如果

T \in L (V)

，并且

T

（关于某个基）的矩阵具有两个相同的列，则

T

不是单的，于是

\det T = 0

。虽然这个解释使以下定理看似合理，但却不能当成证明，因为我们现在还不知道

\det T = \det M (T)

是否对基的每个选择都成立。

10.37 有两个相等列的矩阵

如果方阵

A

有两个列是相同的, 则

\det A = 0

.
证明设方阵

A

有两个列是相同的。把

A

的这两个相同的列交换仍得到最初的矩阵

A

. 因此, 由 10.36 （取

B = A

）得

\det A = - \det A,

从而

\det A = 0

.
回忆一下 3.44 , 如果

A

是

n \times n

矩阵

A = (\begin{array}{ccc} A_{1, 1} & \dots & A_{1, n} \\ ⋮ & ⋮ \\ A_{n, 1} & \dots & A_{n, n} \end{array})

则我们可以把

A

的第

k

列看作一个

n \times 1

矩阵, 记为

A_{\cdot, k}

A_{\cdot, k} = (\begin{matrix} A_{1, k} \\ ⋮ \\ A_{n, k} \end{matrix})

要注意，具有两个下标的

A_{j, k}

表示

A

的一个元素，而具有一个圆点占位符和一个下标的

A_{, k}

表示

A

的一个列。这个记号使我们可将

A

写成

(\begin{array}{lll} A_{\cdot, 1} & \dots & A_{\cdot, n} \end{array}),

有些教材把行列式定义为方阵的函数，这个函数对每个列都是线性的，并且满足 10.38 和

\det I = 1

。要证明这样的函数存在且唯一需要做大量的工作。

这是非常有用的。
以下定理说明, 把矩阵

A

的列重新排列, 行列式就变成了

A

的行列式乘以这个排列的符号。

10.38 重排矩阵的列

设

A = (\begin{array}{lll} A_{\cdot, 1} & \dots & A_{\cdot, n} \end{array})

是

n \times n

矩阵，

(m_{1}, \dots, m_{n})

是一个排列。则

\det (\begin{array}{ccc} A_{\cdot, m_{1}} & \dots & A_{\cdot, m_{n}} \end{array}) = (sign (m_{1}, \dots, m_{n})) \det A .

证明我们可以通过一系列步骤把矩阵（

\begin{array}{llll} A_{\cdot, m_{1}} & \dots & A_{\cdot, m_{n}} \end{array})

变成

A

。每一步交换两列, 根据 10.36 , 得到的行列式等于前一个行列式乘以 -1 . 需要的步骤数等于把排列

(m_{1}, \dots, m_{n})

变成排列

(1, \dots, n)

需要交换元素的次数. 为完成证明，只需注意到如果

(m_{1}, \dots, m_{n})

的符号是 1 , 则这个次数是偶数; 如果

(m_{1}, \dots, m_{n})

的符号是 -1 ,则是这个次数是奇数（根据 10.32 , 并注意到排列

(1, \dots, n)

的符号是 1 ）。

关于行列式的以下定理也是有用的。

10.39 行列式是每一列的线性函数

设

k, n

是满足

1 \leq k \leq n

的正整数. 固定除

A \cdot, k

之外的那些

n \times 1

矩阵

A_{\cdot, 1}, \dots, A_{\cdot, n}

. 则把

n \times 1

列向量

A_{\cdot, k}

映为

\det (\begin{array}{lllll} A_{\cdot, 1} & \dots & A_{\cdot, k} & \dots & A_{\cdot, n} \end{array})

的函数，是从

F

上的

n \times 1

矩阵构成的向量空间到

F

的线性映射。
证明线性由 10.33 易得，因为 10.33 中的每个和项都恰好包含

A

的第

k

列中的一个元素。

我们现在可以证明方阵的行列式的一个重要性质。这个性质使我们能够把算子的行列式和它的矩阵的行列式联系起来。注意，这个证

1812 年法国数学家雅克 • 比内和奥古斯丁 - 路易 - 柯西最早证明了以下定理。

明比关于迹的相应结果的证明复杂得多（参见 10.14）。

10.40 行列式是可乘的

若

A

和

B

是大小相同的方阵, 则

\det (A B) = \det (B A) = (\det A) (\det B)

.
证明令

A = (\begin{array}{lll} A_{\cdot, 1} & \dots & A_{\cdot, n} \end{array})

, 其中每个

A_{\cdot, k}

都是

A

的一个

n \times 1

的列。令

B = (\begin{array}{ccc} B_{1, 1} & \dots & B_{1, n} \\ ⋮ & ⋮ \\ B_{n, 1} & \dots & B_{n, n} \end{array}) = (\begin{array}{ccc} B_{\cdot, 1} & \dots & B_{\cdot, n} \end{array}),

其中每个

B_{,, k}

是

B

的一个

n \times 1

的列。令

e_{k}

表示第

k

行的元素等于 1 其余元素都等于 0 的

n \times 1

矩阵。注意到

A e_{k} = A_{\cdot, k}, B e_{k} = B_{\cdot, k}

。进而有

B \cdot, k = \sum_{m = 1}^{n} B_{m, k} e_{m}

首先证明

\det (A B) = (\det A) (\det B)

。容易看到（参见 3.49），由矩阵乘法的定义可得

A B = (\begin{array}{lll} A B_{, 1} & \dots & A B_{, n} \end{array})

. 因此

\begin{aligned} \det (A B) = \det (\begin{array}{ccc} A B_{\cdot, 1} & \dots & A B_{\cdot, n} \end{array}) \\ = \det (\begin{array}{lll} A (\sum_{m_{1} = 1}^{n} B_{m_{1}, 1} e_{m_{1}}) & \dots & A (\sum_{m_{n} = 1}^{n} B_{m_{n}, n} e_{m_{n}}) \end{array}) \\ = \det (\begin{array}{lll} \sum_{m_{1} = 1}^{n} B_{m_{1}, 1} A e_{m_{1}} & \dots & \sum_{m_{n} = 1}^{n} B_{m_{n}, n} A e_{m_{n}} \end{array}) \\ = \sum_{m_{1} = 1}^{n} \dots \sum_{m_{n} = 1}^{n} B_{m_{1}, 1} \dots B_{m_{n}, n} \det (\begin{array}{lll} A e_{m_{1}} & \dots & A e_{m_{n}} \end{array}), \end{aligned}

其中最后一个等式是反复利用了

\det

作为每一列的函数的线性（10.39）。在上面的最后一个求和式中，存在某个

j \neq k

使得

m_{j} = m_{k}

的所有项都可以忽略，因为具有两个相同列的矩阵的行列式等于 0 （由于 10.37）。因此我们不需要对

m_{1}, \dots, m_{n}

的所有取值求和，只需对使得这些

m_{j}

具有不同值的排列求和，其中每个

m_{j}

都取值于

1, \dots, n

。也就是说

\begin{aligned} \det (A B) & = \sum_{(m_{1}, \dots, m_{n}) \in perm n} B_{m_{1}, 1} \dots B_{m_{n}, n} \det (\begin{array}{lll} A e_{m_{1}} & \dots & A e_{m_{n}} \end{array}) \\ = \sum_{(m_{1}, \dots, m_{n}) \in perm n} B_{m_{1}, 1} \dots B_{m_{n}, n} (sign (m_{1}, \dots, m_{n})) \det A \\ = (\det A) \sum_{(m_{1}, \dots, m_{n}) \in perm n} (sign (m_{1}, \dots, m_{n})) B_{m_{1}, 1} \dots B_{m_{n}, n} \\ = (\det A) (\det B) \end{aligned}

其中第二个等式由 10.38 得到.
上一段证明了

\det (A B) = (\det A) (\det B)

. 交换

A

和

B

的角色得

\det (B A) =

(\det B) (\det A)

, 即

\det (B A) = (\det A) (\det B)

现在我们可以证明，算子的矩阵的行列式与计算这个矩阵所使用的基无关.

注意，以下定理的证明与关于迹的类似结果的证明相似 (参见 10.15).

10.41 算子的矩阵的行列式不依赖于基

设

T \in L (V), u_{1}, \dots, u_{n}

和

v_{1}, \dots, v_{n}

都是

V

的基. 则

\det M (T, (u_{1}, \dots, u_{n})) = \det M (T, (v_{1}, \dots, v_{n}))

证明令

A = M (I, (u_{1}, \dots, u_{n}), (v_{1}, \dots, v_{n}))

. 则

\begin{aligned} \det M (T, (u_{1}, \dots, u_{n})) & = \det (A^{- 1} (M (T, (v_{1}, \dots, v_{n})) A)) \\ = \det ((M (T, (v_{1}, \dots, v_{n})) A) A^{- 1}) \\ = \det M (T, (v_{1}, \dots, v_{n})) \end{aligned}

其中第一个等式由 10.7 得到，第二个等式由 10.40 得到.
以下定理表明, 算子的行列式等于该算子的矩阵的行列式. 这个定理并没有指明所用到的基, 因为根据以上定理, 对于每个基来说, 算子的矩阵的行列式都相同.

10.42 算子的行列式等于它的矩阵的行列式

设

T \in L (V)

. 则

\det T = \det M (T)

.
证明由 10.41 可知

\det M (T)

与

V

的基的选取无关. 因此, 要证明对

V

的每个基都有

\det T = \det M (T)

，只需证明结果对

V

的某个基成立。

我们已经讨论过, 若

V

是复向量空间, 则像 8.29 那样取

V

的一个基, 即得所要的结果. 若

V

是实向量空间, 则把复的情况应用到复化

T_{C}

(用于定义

\det T

) 上,即得所要的结果。

如果知道复向量空间上一个算子的矩阵, 利用上述定理, 不求算子的任何本征值就可以求出所有本征值的乘积.
10.43 例设

T

是

C^{5}

上的算子，其矩阵为

(\begin{array}{ccccc} 0 & 0 & 0 & 0 & - 3 \\ 1 & 0 & 0 & 0 & 6 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 & 0 \end{array}) .

我们不知道这个算子的任何本征值的精确公式，但知道它的本征值的乘积等于 -3 ，因为上面矩阵的行列式等于 -3 。

通过转换成矩阵行列式的语言，利用 10.42 容易证明算子的行列式的一些有用性质，其中有些性质是已经证明过的，或者是显然的。可以如此证明以下定理。

10.44 行列式是可乘的

设

S, T \in L (V)

. 则

\det (S T) = \det (T S) = (\det S) (\det T)

.
证明取

V

的一个基，则有

\begin{aligned} \det (S T) & = \det M (S T) \\ = \det (M (S) M (T)) \\ = (\det M (S)) (\det M (T)) \\ = (\det S) (\det T) \end{aligned}

其中第一个和最后一个等式由 10.42 得到，第三个等式由 10.40 得到.
上一段证明了

\det (S T) = (\det S) (\det T)

。交换

S

和

T

的角色即得

\det (T S) =

(\det T) (\det S)

. 因为

F

中元素的乘法是交换的，所以

\det (T S) = (\det S) (\det T)

。

行列式的符号

我们在最后一章引入行列式之前就已经证明了线性代数的基本结果. 虽然行列式对于更高等的课题是有价值的研究工具，但是它们在基础线性代数中并未发挥多少作用（当该课题得到恰当处理时）。

大多数应用数学家认为, 行列式很

少用于复杂的数值计算.

行列式在大学数学中确实有一个重要的应用，即用于计算某些体积和积分。在这一小节我们解释实向量空间上的行列式的符号的含义。然后在最后一小节，我们将利用所学习的线性代数知识来弄清楚行列式和这些应用之间的联系。因此要利用线性代数来处理分析中的一部分内容。

首先来看研究体积时需要用到的一些纯线性代数的结果。我们在内积空间的假设下考虑. 回想一下，内积空间中的等距同构是保持范数的算子。以下定理表明，每个等距同构的行列式的绝对值都等于 1 。

10.45 等距同构的行列式绝对值为 1

设

V

是内积空间，

S \in L (V)

是等距同构. 则

| \det S | = 1

.
证明首先考虑

V

是复内积空间的情形。此时

S

的所有本征值的绝对值都为1（参见 7.43 的证明）。因此

S

的所有本征值（按重数计）的乘积的绝对值也是 1. 也就是说

| \det S | = 1

。

现在假设

V

是实内积空间，在这种情况下我们给出两种不同的证明.

证明 1：在由 9.B 节练习 3 给出的关于复化

V_{C}

的内积空间中，易知

S_{C}

是

V_{C}

上的等距同构. 因此，由我们已经证明的复内积空间的情况，有

| \det S_{C} | = 1

。根据实向量空间上行列式的定义，有

\det S = \det S_{C}

，所以

| \det S | = 1

。

证明 2：根据 9.36,

V

有一个规范正交基使得关于这个基

M (S)

是分块对角矩阵，对角线上的每个块是由 1 或 -1 组成的

1 \times 1

矩阵，或是形如

(\begin{array}{cc} \cos θ & - \sin θ \\ \sin θ & \cos θ \end{array})

的

2 \times 2

矩阵，其中

θ \in (0, π)

。注意到每个如上形式的

2 \times 2

矩阵的行列式都等于 1 （因为

\cos^{2} θ + \sin^{2} θ = 1

）。

S

的行列式是其块的行列式的乘积，是一些 1 和一些 -1的乘积. 因此

| \det S | = 1

。

实谱定理7.29指出实内积空间上的自伴算子

T

有一个由本征向量组成的规范正交基。关于这个基，每个本征值出现在

M (T)

的对角线上的次数等于它的重数。因此

\det T

等于它的本征值（按重数计）的乘积。当然，这个结论在复向量空间中对每个算子都成立，无论是不是自伴的。

回想一下, 如果

V

是内积空间且

T \in L (V)

, 则

T^{*} T

是正算子, 因此有唯一的正平方根，记为

\sqrt{T^{*} T}

（参见 7.35 和 7.36 ）。因为

\sqrt{T^{*} T}

是正的，所以它的所有本征值都是非负的（还是参见 7.35），因此

\det \sqrt{T^{*} T} \geq 0

。这些考虑在下面的例子中起了重要作用。
10.46 例设

V

是实内积空间，

T \in L (V)

是可逆的（因此

\det T

是正的或者是负的）。找出

\det T

的符号的一个几何解释。
解首先考虑等距同构

S \in L (V)

。由于

10.45, S

的行列式等于 1 或者 -1 . 注意到

{v \in V : S v = - v}

是本征空间

E (- 1, S)

. 从几何的角度考虑，我们可以说这个子空间是

S

的反向子空间。仔细考察 10.45 的证明 2 可知，如果这个子空间的维

我们没有给出短语 "反向" 的正式定义，因为这些解释只是做为一种直观来帮助我们理解。

数是偶数则

\det S = 1

，如果这个子空间的维数是奇数则

\det S = - 1

回到任意可逆算子

T \in L (V)

，由极分解定理 7.45 可知，存在等距同构

S \in L (V)

使得

T = S \sqrt{T^{*} T}

10.44 告诉我们

\det T = (\det S) (\det \sqrt{T^{*} T})

本例之前的叙述指出

\det \sqrt{T^{*} T} \geq 0

. 因此

\det T

是正的还是负的取决于

\det S

是正的还是负的. 上一段已经看到，这取决于

S

的反向子空间是偶数维的还是奇数维的。

因为

T

是

S

与一个根本不使任何向量反向的算子（即

\sqrt{T * T}

）的乘积，所以我们有理由说，

\det T

是正或者是负取决于

T

使向量反向偶数次还是奇数次。

体积

以下定理是研究体积的一个关键的工具. 回想一下, 例 10.46 之前的那段话指出

\det \sqrt{T^{*} T} \geq 0

。

10.47 | \det T | = \det \sqrt{T^{*} T}

设

V

是内积空间，

T \in L (V)

. 则

| \det T | = \det \sqrt{T^{*} T}

习题 8 给出该定理的另一种证明.

| \det T | = | \det S | \det \sqrt{T^{*} T} = \det \sqrt{T^{*} T}

其中第一个等式由 10.44 得到，第二个等式由 10.45 得到。
现在转向

R^{n}

中的体积问题。在这一小节剩下的部分, 取定一个正整数

n

. 我们只考虑带有标准内积的实内积空间

R^{n}

。

我们想给

R^{n}

的每个子集

Ω

赋予

n

维体积（当

n = 2

时，通常称为面积而不是体积). 首先讨论长方体, 长方体有一个很直观的体积概念.
10.48 定义长方体（box）

R^{n}

中的长方体是集合

{(y_{1}, \dots, y_{n}) \in R^{n} : x_{j} < y_{j} < x_{j} + r_{j}, j = 1, \dots, n}

其中

r_{1}, \dots, r_{n}

是正整数，

(x_{1}, \dots, x_{n}) \in R^{n}

。数

r_{1}, \dots, r_{n}

称为长方体的边长.
请自行验证, 当

n = 2

时, 长方体是边平行于坐标轴的矩形; 当

n = 3

时, 长方体就是我们熟悉的边平行于坐标轴的三维长方体。

我们将长方体的体积定义为长方体的边长的乘积，与直观的体积概念一致。
10.49 定义长方体的体积（volume of a box）

R^{n}

中边长为

r_{1}, \dots, r_{n}

的长方体

B

的体积定义为

r_{1} \dots r_{n}

, 记为 volume

B

熟悉外测度的读者会从这里认出这个概念。

现在对任意集合

Ω \subset R^{n}

定义体积，想法是把

Ω

写成很多小长方体的并集，然后再把这些小长方体的体积相加。这些小长方体的并集对

Ω

近似得越精确，我们对 volume

Ω

的估计就越好。
10.50 定义体积 (volume)

设

Ω \subset R^{n}

. 则

Ω

的体积（记作 volume

Ω

）定义为
volume

B_{1} +

volume

B_{2} + \dots

的下确界, 其中

B_{1}, B_{2}, \dots

是长方体序列, 其并集包含

Ω

, 取遍所有这样的长方体序列。

我们将仅使用直观的体积概念。我们的目的是理解线性代数，而体积的概念属于分析学（不过很快就会看到体积与行列式的紧密联系）。因此，本节其余部分将依赖直观的体积概念，而不依赖其严格的发展，但在接下来的线性代数部分我们还是要保持一贯的严密。如果适当解释，这里关于体积所说的一切都是正确的：这里使用的直观方法都可以运用分析学的手段转化成恰当的正确定义、正确陈述和正确证明。
10.51 记号

T (Ω)

对定义在集合

Ω

上的函数

T

，定义

T (Ω)

为

T (Ω) = {T x : x \in Ω}

.
对于

T \in L (R^{n})

和

Ω \subset R^{n}

，我们要利用

T

和 volume

Ω

给出 volume

T (Ω)

的公式. 先来看看正算子。

10.52 正算子 $T$ 使体积改变了 $\det T$ 倍

设

T \in L (R^{n})

是正算子，

Ω \subset R^{n}

。则 volume

T (Ω) = (\det T)

(volume

Ω)

.
证明为了理解这个结果为什么是对的，首先考虑一种特殊情况：

λ_{1}, \dots, λ_{n}

是正整数，

T \in L (R^{n})

定义为

T (x_{1}, \dots, x_{n}) = (λ_{1} x_{1}, \dots, λ_{n} x_{n})

这个算子把第

j

个标准基向量拉伸了

λ_{j}

倍。如果

B

是

R^{n}

中边长为

r_{1}, \dots, r_{n}

的长方体，则

T (B)

就是

R^{n}

中边长为

λ_{1} r, \dots, λ_{n} r

的长方体。长方体

T (B)

的体积是

λ_{1} \dots λ_{n} r_{1} \dots r_{n}

，而长方体

Ω

的体积是

r_{1} \dots r_{n}

。注意到

\det T = λ_{1} \dots λ_{n}

。因此对

R^{n}

中的每个长方体

B

都有

volume T (B) = (\det T) (volume B)

由于

Ω

的体积是用长方体体积和来逼近的，从而有

volume T (Ω) = (\det T) (volume Ω)

现在考虑任意正算子

T \in L (R^{n})

。由实谱定理

7.29, R^{n}

有规范正交基

e_{1}, \dots, e_{n}

，并且有非负整数

λ_{1}, \dots, λ_{n}

使得对

j = 1, \dots, n

有

T e_{j} = λ_{j} e_{j}

。在

e_{1}, \dots, e_{n}

是

R^{n}

的标准基的特殊情况下，这个算子与上一段定义的算子是一样的。对任意的规范正交基

e_{1}, \dots, e_{n}

，这个算子与上一段那个算子有相同的性质：把规范正交基的第

j

个基向量拉伸

λ_{j}

倍。对体积的直觉使我们相信，体积关于每个规范正交基的性质都是一

样的. 这种直觉连同上一段的特殊情形告诉我们，

T

把体积改变了

λ_{1} \dots λ_{n}

倍，即

\det T

倍。

下一个工具是以下定理, 它说的是等距同构不改变体积.

10.53 等距同构不改变体积

设

S \in L (R^{n})

是等距同构，

Ω \subset R^{n}

. 则 volume

S (Ω) =

volume

Ω

.
证明对

x, y \in R^{n}

有

‖ S x - S y ‖ = ‖ S (x - y) ‖ = ‖ x - y ‖ .

也就是说

S

不改变两点之间的距离。仅这个性质就足以使我们确信

S

不改变体积.
但是，如果需要更强的说服力，考虑 9.36 给出的实内积空间上等距同构的完整描述。按照 9.36,

S

可被分解成一些片段，每个片段或者是某个子空间上的恒等映射（它显然不改变体积），或者是某个子空间上的乘以 -1 映射（它显然也不改变体积），或者是二维子空间上的一个旋转（它还是不改变体积）。也可以用 9.36 连同 9.B 节的习题 7 将

S

写成算子之积，其中每一个算子都不改变体积。不论哪种方式都能使我们确信

S

不改变体积。

现在可以证明算子

T \in L (R^{n})

使体积改变了

| \det T |

倍. 注意, 极分解定理对证明极为重要。

10.54 T

使体积改变

| \det T |

倍
设

T \in L (R^{n}), Ω \subset R^{n}

. 则 volume

T (Ω) = | \det T | (volume Ω)

.
证明由极分解定理 7.45，存在等距同构

S \in L (V)

使得

T = S \sqrt{T^{*} T}

若

Ω \subset R^{n}

, 则

T (Ω) = S (\sqrt{T^{*} T} (Ω))

. 因此

\begin{aligned} volume T (Ω) & = volume S (\sqrt{T^{*} T} (Ω)) \\ = volume \sqrt{T^{*} T} (Ω) \\ = (\det \sqrt{T^{*} T}) (volume Ω) \\ = | \det T | (volume Ω) \end{aligned}

第二个等式成立是因为等距同构

S

不改变体积（参见 10.53），第三个等式成立是根据 10.52 （应用于正算子

\sqrt{T * T}

），第四个等式成立是根据 10.47.

上述定理导致了行列式出现在重积分的变量替换公式中. 我们仍将含糊而直观地描述一下。

本书中我们遇到的几乎所有的函数都是线性的. 请注意在下面的材料中并未假设函数

f

和

σ

是线性的。

以下定义旨在表达积分的思想，而不是要作为一个严格的定义.
10.55 定义积分 (integral),

\int_{Ω} f

设

Ω \subset R^{n}, f

是

Ω

上的实值函数.

f

在

Ω

上的积分（记作

\int_{Ω} f

或

\int_{Ω} f (x) d x

）定义如下：将

Ω

分成足够小的小块使得

f

在每个小块上几乎是常值函数，在每个小块上用

f

的值（几乎是常数）乘以这个小块的体积，然后再对所有的小块求和，就得到了积分的一个近似。对

Ω

的分块越细，这个近似就越精确。

实际上，上面定义中的

Ω

应该是一个适当的集合（例如，开集或可测集），并且

f

也应该是一个适当的函数（例如，连续的或可测的），但我们不必担心这些技术问题。注意

\int_{Ω} f (x) d x

中的

x

是哑变量，可以换成任何其他符号。

现在我们定义可微和导数的概念。注意，在这个语境下，导数是一个算子，而不像在一元微积分中那样是一个数。以下定义中的

T

的唯一性留作习题 9 .
10.56 定义可微（differentiable）、导数（derivative），

σ^{'} (x)

设

Ω

是

R^{n}

的开子集，

σ

是从

Ω

到

R^{n}

的函数。对于

x \in Ω

，称函数

σ

在

x

点可微，如果存在算子

T \in L (R^{n})

使得

lim_{y \to 0} \frac{‖ σ (x + y) - σ (x) - T y ‖}{‖ y ‖} = 0

若

σ

在

x

点可微, 则称满足上式的唯一的算子

T \in L (R^{n})

为

σ

在

x

点的导数,记作

σ^{'} (x)

。

导数的思想是，对固定的

x

和很小的

‖ y ‖

σ (x + y) \approx σ (x) + (σ^{'} (x)) (y)

因为

σ^{'} (x) \in L (R^{n})

，所以这是有意义的。

设

Ω

是

R^{n}

的开子集，

σ

是从

Ω

到

R^{n}

的函数，我们可以写

σ (x) = (σ_{1} (x), \dots, σ_{n} (x))

其中每个

σ_{j}

都是从

Ω

到

R

的函数.

σ_{j}

对第

k

个坐标的偏导数记为

D_{k} σ_{j}

. 求这个偏导数在点

x \in Ω

的值得

D_{k} σ_{j} (x)

. 如果

σ

在

x

点可微, 则

σ^{'} (x)

关于

R^{n}

的标准基的矩阵的第

j

行第

k

列元素是

D_{k} σ_{j} (x)

(留作习题)。也就是说
10.57

M (σ^{'} (x)) = (\begin{array}{ccc} D_{1} σ_{1} (x) & \dots & D_{n} σ_{1} (x) \\ ⋮ & ⋮ \\ D_{1} σ_{n} (x) & \dots & D_{n} σ_{n} (x) \end{array})

现在可以给出变量替换积分公式。

f

和

σ^{'}

还需要一点点额外的假设（如连续性或可测性）。但我们并不担心这些，因为下面的证明实际上是一个伪证明，意在传递结果正确的原因。

以下定理称为变量替换公式，因为可以把

y = σ (x)

看成一个变量替换，就像证明后面那两个例子所阐述的那样。

10.58 积分中的变量替换

设

Ω

是

R^{n}

的开子集，

σ : Ω \to R^{n}

在

Ω

的每一点可微，

f

是定义在

σ (Ω)

上的实值函数。则

\int_{σ (Ω)} f (y) d y = \int_{Ω} f (σ (x)) | \det σ^{'} (x) | d x

证明设

x \in Ω, Γ

是

Ω

的一个包含

x

的小子集，使得在集合

σ (Γ)

上

f

约等于常数

f (σ (x))

把一个集合中的每个向量都加上一个固定的向量（例如

σ (x)

）可得另一个具有相同体积的集合. 利用导数可以给出

σ

在

x

点附近的近似，由此可得

volume σ (Γ) \approx volume [(σ^{'} (x)) (Γ)]

对算子

σ^{'} (x)

应用 10.54 , 上式变成

volume σ (Γ) \approx | \det σ^{'} (x) | (volume Γ)

设

y = σ (x)

. 上式左端乘以

f (y)

, 右端乘以

f (σ (x))

（因为

y = σ (x)

，所以这两个量相等），得到

f (y) volume σ (Γ) \approx f (σ (x)) | \det σ^{'} (x) | (volume Γ)

现在把

Ω

分成许多小块，并且把上式对应于各小块的那些等式加起来，即得所求。
做变量替换的要点是，在做替换

y = f (x)

时，一定会包含因子

| \det σ^{'} (x) |

，就像 10.58 右端那样。最后，通过两个重要的例子来说明这一点。

10.59 例极坐标

定义

σ : R^{2} \to R^{2}

为

σ (r, θ) = (r \cos θ, r \sin θ)

这里使用

r, θ

而不是

x_{1}, x_{2}

作为坐标，对熟悉极坐标的每个人来说都很显然（而对其他人来说却很神秘）。请自行验证，对于这个

σ

，相应于 10.57 的偏导数的矩阵是

(\begin{array}{cc} \cos θ & - r \sin θ \\ \sin θ & r \cos θ \end{array})

上面这个矩阵的行列式等于

r

，这解释了在利用极坐标计算积分时为什么会有一个因子

r

。

例如，下式是函数

f

在

R^{2}

的一个圆盘上的积分，注意那个额外的因子

r

：

\int_{- 1}^{1} \int_{- \sqrt{1 - x^{2}}}^{\sqrt{1 - x^{2}}} f (x, y) d y d x = \int_{0}^{2 π} \int_{0}^{1} f (r \cos θ, r \sin θ) r d r d θ

10.60 例球坐标

定义

σ : R^{3} \to R^{3}

为

σ (ρ, φ, θ) = (ρ \sin φ \cos θ, ρ \sin φ \sin θ, ρ \cos φ)

这里使用

ρ, θ, φ

而不是

x_{1}, x_{2}, x_{3}

作为坐标，对熟悉极坐标的每个人来说都很显然（而对其他人来说却很神秘）。请自行验证，对于这个

σ

，相应于 10.57 的偏导数的矩阵是

(\begin{array}{ccc} \sin φ \cos θ & ρ \cos φ \cos θ & - ρ \sin φ \sin θ \\ \sin φ \sin θ & ρ \cos φ \sin θ & ρ \sin φ \cos θ \\ \cos φ & - ρ \sin φ & 0 \end{array})

上面这个矩阵的行列式等于

ρ^{2} \sin φ

，这解释了在利用球坐标计算积分时为什么会有一个因子

ρ^{2} \sin φ

。

例如，下式是函数

f

在

R^{3}

的一个球上的积分，注意那个额外的因子

ρ^{2} \sin φ

\begin{aligned} \int_{- 1}^{1} \int_{- \sqrt{1 - x^{2}}}^{\sqrt{1 - x^{2}}} \int_{- \sqrt{1 - x^{2} - y^{2}}}^{\sqrt{1 - x^{2} - y^{2}}} f (x, y, z) d z d y d x \\ = \int_{0}^{2 π} \int_{0}^{π} \int_{0}^{1} f (ρ \sin φ \cos θ, ρ \sin φ \sin θ, ρ \cos φ) ρ^{2} \sin φ d ρ d φ d θ \end{aligned}

习题 10.B

1 设

V

是实向量空间，

T \in L (V)

没有本征值. 证明

\det T > 0

.
2 设

V

是偶数维的实向量空间，

T \in L (V)

，

\det T < 0

。证明

T

至少有两个不同的本征值。
3 设

T \in L (V), n = \dim V > 2

。令

λ_{1}, \dots, λ_{n}

是

T

的（或

T_{C}

的，如果

V

是实向量空间）按重数重复的全体本征值。
(a) 求

T

的特征多项式中

z^{n - 2}

的系数关于

λ_{1}, \dots, λ_{n}

的公式.
(b) 求

T

的特征多项式中

z

的系数关于

λ_{1}, \dots, λ_{n}

的公式。

4 设

T \in L (V), c \in F

。证明

\det (c T) = c^{\dim V} \det T

.
5 证明或给出反例：若

S, T \in L (V)

则

\det (S + T) = \det S + \det T

.
6 设

A

是分块上三角矩阵

A = (\begin{array}{ccc} A_{1} & * \\ ⋱ \\ 0 & A_{m} \end{array})

对角线上的每个

A_{j}

都是方阵. 证明

\det A = (\det A_{1}) \dots (\det A_{m})

7 设

A

是

n \times n

实矩阵，

S \in L (C^{n})

是

C^{n}

上的算子，其矩阵等于

A, T \in L (R^{n})

是

R^{n}

上的算子，其矩阵也等于

A

。证明：

trace S = trace T

且

\det S = \det T

。
8 设

V

是内积空间，

T \in L (V)

。证明

\det T^{*} = \overset{―}{\det T}

由此证明

| \det T | = \det \sqrt{T^{*} T}

, 这给出 10.47 一个不同的证明.
9 设

Ω

是

R^{n}

的开子集，

σ

是从

Ω

到

R^{n}

的函数，

x \in Ω

且

σ

在

x

点可微. 证明：满足 10.56 中等式的算子

T \in L (R^{n})

是唯一的.
本题表明记号

σ^{'} (x)

是合理的。
10 设

T \in L (R^{n}), x \in R^{n}

. 证明：

T

在

x

点可微且

T^{'} (x) = T

。
11 找出

σ

的一个适当的假设，然后证明 10.57 。
12 设

a, b, c

是正数. 找出一个已知体积的集合

Ω \subset R^{3}

和一个算子

T \in L (R^{3})

使得

T (Ω)

等于椭球

{(x, y, z) \in R^{3} : \frac{x^{2}}{a^{2}} + \frac{y^{2}}{b^{2}} + \frac{z^{2}}{c^{2}} < 1}

并求上述椭球的体积。

第10章

迹与行列式

10.1 记号 F、V

本章的学习目标

10.A 迹

基的变更

10.2 定义 单位矩阵（identity matrix）， I

10.4 线性映射之积的矩阵

10.5 恒等算子关于两个基的矩阵

10.7 基变更公式

迹: 算子与矩阵间的联系

10.9 定义 算子的迹（trace of an operator）

10.12 迹和特征多项式

10.13 定义 矩阵的迹（trace of a matrix）

10.14 A B A B ABA BAB 的迹等于 B A B A BAB ABA 的迹

10.15 算子的矩阵的迹不依赖于基

10.16 算子的迹等于其矩阵的迹

10.18 迹是可加的

10.19 恒等算子不是 S T S T STS TST 与 T S T S TST STS 之差

习题 10.A

10.B 行列式

算子的行列式

10.22 行列式和特征多项式

10.23 特征多项式、迹和行列式

10.24 可逆等价于行列式非零

矩阵的行列式

10.27 定义 排列（permutation）， perm n n nnn

10.30 定义 排列的符号（ sign of a permutation）

10.31 例 排列的符号

10.32 交换排列中的两个元素

10.34 例 行列式

10.36 交换矩阵的两列

10.37 有两个相等列的矩阵

10.38 重排矩阵的列

10.39 行列式是每一列的线性函数

10.40 行列式是可乘的

10.41 算子的矩阵的行列式不依赖于基

10.42 算子的行列式等于它的矩阵的行列式

10.44 行列式是可乘的

行列式的符号

10.45 等距同构的行列式绝对值为 1

体积

10.52 正算子 T T TTT 使体积改变了 det T det T det T\operatorname{det} TdetT 倍

10.53 等距同构不改变体积

10.58 积分中的变量替换

10.59 例 极坐标

10.60 例 球坐标

习题 10.B

10.2 定义单位矩阵（identity matrix）， I

10.9 定义算子的迹（trace of an operator）

10.13 定义矩阵的迹（trace of a matrix）

10.14 $A B$ 的迹等于 $B A$ 的迹

10.19 恒等算子不是 $S T$ 与 $T S$ 之差

10.27 定义排列（permutation）， perm $n$

10.30 定义排列的符号（ sign of a permutation）

10.31 例排列的符号

10.34 例行列式

10.52 正算子 $T$ 使体积改变了 $\det T$ 倍

10.59 例极坐标

10.60 例球坐标