还没有笔记
选中页面文字后点击「高亮」按钮添加
这个ZH.md文件是:
注意 $\mathbb{R}$ 和 $\mathbb{C}$ 之间的区别:对于 $n \in \mathbb{N}$,
(i) 每个非零复数 $z$ 恰好有 $n$ 个不同的 $n$ 次方根。
(ii) 如果 $n$ 是奇数,则每个实数 $t$ 恰好有一个实数 $n$ 次方根。
(iii) 如果 $n$ 是偶数,则实数 $t$ 如果 $t<0$ 则没有实数 $n$ 次方根;如果 $t=0$ 则恰好有一个实数 $n$ 次方根;如果 $t>0$ 则恰好有两个实数 $n$ 次方根 $\pm s$。
我们可以将上述关于 $n$ 次方根的讨论应用于复数 $1=\cos 0+i \sin 0$。
定义 3.4.6. 对于 $n \in \mathbb{N}$,定义 $\mu_{n}$,即 $n$ 次单位根,为集合
特别是,$\mu_{n} \subseteq U(1)$,即每个 $n$ 次单位根的绝对值都为 1。
由此可得:
命题 3.4.7. 对于 $n \in \mathbb{N}$,
因此 $\#\left(\mu_{n}\right)=n$。此外,
(i) 如果 $\zeta_{1}, \zeta_{2} \in \mu_{n}$,则 $\zeta_{1} \zeta_{2} \in \mu_{n}$。换句话说,$\mu_{n}$ 在乘法下是封闭的。
(ii) $1 \in \mu_{n}$。
(iii) 如果 $\zeta \in \mu_{n}$,则 $\zeta^{-1} \in \mu_{n}$。换句话说,$\mu_{n}$ 在取逆操作下是封闭的。
证明. (i) 通过将命题 3.4.4 应用于 $z=1$ 得到。(ii) 如果 $\zeta_{1}, \zeta_{2} \in \mu_{n}$,则 $\left(\zeta_{1} \zeta_{2}\right)^{n}=\zeta_{1}^{n} \zeta_{2}^{n}=1 \cdot 1=1$ 得到。(iii) 如果 $\zeta \in \mu_{n}$,则 $\left(\zeta^{-1}\right)^{n}=\zeta^{-n}=\left(\zeta^{n}\right)^{-1}=1^{-1}=1$ 得到。
备注 3.4.8. (i) $n$ 次单位根,看作 $\mathbb{R}^{2}$ 中的向量,是单位圆内接正 $n$ 边形的顶点,其中一个顶点位于 $(1,0)$。
(ii) 很容易看出,一旦我们找到一个非零复数 $z$ 的一个 $n$ 次方根 $u$,那么 $z$ 的所有 $n$ 次方根都是 $\zeta u$ 的形式,其中 $\zeta \in \mu_{n}$。也就是说,给定一个非零复数的任意两个 $n$ 次方根,它们之间相差一个 $n$ 次单位根的乘积。
警告:我们已经看到整数指数的常规规则适用于复数。然而,分数指数的常规规则(只要我们总是取正值,这些规则对正实数仍然成立)通常不适用于复数根;这与复数的 $n$ 次方根通常没有一个首选值的事实有关。例如,
我们将简要提及线性代数的某些方面,其中大部分内容应该是熟悉的。我们将在第 7 章第 §2.2 节中给出更一般的处理方法,包括对以下一些结果的证明。
线性代数处理向量(即 $\mathbb{R}^{n}$ 的元素,我们此处将用粗体字母如 $\mathbf{v}$ 表示)和标量(换句话说,$\mathbb{R}$ 的元素)。(我们也可以根据需要使用 $\mathbb{C}^{n}$ 或 $\mathbb{Q}^{n}$,标量分别为 $\mathbb{C}$ 或 $\mathbb{Q}$。关键在于,对于我们用作标量的任何集合,我们都需要能够进行加、减、乘、除(除数不能为 0),并且加法和乘法的常规性质都成立。) 我们可以将两个向量相加:如果 $\mathbf{v}=\left(v_{1}, \ldots, v_{n}\right)$ 和 $\mathbf{w}=\left(w_{1}, \ldots, w_{n}\right) \in \mathbb{R}^{n}$,那么 $\mathbf{v}+\mathbf{w}=\left(v_{1}+w_{1}, \ldots, v_{n}+w_{n}\right)$。标量乘法定义如下:给定 $t \in \mathbb{R}$ 和 $\mathbf{v}=\left(v_{1}, \ldots, v_{n}\right) \in \mathbb{R}^{n}$,$t \mathbf{v}=\left(t v_{1}, \ldots, t v_{n}\right)$。注意,给定 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,那么 $\mathbf{v}+\mathbf{w} \in \mathbb{R}^{n}$ (两个向量的和是一个向量),而对于 $t \in \mathbb{R}, \mathbf{v} \in \mathbb{R}^{n}$,$t \mathbf{v} \in \mathbb{R}^{n}$ (当我们将向量与标量相乘时,结果是一个向量)。
以下是向量加法和标量乘法的基本性质。通过使用实数加法和乘法的常规性质,它们很容易验证。
命题 4.1.1. (i) 向量加法是可交换和结合的,存在一个零向量 $\mathbf{0}=(0, \ldots, 0)$,并且每个向量 $\mathbf{v}$ 都有一个加法逆元 $-\mathbf{v}=(-1) \mathbf{v}=\left(-v_{1}, \ldots,-v_{n}\right)$。
(ii) 标量乘法满足:对于所有 $s, t \in \mathbb{R}$ 和 $\mathbf{v} \in \mathbb{R}^{n}$,$s(t \mathbf{v})=(s t) \mathbf{v}$ 且 $1 \mathbf{v}=\mathbf{v}$。
(iii) 有两个分配律的类比:对于所有 $s, t \in \mathbb{R}$ 和 $\mathbf{v} \in \mathbb{R}^{n}$,$(s+t) \mathbf{v}= s \mathbf{v}+t \mathbf{v}$;对于所有 $t \in \mathbb{R}$ 和 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,$t(\mathbf{v}+\mathbf{w})=t \mathbf{v}+t \mathbf{w}$。
接下来我们回顾线性无关、张成、基和维数的标准定义:
定义 4.1.2. 给定 $\mathbb{R}^{n}$ 中的向量序列 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$,它们的线性组合是形式为 $\sum_{i=1}^{k} t_{i} \mathbf{v}_{i}$ 的表达式。$\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 的张成是所有线性组合的集合:
注意 $\mathbf{v}_{i} \in \operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$ 对于所有 $1 \leq i \leq k$ 都成立(取 $t_{j}=0, j \neq i$ 且 $t_{i}=1$)。根据逻辑或惯例,$\operatorname{span} \emptyset=\{\mathbf{0}\}$。
向量 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 是线性无关的,如果 $\sum_{i=1}^{k} t_{i} \mathbf{v}_{i}=\mathbf{0} \Longleftrightarrow t_{1}=\cdots=t_{k}=0$;它们是线性相关的,如果存在不全为 0 的 $t_{1}, \ldots, t_{k} \in \mathbb{R}$ 使得 $\sum_{i=1}^{k} t_{i} \mathbf{v}_{i}=\mathbf{0}$。很容易看出 $\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$ 仅取决于集合 $\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$,而 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 线性无关的性质取决于序列 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$(但与 $\mathbf{v}_{i}$ 的顺序无关)。例如,如果对于某些 $i \neq j$,$ \mathbf{v}_{i}=\mathbf{v}_{j}$,则该序列是线性相关的,因为 $\mathbf{v}_{i}-\mathbf{v}_{j}=1 \cdot \mathbf{v}_{i}+(-1) \cdot \mathbf{v}_{j}=\sum_{k \neq i, j} 0 \cdot \mathbf{v}_{k}+1 \cdot \mathbf{v}_{i}+(-1) \cdot \mathbf{v}_{j}=\mathbf{0}$。
序列 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k} \in \mathbb{R}^{n}$ 是一个基,如果它是线性无关的且 $\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}=\mathbb{R}^{n}$。等价地,每个向量 $\mathbf{w} \in \mathbb{R}^{n}$ 都可以唯一地写成 $\mathbf{v}_{i}$ 的线性组合。$\mathbb{R}^{n}$ 的标准基是 $\mathbf{e}_{1}, \ldots, \mathbf{e}_{n}$,其中 $\mathbf{e}_{i}$ 的分量除了第 $i$ 个分量为 1 外,其余都为 0。因此,每个向量 $\mathbf{v}=\left(v_{1}, \ldots, v_{n}\right)$ 都可以唯一地用标准基表示:$\mathbf{v}=\sum_{i=1}^{n} v_{i} \mathbf{e}_{i}$。
以下是一个基本的线性代数事实:
命题 4.1.3. 令 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k} \in \mathbb{R}^{n}$。
(i) 如果 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 线性无关,则 $k \leq n$。
(ii) 如果 $\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}=\mathbb{R}^{n}$,则 $k \geq n$。
(iii) 如果 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 是 $\mathbb{R}^{n}$ 的基,则 $k=n$。
(iv) 如果 $k=n$,则 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{n}$ 线性无关 $\Longleftrightarrow \operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{n}\right\}=\mathbb{R}^{n} \Longleftrightarrow \mathbf{v}_{1}, \ldots, \mathbf{v}_{n}$ 是 $\mathbb{R}^{n}$ 的基。
(v) $\mathbb{R}^{n}$ 中任何一组线性无关的向量都可以扩展成 $\mathbb{R}^{n}$ 的基。如果 $\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}=\mathbb{R}^{n}$,那么存在一个序列 $\mathbf{v}_{i_{1}}, \ldots, \mathbf{v}_{i_{n}}$,其项是 $\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$ 的元素,并且它是一个基。
定义 4.1.4. $\mathbb{R}^{n}$ 的向量子空间或简称子空间是一个非空子集 $V$,使得 $V$ 在向量运算下是封闭的:对于所有 $\mathbf{v}, \mathbf{w} \in V$ 和 $t \in \mathbb{R}$,$\mathbf{v}+\mathbf{w} \in V$ 且 $t \mathbf{v} \in V$。由此可知,对于 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k} \in V$,$\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\} \subseteq V$。关于 $V$ 中的 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 何时张成 $V$ 以及何时它们是 $V$ 的基,有自然的定义。
命题 4.1.5. (i) $\mathbb{R}^{n}$ 的子集 $V$ 是 $\mathbb{R}^{n}$ 的向量子空间 $\Longleftrightarrow$ 存在 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k} \in \mathbb{R}^{n}$ 使得 $V=\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$。特别是,$\operatorname{span}\left\{\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}\right\}$ 总是向量子空间,并且它是包含 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$ 的最小子空间。
(ii) $\mathbb{R}^{n}$ 的向量子空间 $V$ 的任意两个基具有相同的长度,我们将其记作 $\operatorname{dim} V$。
(iii) 如果 $V$ 是 $\mathbb{R}^{n}$ 的向量子空间,则 $0 \leq \operatorname{dim} V \leq n$。此外,$\operatorname{dim} V=0 \Longleftrightarrow V=\{\mathbf{0}\}$ 且 $\operatorname{dim} V=n \Longleftrightarrow V=\mathbb{R}^{n}$。
定义 4.1.6. 两个向量 $\mathbf{v}= \left(v_{1}, \ldots, v_{n}\right)$ 和 $\mathbf{w}=\left(w_{1}, \ldots, w_{n}\right) \in \mathbb{R}^{n}$ 的点积、标量积或内积(我们称之为内积并写作 $\langle\mathbf{v}, \mathbf{w}\rangle$)定义为
(如果称作点积,通常写为 $\mathbf{v} \cdot \mathbf{w}$。)两个向量的乘积是一个标量,因此得名标量积。例如,如果 $\mathbf{v}=\left(v_{1}, \ldots, v_{n}\right)$,那么 $\left\langle\mathbf{v}, \mathbf{e}_{i}\right\rangle=v_{i}$,即 $\mathbf{v}$ 的第 $i$ 个分量。我们称 $\mathbf{v}$ 和 $\mathbf{w}$ 正交,如果 $\langle\mathbf{v}, \mathbf{w}\rangle=0$。
命题 4.1.7. 内积是对称的、双线性的和正定的:对于所有 $\mathbf{v}, \mathbf{w}, \mathbf{u} \in \mathbb{R}^{n}$ 和 $t \in \mathbb{R}$,
定义 4.1.8. $\mathbf{v}$ 的长度或范数定义为
命题 4.1.9. 对于所有 $t \in \mathbb{R}, \mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,
一个有用的事实是以下内容,它表明唯一与 $\mathbb{R}^{n}$ 中每个向量都正交的向量是零向量。
引理 4.1.10. 如果 $\mathbf{v} \in \mathbb{R}^{n}$ 满足对于所有 $\mathbf{w} \in \mathbb{R}^{n}$ 都有 $\langle\mathbf{v}, \mathbf{w}\rangle=0$,那么 $\mathbf{v}=\mathbf{0}$。
证明. 如果对于所有 $\mathbf{w} \in \mathbb{R}^{n}$ 都有 $\langle\mathbf{v}, \mathbf{w}\rangle=0$,那么特别地取 $\mathbf{w}=\mathbf{v}$ 即可看出 $\langle\mathbf{v}, \mathbf{v}\rangle=0$,因此 $\mathbf{v}=\mathbf{0}$。(第二种证明是利用 $\left\langle\mathbf{v}, \mathbf{e}_{i}\right\rangle=v_{i}$ 的事实,推断出对于每个 $i$ 都有 $v_{i}=0$。)
定义 4.1.11. 标准正交基 $\mathbf{u}_{1}, \ldots, \mathbf{u}_{n}$ 是一个基,使得
例如,标准基 $\mathbf{e}_{1}, \ldots, \mathbf{e}_{n}$ 是一个标准正交基。更一般地,$\mathbb{R}^{n}$ 中向量序列 $\mathbf{u}_{1}, \ldots, \mathbf{u}_{k}$ 是标准正交的,如果对于所有 $i$ 都有 $\|\mathbf{u}_{i}\|=1$,并且对于所有 $i \neq j$ 都有 $\langle\mathbf{u}_{i}, \mathbf{u}_{j}\rangle=0$。很容易看出标准正交序列是线性无关的:由于 $\left\langle\sum_{i=1}^{k} t_{i} \mathbf{u}_{i}, \mathbf{u}_{j}\right\rangle=t_{j}$,如果 $\sum_{i=1}^{k} t_{i} \mathbf{u}_{i}=\mathbf{0}$,那么对于所有 $j$ 都有 $t_{j}=0$。特别地,$\mathbb{R}^{n}$ 中标准正交序列的最大可能长度是 $n$。
很容易明确地描述 $\mathbb{R}^{2}$ 中所有的标准正交基:首先,如果 $\mathbf{u}_{1}$ 是单位向量,即 $\|\mathbf{u}_{1}\|=1$,那么 $\mathbf{u}_{1}=(\cos \theta, \sin \theta)$,其中 $\theta$ 是一个实数,且在加上 $2 \pi$ 的整数倍后是唯一的。为了找到 $\mathbf{u}_{2}$,有一个标准方法,给定一个非零向量 $\mathbf{v}=(a, b) \in \mathbb{R}^{2}$,可以找到一个与 $\mathbf{v}$ 正交且 $\|\mathbf{v}^{\prime}\|=\|\mathbf{v}\|$ 的向量 $\mathbf{v}^{\prime}$。实际上,对于 $\mathbf{v}^{\prime}$ 只有两种可能性:它要么是 $(-b, a)$,要么是 $-(-b, a)=(b,-a)$。第一种可能性对应于将 $\mathbf{v}$ 逆时针旋转 $\pi/2$ 角,第二种对应于将 $\mathbf{v}$ 顺时针旋转 $\pi/2$ 角。(推论:如果 $\mathbb{R}^{2}$ 中两条非垂直线 $L_{1}$ 和 $L_{2}$ 垂直,它们的斜率 $m_{1}$ 和 $m_{2}$ 满足:$m_{1} m_{2}=-1$,即互为“倒数负”)。总结如下:
命题 4.1.12. $\mathbb{R}^{2}$ 中的每个标准正交基要么是以下形式:
要么是以下形式:
其中 $\theta$ 是一个实数,作为 $\mathbb{R} / 2 \pi \mathbb{Z}$ 的元素是唯一的。
更一般地,存在一个算法(Gram-Schmidt)可以实现以下目的:给定一个线性无关的向量序列 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}$,它产生一个标准正交向量序列 $\mathbf{u}_{1}, \ldots, \mathbf{u}_{k}$,使得对于所有 $1 \leq i \leq k$ 的 $i$,
$\mathbf{u}_{i}$ 的构造很简单,但不幸的是,在大多数例子中执行起来涉及大量繁琐的平方根。
回想一下,$m \times n$ 矩阵是一个矩形数组
我们通常将其缩写为 $A=\left(a_{i j}\right)$。上面的矩阵由 $m$ 行和 $n$ 列组成。我们将数字 $a_{i j}$ 称为 $(i, j)$ 元素。这意味着 $a_{i j}$ 是第 $i$ 行第 $j$ 列的数字。特别是,向量 $\left(x_{1}, \ldots, x_{n}\right)$ 也是一个矩阵,在这种情况下是一个 $1 \times n$ 矩阵。我们称这种矩阵为行向量。我们也可以将向量视为 $n \times 1$ 矩阵,我们称之为列向量。(由于我们对函数书写方式的约定,我们通常需要将向量视为列向量。)所有 $m \times n$ 矩阵的集合写作 $\mathbb{M}_{m, n}(\mathbb{R})$。$\mathbb{M}_{m, n}(\mathbb{C}), \mathbb{M}_{m, n}(\mathbb{Q})$,甚至 $\mathbb{M}_{m, n}(\mathbb{Z})$ 也有类似的定义。在 $m=n$ 的情况下,我们将 $\mathbb{M}_{n, n}(\mathbb{R})$ 缩写为 $\mathbb{M}_{n}(\mathbb{R})$,并称这种矩阵为方阵($n \times n$)矩阵,$\mathbb{M}_{n}(\mathbb{C}), \mathbb{M}_{n}(\mathbb{Q})$ 和 $\mathbb{M}_{n}(\mathbb{Z})$ 也有类似称呼。我们可以通过将对应元素相加来将 $\mathbb{M}_{m, n}(\mathbb{R})$ 中的两个矩阵 $A$ 和 $B$ 相加,并且可以将矩阵 $A$ 乘以标量 $t$。因此,$\left(a_{i j}\right)+\left(b_{i j}\right)=\left(a_{i j}+b_{i j}\right)$ 且 $t\left(a_{i j}\right)=\left(t a_{i j}\right)$。零矩阵 $O=O_{m, n} \in \mathbb{M}_{m, n}(\mathbb{R})$ 是所有元素都为 0 的矩阵。除了元素排序问题,$\mathbb{M}_{m, n}(\mathbb{R})$ 实际上与 $\mathbb{R}^{m n}$ 是同一回事,并且加法和标量乘法与常规向量运算相同。
给定一个 $m \times n$ 矩阵 $A$ 和一个 $n \times k$ 矩阵 $B$,我们可以形成矩阵积 $AB$,它是一个 $m \times k$ 矩阵,其 $(i, j)$ 元素由 $\sum_{t=1}^{n} a_{i t} b_{t j}$ 给出。因此,$(i, j)$ 元素是 $A$ 的第 $i$ 行与 $B$ 的第 $j$ 列的内积。象征性地,如果我们写作
其中 $\mathbf{r}_{i}$ 表示 $A$ 的第 $i$ 行,$\mathbf{c}_{j}$ 表示 $B$ 的第 $j$ 列,那么 $AB$ 的 $(i, j)$ 元素是 $\left\langle\mathbf{r}_{i}, \mathbf{c}_{j}\right\rangle$。
矩阵乘法具有结合性,且对矩阵加法(在定义域内)具有分配性,但对于 $A, B \in \mathbb{M}_{n}(\mathbb{R})$(这是 $AB$ 和 $BA$ 都定义且形状相同的唯一情况),并且对于 $n>1$,通常不满足 $AB=BA$:矩阵乘法通常不具有交换性。$\mathbb{M}_{n}(\mathbb{R})$ 的一个重要元素是单位矩阵 $I_{n}=I$,其对角线元素 $a_{i i}$ 等于 1,其他元素 $a_{i j}, i \neq j$ 等于 0。等价地,
其中 $\mathbf{e}_{1}, \ldots, \mathbf{e}_{n}$ 是 $\mathbb{R}^{n}$ 中的标准基。很容易看出,对于所有 $A \in \mathbb{M}_{m, n}(\mathbb{R})$,$I_{m} A= A I_{n}=A$。当 $n$ 从上下文中清楚时,我们将 $I_{n}$ 缩写为 $I$。
回想一下,线性函数 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 是一个函数 $F$,使得对于所有 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$ 和 $t \in \mathbb{R}$,$F(\mathbf{v}+\mathbf{w})=F(\mathbf{v})+F(\mathbf{w})$ 且 $F(t \mathbf{v})=t F(\mathbf{v})$。一个线性函数通过其在标准基向量 $\mathbf{e}_{1}, \ldots, \mathbf{e}_{n}$ 上的值完全确定。反之,给定任何 $n$ 个向量的序列 $\mathbf{v}_{1}, \ldots, \mathbf{v}_{n} \in \mathbb{R}^{m}$,存在一个唯一的线性函数 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$,使得对于所有 $i$,$F\left(\mathbf{e}_{i}\right)=\mathbf{v}_{i}$,即 $F\left(x_{1}, \ldots, x_{n}\right)=\sum_{i} x_{i} \mathbf{v}_{i}$。在这种情况下,回想一下我们可以将一个 $m \times n$ 矩阵与 $F$ 关联起来:将向量 $\mathbf{v}_{i}=\left(a_{1 i}, \ldots, a_{m i}\right)$ 写入。然后我们将矩阵与 $F$ 关联起来
这里 $A$ 的列是向量 $\mathbf{v}_{i}$,写成列的形式,并且线性映射 $F\left(x_{1}, \ldots, x_{n}\right)$ 对应于矩阵积 $A \cdot \mathbf{x}$,其中 $A \cdot \mathbf{x}$ 是一个 $n \times 1$ 矩阵(列向量),其第 $j$ 个元素是 $\sum_{i=1}^{n} a_{j i} x_{i}$。特别地,$A \cdot \mathbf{e}_{i}=\mathbf{v}_{i}$,写成列向量;其第 $j$ 个元素是 $a_{j i}$,并且它等于 $\sum_{j=1}^{m} a_{j i} \mathbf{e}_{j}$,其中在等式
左侧的 $\mathbf{e}_{i}$ 是 $\mathbb{R}^{n}$ 中的基向量,右侧的 $\mathbf{e}_{j}$ 是 $\mathbb{R}^{m}$ 中的基向量。注意索引的倒置!$F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{n}$ 的情况对应于方阵($n \times n$)矩阵。例如,线性函数 $\operatorname{Id}_{\mathbb{R}^{n}}$ 对应于单位矩阵 $I_{n}$。然后我们有:
命题 4.2.1. 如果 $F: \mathbb{R}^{k} \rightarrow \mathbb{R}^{n}$ 和 $G: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 是线性映射,并且 $A \in \mathbb{M}_{m, n}(\mathbb{R})$ 和 $B \in \mathbb{M}_{n, k}(\mathbb{R})$ 分别是对应于 $G$ 和 $F$ 的矩阵,那么 $G \circ F: \mathbb{R}^{k} \rightarrow \mathbb{R}^{m}$ 再次是线性的,并且对应于 $G \circ F$ 的矩阵是矩阵积 $A \cdot B$。
证明. 我们省略 $G \circ F$ 是线性的简单验证。根据线性函数和矩阵之间关系的公式,
因此,计算得到
这意味着对应于 $G \circ F$ 的矩阵的 $(i, k)$ 元素是 $\sum_{j=1}^{n} a_{i j} b_{j k}$。在重新标记索引后,这正是 $A \cdot B$ 的 $(i, k)$ 元素。
这为矩阵乘法的结合性提供了一个概念性证明:它具有结合性是因为函数复合具有结合性。(反之,我们也可以利用矩阵乘法的结合性来证明命题 4.2.1。)
矩阵乘法特别是一种方便描述线性方程组的方法:方程组
更简洁地写为 $A \cdot \mathbf{x}=\mathbf{b}$。
我们将线性映射 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 写成矩阵 $A: F(\mathbf{v})=A \mathbf{v}$,其中理解为,对于右侧,$\mathbf{v}$ 必须被视为列向量。定义 $A$ 的零空间或核为集合 $\left\{\mathbf{v} \in \mathbb{R}^{n}: A \mathbf{v}=\mathbf{0}\right\}$。然后我们有基本结果:
命题 4.3.1. $A$ 的零空间和像是向量子空间(分别为 $\mathbb{R}^{n}$ 和 $\mathbb{R}^{m}$ 的)。线性函数 $A: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 是单射 $\Longleftrightarrow$ $A$ 的零空间是 $\{\mathbf{0}\} \Longleftrightarrow$ $A$ 的列是线性无关的。线性函数 $A: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 是满射 $\Longleftrightarrow$ $A$ 的列张成 $\mathbb{R}^{m}$。更一般地,$\operatorname{Im} A$ 是 $A$ 的列的张成。
特别地,对于对应于 $A$ 的线性方程组 $A \cdot \mathbf{x}=\mathbf{b}$,我们看到解存在 $\Longleftrightarrow \mathbf{b} \in \operatorname{Im} A$,并且解是唯一的(但可能不存在) $\Longleftrightarrow$ $A$ 的零空间是 $\{\mathbf{0}\}$。
推论 4.3.2. 设 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ 是一个线性函数,对应于矩阵 $A$。
(i) 如果 $F$ 是单射,则 $n \leq m$。此外,$F$ 是单射 $\Longleftrightarrow$ $F$ 有一个也是线性函数的左逆。
(ii) 如果 $F$ 是满射,则 $n \geq m$。此外,$F$ 是满射 $\Longleftrightarrow$ $F$ 有一个也是线性函数的右逆。
(iii) 如果 $n=m$,则 $F$ 是单射 $\Longleftrightarrow F$ 是满射 $\Longleftrightarrow F$ 是双射,并且在这种情况下,逆函数 $F^{-1}$ 再次是线性的,因此对应于一个矩阵,记作 $A^{-1}$,具有以下性质
对于 $A \in \mathbb{M}_{m, n}(\mathbb{R})$,我们可以用通常的方式定义左逆和右逆。然后,使用上述 (iii),$A \in \mathbb{M}_{n}(\mathbb{R})$ 有一个左逆 $B \Longleftrightarrow A$ 有一个右逆 $C$,并且实际上 $B=C=A^{-1}$,通过通常的论证:
定义 4.3.3. 矩阵 $A \in \mathbb{M}_{n}(\mathbb{R})$ 是可逆的,如果逆矩阵 $A^{-1}$ 存在。定义一般线性群 $G L_{n}(\mathbb{R})$ 为 $\mathbb{M}_{n}(\mathbb{R})$ 中由可逆矩阵组成的子集。
以下是一个简单的计算:
命题 4.3.4. (i) 如果 $A, B \in G L_{n}(\mathbb{R})$,则 $AB$ 是可逆的,并且实际上 $(A B)^{-1}= B^{-1} A^{-1}$。因此 $G L_{n}(\mathbb{R})$ 在矩阵乘积下是封闭的。
(ii) $I_{n} \in G L_{n}(\mathbb{R})$,并且实际上 $I_{n}^{-1}=I_{n}$。
(iii) 如果 $A \in G L_{n}(\mathbb{R})$,则 $A^{-1} \in G L_{n}(\mathbb{R})$,并且实际上 $\left(A^{-1}\right)^{-1}=A$。
判断给定 $n \times n$ 矩阵 $A$ 是否可逆的问题可以通过行列式来回答。回想一下,对于每个 $n$,我们都有一个函数 $\det: \mathbb{M}_{n}(\mathbb{R}) \rightarrow \mathbb{R}$,具有以下性质:
(1) 对于所有 $A, B \in \mathbb{M}_{n}(\mathbb{R})$,$\operatorname{det}(A B)=(\operatorname{det} A)(\operatorname{det} B)$。
(2) $\operatorname{det} I_{n}=1$。
(3) $A$ 是可逆的 $\Longleftrightarrow \operatorname{det} A \neq 0$。因此 $G L_{n}(\mathbb{R})=\left\{A \in \mathbb{M}_{n}(\mathbb{R}): \operatorname{det} A \neq 0\right\}$。如果 $A$ 是可逆的,那么
例 4.3.5. 对于 $2 \times 2$ 矩阵 $A=\left(\begin{array}{ll}a & b \\ c & d\end{array}\right)$,我们有
如果 $\det A \neq 0$,那么计算得到:
除了上面列出的性质 (1)-(3) 之外,还有两个重要的额外性质:行列式是 $A$ 的列的多线性函数,换句话说,当其余列保持不变时,它在每列中都是线性函数;并且行列式是 $A$ 的列的交错函数,换句话说,如果我们通过交换两列 $\mathbf{c}_{i}$ 和 $\mathbf{c}_{j}$ 将 $A$ 变为另一个 $n \times n$ 矩阵 $A^{\prime}$,那么 $\det A^{\prime}=-\det A$。实际上,这些性质加上上面的 (2) 就足以刻画行列式。
定义 4.3.6. 特殊线性群 $S L_{n}(\mathbb{R})$ 由下式给出
以下是上述性质的一个简单推论:
命题 4.3.7. $S L_{n}(\mathbb{R}) \subseteq G L_{n}(\mathbb{R})$。此外,
(i) 如果 $A, B \in S L_{n}(\mathbb{R})$,则 $A B \in S L_{n}(\mathbb{R})$,即 $S L_{n}(\mathbb{R})$ 在乘法下是封闭的。
(ii) $I_{n} \in S L_{n}(\mathbb{R})$。
(iii) 如果 $A \in S L_{n}(\mathbb{R})$,则 $A$ 是可逆的,并且 $A^{-1} \in S L_{n}(\mathbb{R})$。
首先我们回顾转置的定义。
定义 4.4.1. 设 $A=\left(a_{i j}\right)$ 是一个 $m \times n$ 矩阵。转置矩阵 ${ }^{t} A$ 是一个 $n \times m$ 矩阵,其 $(i, j)$ 元素是 $a_{j i}$。例如,如果 $A$ 是一个方阵($n \times n$)矩阵,那么 ${ }^{t} A$ 是 $A$ 沿着从左上到右下的对角线的反射。一般来说,${ }^{t} A$ 的列是 $A$ 的行,写成列向量,反之亦然。
命题 4.4.2. 对于所有 $A \in \mathbb{M}_{m, n}(\mathbb{R})$,
(i) ${ }^{t}\left({ }^{t} A\right)=A$。
(ii) 对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 和 $\mathbf{w} \in \mathbb{R}^{n}$,
此外,${ }^{t} A$ 是 $\mathbb{M}_{n, m}(\mathbb{R})$ 中唯一的元素 $B$,使得对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 和 $\mathbf{w} \in \mathbb{R}^{n}$,$\langle\mathbf{v}, A \mathbf{w}\rangle=\langle B \mathbf{v}, \mathbf{w}\rangle$。
(iii) 如果 $A$ 是一个 $m \times n$ 矩阵, $B$ 是一个 $n \times k$ 矩阵,那么
(iv) 如果 $A$ 是一个具有逆矩阵 $A^{-1}$ 的 $n \times n$ 矩阵,那么 ${ }^{t}\left(A^{-1}\right)=\left({ }^{t} A\right)^{-1}$。
证明. (i) 直接由定义得出。(ii) 对于所有标准基向量 $\mathbf{e}_{i} \in \mathbb{R}^{m}$ 和 $\mathbf{e}_{j} \in \mathbb{R}^{n}$,
(这里当然,第一个内积是 $\mathbb{R}^{m}$ 中的向量的内积,第二个是 $\mathbb{R}^{n}$ 中的向量的内积。)利用双线性,可以得出对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 和 $\mathbf{w} \in \mathbb{R}^{n}$,$\langle\mathbf{v}, A \mathbf{w}\rangle=\left\langle{ }^{t} A \mathbf{v}, \mathbf{w}\right\rangle$,通过将 $\mathbf{v}$ 和 $\mathbf{w}$ 展开为标准基向量的线性组合。要看 (ii) 中的第二个陈述,如果 $B$ 也满足 $\langle\mathbf{v}, A \mathbf{w}\rangle=\langle B \mathbf{v}, \mathbf{w}\rangle$,那么
因此,对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 和所有 $\mathbf{w} \in \mathbb{R}^{n}$,$\left(B-{ }^{t} A\right) \mathbf{v}$ 与 $\mathbf{w}$ 正交,因此是零向量 $\mathbf{0} \in \mathbb{R}^{n}$。因此对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 都有 $B \mathbf{v}={ }^{t} A \mathbf{v}$,所以 $B={ }^{t} A$。
要看 (iii),对于所有 $\mathbf{v} \in \mathbb{R}^{m}$ 和 $\mathbf{w} \in \mathbb{R}^{k}$,我们有
因此,根据 (ii) 中的唯一性陈述,${ }^{t}(A B)={ }^{t} B^{t} A$。
最后,要看 (iv),如果 $A A^{-1}=I_{n}$,那么
因此 ${ }^{t}\left(A^{-1}\right)$ 是 ${ }^{t} A$ 的左逆,也因此是右逆,所以 ${ }^{t}\left(A^{-1}\right)=\left({ }^{t} A\right)^{-1}$。
我们还有(无证明):
命题 4.4.3. 对于所有 $A \in \mathbb{M}_{n}(\mathbb{R})$,$\det { }^{t} A=\det A$。
正交矩阵是具有非常特殊几何性质的可逆矩阵。
定义 4.4.4. 线性函数 $A: \mathbb{R}^{n} \rightarrow \mathbb{R}^{n}$ 是等距变换,如果对于所有 $\mathbf{v} \in \mathbb{R}^{n}$,$\|A \mathbf{v}\|=\|\mathbf{v}\|$。换句话说,$A$ 保持长度不变。
命题 4.4.5. 给定 $A \in \mathbb{M}_{n}(\mathbb{R})$,以下关于 $A$ 的条件是等价的。
(i) $A$ 是等距变换,即对于所有 $\mathbf{v} \in \mathbb{R}^{n}$,$\|A \mathbf{v}\|=\|\mathbf{v}\|$。
(ii) 对于所有 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,$\langle A \mathbf{v}, A \mathbf{w}\rangle=\langle\mathbf{v}, \mathbf{w}\rangle$。换句话说,$A$ 保持内积不变。
(iii) $A$ 的列是 $\mathbb{R}^{n}$ 的标准正交基。
(iv) $A$ 是可逆的,且 ${ }^{t} A=A^{-1}$。
(v) $A$ 的行是 $\mathbb{R}^{n}$ 的标准正交基。
证明. (i) ⟹ (ii):这由恒等式得出:
这是内积的双线性和对称性以及展开的推论。(将 $\mathbf{w}$ 替换为 $-\mathbf{w}$,这等价于 $\mathbb{R}^{2}$ 中的余弦定律。)换句话说,对于所有向量 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,
特别地将此应用于向量 $A \mathbf{v}, A \mathbf{w}$ 并使用 $A$ 是等距变换的事实,得到
因此,对于所有 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,$\langle A \mathbf{v}, A \mathbf{w}\rangle=\langle\mathbf{v}, \mathbf{w}\rangle$。
(ii) ⟹ (i):如果对于所有 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,$\langle A \mathbf{v}, A \mathbf{w}\rangle=\langle\mathbf{v}, \mathbf{w}\rangle$,那么取 $\mathbf{v}=\mathbf{w}$,使得 $\|A \mathbf{v}\|^{2}=\langle A \mathbf{v}, A \mathbf{v}\rangle= \langle\mathbf{v}, \mathbf{v}\rangle=\|\mathbf{v}\|^{2}$。
(ii) ⟹ (iii):$A$ 的列等于 $\mathbf{c}_{i}=A \mathbf{e}_{i}$。根据 (ii),$\left\langle\mathbf{c}_{i}, \mathbf{c}_{j}\right\rangle=\left\langle A \mathbf{e}_{i}, A \mathbf{e}_{\mathbf{j}}\right\rangle=\left\langle\mathbf{e}_{i}, \mathbf{e}_{j}\right\rangle$。因此 $\mathbf{c}_{1}, \ldots, \mathbf{c}_{n}$ 是 $\mathbb{R}^{n}$ 的标准正交基。
(iii) ⟺ (iv):转置交换 $A$ 的行和列。因此,${ }^{t} A A$ 的 $(i, j)$ 元素是内积 $\left\langle\mathbf{c}_{i}, \mathbf{c}_{j}\right\rangle$。因此 ${ }^{t} A A=I_{n} \Longleftrightarrow \left\langle\mathbf{c}_{i}, \mathbf{c}_{j}\right\rangle$ 如果 $i \neq j$ 则为 0,如果 $i=j$ 则为 1 $\Longleftrightarrow$ $A$ 的列是 $\mathbb{R}^{n}$ 的标准正交基。
(iv) ⟺ (v):与上述类似,使用 $A^{t} A$ 而不是 ${ }^{t} A A$。
(iv) ⟹ (ii):如果 ${ }^{t} A=A^{-1}$,那么对于所有 $\mathbf{v}, \mathbf{w} \in \mathbb{R}^{n}$,
因此 (ii) 成立。
我们看到命题中的五个陈述中的任何一个都蕴含其他任何一个,所以它们都是等价的。
定义 4.4.6. 满足上述任何(以及所有)等价性质的矩阵 $A \in \mathbb{M}_{n}(\mathbb{R})$ 称为正交矩阵。所有 $n \times n$ 正交矩阵的集合记作 $O_{n}$,即正交群。行列式为 1 的所有正交矩阵的集合记作 $S O_{n}$,即特殊正交群。
命题 4.4.7. (i) 如果 $A, B \in O_{n}$,则 $A B \in O_{n}$;如果 $A, B \in S O_{n}$,则 $A B \in S O_{n}$。
(ii) $I_{n} \in S O_{n}$,因此 $I_{n} \in O_{n}$。
(iii) 如果 $A \in O_{n}$,则 $A^{-1} \in O_{n}$;如果 $A \in S O_{n}$,则 $A^{-1} \in S O_{n}$。
证明. 我们将基于命题 4.4.5 的性质 (iv) 给出证明。基于性质 (i) 给出证明也很容易。如果 $A, B \in O_{n}$,那么
因此 $A B \in O_{n}$,并且如果 $\operatorname{det} A=\operatorname{det} B=1$,那么 $\operatorname{det} A B=1$。由于 ${ }^{t} I_{n}=I_{n}=I_{n}^{-1}$ 且 $\operatorname{det} I_{n}=1$,$I_{n} \in S O_{n}$,因此 $I_{n} \in O_{n}$。最后,根据命题 4.4.2(iv),${ }^{t}\left(A^{-1}\right)=\left({ }^{t} A\right)^{-1}$。如果 $A$ 是正交的,
由于 ${ }^{t}\left(A^{-1}\right)=\left(A^{-1}\right)^{-1}$,根据定义 $A^{-1} \in O_{n}$。如果 $\operatorname{det} A=1$,那么 $\operatorname{det} A^{-1}=1$。
以下说明 $O_{n}$ 和 $S O_{n}$ 之间没有太大区别:
命题 4.4.8. 如果 $A \in O_{n}$,则 $\operatorname{det} A= \pm 1$。
证明. 使用 ${ }^{t} A=A^{-1}$,我们看到
因此 $(\operatorname{det} A)^{2}=1$,所以 $\operatorname{det} A= \pm 1$。
我们有时将 $S O_{n}$ 视为 $\mathbb{R}^{n}$ 的刚体运动集合(固定原点)。群 $S O_{2}$ 和 $O_{2}$ 明确给出如下:
和
因此 $S O_{2}$ 是 $\mathbb{R}^{2}$ 绕原点的旋转集合。
练习 1.1. (i) 设 $X$ 为一个集合,设 $\Delta_{X}$ 为 $X \times X$ 中的对角线:
证明,如果 $X$ 至少有两个元素,那么不存在 $X$ 的子集 $A, B$ 使得 $\Delta_{X}=A \times B$。
(ii) 设 $X$ 和 $Y$ 为两个集合。定义函数 $F: \mathcal{P}(X) \times \mathcal{P}(Y) \rightarrow \mathcal{P}(X \times Y)$ 为 $F(A, B)=A \times B$。是否 $F$ 是单射?换句话说,如果 $A_{1} \times B_{1}=A_{2} \times B_{2}$,是否必然 $A_{1}=A_{2}$ 且 $B_{1}=B_{2}$?对于满射又如何?
练习 1.2. 直接使用函数的精确定义和一点逻辑,证明对于每个集合 $Y$,恰好有一个从 $\emptyset$ 到 $Y$ 的函数 $f$。$f$ 何时是单射?满射?解释你的答案。
设 $X$ 为一个集合。证明从 $X$ 到 $\emptyset$ 的函数要么不存在,要么恰好有一个,取决于 $X \neq \emptyset$ 还是 $X=\emptyset$。
练习 1.3. 设 $X$ 和 $Y$ 是两个非空集合,设 $f: X \rightarrow Y$ 是一个函数。证明 $f$ 的图 $G_{f}$ 具有 $X$ 的某个子集 $A$ 和 $Y$ 的某个子集 $B$ 的 $A \times B$ 形式 $\Longleftrightarrow f$ 是一个常数函数,即存在 $c \in Y$ 使得对于所有 $x \in X$ 都有 $f(x)=c$。
练习 1.4. 设 $f: \mathbb{N} \rightarrow \mathbb{N}$ 是由 $f(n)=n-1$ (如果 $n \geq 2$) 定义的函数,且 $f(1)=17$(这里 $\mathbb{N}=\{1,2,3, \ldots\}$ 是自然数集)。
(i) $f$ 是单射吗?满射吗?为什么?
(ii) 求出 $\mathbb{N}$ 的以下子集:
(a) $f(\{1,2,3,5\})$;
(b) $f(\{1,18\})$;
(c) $f^{-1}(1)$;
(d) $f^{-1}(\{1,2,3\})$
(e) $f^{-1}(17)$;
(f) $f^{-1}(\{1,17\})$。
(iii) 证明 $h(n)=n+1$ 是 $f$ 的右逆。$f$ 的所有可能的右逆是什么?
(iv) 由于 $h$ 是 $f$ 的右逆,$f$ 是 $h$ 的左逆。$h$ 的所有可能的左逆是什么?
练习 1.5. 直接从定义出发,证明两个单射函数的复合是单射的,并且两个满射函数的复合是满射的。
练习 1.6. 设 $X$ 和 $Y$ 为两个非空集合。定义投影函数 $\pi_{1}: X \times Y \rightarrow X$ 和 $\pi_{2}: X \times Y \rightarrow Y$ 为:
函数 $\pi_{1}$ 称为第一投影或 $X \times Y$ 到第一个分量的投影,$\pi_{2}$ 类似。$\pi_{1}$ 何时是单射?满射?当 $X=\emptyset$ 或 $Y=\emptyset$ 时会发生什么?解释你的答案。
练习 1.7. 设 $f: X \rightarrow Y$ 是一个函数。证明,如果 $f$ 有一个左逆 $g$,则 $f$ 是单射。反之,假设 $f$ 是单射且 $X \neq \emptyset$。证明 $f$ 有一个左逆。然而,使用练习 1.2,证明如果 $X=\emptyset$ 但 $Y \neq \emptyset$,那么唯一的函数 $f: X \rightarrow Y$ 是单射但没有左逆。
证明,如果 $f$ 有一个右逆 $h$,则 $f$ 是满射。(反之,如果 $f$ 是满射,则它有一个右逆,但这涉及一些更严肃的集合论。)
练习 1.8. 设 $Y=\{y\}$ 是一个恰好有一个元素的集合,设 $X$ 是一个任意集合。证明存在一个从 $X$ 到 $Y$ 的唯一函数 $f$。$f$ 何时是单射?满射?双射?描述 $f$ 的所有可能的左逆,以及所有可能的右逆。