📝 我的笔记

还没有笔记

选中页面文字后点击「高亮」按钮添加

1.5_预备知识_习题.ZH解释

📜 原文
📖 逐步解释
∑ 公式拆解
💡 数值示例
⚠️ 易错点
📝 总结
🎯 存在目的
🧠 直觉心智模型
💭 直观想象

1. 习题

11.1. 习题 1.1

📜 [原文1]

(i) 设 $X$ 是一个集合,并设 $\Delta_{X}$$X \times X$ 中的对角线

$$ \Delta_{X}=\{(x, x): x \in X\} . $$

证明,如果 $X$ 至少有两个元素,则不存在 $X$子集 $A, B$ 使得 $\Delta_{X}=A \times B$

(ii) 设 $X$$Y$ 是两个集合。定义一个函数 $F: \mathcal{P}(X) \times \mathcal{P}(Y) \rightarrow \mathcal{P}(X \times Y)$,其中 $F(A, B)=A \times B$$F$ 是否是单射?换句话说,如果 $A_{1} \times B_{1}=A_{2} \times B_{2}$,是否必然有 $A_{1}=A_{2}$$B_{1}=B_{2}$?它是否是满射

📖 [逐步解释]

(i) 这部分要求我们证明一个关于笛卡尔积对角线集合的结论。证明的核心思想是利用反证法

  1. 首先,理解对角线集合 $\Delta_{X}$ 的定义。它是由所有形如 $(x, x)$有序对组成的集合,其中 $x$ 来自集合 $X$。这意味着有序对的两个分量是完全相同的。
  2. 其次,理解笛卡尔积 $A \times B$ 的定义。它是由所有形如 $(a, b)$有序对组成的集合,其中 $a$ 来自集合 $A$$b$ 来自集合 $B$
  3. 我们的目标是证明,当 $X$ 至少有两个元素时,我们无法找到 $X$子集 $A$$B$ 使得 $\Delta_{X}$ 恰好等于 $A \times B$
  4. 采用反证法。我们假设存在这样的子集 $A, B \subseteq X$,使得 $\Delta_{X}=A \times B$
  5. 根据题设,$X$ 至少有两个元素。我们不妨设 $x_1, x_2 \in X$$x_1 \neq x_2$
  6. 因为 $x_1 \in X$,根据 $\Delta_{X}$ 的定义,$(x_1, x_1) \in \Delta_{X}$
  7. 因为我们假设了 $\Delta_{X}=A \times B$,所以 $(x_1, x_1) \in A \times B$
  8. 根据笛卡尔积的定义,这意味着 $x_1 \in A$ 并且 $x_1 \in B$
  9. 同理,因为 $x_2 \in X$,我们有 $(x_2, x_2) \in \Delta_{X}$
  10. 这同样意味着 $(x_2, x_2) \in A \times B$,所以 $x_2 \in A$ 并且 $x_2 \in B$
  11. 现在我们已经知道 $x_1 \in A$$x_2 \in B$。根据笛卡尔积的定义,有序对 $(x_1, x_2)$ 必须属于 $A \times B$
  12. 因为我们假设了 $A \times B = \Delta_{X}$,所以 $(x_1, x_2)$ 也必须属于 $\Delta_{X}$
  13. 但是,根据 $\Delta_{X}$ 的定义,它里面的元素的两个分量必须相等。而我们已知 $x_1 \neq x_2$,所以 $(x_1, x_2)$ 并不在 $\Delta_{X}$ 中。
  14. 这就产生了一个矛盾$(x_1, x_2)$ 既必须在 $\Delta_{X}$ 中,又必须不在 $\Delta_{X}$ 中。
  15. 这个矛盾说明我们最初的假设——即存在 $A, B$ 使得 $\Delta_{X}=A \times B$——是错误的。
  16. 因此,我们证明了如果 $X$ 至少有两个元素,则这样的 $A, B$ 不存在。

(ii) 这部分考察函数 $F(A, B) = A \times B$单射性和满射性。

  1. 单射性:我们要判断的是,如果 $A_1 \times B_1 = A_2 \times B_2$,是否一定能推出 $A_1 = A_2$$B_1 = B_2$
    • 我们来考虑一个特殊情况:空集 $\emptyset$
    • 如果 $A_1 = \emptyset$ 或者 $B_1 = \emptyset$,那么 $A_1 \times B_1 = \emptyset$
    • 假设我们有 $A_1 = \emptyset$, $B_1$ 是任意非空子集。那么 $A_1 \times B_1 = \emptyset$
    • 再取 $A_2$ 是任意非空子集$B_2 = \emptyset$。那么 $A_2 \times B_2 = \emptyset$
    • 此时我们有 $A_1 \times B_1 = A_2 \times B_2 = \emptyset$,但是 $A_1 = \emptyset \neq A_2$ (如果 $A_2$ 非空),并且 $B_1 \neq \emptyset = B_2$ (如果 $B_1$ 非空)。
    • 这说明了 $F$ 不是单射的。
    • 再考虑一个非空的情况。如果 $A_1 \times B_1 = A_2 \times B_2$ 是一个非空集合,那么 $A_1, B_1, A_2, B_2$ 都必须是非空的。
    • 在这种情况下,我们可以证明 $A_1=A_2$$B_1=B_2$。证明如下:
    • $(a, b) \in A_1 \times B_1$。那么 $a \in A_1$$b \in B_1$
    • 因为 $A_1 \times B_1 = A_2 \times B_2$,所以 $(a, b) \in A_2 \times B_2$,这意味着 $a \in A_2$$b \in B_2$
    • 这表明 $A_1 \subseteq A_2$$B_1 \subseteq B_2$
    • 反过来,任取 $(a', b') \in A_2 \times B_2$,同样可以证明 $A_2 \subseteq A_1$$B_2 \subseteq B_1$
    • 因此,$A_1=A_2$$B_1=B_2$
    • 所以,结论是:当笛卡尔积为非空时,结论成立;但当笛卡尔积为空时,结论不成立,导致函数 $F$ 整体上不是单射的。
  2. 满射性:我们要判断的是,对于任意的子集 $S \subseteq X \times Y$,是否总能找到 $X$子集 $A$$Y$子集 $B$,使得 $A \times B = S$
    • 答案是否定的。并不是所有 $X \times Y$子集都能表示成一个笛卡尔积的形式。
    • 一个子集 $S \subseteq X \times Y$ 能被写成 $A \times B$ 的形式,当且仅当对于所有的 $(x_1, y_1) \in S$$(x_2, y_2) \in S$,都有 $(x_1, y_2) \in S$$(x_2, y_1) \in S$。这样的子集被称为“矩形”子集
    • 我们可以用第一部分的结论来构造一个反例。设 $X=Y=\{1, 2\}$
    • 考虑 $X \times Y$子集 $S = \{(1, 1), (2, 2)\}$。这个 $S$ 就是集合 $\{1, 2\}$ 上的对角线 $\Delta_{\{1,2\}}$
    • 根据第一部分的证明,因为 $X$ 有两个元素,所以 $S$ 不能被写成任何 $A \times B$ 的形式,其中 $A, B \subseteq X$
    • 因此,我们找到了一个 $F$值域无法覆盖的元素 $S \in \mathcal{P}(X \times Y)$
    • 所以,$F$ 不是满射的。
∑ [公式拆解]

(i)

$$ \Delta_{X}=\{(x, x): x \in X\} $$

  • $\Delta_{X}$: 读作 "delta X",表示集合 $X$对角线 (diagonal)。
  • $\{(x, x): x \in X\}$: 这是集合的描述性表示法。
  • {...}: 表示这是一个集合
  • (x, x): 表示集合中的元素有序对,且第一个分量和第二个分量相等。
  • :: 读作 "使得" (such that)。
  • x \in X: 表示 $x$集合 $X$ 中的任意一个元素
  • 这个公式的整体含义是:$\Delta_{X}$ 是由所有第一个分量和第二个分量都相等且都来自 $X$有序对所组成的集合
💡 [数值示例]

(i) 示例1:$X = \{1, 2\}$

  • $X$ 至少有两个元素,满足题目条件。
  • $X \times X = \{(1, 1), (1, 2), (2, 1), (2, 2)\}$
  • 对角线 $\Delta_{X} = \{(1, 1), (2, 2)\}$
  • 我们要证明不存在 $A, B \subseteq X$ 使得 $A \times B = \Delta_{X}$
  • $X$子集有:$\emptyset, \{1\}, \{2\}, \{1, 2\}$
  • 假设存在这样的 $A, B$。因为 $\Delta_{X}$ 非空,所以 $A, B$ 也必须非空。
  • 如果 $A \times B = \{(1, 1), (2, 2)\}$,那么所有有序对的第一个分量构成了 $A$,所有第二个分量构成了 $B$
  • 所以 $A$ 必须包含 $\{1, 2\}$$B$ 必须包含 $\{1, 2\}$
  • 因此 $A = \{1, 2\}$$B = \{1, 2\}$
  • 但是,$A \times B = \{1, 2\} \times \{1, 2\} = \{(1, 1), (1, 2), (2, 1), (2, 2)\}$
  • 这显然不等于 $\Delta_{X} = \{(1, 1), (2, 2)\}$
  • 我们检查其他可能的 $A, B$ 也会发现矛盾。例如,如果 $A=\{1\}$, $B=\{1\}$,则 $A \times B = \{(1,1)\}$,不等于 $\Delta_X$。如果 $A=\{1,2\}, B=\{1\}$,则 $A \times B = \{(1,1), (2,1)\}$,也不等于 $\Delta_X$。这验证了结论。

(ii) 示例1 (单射性):$X = \{1\}, Y = \{2\}$

  • $\mathcal{P}(X) = \{\emptyset, \{1\}\}$
  • $\mathcal{P}(Y) = \{\emptyset, \{2\}\}$
  • $A_1 = \{1\}$, $B_1 = \emptyset$$A_1 \in \mathcal{P}(X), B_1 \in \mathcal{P}(Y)$
  • $F(A_1, B_1) = A_1 \times B_1 = \{1\} \times \emptyset = \emptyset$
  • $A_2 = \emptyset$, $B_2 = \{2\}$$A_2 \in \mathcal{P}(X), B_2 \in \mathcal{P}(Y)$
  • $F(A_2, B_2) = A_2 \times B_2 = \emptyset \times \{2\} = \emptyset$
  • 我们有 $F(A_1, B_1) = F(A_2, B_2) = \emptyset$,但是 $(A_1, B_1) = (\{1\}, \emptyset)$ 不等于 $(A_2, B_2) = (\emptyset, \{2\})$
  • 因此,$F$ 不是单射的。

示例2 (满射性):$X=Y=\{1, 2\}$

  • $X \times Y = \{(1, 1), (1, 2), (2, 1), (2, 2)\}$
  • $\mathcal{P}(X \times Y)$$X \times Y$ 的所有子集构成的集合。它有 $2^4 = 16$元素
  • 考虑 $S = \{(1, 2), (2, 1)\} \in \mathcal{P}(X \times Y)$
  • 我们能否找到 $A, B \subseteq X$ 使得 $A \times B = S$
  • 如果 $A \times B = \{(1, 2), (2, 1)\}$,那么 $A$ 必须包含有序对的第一个分量,即 $A$ 包含 $\{1, 2\}$。所以 $A=\{1, 2\}$
  • $B$ 必须包含有序对的第二个分量,即 $B$ 包含 $\{2, 1\}$。所以 $B=\{1, 2\}$
  • 但是 $A \times B = \{1, 2\} \times \{1, 2\} = \{(1, 1), (1, 2), (2, 1), (2, 2)\}$,这不等于 $S$
  • 因此,不存在这样的 $A, B$
  • 所以 $S$ 不在 $F$值域中,$F$ 不是满射的。
⚠️ [易错点]

(i) 易错点: 容易忘记题目中 "$X$ 至少有两个元素" 这个条件。如果 $X$ 只有一个元素,比如 $X=\{c\}$,那么 $\Delta_X = \{(c,c)\}$。我们可以取 $A=\{c\}, B=\{c\}$,此时 $A \times B = \{(c,c)\} = \Delta_X$。此时结论不成立。如果 $X = \emptyset$,那么 $\Delta_X = \emptyset$。我们可以取 $A=\emptyset, B=\emptyset$ (或者 $A$ 非空, $B$ 空等),此时 $A \times B = \emptyset = \Delta_X$。所以这个条件至关重要。

  1. 边界情况: $X$元素个数为 0 或 1。
  2. $X = \emptyset$, $\Delta_X = \emptyset$。取 $A = \emptyset, B = \emptyset$,则 $A \times B = \emptyset = \Delta_X$
  3. $X = \{c\}$, $\Delta_X = \{(c,c)\}$。取 $A = \{c\}, B = \{c\}$,则 $A \times B = \{(c,c)\} = \Delta_X$

(ii) 易错点: 在判断单射性时,只考虑非空集合的情况,从而错误地得出 $F$单射的结论。空集是导致其非单射的关键。

  1. 易错点: 对满射性的理解不够深刻,认为任何子集都可以是笛卡尔积。必须认识到只有“矩形”结构的子集才能表示为笛卡尔积
  2. 边界情况: $X$$Y$空集
  3. 如果 $X = \emptyset$,那么 $\mathcal{P}(X) = \{\emptyset\}$。输入变成了 $(\emptyset, B)$,其中 $B \subseteq Y$$F(\emptyset, B) = \emptyset \times B = \emptyset$。此时函数 $F$ 的定义域是 $\mathcal{P}(Y)$,值域是 $\mathcal{P}(\emptyset)$ 的一个子集,实际上值恒为空集
  4. 如果 $X, Y$ 都非空,但 $A_1, B_1, A_2, B_2$ 中有空集,这是判断非单射性的关键。
📝 [总结]

(i) 本题证明了笛卡尔积 $A \times B$ 具有一种“矩形”结构,而当一个集合 $X$元素足够多(至少两个)时,它的对角线 $\Delta_X$ 不具备这种矩形结构,因此不能表示为任何子集 $A, B$笛卡尔积。其核心在于笛卡尔积会包含所有“交叉”的有序对

(ii) 本题探讨了将取笛卡尔积这个操作本身看作一个函数 $F$ 时的性质。我们发现:

  1. $F$ 不是单射的,因为空集笛卡尔积可以由不同的输入得到,例如 $A \times \emptyset = \emptyset \times B = \emptyset$
  2. $F$ 也不是满射的,因为 $X \times Y$ 的很多子集(非“矩形”的子集)都无法表示成 $A \times B$ 的形式。
🎯 [存在目的]
  1. 巩固定义: 此题旨在加深对集合子集对角线笛卡尔积函数单射满射)这些基本概念的理解。
  2. 培养证明技巧: 训练使用反证法进行逻辑推导的能力。
  3. 理解结构: 帮助学生理解笛卡尔积所生成的集合具有的特定结构(“矩形”),并认识到并非所有子集都具有这种结构。
  4. 抽象思维: 将“取笛卡尔积”这一运算抽象为函数,并分析其性质,这是代数范畴论中常见的思维方式。
🧠 [直觉心智模型]
  1. (i) 想象一个坐标平面。集合 $X$ 可以看作是 x 轴和 y 轴上的刻度。笛卡尔积 $A \times B$ 对应平面上由水平带 $A$ 和垂直带 $B$ 交叉形成的一个矩形区域(如果 $A,B$ 是区间的话)。而对角线 $\Delta_X$ 是平面上一条斜率为 1 的直线 $y=x$ 上的点集。一个矩形,除非退化成一个点或者一条线(这对应 $X$ 只有一个元素或为空的情况),永远不可能和一条斜线完全重合。
  2. (ii) 满射性:想象你在用一些矩形砖块 ($A \times B$) 去铺满一个大的画布 ($X \times Y$) 的一个任意形状的区域 ($S$)。你发现你只能铺出矩形的形状,对于那些奇形怪状的区域(比如一个“L”形或者只有对角线的区域),你用一块矩形砖是无法完美覆盖的。
💭 [直观想象]
  1. (i) 想象一个班级 $X$ 的所有学生。$X \times X$ 是所有可能的“学生-学生”配对。$\Delta_X$ 是所有“自己和自己”的配对。现在你要找两个小组 $A$$B$$A, B$ 都是这个班级的一部分学生),使得从 $A$ 组里任选一人,从 $B$ 组里任选一人,组成的所有配对,正好就是所有“自己和自己”的配对。如果班里不止一个人,比如有小明和小红。那么 (小明, 小明)(小红, 小红) 都得在你构造的配对集合里。这意味着小明和小红都得在 $A$ 组里,也得在 $B$ 组里。但如果这样,那么 (小明, 小红) 这个配对也必须存在,但这又不是“自己和自己”的配对,所以矛盾了。
  2. (ii) 想象你有两盒积木,$X$$Y$$\mathcal{P}(X)$ 是从 $X$ 盒中拿出一些积木的所有可能方案,$\mathcal{P}(Y)$ 同理。函数 $F$ 的作用是:你从 $\mathcal{P}(X)$ 中拿一个方案(一个子集 $A$),从 $\mathcal{P}(Y)$ 中拿一个方案(一个子集 $B$),然后将它们配对,形成 $A \times B$
  3. 非单射:你发现,如果你的方案 $A$ 是“不拿任何积木”(即 $A=\emptyset$),那么无论对方的方案 $B$ 是什么(只要 $B$ 非空),最终结果都是“零配对” ($\emptyset$)。同样,如果对方的方案 $B$ 是“不拿任何积- 1.11. (i) 集合 S_{2}(从 {1,2} 到 {1,2} 的所有双射的集合)中有多少个元素?证明,对于所有 f, g \in S_{2},f \circ g=g \circ f。然而,给出一个从 {1,2} 到 {1,2} 的两个函数(不假设为双射)f, g 的例子,使得 f \circ g \neq g \circ f。

(ii) S_{3} 中有多少个元素?找出两个函数 f, g \in S_{3},使得 f \circ g \neq g \circ f。

📖 [逐步解释]

(i)

  1. S₂ 中元素的个数:
    • $S_2$ 是从集合 $\{1, 2\}$ 到自身的所有双射集合。一个双射既是单射又是满射
    • 我们来构造这样的函数 $f: \{1, 2\} \to \{1, 2\}$
    • 对于输入 1, $f(1)$ 可以是 1 或者 2。有两个选择。
    • 如果 $f(1) = 1$,为了保证函数单射的(不重复),$f(2)$ 不能等于 $f(1)$,所以 $f(2)$ 必须是 2。这样就得到了一个函数$f_1(1)=1, f_1(2)=2$。这就是恒等函数
    • 如果 $f(1) = 2$,为了保证单射性,$f(2)$ 必须是 1。这样就得到了另一个函数$f_2(1)=2, f_2(2)=1$。这就是交换 1 和 2 的函数
    • 这两个函数都是双射(也是满射,因为值域是 $\{1, 2\}$)。
    • 所以,$S_2$ 中恰好有两个元素$f_1$ (恒等映射,常记作 $id$$e$) 和 $f_2$ (交换映射,常记作 $\tau$$(12)$)。
  2. 证明 f ∘ g = g ∘ f 对所有 f, g ∈ S₂ 成立 (交换性):
    • $S_2 = \{f_1, f_2\}$。我们需要验证四种组合:
    • $f_1 \circ f_1 = f_1$$g_1 \circ f_1 = f_1$。两者相等。
    • $f_1 \circ f_2 = f_2$ (恒等映射复合任何映射,等于那个映射本身),$f_2 \circ f_1 = f_2$。两者相等。
    • $f_2 \circ f_1 = f_2$$f_1 \circ f_2 = f_2$。两者相等。(这和上一种情况一样)。
    • $f_2 \circ f_2 = f_1$。我们来验证一下:
    • $(f_2 \circ f_2)(1) = f_2(f_2(1)) = f_2(2) = 1$
    • $(f_2 \circ f_2)(2) = f_2(f_2(2)) = f_2(1) = 2$
    • 所以 $f_2 \circ f_2$ 的行为和 $f_1$ (恒等映射) 完全一样,即 $f_2 \circ f_2 = f_1$
    • 反过来计算也是一样的。
    • 既然所有可能的组合都满足交换律,所以对于所有 $f, g \in S_2$$f \circ g = g \circ f$
  3. 给出 f ∘ g ≠ g ∘ f 的非双射例子:
    • 我们需要定义两个从 $\{1, 2\}$$\{1, 2\}$函数 $f$$g$,它们不必是双射
    • 让我们尝试构造常数函数
    • $f(x) = 1$ (对于所有 $x \in \{1, 2\}$)。
    • $g(x) = x+1$ (模2加1可能不直观,我们直接定义),设 $g(1)=2, g(2)=1$ (这其实就是 $f_2$$S_2$ 里的那个双射)。
    • 现在计算复合函数
    • $(f \circ g)(1) = f(g(1)) = f(2) = 1$
    • $(f \circ g)(2) = f(g(2)) = f(1) = 1$
    • 所以 $f \circ g$ 是一个将所有元素都映到 1 的常数函数
    • 现在计算反向的复合函数
    • $(g \circ f)(1) = g(f(1)) = g(1) = 2$
    • $(g \circ f)(2) = g(f(2)) = g(1) = 2$
    • 所以 $g \circ f$ 是一个将所有元素都映到 2 的常数函数
    • 显然,将所有东西映到 1 的函数和将所有东西映到 2 的函数是不同的。
    • 因此,$f \circ g \neq g \circ f$

(ii)

  1. S₃ 中元素的个数:
    • $S_3$ 是从集合 $\{1, 2, 3\}$ 到自身的所有双射集合
    • 我们来数一下有多少种这样的函数 $f: \{1, 2, 3\} \to \{1, 2, 3\}$
    • 对于 $f(1)$,它可以是 1, 2, 3 中的任何一个。有 3 个选择。
    • 一旦确定了 $f(1)$,为了保证单射性,$f(2)$ 不能等于 $f(1)$。所以 $f(2)$ 只有 2 个选择。
    • 确定了 $f(1)$$f(2)$ 之后,$f(3)$ 为了单射性,不能等于 $f(1)$$f(2)$,所以只剩下 1 个选择。
    • 总的可能性数量是 $3 \times 2 \times 1 = 6$
    • 所以 $S_3$ 中有 6 个元素。这个数被称为 3 的阶乘,记作 $3!$
  2. 找出 f, g ∈ S₃ 使得 f ∘ g ≠ g ∘ f:
    • $S_3$ 里的元素通常被称为置换。我们来找两个具体的置换
    • 函数 $f$ 为一个“循环置换”,它把 1 变成 2,2 变成 3,3 变回 1。
    • $f(1)=2, f(2)=3, f(3)=1$
    • 函数 $g$ 为一个“对换”,它交换 1 和 2,保持 3 不变。
    • $g(1)=2, g(2)=1, g(3)=3$
    • 现在计算复合函数 $f \circ g$
    • $(f \circ g)(1) = f(g(1)) = f(2) = 3$
    • $(f \circ g)(2) = f(g(2)) = f(1) = 2$
    • $(f \circ g)(3) = f(g(3)) = f(3) = 1$
    • 所以 $f \circ g$ 是这样一个置换$1 \to 3, 2 \to 2, 3 \to 1$。它交换了 1 和 3。
    • 现在计算复合函数 $g \circ f$
    • $(g \circ f)(1) = g(f(1)) = g(2) = 1$
    • $(g \circ f)(2) = g(f(2)) = g(3) = 3$
    • $(g \circ f)(3) = g(f(3)) = g(1) = 2$
    • 所以 $g \circ f$ 是这样一个置换$1 \to 1, 2 \to 3, 3 \to 2$。它交换了 2 和 3。
    • 我们比较一下两个结果:
    • $(f \circ g)(1) = 3$,而 $(g \circ f)(1) = 1$
    • 因为它们在输入 1 上的取值不同,所以这两个复合函数是不同的函数
    • 因此,我们找到了两个元素 $f, g \in S_3$ 使得 $f \circ g \neq g \circ f$
∑ [公式拆解]

本段没有复杂的行间公式,主要是函数复合的符号 $f \circ g$

  • $f \circ g$: 读作 "f compose g" 或 "f after g",表示先应用函数 $g$,然后再对结果应用函数 $f$
  • $(f \circ g)(x) = f(g(x))$: 这是复合函数的定义。计算时从右向左进行。
💡 [数值示例]

(i) 双射交换性:

  • $S_2 = \{f_1, f_2\}$,其中 $f_1(1)=1, f_1(2)=2$ (恒等),$f_2(1)=2, f_2(2)=1$ (交换)。
  • 示例: 验证 $f_2 \circ f_1 = f_1 \circ f_2$
  • $(f_2 \circ f_1)(1) = f_2(f_1(1)) = f_2(1) = 2$
  • $(f_1 \circ f_2)(1) = f_1(f_2(1)) = f_1(2) = 2$
  • 两者在 1 上的值相同。
  • $(f_2 \circ f_1)(2) = f_2(f_1(2)) = f_2(2) = 1$
  • $(f_1 \circ f_2)(2) = f_1(f_2(2)) = f_1(1) = 1$
  • 两者在 2 上的值也相同。
  • 因此 $f_2 \circ f_1 = f_1 \circ f_2$ (实际上都等于 $f_2$)。

非双射非交换性:

  • 示例1:
  • $f(1)=1, f(2)=1$ (常数函数)。
  • $g(1)=1, g(2)=2$ (恒等函数)。
  • $f \circ g$: $(f \circ g)(1) = f(g(1)) = f(1)=1$, $(f \circ g)(2) = f(g(2)) = f(2)=1$。所以 $f \circ g$ 是常数函数 1。
  • $g \circ f$: $(g \circ f)(1) = g(f(1)) = g(1)=1$, $(g \circ f)(2) = g(f(2)) = g(1)=1$。所以 $g \circ f$ 是常数函数 1。
  • 在这个例子里,$f \circ g = g \circ f$。所以不是随便找就能找到反例。
  • 示例2 (题目中用的例子):
  • $f(x)=1$$g(1)=2, g(2)=1$
  • $f \circ g$: $1 \xrightarrow{g} 2 \xrightarrow{f} 1$, $2 \xrightarrow{g} 1 \xrightarrow{f} 1$。结果是 $1 \to 1, 2 \to 1$
  • $g \circ f$: $1 \xrightarrow{f} 1 \xrightarrow{g} 2$, $2 \xrightarrow{f} 1 \xrightarrow{g} 2$。结果是 $1 \to 2, 2 \to 2$
  • 这两个结果显然不同。

(ii) S₃ 非交换性:

  • $S_3$ 的六个元素可以写成:
  • $e = (1)(2)(3)$ (恒等: $1\to1, 2\to2, 3\to3$)
  • $(12) = (1\to2, 2\to1, 3\to3)$ (交换1和2)
  • $(13) = (1\to3, 2\to2, 3\to1)$ (交换1和3)
  • $(23) = (1\to1, 2\to3, 3\to2)$ (交换2和3)
  • $(123) = (1\to2, 2\to3, 3\to1)$ (循环)
  • $(132) = (1\to3, 2\to1, 3\to2)$ (循环)
  • 示例: 验证 $(12) \circ (13) \neq (13) \circ (12)$
  • $f=(12), g=(13)$
  • $(f \circ g)(1) = f(g(1)) = f(3) = 3$
  • $(g \circ f)(1) = g(f(1)) = g(2) = 2$
  • 因为 $(f \circ g)(1) \neq (g \circ f)(1)$,所以 $f \circ g \neq g \circ f$
  • (我们继续算完:$f \circ g$$1\to3, 3\to1, 2\to2$, 即 $(132)$$g \circ f$$1\to2, 2\to1, 3\to3$,即 $(123)$。)
⚠️ [易错点]
  1. 计算顺序: 复合函数 $f \circ g$ 的计算顺序是先 $g$$f$,这和书写顺序相反,初学者容易搞错。
  2. S₂ 的特殊性: 很容易将 $S_2$ 的交换性推广到所有 $S_n$,但这是错误的。$S_2$ 是一个非常小的、特殊的阿贝尔群),而从 $S_3$ 开始,对称群都是非阿贝尔群(非交换的)。
  3. 寻找反例: 在 (i) 中寻找非双射的非交换例子时,如果选的两个函数结构太简单(比如都是恒等函数或都是同一个常数函数),可能会碰巧得到一个交换的例子。需要有意识地构造一个能体现出顺序差异的组合。
  4. 符号: 置换的符号(如 $(123)$)对于初学者可能很陌生。题目本身没有引入,但它是理解这个问题的标准工具。如果只用 $f(1)=2, f(2)=3, \ldots$ 的方式,虽然啰嗦但不会出错。
📝 [总结]
  1. (i) 本题说明,在只有两个元素双射世界($S_2$)里,运算(函数复合)是可交换的。$S_2$ 只有两个元素:什么都不做的恒等函数,和交换两个元素函数。但只要跳出双射的限制,即使在只有两个元素集合上,也很容易构造出不可交换的函数复合
  2. (ii) 本题说明,当集合元素增加到三个时,即使是双射构成的世界($S_3$),函数复合这个运算也变得不可交换了。$S_3$ 包含 6 个元素,其内部结构比 $S_2$ 复杂得多。
  3. 总的来说,这道题通过 $S_2$$S_3$ 的对比,揭示了函数复合通常是不可交换的,而 $S_2$ 的交换性是一个特例而非通则。
🎯 [存在目的]
  1. 引入非交换性: 这是抽象代数中一个极其重要的概念。很多我们熟悉的运算(如数的加法、乘法)都是可交换的,但这道题明确指出,函数复合这个非常自然的运算,在一般情况下是不可交换的。这是后续学习群论,特别是非阿贝尔群的基础。
  2. 熟悉对称群: $S_n$n元对称群)是群论中最重要的例子之一。此题通过计算 $S_2$$S_3$ 的大小和性质,为学习对称群做了初步铺垫。
  3. 具体计算练习: 练习复合函数的求值,为更抽象的理论学习打下基础。
  4. 从具体到抽象: 通过具体计算 $\{1,2\}$$\{1,2,3\}$ 上的函数,让学生直观感受到“交换律”不是理所当然成立的,从而理解为什么在抽象代数中要把它当作一个专门的性质(如阿贝尔群的定义)来研究。
🧠 [直觉心智模型]
  1. 想象你有一串珠子,编号为 1, 2, 3。一个函数 $f \in S_3$ 就是一种对珠子重新排列的方式。
  2. $f \circ g$ 的意思就是:你先按照 $g$ 的方式排列一次,然后在得到的新排列的基础上,再按照 $f$ 的方式排列一次。
  3. $g \circ f$ 则是先 $f$$g$
  4. 问题就是:先穿袜子再穿鞋,和先穿鞋再穿袜子,结果一样吗?显然不一样。函数复合也是如此,操作的顺序至关重要。
  5. $f=$“把最上面的珠子和中间的珠子交换位置”,$g=$“把中间的珠子和最下面的珠子交换位置”。
  6. $f \circ g$: 初始状态 (1,2,3)。先 $g$: (1,3,2)。再 $f$: (3,1,2)。
  7. $g \circ f$: 初始状态 (1,2,3)。先 $f$: (2,1,3)。再 $g$: (2,3,1)。
  8. 最终结果 (3,1,2) 和 (2,3,1) 不一样。这说明 $f \circ g \neq g \circ f$
💭 [直观想象]
  1. 想象一个魔方。$f$ 可能是一个操作“转动顶层90度”,$g$ 是“转动右面90度”。
  2. 你先执行 $f$ 再执行 $g$,得到一个魔方状态。
  3. 你把魔方复原,然后先执行 $g$ 再执行 $f$,你会发现得到的状态和前一次不一样。
  4. $S_3$ 就好比一个只有3个方块的“迷你魔方”,它的不同操作(置换)之间的组合,顺序是重要的。而 $S_2$ 就像一个只有正反两面的硬币,操作只有“不动”和“翻面”,先翻再翻等于不动,不动和翻面结合,顺序无所谓,所以它是交换的。
21.12. 习题 1.12

📜 [原文2]

$\mathbb{R}^{n}$ 中的定向量是一个有向线段 $\overrightarrow{\mathbf{p q}}$,其中 $\mathbf{p}, \mathbf{q} \in \mathbb{R}^{n}$。因此,定向量$\mathbb{R}^{n} \times \mathbb{R}^{n}$ 的一个元素是相同的。我们说 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$,如果 $\mathbf{q}_{1}-\mathbf{p}_{1}=\mathbf{q}_{2}-\mathbf{p}_{2}$,其中上述运算是通常的向量减法:如果 $\mathbf{p}=\left(a_{1}, \ldots, a_{n}\right)$$\mathbf{q}=\left(b_{1}, \ldots, b_{n}\right)$,则

$$ \mathbf{q}-\mathbf{p}=\mathbf{q}+(-\mathbf{p})=\left(b_{1}-a_{1}, \ldots, b_{n}-a_{n}\right) $$

使用向量加法的标准性质证明 $\sim$$\mathbb{R}^{n} \times \mathbb{R}^{n}$ 上的一个等价关系,并且每个等价类包含一个形式为 $\overrightarrow{\text { or }}$ 的唯一代表元

📖 [逐步解释]

这道题要求我们做两件事:

  1. 证明一个定义在所有定向量(有向线段)集合上的关系 $\sim$ 是一个等价关系
  2. 描述这个等价关系下的等价类,并说明每个等价类都与一个从原点出发的向量唯一对应。

第一部分:证明 $\sim$ 是等价关系

一个关系要成为等价关系,必须满足三个性质:自反性对称性传递性

关系的定义:$\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \iff \mathbf{q}_{1}-\mathbf{p}_{1}=\mathbf{q}_{2}-\mathbf{p}_{2}$

这里的 $\overrightarrow{\mathbf{p q}}$ 就等同于有序对 $(\mathbf{p}, \mathbf{q})$

  1. 自反性 (Reflexivity):
    • 要证: 对于任意一个定向量 $\overrightarrow{\mathbf{p q}}$,都有 $\overrightarrow{\mathbf{p q}} \sim \overrightarrow{\mathbf{p q}}$
    • 证明: 根据 $\sim$ 的定义,我们要检验是否 $\mathbf{q}-\mathbf{p} = \mathbf{q}-\mathbf{p}$
    • 这是一个恒等式,显然成立。
    • 因此,$\sim$ 满足自反性
  2. 对称性 (Symmetry):
    • 要证: 如果 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$,那么一定有 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \sim \overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}}$
    • 证明:
    • 假设 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$
    • 根据定义,这意味着 $\mathbf{q}_{1}-\mathbf{p}_{1}=\mathbf{q}_{2}-\mathbf{p}_{2}$
    • 这是一个向量等式。根据等式的对称性(如果 $A=B$,那么 $B=A$),我们可以把等式两边交换位置:
    • $\mathbf{q}_{2}-\mathbf{p}_{2}=\mathbf{q}_{1}-\mathbf{p}_{1}$
    • 根据 $\sim$ 的定义,这个新的等式恰好就是 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \sim \overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}}$ 的意思。
    • 因此,$\sim$ 满足对称性
  3. 传递性 (Transitivity):
    • 要证: 如果 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$ 并且 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$,那么一定有 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$
    • 证明:
    • 假设 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$。根据定义,这表示 $\mathbf{q}_{1}-\mathbf{p}_{1}=\mathbf{q}_{2}-\mathbf{p}_{2}$。我们称这个向量$\mathbf{v}$。所以 $\mathbf{q}_{1}-\mathbf{p}_{1} = \mathbf{v}$
    • 假设 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$。根据定义,这表示 $\mathbf{q}_{2}-\mathbf{p}_{2}=\mathbf{q}_{3}-\mathbf{p}_{3}$。因为 $\mathbf{q}_{2}-\mathbf{p}_{2}$ 就是 $\mathbf{v}$,所以 $\mathbf{q}_{3}-\mathbf{p}_{3} = \mathbf{v}$
    • 现在我们有 $\mathbf{q}_{1}-\mathbf{p}_{1} = \mathbf{v}$$\mathbf{q}_{3}-\mathbf{p}_{3} = \mathbf{v}$
    • 根据等式的传递性(如果 $A=B$$B=C$,则 $A=C$),我们得到 $\mathbf{q}_{1}-\mathbf{p}_{1} = \mathbf{q}_{3}-\mathbf{p}_{3}$
    • 这个等式正是 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$ 的定义。
    • 因此,$\sim$ 满足传递性

因为关系 $\sim$ 同时满足自反性对称性传递性,所以 $\sim$ 是一个等价关系

第二部分:描述等价类和唯一代表元

  1. 等价类的含义:
    • 一个等价类是由所有相互等价的定向量组成的集合
    • 根据 $\sim$ 的定义,两个定向量 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}}$$\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$ 等价,意味着它们代表了同一个“自由向量”,即 $\mathbf{q}_{1}-\mathbf{p}_{1} = \mathbf{q}_{2}-\mathbf{p}_{2}$。这个差值向量捕捉了有向线段的“方向”和“长度”,但忽略了它的“起点”。
    • 所以,一个等价类就是所有具有相同方向和长度的定向量集合
  2. 寻找唯一代表元:
    • 题目要求我们证明每个等价类包含一个形式为 $\overrightarrow{\mathbf{o r}}$ 的唯一代表元。这里的 $\mathbf{o}$ 是原点 $(0, \ldots, 0)$$\mathbf{r}$$\mathbb{R}^n$ 中的某个点。
    • 存在性:
    • 任取一个等价类,从这个等价类中随便拿出一个元素 $\overrightarrow{\mathbf{p q}}$
    • 这个定向量对应一个自由向量 $\mathbf{v} = \mathbf{q} - \mathbf{p}$
    • 我们要找一个与 $\overrightarrow{\mathbf{p q}}$ 等价的、且形式为 $\overrightarrow{\mathbf{o r}}$定向量
    • 设这个我们要找的向量$\overrightarrow{\mathbf{o r}}$。要使它与 $\overrightarrow{\mathbf{p q}}$ 等价,必须满足 $\mathbf{r} - \mathbf{o} = \mathbf{q} - \mathbf{p}$
    • 因为 $\mathbf{o}$ 是零向量,所以这个条件简化为 $\mathbf{r} = \mathbf{q} - \mathbf{p}$
    • 我们令 $\mathbf{r} = \mathbf{q} - \mathbf{p}$。这个 $\mathbf{r}$$\mathbb{R}^n$ 中一个确定的点。
    • 那么,我们构造的定向量 $\overrightarrow{\mathbf{o r}}$ 就满足 $\mathbf{r} - \mathbf{o} = \mathbf{r} = \mathbf{q} - \mathbf{p}$
    • 因此,$\overrightarrow{\mathbf{o r}} \sim \overrightarrow{\mathbf{p q}}$
    • 这说明,对于任意一个定向量所在的等价类,我们总能找到一个以原点为起点的代表元 $\overrightarrow{\mathbf{o r}}$
  • 唯一性:
  • 现在我们要证明这个代表元是唯一的。
  • 假设同一个等价类中有两个这样的代表元,分别是 $\overrightarrow{\mathbf{o r}_{1}}$$\overrightarrow{\mathbf{o r}_{2}}$
  • 因为它们在同一个等价类中,所以 $\overrightarrow{\mathbf{o r}_{1}} \sim \overrightarrow{\mathbf{o r}_{2}}$
  • 根据 $\sim$ 的定义,这意味着 $\mathbf{r}_{1} - \mathbf{o} = \mathbf{r}_{2} - \mathbf{o}$
  • 因为 $\mathbf{o}$ 是零向量,所以这简化为 $\mathbf{r}_{1} = \mathbf{r}_{2}$
  • 这就证明了两个代表元的终点必须是同一个点,所以这两个代表元是同一个定向量
  • 因此,每个等价类中,以原点为起点的代表元是唯一的。
  • 结论: 所有的定向量 $\overrightarrow{\mathbf{p q}}$ 通过等价关系 $\sim$ 被划分成不同的等价类。每个等价类可以由一个唯一的、从原点出发的向量 $\overrightarrow{\mathbf{o r}}$ 来代表,其中 $\mathbf{r} = \mathbf{q} - \mathbf{p}$。这正是我们在线性代数中学习的“向量”概念的严格定义:向量定向量(有向线段)的一个等价类,通常我们用从原点出发的那个唯一的代表元来指代整个等价类
∑ [公式拆解]

$$ \mathbf{q}-\mathbf{p}=\mathbf{q}+(-\mathbf{p})=\left(b_{1}-a_{1}, \ldots, b_{n}-a_{n}\right) $$

  • $\mathbf{q}-\mathbf{p}$: 表示向量 $\mathbf{q}$ 减去向量 $\mathbf{p}$。在几何上,这对应于从点 $\mathbf{p}$ 指向点 $\mathbf{q}$ 的有向线段所代表的自由向量
  • $\mathbf{q}+(-\mathbf{p})$: 这是向量减法的定义,即一个向量减去另一个向量等于加上那个向量负向量
  • $(b_{1}-a_{1}, \ldots, b_{n}-a_{n})$: 这是向量减法在坐标下的具体计算方式。如果 $\mathbf{p}=(a_1, \ldots, a_n)$$\mathbf{q}=(b_1, \ldots, b_n)$,那么它们的差就是对应坐标分量相减。
  • $\overrightarrow{\mathbf{p q}}$: 表示一个定向量,起点是 $\mathbf{p}$,终点是 $\mathbf{q}$
  • $\sim$: 这是一个二元关系的符号,读作 "tilde" 或 "is equivalent to" (等价于)。
💡 [数值示例]

示例1: 在 $\mathbb{R}^2$

  • $\mathbf{p}_1 = (1, 2)$, $\mathbf{q}_1 = (3, 5)$。定向量为 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}}$
  • $\mathbf{q}_1 - \mathbf{p}_1 = (3-1, 5-2) = (2, 3)$
  • $\mathbf{p}_2 = (0, 0)$, $\mathbf{q}_2 = (2, 3)$。定向量为 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$
  • $\mathbf{q}_2 - \mathbf{p}_2 = (2-0, 3-0) = (2, 3)$
  • 因为 $\mathbf{q}_{1}-\mathbf{p}_{1}=\mathbf{q}_{2}-\mathbf{p}_{2}$,所以 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$。它们属于同一个等价类
  • $\mathbf{p}_3 = (-1, -1)$, $\mathbf{q}_3 = (1, 2)$。定向量为 $\overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$
  • $\mathbf{q}_3 - \mathbf{p}_3 = (1-(-1), 2-(-1)) = (2, 3)$
  • 所以 $\overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$ 也和前两者等价。
  • 这个等价类中,以原点 $\mathbf{o}=(0,0)$ 为起点的唯一代表元$\overrightarrow{\mathbf{o r}}$,其中 $\mathbf{r} = (2,3)$。所以就是 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$

示例2: 证明传递性

  • $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}}$: $\mathbf{p}_1=(1,1), \mathbf{q}_1=(2,3)$, 差为 $(1,2)$
  • $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$: $\mathbf{p}_2=(4,0), \mathbf{q}_2=(5,2)$, 差为 $(1,2)$
  • $\overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$: $\mathbf{p}_3=(-1,5), \mathbf{q}_3=(0,7)$, 差为 $(1,2)$
  • 我们有 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}}$ (因为差都是 $(1,2)$)。
  • 我们也有 $\overrightarrow{\mathbf{p}_{2} \mathbf{q}_{2}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$ (因为差都是 $(1,2)$)。
  • 那么是否 $\overrightarrow{\mathbf{p}_{1} \mathbf{q}_{1}} \sim \overrightarrow{\mathbf{p}_{3} \mathbf{q}_{3}}$ 呢?
  • 是的,因为它们的差也都是 $(1,2)$,所以 $\mathbf{q}_1-\mathbf{p}_1 = \mathbf{q}_3-\mathbf{p}_3$。传递性成立。
⚠️ [易错点]
  1. 混淆定向量和自由向量: 定向量 $\overrightarrow{\mathbf{p q}}$ 是一个具体的几何对象,它的起点和终点是固定的。我们平时说的“向量”通常指“自由向量”,它只关心方向和长度,不关心起点,它实际上是定向量的一个等价类。这道题就是这个概念的严格化过程。
  2. 符号混淆: $\mathbf{p}$$\overrightarrow{\mathbf{p q}}$ 是不同类型的对象。前者是 $\mathbb{R}^n$ 中的一个点(或向量),后者是一个有序对 $(\mathbf{p}, \mathbf{q}) \in \mathbb{R}^n \times \mathbb{R}^n$,代表一个有向线段。
  3. 证明唯一性: 在证明唯一性时,要清晰地陈述“假设有两个,然后证明它们是同一个”,这是证明唯一性的标准范式。
  4. 边界情况:
  5. 向量: 如果 $\mathbf{p}=\mathbf{q}$,那么 $\overrightarrow{\mathbf{p p}}$ 代表一个零定向量。它对应的自由向量$\mathbf{p}-\mathbf{p}=\mathbf{0}$ (零向量)。所有零定向量(起点和终点相同的向量)构成一个等价类,其唯一代表元$\overrightarrow{\mathbf{o o}}$
📝 [总结]
  1. 本题通过定义一个基于“终点减起点”的等价关系 $\sim$,在所有定向量(有向线段)的集合上进行了划分。
  2. 证明了 $\sim$ 确实是一个等价关系,因为它满足自反对称传递三条性质。
  3. 最终表明,每一个由 $\sim$ 划分出的等价类,都唯一地对应于一个从原点出发的定向量。这为“自由向量”的概念提供了严格的数学基础,即一个自由向量可以被看作是所有与其方向和长度相同的有向线段的集合(一个等价类),并可以用从原点出发的那个代表元方便地表示。
🎯 [存在目的]
  1. 严格化基本概念: 将线性代数和物理中直观使用的“向量”概念(可以自由平移的箭头)用集合论等价关系的语言进行严格的数学定义。
  2. 等价关系的应用: 这是等价关系如何“识别”或“粘合”具有共同属性的对象的经典范例。在这里,它“粘合”了所有代表相同位移的定向量
  3. 商集的概念: 等价类集合,即 $\left(\mathbb{R}^{n} \times \mathbb{R}^{n}\right) / \sim$,被称为商集。这道题实际上是在说明商集$\mathbb{R}^n$ 本身存在一个双射。每个等价类对应于 $\mathbb{R}^n$ 中的一个向量(那个唯一的代表元的终点)。这是理解更抽象的商空间商群等概念的重要一步。
  4. 连接几何与代数: 题目将几何对象(有向线段)与代数运算(向量减法)联系起来,展示了代数工具如何用来分类和研究几何对象。
🧠 [直觉心智模型]
  1. 想象你在一张巨大的地图上。一个定向量 $\overrightarrow{\mathbf{p q}}$ 就是从地点 P 到地点 Q 的一次具体的移动,比如“从你家走到超市”。
  2. 等价关系 $\sim$ 的意思是,我们不关心移动的起点和终点,只关心这个移动本身的效果,即“向东北方向走1公里”。
  3. 所有“向东北方向走1公里”的移动,比如“从你家走到超市”、“从公司走到地铁站”、“从学校走到图书馆”,只要它们的方向和距离完全一样,我们就认为它们是“等价”的移动。
  4. 所有这些等价的移动就构成了一个等价类
  5. “唯一代表元 $\overrightarrow{\mathbf{o r}}$”的意思是,为了方便指代这一类“向东北方向走1公里”的移动,我们设立一个标准参考点——原点(比如市中心广场的中心),然后说,这一整类移动,我们都用“从市中心广场中心出发,向东北方向走1公里到达的那个点”来代表。这个代表是唯一的,也是最简洁的。
💭 [直观想象]
  1. 想象天空中飞过一群队列整齐的鸟。每只鸟的瞬间位移(在下一秒它会飞到哪里)都可以用一个小箭头表示。
  2. 如果鸟群保持队形整体平移,那么每个鸟的小箭头都是平行的,且长度相同。
  3. 所有这些小箭头(定向量)虽然起点不同(每只鸟的位置不同),但它们都属于同一个等价类,因为它们代表了同一个“飞行向量”(例如,以 50公里/小时的速度向北飞)。
  4. 我们可以用一个从地面原点画出的、指向北、长度代表 50公里/小时的箭头,来作为这个“飞行向量”的唯一代表元。这个代表元就概括了整个鸟群的运动状态。
31.13. 习题 1.13

📜 [原文3]

集合 $\mathbb{R}^{n}-\{\mathbf{0}\}$ 上定义一个关系 $\sim$$\mathbf{v} \sim \mathbf{w}$ 如果存在 $t \in \mathbb{R}$$t \neq 0$,使得 $\mathbf{v}=t \mathbf{w}$。证明 $\sim$ 是一个等价关系,并将 $\left(\mathbb{R}^{n}-\{\mathbf{0}\}\right) / \sim$ 识别为 $\mathbb{R}^{n}$一维向量子空间集,即 $\mathbb{R}^{n}$ 中通过原点的直线集

📖 [逐步解释]

这道题与上一题类似,也是要求证明一个关系等价关系,并描述其等价类构成的商集

第一部分:证明 $\sim$ 是等价关系

关系定义在非零向量集合 $\mathbb{R}^{n}-\{\mathbf{0}\}$ 上:

$\mathbf{v} \sim \mathbf{w} \iff$ 存在一个非零实数 $t$ 使得 $\mathbf{v}=t \mathbf{w}$

这意味着,两个非零向量如果“共线”(方向相同或相反),它们就是等价的。

  1. 自反性 (Reflexivity):
    • 要证: 对于任意 $\mathbf{v} \in \mathbb{R}^{n}-\{\mathbf{0}\}$,都有 $\mathbf{v} \sim \mathbf{v}$
    • 证明: 我们需要找到一个非零实数 $t$ 使得 $\mathbf{v} = t \mathbf{v}$
    • $t=1$。显然 $1 \in \mathbb{R}$$1 \neq 0$
    • $\mathbf{v} = 1 \cdot \mathbf{v}$ 这个等式对所有向量 $\mathbf{v}$ 都成立。
    • 因此,$\mathbf{v} \sim \mathbf{v}$自反性成立。
  2. 对称性 (Symmetry):
    • 要证: 如果 $\mathbf{v} \sim \mathbf{w}$,那么一定有 $\mathbf{w} \sim \mathbf{v}$
    • 证明:
    • 假设 $\mathbf{v} \sim \mathbf{w}$。根据定义,存在一个非零实数 $t$ 使得 $\mathbf{v} = t \mathbf{w}$
    • 因为 $\mathbf{v}$$\mathbf{w}$ 都是非零向量,所以 $t$ 也必须是非零的。
    • 我们可以在等式 $\mathbf{v} = t \mathbf{w}$ 两边同时乘以 $\frac{1}{t}$。因为 $t \neq 0$,所以 $\frac{1}{t}$ 也是一个明确定义的非零实数。
    • 我们得到 $\frac{1}{t} \mathbf{v} = \mathbf{w}$,或者写成 $\mathbf{w} = \frac{1}{t} \mathbf{v}$
    • $s = \frac{1}{t}$。因为 $t \neq 0$,所以 $s \neq 0$
    • 现在我们找到了一个非零实数 $s$ 使得 $\mathbf{w} = s \mathbf{v}$
    • 根据 $\sim$ 的定义,这正是 $\mathbf{w} \sim \mathbf{v}$ 的意思。
    • 因此,对称性成立。
  3. 传递性 (Transitivity):
    • 要证: 如果 $\mathbf{u} \sim \mathbf{v}$ 并且 $\mathbf{v} \sim \mathbf{w}$,那么一定有 $\mathbf{u} \sim \mathbf{w}$
    • 证明:
    • 假设 $\mathbf{u} \sim \mathbf{v}$。存在非零实数 $t_1$ 使得 $\mathbf{u} = t_1 \mathbf{v}$
    • 假设 $\mathbf{v} \sim \mathbf{w}$。存在非零实数 $t_2$ 使得 $\mathbf{v} = t_2 \mathbf{w}$
    • 我们将第二个等式代入第一个等式:
    • $\mathbf{u} = t_1 (\mathbf{v}) = t_1 (t_2 \mathbf{w}) = (t_1 t_2) \mathbf{w}$
    • $t_3 = t_1 t_2$。因为 $t_1 \neq 0$$t_2 \neq 0$,所以它们的乘积 $t_3$ 也非零。
    • 我们找到了一个非零实数 $t_3$ 使得 $\mathbf{u} = t_3 \mathbf{w}$
    • 根据 $\sim$ 的定义,这意味着 $\mathbf{u} \sim \mathbf{w}$
    • 因此,传递性成立。

因为关系 $\sim$ 同时满足自反性对称性传递性,所以 $\sim$ 是一个等价关系

第二部分:识别商集

  • 商集 $\left(\mathbb{R}^{n}-\{\mathbf{0}\}\right) / \sim$ 是所有等价类集合
  • 我们先来理解一个等价类是什么。
  • 给定一个非零向量 $\mathbf{v}_0$,它的等价类 $[\mathbf{v}_0]$ 是由所有与 $\mathbf{v}_0$ 等价的向量组成的集合
  • $[\mathbf{v}_0] = \{\mathbf{w} \in \mathbb{R}^n-\{\mathbf{0}\} \mid \mathbf{w} \sim \mathbf{v}_0 \}$
  • $= \{\mathbf{w} \in \mathbb{R}^n-\{\mathbf{0}\} \mid \mathbf{w} = t \mathbf{v}_0 \text{ for some } t \in \mathbb{R}, t \neq 0 \}$
  • 这个集合 $\{\ldots, -2\mathbf{v}_0, -\mathbf{v}_0, \frac{1}{2}\mathbf{v}_0, \mathbf{v}_0, 2\mathbf{v}_0, \ldots\}$ 正是穿过原点、方向由 $\mathbf{v}_0$ 决定的那条直线上,除了原点之外的所有点的集合
  • 每个等价类就对应于一条穿过原点的直线(去掉了原点本身)。
  • 商集就是所有这些“去掉了原点的直线”的集合
  • 题目要求我们将商集识别为 “$\mathbb{R}^{n}$一维向量子空间集,即 $\mathbb{R}^{n}$ 中通过原点的直线集”。
  • 一个一维向量子空间是什么?它是由一个非零向量 $\mathbf{v}_0$ 的所有标量倍数构成的集合$L = \{t \mathbf{v}_0 \mid t \in \mathbb{R}\}$。这恰好就是几何上的一条通过原点的直线
  • 我们的等价类 $[\mathbf{v}_0]$一维子空间 $L$ 的关系是:$[\mathbf{v}_0] = L - \{\mathbf{0}\}$
  • 存在一个非常自然的一一对应关系(双射):
  • 每一个等价类 $[\mathbf{v}_0]$ 都唯一地对应于包含它的那条直线(一维子空间)$L = [\mathbf{v}_0] \cup \{\mathbf{0}\}$
  • 反过来,每一条通过原点的直线 $L$(一维子空间),去掉原点后,就构成一个等价类
  • 因此,商集 $\left(\mathbb{R}^{n}-\{\mathbf{0}\}\right) / \sim$ 可以被“识别为”或“等同于”所有通过原点的直线集合。这个集合射影几何中非常重要,被称为射影空间 $\mathbb{P}^{n-1}(\mathbb{R})$
∑ [公式拆解]
  • $\mathbb{R}^{n}-\{\mathbf{0}\}$: 表示 $n$ 维实数向量空间中除去零向量(原点)之外的所有点的集合
  • $\mathbf{v} \sim \mathbf{w}$: 读作 "v is equivalent to w"。
  • $\exists t \in \mathbb{R}, t \neq 0$: "存在一个实数 $t$,并且 $t$ 不等于 0"。
  • $\mathbf{v}=t \mathbf{w}$: 向量 $\mathbf{v}$向量 $\mathbf{w}$ 的一个非零标量倍。
  • $\left(\mathbb{R}^{n}-\{\mathbf{0}\}\right) / \sim$: 这是商集的符号,表示由集合 $\mathbb{R}^{n}-\{\mathbf{0}\}$等价关系 $\sim$ 划分出的所有等价类所组成的新集合
💡 [数值示例]

示例1: 在 $\mathbb{R}^2$

  • $\mathbf{v} = (1, 2)$。这是一个非零向量
  • 它的等价类 $[\mathbf{v}]$ 是什么?
  • $[\mathbf{v}] = \{ t(1, 2) \mid t \in \mathbb{R}, t \neq 0 \} = \{ (t, 2t) \mid t \in \mathbb{R}, t \neq 0 \}$
  • 这个集合包含了像 $(2, 4)$ (当 $t=2$), $(-1, -2)$ (当 $t=-1$), $(\frac{1}{2}, 1)$ (当 $t=\frac{1}{2}$) 等等所有的点。
  • 这些点在二维平面上构成了直线 $y=2x$ 上除了原点 $(0,0)$ 之外的所有点。
  • 这个等价类就对应于直线 $y=2x$ 这个一维子空间

示例2: 在 $\mathbb{R}^3$

  • $\mathbf{v} = (1, 0, 0)$。这是 x 轴方向的单位向量
  • 它的等价类$[\mathbf{v}] = \{ (t, 0, 0) \mid t \in \mathbb{R}, t \neq 0 \}$
  • 这代表了 x 轴上除了原点以外的所有点。这个等价类就对应于 x 轴这个一维子空间
  • $\mathbf{w} = (2, 3, 4)$
  • 它的等价类$[\mathbf{w}] = \{ (2t, 3t, 4t) \mid t \in \mathbb{R}, t \neq 0 \}$
  • 这代表了三维空间中,穿过原点和点 $(2, 3, 4)$ 的那条直线(去掉了原点)。

商集 $\left(\mathbb{R}^{2}-\{\mathbf{0}\}\right) / \sim$ 就是所有穿过原点的直线(比如 $y=0, y=x, y=2x, x=0$ 等等)的集合

⚠️ [易错点]
  1. 零向量: 题目在一开始就排除了零向量 $\mathbf{0}$。这是非常重要的。
  2. 如果允许 $\mathbf{v}=\mathbf{0}$,那么 $\mathbf{0} = 0 \cdot \mathbf{w}$ 对任何 $\mathbf{w}$ 都成立,但定义要求 $t \neq 0$
  3. 如果允许 $\mathbf{w}=\mathbf{0}$,那么 $\mathbf{v} = t \cdot \mathbf{0} = \mathbf{0}$$\mathbf{v} \sim \mathbf{0}$ 只对 $\mathbf{v}=\mathbf{0}$ 成立。
  4. 关键在于,如果 $\mathbf{v}=t \mathbf{w}$$t \neq 0$,则 $\mathbf{v}$ 是零向量当且仅当 $\mathbf{w}$ 是零向量。所以非零向量只会与非零向量等价,零向量只会与零向量等价。将零向量排除,使得我们只关注非零向量的世界,定义更简洁。
  5. t≠0: 这个条件是关系的核心。如果允许 $t=0$,那么任何向量 $\mathbf{v}$ 都会与 $\mathbf{0}$ 等价(因为 $\mathbf{0}=0\mathbf{v}$),这会导致所有向量都落入一个等价类,失去了意义。在证明对称性时,我们需要 $t$ 非零才能做除法 $1/t$。在证明传递性时,需要 $t_1, t_2$ 非零来保证 $t_1 t_2$ 非零。
  6. 识别为: “识别为”(identify with) 是一个数学术语,意味着两个看起来不同的集合之间存在一个非常自然和保持结构的一一对应关系,以至于我们可以把它们当作同一个东西来看待。这里就是 等价类的集合 $\leftrightarrow$ 一维子空间的集合
📝 [总结]
  1. 本题定义了一个在非零向量上的“共线”等价关系
  2. 通过验证自反对称传递性,证明了它是一个等价关系
  3. 这个等价关系将整个 $\mathbb{R}^n - \{\mathbf{0}\}$ 空间划分成多个等价类
  4. 每个等价类都由一条穿过原点的直线(去掉原点)上的所有点构成。
  5. 因此,所有等价类集合商集)与所有穿过原点的直线集合(即所有一维子空间集合)之间存在自然的一一对应
🎯 [存在目的]
  1. 引入射影空间: 这是射影几何的入门。n-1维射影空间 $\mathbb{P}^{n-1}(\mathbb{R})$ 的标准定义就是 $\mathbb{R}^n$ 中所有通过原点的直线集合。这道题通过等价关系给出了这个概念的一个严格构造。射影空间在几何、拓扑和代数几何中都是核心研究对象。
  2. 加深对等价关系和商集的理解: 这是一个比上一题更抽象的例子,展示了等价关系如何从一个熟悉的向量空间构造出一个全新的、但同样富有几何意义的空间
  3. 从“点”到“线”的视角转换: 通常我们考虑空间中的点,但这道题引导我们将“直线”(作为一条整体)视为一个新的“点”或“元素”。这种视角提升在数学中非常常见。
  4. 理解“共线”的代数本质: 将几何概念“共线”精确地表述为代数关系 $\mathbf{v} = t \mathbf{w}$
🧠 [直觉心智模型]
  1. 想象你站在原点,看着周围的整个三维世界。你看到的每个方向都对应一条从你眼中射出的光线(直线)。
  2. 这条光线上的所有点(除了你自己),比如离你1米远的灰尘、2米远的蚊子、1000米外的大楼上的一个点,只要它们都在同一条直线上,这道题就把它们都归为“一类”。
  3. 这个等价关系就像是你的“视线”,它把在同一视线方向上的所有点都“压缩”到了一起,认为它们是等价的。
  4. 商集是什么?就是你所有可能的“视线方向”的集合。每个“方向”就是一个元素。在二维平面上,这个集合就像一个圆周(一个方向对应圆上的一个点,对径点被视为相同方向的直线,但这里我们先不考虑这个细节)。
💭 [直观想象]
  1. 想象一个插满了编织针的巨大针插(原点)。每一根无限长的编织针(穿过原点的直线)就是一个一维子空间
  2. 等价关系 $\sim$ 的规则是:只要两个点在同一根编织针上(并且不是针插中心),它俩就是一伙的。
  3. 一个等价类就是一根特定的编织针上,除了中心点以外的所有点。
  4. 商集就是所有这些编织针的集合。你不再关心针上的某个具体的点,你只关心这是“哪一根针”。所以,商集里的一个元素就是“那根指向某个方向的针”。
41.14. 习题 1.14

📜 [原文4]

假设 $X$ 是一个集合,并且 $f: X \rightarrow Y$ 是从 $X$ 到某个集合 $Y$ 的一个固定函数。在 $X$ 上定义关系 $\sim$$a \sim b \Longleftrightarrow f(a)=f(b)$。仔细证明 $\sim$ 是一个等价关系

📖 [逐步解释]

这道题给出了一个非常通用和重要的构造等价关系的方法:通过一个函数的取值来定义。两个元素等价,当且仅当它们在函数 $f$ 下的像相同。

关系定义在集合 $X$ 上:

$a \sim b \iff f(a) = f(b)$, 其中 $a, b \in X$

我们要证明它满足等价关系的三大性质:自反性对称性传递性

  1. 自反性 (Reflexivity):
    • 要证: 对于任意 $a \in X$,都有 $a \sim a$
    • 证明:
    • 根据 $\sim$ 的定义,我们要检验是否 $f(a) = f(a)$
    • 这是一个恒等式,等号的自反性保证了它一定成立。
    • 因此,$a \sim a$ 成立。自反性得证。
  2. 对称性 (Symmetry):
    • 要证: 如果 $a \sim b$,那么一定有 $b \sim a$
    • 证明:
    • 假设 $a \sim b$
    • 根据定义,这意味着 $f(a) = f(b)$
    • 这是一个在集合 $Y$元素的等式。根据等式的对称性(如果 $y_1 = y_2$,那么 $y_2 = y_1$),我们可以写出 $f(b) = f(a)$
    • 根据 $\sim$ 的定义,这个新的等式 $f(b) = f(a)$ 恰好就是 $b \sim a$ 的意思。
    • 因此,对称性得证。
  3. 传递性 (Transitivity):
    • 要证: 如果 $a \sim b$ 并且 $b \sim c$,那么一定有 $a \sim c$
    • 证明:
    • 假设 $a \sim b$。根据定义,这表示 $f(a) = f(b)$
    • 假设 $b \sim c$。根据定义,这表示 $f(b) = f(c)$
    • 现在我们有两个等式:$f(a) = f(b)$$f(b) = f(c)$
    • 根据等式的传递性(如果 $y_1 = y_2$$y_2 = y_3$,则 $y_1 = y_3$),我们可以得到 $f(a) = f(c)$
    • 根据 $\sim$ 的定义,这个等式 $f(a) = f(c)$ 正是 $a \sim c$ 的意思。
    • 因此,传递性得证。

由于关系 $\sim$ 同时满足自反性对称性传递性,所以它是一个定义在 $X$ 上的等价关系

这个等价关系被称为由函数 $f$ 导出(或诱导)的等价关系。它的等价类$f$水平集(level sets)或原像(preimages)。具体来说,对于一个元素 $a \in X$,它的等价类是:

$[a] = \{x \in X \mid x \sim a\} = \{x \in X \mid f(x) = f(a)\} = f^{-1}(\{f(a)\})$

即所有被 $f$ 映射到同一个值 $f(a)$元素集合

∑ [公式拆解]
  • $f: X \rightarrow Y$: 表示 $f$ 是一个从定义域集合 $X$ 映射到值域集合 $Y$函数
  • $a \sim b \Longleftrightarrow f(a)=f(b)$: 这是本题中关系 $\sim$ 的定义。
  • $\Longleftrightarrow$: 读作 "if and only if" (当且仅当)。
  • $f(a)=f(b)$: 核心条件,表示 $a$$b$函数 $f$ 下的像是相同的。
💡 [数值示例]

示例1:

  • $X = \mathbb{Z}$ (所有整数的集合)。
  • $Y = \{0, 1\}$
  • 定义函数 $f: \mathbb{Z} \rightarrow \{0, 1\}$$f(n) = n \pmod 2$ (一个数除以2的余数,即判断奇偶性)。
  • $f(n) = 0$ 如果 $n$ 是偶数。
  • $f(n) = 1$ 如果 $n$ 是奇数。
  • 关系 $\sim$ 定义为: $a \sim b \iff f(a)=f(b) \iff a, b$ 奇偶性相同。
  • 自反性: $a$$a$ 的奇偶性总是一样的。成立。
  • 对称性: 如果 $a$$b$ 奇偶性相同,那么 $b$$a$ 的奇偶性也相同。成立。
  • 传递性: 如果 $a,b$ 奇偶性相同, $b,c$ 奇偶性也相同,那么 $a,c$ 的奇偶性必然相同。成立。
  • 所以这是一个等价关系。它将整数集合 $\mathbb{Z}$ 划分成两个等价类
  • 等价类1: 所有偶数 $\{..., -4, -2, 0, 2, 4, ...\}$。这是 $f^{-1}(0)$
  • 等价类2: 所有奇数 $\{..., -3, -1, 1, 3, 5, ...\}$。这是 $f^{-1}(1)$

示例2:

  • $X = \mathbb{R}^2$ (二维平面上的所有点)。
  • $Y = \mathbb{R}$
  • 定义函数 $f: \mathbb{R}^2 \rightarrow \mathbb{R}$$f(x,y) = x^2 + y^2$ (一个点到原点距离的平方)。
  • 关系 $\sim$ 定义为: $\mathbf{v}_1 \sim \mathbf{v}_2 \iff f(\mathbf{v}_1)=f(\mathbf{v}_2)$
  • 其中 $\mathbf{v}_1=(x_1, y_1), \mathbf{v}_2=(x_2, y_2)$
  • $\mathbf{v}_1 \sim \mathbf{v}_2 \iff x_1^2 + y_1^2 = x_2^2 + y_2^2$
  • 这意味着两个点等价,当且仅当它们到原点的距离相等。
  • 自反性: 一个点到原点的距离等于它自己到原点的距离。成立。
  • 对称性: 如果点A到原点距离等于点B,那么点B也等于点A。成立。
  • 传递性: 如果A的距离等于B,B的距离等于C,那么A的距离等于C。成立。
  • 这是一个等价关系。它的等价类是什么?
  • 一个等价类是所有到原点距离相等的点的集合。这正是一个以原点为圆心的圆周。
  • 例如,等价类 $[\ (1,0)\ ]$ 是所有满足 $x^2+y^2 = 1^2+0^2 = 1$ 的点 $(x,y)$集合,即单位圆。
  • 这个等价关系将整个平面 $\mathbb{R}^2$ 划分成了无数个同心圆(以及原点本身这一个特殊的等价类)。
⚠️ [易错点]
  1. 证明逻辑: 证明过程非常直接,几乎是把等号的性质“翻译”成关系 $\sim$ 的性质。关键在于要清楚地意识到我们是在利用 = 这个已知是等价关系关系来证明 $\sim$ 也是。
  2. 函数f的选择: 这个构造方法对任何函数 $f$ 都适用,无论 $f$单射满射还是都不是。
  3. 边界情况:
  4. 如果 $f$单射函数 (一对一),那么 $f(a)=f(b)$ 意味着 $a=b$。此时,$a \sim b \iff a=b$。这个等价关系是最小的等价关系,即“恒等关系”。每个元素只与它自身等价,每个等价类都只包含一个元素
  5. 如果 $f$常数函数,即对于所有 $x \in X$$f(x)=c$(一个固定的值)。那么对于任意的 $a, b \in X$,都有 $f(a)=c$$f(b)=c$,所以 $f(a)=f(b)$ 恒成立。这意味着任意 $a \sim b$。这个等价关系是最大的等价关系,所有元素都相互等价,整个集合 $X$ 构成一个单独的等价类
📝 [总结]
  1. 本题揭示了一个从任意函数 $f: X \to Y$ 出发,构造 $X$ 上的一个等价关系的标准方法。
  2. 等价关系的定义非常直观:像相同的元素归为一类。
  3. 证明过程依赖于等号 = 本身所具有的自反对称传递的性质。
  4. 这个等价关系所产生的等价类就是函数 $f$ 的“水平集”,即 $f^{-1}(\{y\})$ 形式的子集,它们构成了对定义域 $X$ 的一个划分
🎯 [存在目的]
  1. 提供构造工具: 介绍一个在数学中无处不在的、用函数构造等价关系的普适方法。许多等价关系,包括前面习题中的例子,都可以看作是这种方法的特例。
  2. 习题1.12:$f(\overrightarrow{\mathbf{pq}}) = \mathbf{q}-\mathbf{p}$
  3. 习题1.13:$f(\mathbf{v}) = \text{span}(\mathbf{v})$ (v生成的一维子空间)。
  4. 习题1.15:$f(A) = \#(A)$ (集合的基数)。
  5. 第一同构定理的铺垫: 这个构造是群论环论第一同构定理的核心思想。该定理指出,商集 $X/\sim$函数 $f$ $\operatorname{Im}(f)$ 之间存在一个自然的双射。也就是说,通过将像相同的元素“捏合”在一起,我们得到的商集的大小和结构,恰好就反映了函数 $f$像集
  6. 抽象化: 鼓励学生从具体的例子(如奇偶性、共线)中抽取出一般的模式和结构。
🧠 [直觉心智模型]
  1. 想象一个函数 $f$ 是一台“贴标签机”。它为集合 $X$ 里的每个元素 $x$ 都贴上一个来自集合 $Y$ 的标签 $f(x)$
  2. 等价关系 $\sim$ 的规则是:“贴有相同标签的两个元素是等价的”。
  3. 自反性: 每个元素都和自己贴着一样的标签。
  4. 对称性: 如果 A 和 B 贴着一样的标签,那么 B 和 A 也贴着一样的标签。
  5. 传递性: 如果 A 和 B 标签一样,B 和 C 标签也一样,那么 A 和 C 的标签肯定也一样。
  6. 一个等价类就是所有贴着某个特定标签(比如“红色”)的所有元素集合
  7. 商集 $X/\sim$ 就是所有不同种类的“标签”的集合(严格来说是所有贴有某标签的元素集合集合)。
💭 [直观想象]
  1. 想象一次考试, $X$ 是所有学生的集合$Y$ 是所有可能的分数(例如 0 到 100)。函数 $f$ 是 "给出学生的分数",$f(\text{张三}) = 95$
  2. 关系 $a \sim b$ 意味着学生 $a$ 和学生 $b$ 的分数相同。
  3. 这个关系显然是等价关系
  4. 每个人的分数都等于自己的分数。
  5. 如果张三和李四分数一样,那么李四和张三也分数一样。
  6. 如果张三和李四分数一样,李四和王五分数也一样,那么张三和王五的分数肯定也一样。
  7. 一个等价类就是所有考了同一个分数的学生的集合,例如“所有考了95分的学生”。
  8. 商集就是所有这些“同分学生群”的集合
51.15. 习题 1.15

📜 [原文5]

$X=\left\{x_{1}, x_{2}, x_{3}\right\}$ 是一个包含三个元素集合。在幂集 $\mathcal{P}(X)$(而不是在 $X$ 上!)上定义一个关系 $\sim$:给定 $A, B \in \mathcal{P}(X)$$A \sim B$ 如果 $\#(A)=\#(B)$。证明 $\sim$ 是一个等价关系。列出 $\sim$ 的所有可能的等价类及其元素

📖 [逐步解释]

这道题要求我们对一个幂集(即一个集合的所有子集构成的集合)上的关系进行分析。

第一部分:证明 $\sim$ 是等价关系

  • 作用对象: 我们的关系 $\sim$ 是定义在 $\mathcal{P}(X)$ 上的。$\mathcal{P}(X)$元素$X$子集。所以,我们比较的是两个子集,比如 $A, B \subseteq X$
  • 关系定义: $A \sim B \iff \#(A) = \#(B)$。这里 $\#(A)$ 表示集合 $A$元素个数(也称为基数)。两个子集等价,当且仅当它们包含相同数量的元素
  • 这道题是上一题(习题1.14)的一个具体应用。我们可以定义一个函数 $f: \mathcal{P}(X) \to \{0, 1, 2, 3\}$,其中 $f(A) = \#(A)$。那么关系 $A \sim B$ 就等价于 $f(A)=f(B)$。根据上一题的结论,这必然是一个等价关系
  • 不过,题目要求我们直接证明,所以我们还是要走一遍三个性质的验证。
  1. 自反性 (Reflexivity):
    • 要证: 对于任意 $A \in \mathcal{P}(X)$,都有 $A \sim A$
    • 证明: 我们要检验是否 $\#(A) = \#(A)$。一个集合元素个数当然等于它自身的元素个数。这基于等号的自反性。成立。
  2. 对称性 (Symmetry):
    • 要证: 如果 $A \sim B$,那么一定有 $B \sim A$
    • 证明: 假设 $A \sim B$。这意味着 $\#(A) = \#(B)$。根据等号的对称性,我们有 $\#(B) = \#(A)$。这正是 $B \sim A$ 的定义。成立。
  3. 传递性 (Transitivity):
    • 要证: 如果 $A \sim B$ 并且 $B \sim C$,那么一定有 $A \sim C$
    • 证明: 假设 $A \sim B$$B \sim C$。这意味着 $\#(A) = \#(B)$ 并且 $\#(B) = \#(C)$。根据等号的传递性,我们得到 $\#(A) = \#(C)$。这正是 $A \sim C$ 的定义。成立。

因为 $\sim$ 满足自反对称传递性,所以它是在 $\mathcal{P}(X)$ 上的一个等价关系

第二部分:列出所有等价类及其元素

  • $X = \{x_1, x_2, x_3\}$
  • $\mathcal{P}(X)$$X$ 的所有子集集合$X$ 有 3 个元素,所以 $\mathcal{P}(X)$$2^3 = 8$元素
  • 一个等价类是由所有元素个数相同的子集构成的。
  • $X$子集元素个数可能是 0, 1, 2, 或 3。所以会有 4 个等价类
  1. 第1个等价类:元素个数为 0 的子集
    • 只有一个这样的子集空集 $\emptyset$
    • 等价类 $[\emptyset] = \{\emptyset\}$
  2. 第2个等价类:元素个数为 1 的子集
    • 这些子集是通过从 $X$ 中选取一个元素构成的。
    • $\binom{3}{1} = 3$ 个这样的子集
    • 它们是: $\{x_1\}$, $\{x_2\}$, $\{x_3\}$
    • 等价类 $[\{x_1\}] = \{\{x_1\}, \{x_2\}, \{x_3\}\}$
  3. 第3个等价类:元素个数为 2 的子集
    • 这些子集是通过从 $X$ 中选取两个元素构成的。
    • $\binom{3}{2} = 3$ 个这样的子集
    • 它们是: $\{x_1, x_2\}$, $\{x_1, x_3\}$, $\{x_2, x_3\}$
    • 等价类 $[\{x_1, x_2\}] = \{\{x_1, x_2\}, \{x_1, x_3\}, \{x_2, x_3\}\}$
  4. 第4个等价类:元素个数为 3 的子集
    • 只有一个这样的子集集合 $X$ 本身。
    • 它是: $\{x_1, x_2, x_3\}$
    • 等价类 $[X] = \{\{x_1, x_2, x_3\}\}$
  • 验证: 我们列出的四个等价类中的元素总数是 $1 + 3 + 3 + 1 = 8$,这正好是 $\mathcal{P}(X)$ 的总元素个数。这四个等价类互不相交,且它们的并集等于整个 $\mathcal{P}(X)$,构成了对 $\mathcal{P}(X)$ 的一个划分
∑ [公式拆解]
  • $\mathcal{P}(X)$: 幂集 (Power Set) 符号,表示集合 $X$ 的所有子集所组成的集合。如果 $X$$n$元素$\mathcal{P}(X)$ 就有 $2^n$元素
  • $\#(A)$: 表示集合 $A$基数 (Cardinality),即元素的个数。对于有限集,这只是一个计数。
  • $A, B \in \mathcal{P}(X)$: 表示 $A$$B$$\mathcal{P}(X)$ 中的元素,也就是说,$A$$B$ 本身就是 $X$子集
💡 [数值示例]

题目本身就是一个非常具体的例子。我们可以用一个更简单的例子来加深理解。

示例: 设 $X=\{1, 2\}$

  • $\mathcal{P}(X)$$2^2=4$元素$\mathcal{P}(X) = \{\emptyset, \{1\}, \{2\}, \{1, 2\}\}$
  • 关系$A \sim B \iff \#(A) = \#(B)$
  • 等价类元素个数划分:
  • 个数为 0: $\{\emptyset\}$。这是一个等价类
  • 个数为 1: $\{\{1\}, \{2\}\}$。这是第二个等价类。因为 $\#(\{1\})=1, \#(\{2\})=1$, 所以 $\{1\} \sim \{2\}$
  • 个数为 2: $\{\{1, 2\}\}$。这是第三个等价类
  • 总共有 3 个等价类。它们的并集是 $\mathcal{P}(X)$,且互不相交。
⚠️ [易错点]
  1. 混淆作用域: 一定要清楚关系是定义在 $\mathcal{P}(X)$ 上,而不是 $X$ 上。被比较的对象是 $X$子集,而不是 $x_1, x_2, x_3$ 这些元素
  2. 书写错误: 在写等价类元素时,要注意双花括号。例如,$\{x_1\}$$\mathcal{P}(X)$ 的一个元素,而包含它的等价类$\{\{x_1\}, \{x_2\}, \{x_3\}\}$,这是一个集合集合
  3. 组合数计算: 对于更大的 $X$,计算等价类中的元素个数需要用到组合数 $\binom{n}{k}$。对于本题 $n=3$$\binom{3}{0}=1, \binom{3}{1}=3, \binom{3}{2}=3, \binom{3}{3}=1$
📝 [总结]
  1. 本题通过“集合大小相等”在幂集上定义了一个等价关系
  2. 证明过程是“通过函数 $f(A)=\#(A)$ 定义等价关系”这一通用方法的直接应用。
  3. 通过具体列举一个3元素集合幂集,展示了等价关系如何将一个集合(这里是幂集 $\mathcal{P}(X)$划分为若干个不相交的子集等价类)。
  4. 每个等价类都由所有具有相同元素个数的子集构成。
🎯 [存在目的]
  1. 练习幂集概念: 确保学生理解幂集是由集合组成的集合,并能在此之上进行思考。
  2. 具体化等价类和划分: 提供一个非常清晰具体的例子,让学生亲手计算并列出所有的等价类,从而直观地理解等价关系的核心作用——划分
  3. 组合学联系: 将集合论中的等价类组合学中的组合数联系起来,一个等价类的大小就是组合数 $\binom{n}{k}$
  4. 抽象层次的提升: 在“集合集合”上定义关系,比在简单的数字或点的集合上定义关系,需要更高一层的抽象能力。

[直觉心- 1.18. (i) 在 $\mathbb{Z} / 17 \mathbb{Z}$ 中,计算 (通过写成 $[a]$ 的形式,其中 $0 \leq a \leq 16$) $[3]+[14]$$[3] \cdot[14]$$[12]+[12]$$[12] \cdot[12]=[12]^{2}$。找出一个整数 $k$ 使得在 $\mathbb{Z} / 17 \mathbb{Z}$$[3] \cdot[k]=[1]$

(ii) 在 $\mathbb{Z} / 12 \mathbb{Z}$ 中,计算 $[3] \cdot[4]$$[2] \cdot[6]$ (通过写成 $[a]$ 的形式,其中 $0 \leq a \leq 11$)。你能找出一个整数 $k$ 使得在 $\mathbb{Z} / 12 \mathbb{Z}$$[3] \cdot[k]=[1]$ 吗?为什么?(注意:你可以尝试所有可能的 $k$ 值,但请尝试找到一个更具概念性的解释。)

📖 [逐步解释]

这道题让我们在两个不同的模n整数环 $\mathbb{Z}/n\mathbb{Z}$ 中进行计算,并探索乘法逆元的存在性。

(i) 在 $\mathbb{Z} / 17 \mathbb{Z}$ 中计算

$\mathbb{Z} / 17 \mathbb{Z}$ 是整数模 17 的等价类集合,其元素$[0], [1], \dots, [16]$。运算规则是先在整数环 $\mathbb{Z}$ 中进行运算,然后取结果模 17 的等价类

  1. 计算 $[3]+[14]$:
    • 根据加法定义:$[3]+[14] = [3+14]$
    • $3+14 = 17$
    • 所以结果是 $[17]$
    • 在模 17 的世界里,17 和 0 是等价的(因为 $17-0=17$,是 17 的倍数)。
    • 所以 $[17] = [0]$
    • 最终答案是 $[0]$
  2. 计算 $[3] \cdot[14]$:
    • 根据乘法定义:$[3] \cdot[14] = [3 \times 14]$
    • $3 \times 14 = 42$
    • 所以结果是 $[42]$
    • 为了化简,我们计算 42 除以 17 的余数。
    • $42 = 2 \times 17 + 8$
    • 所以 42 和 8 在模 17 下是等价的。
    • $[42] = [8]$
    • 最终答案是 $[8]$
    • 另类计算: $[14]$ 在模 17 下等于 $[-3]$ (因为 $14- (-3)=17$)。所以 $[3] \cdot [14] = [3] \cdot [-3] = [-9]$。而 $-9+17=8$,所以 $[-9]=[8]$
  3. 计算 $[12]+[12]$:
    • $[12]+[12] = [12+12] = [24]$
    • $24 = 1 \times 17 + 7$
    • 所以 $[24] = [7]$
    • 最终答案是 $[7]$
  4. 计算 $[12] \cdot[12]=[12]^{2}$:
    • $[12] \cdot[12] = [12 \times 12] = [144]$
    • 计算 144 除以 17 的余数。
    • $17 \times 8 = 136$
    • $144 = 8 \times 17 + 8$
    • 所以 $[144] = [8]$
    • 最终答案是 $[8]$
    • 另类计算: $[12] = [-5]$。所以 $[12]^2 = [-5]^2 = [(-5) \times (-5)] = [25]$$25 = 1 \times 17 + 8$。所以 $[25]=[8]$
  5. 找出 $k$ 使得 $[3] \cdot[k]=[1]$:
    • 这个问题是在求 $[3]$$\mathbb{Z} / 17 \mathbb{Z}$ 中的乘法逆元
    • 因为 17 是一个素数,所以任何非零元素都存在乘法逆元
    • 我们要找一个整数 $k$ 使得 $3k \equiv 1 \pmod{17}$
    • 我们可以逐一尝试 $k=1, 2, 3, \dots, 16$
    • $3 \times 1 = 3$
    • $3 \times 2 = 6$
    • $3 \times 3 = 9$
    • $3 \times 4 = 12$
    • $3 \times 5 = 15 \equiv -2 \pmod{17}$
    • $3 \times 6 = 18 \equiv 1 \pmod{17}$。找到了!
    • 所以 $k=6$ 是一个解。
    • $[3] \cdot [6] = [18] = [1]$
    • 所以,一个可能的 $k$ 是 6。

(ii) 在 $\mathbb{Z} / 12 \mathbb{Z}$ 中计算

$\mathbb{Z} / 12 \mathbb{Z}$ 是整数模 12 的等价类集合,其元素$[0], [1], \dots, [11]$。12 是一个合数

  1. 计算 $[3] \cdot[4]$:
    • $[3] \cdot[4] = [3 \times 4] = [12]$
    • 在模 12 的世界里,$12 \equiv 0 \pmod{12}$
    • 所以 $[12]=[0]$
    • 最终答案是 $[0]$
  2. 计算 $[2] \cdot[6]$:
    • $[2] \cdot[6] = [2 \times 6] = [12]$
    • 同样地,$[12]=[0]$
    • 最终答案是 $[0]$
    • 这两个计算结果被称为“零因子”(zero divisors)。即两个非零的元素,相乘的结果却是零元素。这是在 $\mathbb{Z}$$\mathbb{R}$ 中不会发生的事情。
  3. 你能找出一个整数 $k$ 使得在 $\mathbb{Z} / 12 \mathbb{Z}$$[3] \cdot[k]=[1]$ 吗?为什么?
    • 答案是:不能。
    • 尝试法: 我们可以尝试所有可能的 $k \in \{0, 1, ..., 11\}$
    • $[3] \cdot [0] = [0]$
    • $[3] \cdot [1] = [3]$
    • $[3] \cdot [2] = [6]$
    • $[3] \cdot [3] = [9]$
    • $[3] \cdot [4] = [12] = [0]$
    • $[3] \cdot [5] = [15] = [3]$
    • $[3] \cdot [6] = [18] = [6]$
    • $[3] \cdot [7] = [21] = [9]$
    • $[3] \cdot [8] = [24] = [0]$
    • $[3] \cdot [9] = [27] = [3]$
    • $[3] \cdot [10] = [30] = [6]$
    • $[3] \cdot [11] = [33] = [9]$
    • 我们看到,$[3]$ 与任何元素相乘的结果只能是 $[0], [3], [6], [9]$ 这四个值中的一个,永远不可能得到 $[1]$
  • 概念性解释:
  • 假设存在这样的 $k$ 使得 $[3] \cdot [k] = [1]$
  • 我们在上面已经计算出 $[3] \cdot [4] = [0]$
  • $[3] \cdot [k] = [1]$ 这个假设的等式两边同时乘以 $[4]$
  • $[4] \cdot ([3] \cdot [k]) = [4] \cdot [1]$
  • 利用乘法结合律: $([4] \cdot [3]) \cdot [k] = [4]$
  • 我们知道 $[4] \cdot [3] = [12] = [0]$,所以左边变成:
  • $[0] \cdot [k] = [4]$
  • 任何元素乘以零元素 $[0]$ 的结果都是 $[0]$。所以左边是 $[0]$
  • 等式变成了 $[0] = [4]$
  • 这在 $\mathbb{Z}/12\mathbb{Z}$ 中显然是不成立的。
  • 这个矛盾说明我们最初的假设“存在这样的 $k$”是错误的。
  • 根本原因: 在 $\mathbb{Z}/n\mathbb{Z}$ 中,一个元素 $[a]$ 存在乘法逆元充要条件$a$$n$ 互素(即它们的最大公约数是1,$\text{gcd}(a, n)=1$)。
  • 在 (i) 中,$\text{gcd}(3, 17)=1$,所以 $[3]$$\mathbb{Z} / 17 \mathbb{Z}$ 中有逆元。
  • 在 (ii) 中,$\text{gcd}(3, 12)=3 \neq 1$,所以 $[3]$$\mathbb{Z} / 12 \mathbb{Z}$ 中没有逆元。同样,$\text{gcd}(4, 12)=4 \neq 1$,所以 $[4]$ 也没有逆元。像 $[3], [4], [2], [6], [8], [9], [10]$ 这些在 $\mathbb{Z} / 12 \mathbb{Z}$ 中都没有逆元。只有 $[1], [5], [7], [11]$ 有逆元。
∑ [公式拆解]
  • $\mathbb{Z} / n \mathbb{Z}$: 整数模 $n$同余类集合,也叫模n整数环
  • $[a]$: 表示整数 $a$ 所在的同余类。它是一个集合: $[a] = \{..., a-2n, a-n, a, a+n, a+2n, ...\}$
  • $[a]+[b] = [a+b]$: 同余类加法的定义。
  • $[a] \cdot [b] = [ab]$: 同余类乘法的定义。
  • $[a]^{-1}$: $[a]$乘法逆元,即满足 $[a] \cdot [a]^{-1} = [1]$ 的那个元素
💡 [数值示例]

本题本身就是非常具体的数值计算。这里再补充一个关于逆元的例子。

示例1: 在 $\mathbb{Z}/7\mathbb{Z}$ 中求 $[4]$ 的逆元 (7是素数)

  • 我们要找 $[k]$ 使得 $[4][k]=[1]$
  • $4 \times 1 = 4$
  • $4 \times 2 = 8 \equiv 1 \pmod 7$
  • 所以 $[4]$ 的逆元是 $[2]$

示例2: 在 $\mathbb{Z}/10\mathbb{Z}$ 中求 $[3]$ 的逆元 (10是合数, 但 $\text{gcd}(3,10)=1$)

  • 我们要找 $[k]$ 使得 $[3][k]=[1]$
  • $3 \times 1 = 3$
  • $3 \times 2 = 6$
  • $3 \times 3 = 9$
  • $3 \times 4 = 12 \equiv 2$
  • $3 \times 5 = 15 \equiv 5$
  • $3 \times 6 = 18 \equiv 8$
  • $3 \times 7 = 21 \equiv 1$
  • 所以 $[3]$ 的逆元是 $[7]$

示例3: 在 $\mathbb{Z}/10\mathbb{Z}$ 中说明 $[4]$ 没有逆元

  • $\text{gcd}(4, 10)=2 \neq 1$
  • 假设 $[4][k]=[1]$
  • 两边乘以 $[5]$: $[5]\cdot([4][k]) = [5][1]$
  • $([5]\cdot[4])\cdot[k] = [5]$
  • $[20]\cdot[k] = [5]$
  • $[0]\cdot[k] = [5]$
  • $[0] = [5]$,矛盾。
  • 所以 $[4]$$\mathbb{Z}/10\mathbb{Z}$ 中没有逆元。
⚠️ [易错点]
  1. 混淆整数和等价类: 要时刻记住 $[a]$ 是一个集合,而不是一个数。我们写的 $[3]+[14]=[0]$ 意思是“包含3的集合与包含14的集合相加,得到包含0的集合”。但实际计算时,我们可以方便地只操作代表元 (3, 14, 0)。
  2. 忘记取模: 在计算后得到一个大数,如 $144$,要记得将它化简到 $\{0, 1, \dots, n-1\}$ 这个范围内的代表元
  3. 素数和合数的区别: 对于模n运算,n是素数还是合数,性质差异巨大。在素数模p下,$\mathbb{Z}/p\mathbb{Z}$ 构成一个域(field),所有非零元素都有乘法逆元。在合数模n下,$\mathbb{Z}/n\mathbb{Z}$ 只是一个环(ring),只有与n互素元素才有乘法逆元,并且存在零因子
📝 [总结]
  1. (i) 在 $\mathbb{Z} / 17 \mathbb{Z}$ 中,由于 17 是素数,这是一个。我们演示了基本的加法和乘法运算,并通过尝试法(或扩展欧几里得算法)找到了一个元素乘法逆元
  2. (ii) 在 $\mathbb{Z} / 12 \mathbb{Z}$ 中,由于 12 是合数,这是一个但不是。我们看到了零因子的出现(两个非零数相乘得零),并解释了为什么与模数 12 不互素元素(如 [3])没有乘法逆元
  3. 核心结论是:在 $\mathbb{Z}/n\mathbb{Z}$ 中,$[a]$乘法逆元的充要条件是 $\text{gcd}(a, n)=1$
🎯 [存在目的]
  1. 熟悉模算术: 模算术是群论环论数论密码学的基石。此题是入门级的计算练习。
  2. 引入逆元和零因子: 通过对比 $\mathbb{Z}/17\mathbb{Z}$$\mathbb{Z}/12\mathbb{Z}$,直观地展示了乘法逆元的存在性不是必然的,并引入了零因子这个在普通整数运算中不存在的概念。
  3. 铺垫域和环的概念: 虽然没有明确说出,但这道题完美地展示了(field,如 $\mathbb{Z}/17\mathbb{Z}$)和(ring,如 $\mathbb{Z}/12\mathbb{Z}$)在乘法结构上的关键区别。为后续学习这些代数结构提供了具体例子。
  4. 从计算到概念: 题目引导学生从简单的计算(“算一算”)过渡到更抽象的思考(“为什么找不到?”),培养从具体例子中发现一般规律的能力。
🧠 [直觉心智模型]
  1. 想象一个有 $n$ 个小时的钟表(刻度为 $0, 1, ..., n-1$)。
  2. 加法 $a+b$ 就是从 $a$ 点开始,再走 $b$ 个小时,看停在哪里。例如,在12小时的钟上,8点再过5小时是1点,即 $8+5=13 \equiv 1 \pmod{12}$
  3. 乘法 $a \cdot b$ 可以看作是连续做 $b$ 次“跳 $a$ 个小时”的动作。例如,在12小时钟上,$3 \times 4$ 就是从0点开始,跳4次,每次跳3小时:$0 \to 3 \to 6 \to 9 \to 0$。最终回到0点。所以 $[3]\cdot[4]=[0]$
  4. 找逆元 $[3] \cdot [k] = [1]$ (在 $\mathbb{Z}/17\mathbb{Z}$ 中) 就是问:在17小时的钟上,做多少次“跳3小时”的动作,恰好能停在1点的位置?答案是6次。$3 \times 6 = 18 \equiv 1 \pmod{17}$
  5. 为什么 [3] 在12小时钟上没有逆元? 因为你不停地跳3小时,你只会落在 $0, 3, 6, 9$ 这几个点上,永远也落不到 1 点。这是因为 3 和 12 有共同的因子,你的步长“不够随机”,被限制在一个小圈子里了。而 3 和 17 互素,步长3可以“遍历”所有位置(经过足够多次后)。
💭 [直观想象]
  1. 把数字 $0, 1, ..., 11$ 排成一个圆圈。
  2. $[3] \cdot [4] = [0]$: 从0开始,走3步到3,再走3步到6,再走3步到9,最后再走3步,你恰好回到了0。总共走了4次,每次3步。
  3. $[2] \cdot [6] = [0]$: 从0开始,走6次,每次2步:$0 \to 2 \to 4 \to 6 \to 8 \to 10 \to 0$。也回到了0。
  4. 寻找 $[3]$ 的逆元: 你站在0点,想通过“每次跳3步”的方式,最终停在1点。你跳一次到3,两次到6,三次到9,四次回到0,五次又到3... 你发现你的脚印形成了一个循环 $0 \to 3 \to 6 \to 9 \to 0$,你永远也踩不到1, 2, 4, 5, 7, 8, 10, 11这些位置。所以你永远无法通过跳3步的方式到达1。
61.19. 习题 1.19

📜 [原文6]

对于 $n \in \mathbb{N}$,回顾一下,我们有时将整数 $n$同余类表示为 $[a]_{n}$,例如当我们想要讨论不同同余时。

(1) 对于 $a, k \in \mathbb{Z}$,证明 $[a+k]_{n}=[a]_{n} \Longleftrightarrow n \mid k$

(2) 使用 (a),证明,给定 $n, m \in \mathbb{N}$恒等函数 $F: \mathbb{Z} \rightarrow \mathbb{Z}$ 诱导出一个良定义函数 $\mathbb{Z} / n \mathbb{Z} \rightarrow \mathbb{Z} / m \mathbb{Z} \Longleftrightarrow m \mid n$。等价地,由 $f\left([a]_{n}\right)=[a]_{m}$ 定义的“函数$f: \mathbb{Z} / n \mathbb{Z} \rightarrow \mathbb{Z} / m \mathbb{Z}$良定义$\Longleftrightarrow m \mid n$。在这种情况下,证明对于所有 $[a]_{n},[b]_{n} \in \mathbb{Z} / n \mathbb{Z}$$f\left([a]_{n}+[b]_{n}\right)=f\left([a]_{n}\right)+f\left([b]_{n}\right)$

📖 [逐步解释]

这道题探讨了不同模数下的同余类之间的关系,特别是何时可以自然地定义一个从一个商集到另一个商集函数

(1) 证明 $[a+k]_{n}=[a]_{n} \Longleftrightarrow n \mid k$

这是一个双向的证明。

  • 符号说明: $[x]_n$ 表示整数 $x$ 在模 $n$ 下的同余类
  • 定义: $[x]_n = [y]_n \iff x \equiv y \pmod n \iff n \mid (x-y)$

证明 "$\Longrightarrow$" (如果 $[a+k]_{n}=[a]_{n}$,则 $n \mid k$)

  1. 假设 $[a+k]_{n}=[a]_{n}$
  2. 根据同余类相等的定义,这意味着 $a+k \equiv a \pmod n$
  3. 根据同余的定义,这意味着 $n$ 整除它们的差,即 $n \mid ((a+k) - a)$
  4. $(a+k) - a = k$
  5. 所以,$n \mid k$
  6. 这部分证明完毕。

证明 "$\Longleftarrow$" (如果 $n \mid k$,则 $[a+k]_{n}=[a]_{n}$)

  1. 假设 $n \mid k$
  2. 这意味着 $k = qn$ 对于某个整数 $q$
  3. 我们来比较 $a+k$$a$。它们的差是 $(a+k) - a = k$
  4. 因为我们假设了 $n \mid k$,所以 $n$ 整除它们的差。
  5. 根据同余的定义,这就意味着 $a+k \equiv a \pmod n$
  6. 根据同余类的定义,这就意味着 $[a+k]_n = [a]_n$
  7. 这部分证明完毕。

两部分结合,我们证明了 $[a+k]_{n}=[a]_{n} \Longleftrightarrow n \mid k$。这个结论的直观意义是:给一个同余类代表元加上 $n$ 的任何倍数,得到的还是同一个同余类

(2) 证明 $f([a]_n) = [a]_m$ 是良定义的 $\iff m \mid n$,并证明其保持加法

良定义性 (Well-definedness) 证明

  • 什么是“良定义”? 我们定义的函数 $f$ 的输入是同余类 $[a]_n$,但定义式本身却使用了代表元 $a$ 来计算输出 $[a]_m$。一个同余类有很多个代表元(例如,在模12下,$[1]_ {12}$$[13]_ {12}$ 是同一个同余类)。为了让 $f$ 是一个真正的函数,我们必须保证,无论我们选择哪个代表元,计算出的结果都必须是同一个输出同余类。如果对于同一个输入,我们可能得到不同的输出,那这个“函数”的定义就是有问题的,即“非良定义”的。
  • 验证过程:
  1. 假设我们有两个代表元 $a$$b$ 属于同一个输入同余类,即 $[a]_n = [b]_n$
  2. 我们要检验是否它们的输出也必定相同,即是否 $[a]_m = [b]_m$。如果对于所有满足条件的 $a, b$ 都成立,那么函数就是良定义的。

证明 "$\Longrightarrow$" (如果 $f$ 是良定义的,则 $m \mid n$)

  1. 我们假设 $f$良定义的。这意味着:如果 $[a]_n = [b]_n$,那么一定有 $[a]_m = [b]_m$
  2. 我们来选取一个特定的同余类来测试这个条件。取 $a=n$$b=0$
  3. 在模 $n$ 下,$[n]_n = [0]_n$ (因为 $n-0=n$$n$ 的倍数)。
  4. 既然 $f$良定义的,将 $a=n, b=0$ 代入条件,我们必须得到 $f([n]_n) = f([0]_n)$
  5. 根据 $f$ 的定义式,$f([n]_n) = [n]_m$$f([0]_n) = [0]_m$
  6. 所以,必须有 $[n]_m = [0]_m$
  7. 根据同余类相等的定义,这意味着 $n \equiv 0 \pmod m$
  8. 根据同余的定义,这意味着 $m \mid (n-0)$,即 $m \mid n$
  9. 证明完毕。

证明 "$\Longleftarrow$" (如果 $m \mid n$,则 $f$ 是良定义的)

  1. 我们假设 $m \mid n$。这意味着 $n = qm$ 对于某个整数 $q$
  2. 我们要证明 $f$良定义的。取任意两个代表元 $a, b$ 使得 $[a]_n = [b]_n$
  3. 根据定义,$[a]_n = [b]_n \iff n \mid (a-b)$
  4. 既然 $n \mid (a-b)$,并且我们假设了 $m \mid n$,那么根据整除的传递性,我们有 $m \mid (a-b)$
  5. 根据同余的定义,$m \mid (a-b)$ 意味着 $a \equiv b \pmod m$
  6. 根据同余类的定义, $a \equiv b \pmod m$ 意味着 $[a]_m = [b]_m$
  7. 我们从 $[a]_n = [b]_n$ 出发,在 $m \mid n$ 的条件下,成功推出了 $[a]_m = [b]_m$
  8. 这表明,无论我们选择哪个代表元,输出都是相同的同余类。因此,$f$良定义的。
  9. 证明完毕。

综合起来,我们证明了 $f$良定义充要条件$m \mid n$

证明 $f$ 保持加法 (是一个同态)

  • 要证: 在 $m \mid n$ 的情况下,$f\left([a]_{n}+[b]_{n}\right)=f\left([a]_{n}\right)+f\left([b]_{n}\right)$
  • 证明:
  1. 从左边开始:

$f\left([a]_{n}+[b]_{n}\right)$

  1. 根据 $\mathbb{Z}/n\mathbb{Z}$ 中的加法定义:

$= f\left([a+b]_{n}\right)$

  1. 根据 $f$ 的定义:

$= [a+b]_{m}$

  1. 根据 $\mathbb{Z}/m\mathbb{Z}$ 中的加法定义:

$= [a]_{m}+[b]_{m}$

  1. 再次使用 $f$ 的定义,把 $[a]_m$$[b]_m$ 换回 $f$ 的形式:

$= f\left([a]_{n}\right)+f\left([b]_{n}\right)$

  1. 我们从左边推到了右边,证明完毕。
    • 这个性质表明 $f$ 是一个从加法群 $(\mathbb{Z}/n\mathbb{Z}, +)$$(\mathbb{Z}/m\mathbb{Z}, +)$群同态
∑ [公式拆解]
  • $n \mid k$: "$n$ divides $k$",$n$ 整除 $k$,即 $k$$n$ 的整数倍。
  • $f: \mathbb{Z} / n \mathbb{Z} \rightarrow \mathbb{Z} / m \mathbb{Z}$: 一个从“模n同余类集合到“模m同余类集合函数
  • $f\left([a]_{n}\right)=[a]_{m}$: 这个函数的定义规则,即把模n的同余类“自然的”映射到模m的同余类
💡 [数值示例]

示例1: $m \mid n$ 的情况 (良定义)

  • $n=12, m=4$$4 \mid 12$,所以 $f: \mathbb{Z}/12\mathbb{Z} \to \mathbb{Z}/4\mathbb{Z}$ 应该是良定义的。
  • $f([a]_{12}) = [a]_4$
  • 我们来检验一下。考虑 $\mathbb{Z}/12\mathbb{Z}$ 中的同余类 $[2]_{12}$
  • 它的代表元可以是 2, 14, -10 等。
  • 如果用代表元 2: $f([2]_{12}) = [2]_4$
  • 如果用代表元 14: $f([14]_{12}) = [14]_4$。因为 $14 = 3 \times 4 + 2$,所以 $[14]_4 = [2]_4$
  • 如果用代表元 -10: $f([-10]_{12}) = [-10]_4$。因为 $-10 = -3 \times 4 + 2$,所以 $[-10]_4 = [2]_4$
  • 可以看到,无论用哪个代表元,输出都是同一个同余类 $[2]_4$函数良定义的。

示例2: $m \nmid n$ 的情况 (非良定义)

  • $n=12, m=5$$5 \nmid 12$,所以 $f: \mathbb{Z}/12\mathbb{Z} \to \mathbb{Z}/5\mathbb{Z}$ 应该不是良定义的。
  • $f([a]_{12}) = [a]_5$
  • 我们来检验一下。再次考虑同余类 $[2]_{12}$
  • 我们知道 $[2]_{12} = [14]_{12}$,因为它们是同一个输入。
  • 如果用代表元 2: $f([2]_{12}) = [2]_5$
  • 如果用代表元 14: $f([14]_{12}) = [14]_5$。因为 $14 = 2 \times 5 + 4$,所以 $[14]_5 = [4]_5$
  • 我们发现,对于同一个输入 $[2]_{12}$,我们得到了两个不同的输出:$[2]_5$$[4]_5$
  • 一个输入不能对应多个输出,所以这个 $f$ 根本就不是一个合法的函数。它是“非良定义”的。

加法同态示例:

  • 使用 $n=12, m=4$
  • $f([5]_{12} + [9]_{12}) = f([14]_{12}) = f([2]_{12}) = [2]_4$
  • $f([5]_{12}) + f([9]_{12}) = [5]_4 + [9]_4 = [1]_4 + [1]_4 = [2]_4$
  • 两者结果相同,验证了同态性质。
⚠️ [易错点]
  1. 对“良定义”的理解: “良定义”是处理商集(由等价类构成的集合)时最核心也最容易混淆的概念。关键就在于,当你的函数定义依赖于代表元的选择时,你必须证明这个选择是无关紧要的。
  2. $m \mid n$ vs $n \mid m$: 很容易记反。直观上想,从一个更“精细”的划分(模 $n$ 大)到一个更“粗糙”的划分(模 $m$ 小),信息是丢失的,这是可以的。但反过来,从粗糙到精细,一个粗糙的类可能横跨了多个精细的类,就没法唯一定义了。所以必须是 $m \mid n$
  3. 恒等函数 F: 题目中提到的恒等函数 $F(a)=a$ 是一个“幕后推手”。它作用在整数上,我们想看看它能不能“降格”到商集上。当 $m \mid n$ 时,它可以,我们就得到了 $f$
📝 [总结]
  1. (1) 证明了在模n算术中,一个同余类中的元素之间都相差n的整数倍。
  2. (2) 核心结论:从模n同余类模m同余类的自然映射 $f([a]_n) = [a]_m$ 是一个良定义函数,当且仅当 $m$ 整除 $n$ ($m \mid n$)。
  3. 当这个函数存在时(即 $m \mid n$),它还是一个同态,也就是说它保持了同余类加法结构
🎯 [存在目的]
  1. 深入理解商集和函数: 这是继习题1.16之后,对商集函数良定义性的又一次重要训练,并且给出了一个充要条件
  2. 引入同态概念: “保持结构的映射”是整个代数的核心思想。这里的 $f$ 就是一个群同态的例子,它连接了两个不同的代数结构 $(\mathbb{Z}/n\mathbb{Z}, +)$$(\mathbb{Z}/m\mathbb{Z}, +)$
  3. 为子群和正规子群铺垫: 这个结论和思想在后续学习群论中的子群正规子群商群时至关重要。一个 $G$ 对其子群 $H$商群 $G/H$ 能否良好地继承 $G$ 的运算结构,取决于 $H$ 是否是正规子群,这与本题中 $m \mid n$ 的角色有深刻的类比。
🧠 [直觉心智模型]
  1. 想象你有两种尺子。尺子A的刻度是厘米,尺子B的刻度是米。($n=100, m=1$)。
  2. $m \mid n$ ($1 \mid 100$) 成立。
  3. 函数 $f$ 的作用是:你告诉我一个用厘米尺量出的长度(在模100的意义下,比如345cm等同于45cm),我把它换算成米(在模1的意义下,即只看小数部分)。
  4. 这是良定义的。因为如果两个长度在厘米尺上相差100的整数倍(比如 45cm 和 145cm),它们换算成米后 (0.45m 和 1.45m),它们的小数部分是完全一样的。
  5. 现在反过来,尺子A刻度是米,尺子B是厘米。($n=1, m=100$)
  6. $m \nmid n$ ($100 \nmid 1$)。
  7. 函数 $f$ 的作用是:你告诉我一个米数(只看小数部分),我告诉你对应的厘米数。
  8. 这不是良定义的。比如 0.5m 这个输入。它和 1.5m, 2.5m 在模1的意义下是同一个输入。但 0.5m 对应 50cm,1.5m 对应 150cm(在模100下是50cm),2.5m 对应 250cm(在模100下是50cm),等等。哦,这个例子不够好,我们换一个。
💭 [直观想象]
  1. 把一年360天(假设)看作 $\mathbb{Z}/360\mathbb{Z}$ ($n=360$)。
  2. 把12个月看作 $\mathbb{Z}/12\mathbb{Z}$ ($m=12$)。
  3. $12 \mid 360$,所以函数 $f([\text{天数}]_{360}) = [\text{天数}]_{12}$良定义的吗?这其实是问“某一天是几月?”
  4. 我们来检查。比如第32天和第392天,在模360下是不同的类。我们用另一个例子。
  5. 正确的想象:
  6. $\mathbb{Z}/12\mathbb{Z}$ 是一个钟面,有12个刻度。
  7. $\mathbb{Z}/4\mathbb{Z}$ 是一个只有“上、下、左、右”四个方位的罗盘。
  8. $f: \mathbb{Z}/12\mathbb{Z} \to \mathbb{Z}/4\mathbb{Z}$
  9. $m=4, n=12$$4 \mid 12$。所以 $f$良定义的。
  10. $f([a]_{12})=[a]_4$
  11. $f([1]_{12})=[1]_4$ (1点钟映射到“右”)
  12. $f([2]_{12})=[2]_4$ (2点钟映射到“下”)
  13. $f([3]_{12})=[3]_4$ (3点钟映射到“左”)
  14. $f([4]_{12})=[4]_4=[0]_4$ (4点钟映射到“上”)
  15. ...
  16. $f([13]_{12})$ 呢?$[13]_{12} = [1]_{12}$$f([13]_{12})=[13]_4 = [1]_4$。和 $f([1]_{12})$ 的结果一样。良定义
  17. 这个函数相当于把钟面上的12个点,每3个点(比如{12,1,2})“捏”在一起,映射到罗盘上的一个方位(“上”)。
  18. 反例: $\mathbb{Z}/5\mathbb{Z}$ 是一个五角星的五个顶点。$f: \mathbb{Z}/12\mathbb{Z} \to \mathbb{Z}/5\mathbb{Z}$
  19. $f([1]_{12})=[1]_5$
  20. $f([13]_{12})=[13]_5=[3]_5$
  21. 输入都是 $[1]_{12}$,输出却一个是 $[1]_5$,另一个是 $[3]_5$。完蛋了,这个映射规则根本没法构成一个函数
71.20. 习题 1.20

📜 [原文7]

回顾一下,$\mathbb{R} / 2 \pi \mathbb{Z}$等价关系 $\equiv(\bmod 2 \pi)$等价类集$\theta_{1} \equiv \theta_{2} \bmod 2 \pi$ 如果存在 $k \in \mathbb{Z}$ 使得 $\theta_{2}-\theta_{1}=2 k \pi$。证明,如果 $t \in \mathbb{R}$,则 $F(\theta)=t \theta$ 诱导出一个良定义函数 $\mathbb{R} / 2 \pi \mathbb{Z} \rightarrow \mathbb{R} / 2 \pi \mathbb{Z} \Longleftrightarrow t \in \mathbb{Z}$

📖 [逐步解释]

这道题是上一题思想的延续,但把场景从整数环 $\mathbb{Z}/n\mathbb{Z}$ 换到了实数商群 $\mathbb{R}/2\pi\mathbb{Z}$。这个代数结构在几何上可以被理解为单位圆。

  • 理解 $\mathbb{R} / 2 \pi \mathbb{Z}$:
  • 它把实数轴 $\mathbb{R}$ 上所有相差 $2\pi$ 整数倍的点都视为“等价”。
  • 例如,$0, 2\pi, -2\pi, 4\pi, \dots$ 都在同一个等价类 $[\_0_]$ 中。
  • $\pi/2, \pi/2+2\pi, \pi/2-4\pi, \dots$ 都在同一个等价类 $[\pi/2]$ 中。
  • 几何上,这就像把无限长的实数轴卷起来,缠绕在一个周长为 $2\pi$ 的圆上。每个实数都对应圆上的一个点(角度)。一个等价类就是圆上的一个点。
  • 理解问题:
  • 我们有一个潜在的函数 $f: \mathbb{R} / 2 \pi \mathbb{Z} \to \mathbb{R} / 2 \pi \mathbb{Z}$
  • 它的定义规则是基于代表元的:$f([\theta]) = [t\theta]$
  • 这里 $[\theta]$$\mathbb{R} / 2 \pi \mathbb{Z}$ 中的一个等价类$\theta$ 是它的一个代表元(一个实数)。
  • $t$ 是一个固定的实数。
  • 问题是:对于什么样的实数 $t$,这个函数 $f$ 才是良定义的?题目给出的论断是,当且仅当 $t$ 是一个整数。

证明 $\sim$ 是良定义的 $\iff t \in \mathbb{Z}$

核心问题: 检验 $f$良定义性。

  1. 取同一个输入等价类的两个不同代表元,设为 $\theta_1$$\theta_2$
  2. 这意味着 $[\theta_1] = [\theta_2]$,根据定义,$\theta_1 \equiv \theta_2 \pmod{2\pi}$
  3. 即存在某个整数 $k$ 使得 $\theta_2 = \theta_1 + 2k\pi$
  4. 我们要检验它们的输出是否也相同,即 $f([\theta_1])$ 是否等于 $f([\theta_2])$
  5. $f([\theta_1]) = [t\theta_1]$
  6. $f([\theta_2]) = [t\theta_2]$
  7. 为了让这两个输出相等,即 $[t\theta_1] = [t\theta_2]$,我们需要 $t\theta_1 \equiv t\theta_2 \pmod{2\pi}$
  8. 这意味着,必须存在某个整数 $j$,使得 $t\theta_2 - t\theta_1 = 2j\pi$
  9. $t(\theta_2 - \theta_1) = 2j\pi$
  10. 我们把第3步的 $\theta_2 - \theta_1 = 2k\pi$ 代入:
  11. $t(2k\pi) = 2j\pi$
  12. $tk\pi = j\pi$ (两边同除2)。
  13. $tk = j$
  14. 关键分析: 我们需要对于任意满足 $[\theta_1]=[\theta_2]$$\theta_1, \theta_2$ (即对于任意整数 $k$),所计算出的 $t\theta_1, t\theta_2$ 也要落在同一个等价类中 (即 $tk$ 必须是一个整数)。
    • 这个条件 "$tk$ 必须是整数" 必须对我们选取的任意整数 $k$ 都成立。

证明 "$\Longrightarrow$" (如果 $f$ 是良定义的,则 $t \in \mathbb{Z}$)

  1. 假设 $f$良定义的。
  2. 这意味着,对于任意的 $\theta_1$$\theta_2$,只要 $\theta_2 - \theta_1 = 2k\pi$ (对任意整数 $k$),就必须有 $t(\theta_2 - \theta_1)$$2\pi$ 的整数倍。
  3. 换句话说,对于任意整数 $k$$t(2k\pi)$ 必须是 $2\pi$ 的整数倍。
  4. $t(2k\pi) = (tk) \cdot 2\pi$。要使它是 $2\pi$ 的整数倍, $tk$ 必须是一个整数。
  5. 这个条件必须对所有整数 $k$ 都成立。
  6. 我们特别地选取 $k=1$
  7. 那么 $t \cdot 1 = t$ 必须是一个整数。
  8. 所以,$t \in \mathbb{Z}$
  9. 证明完毕。

证明 "$\Longleftarrow$" (如果 $t \in \mathbb{Z}$,则 $f$ 是良定义的)

  1. 假设 $t$ 是一个整数。
  2. 我们要证明 $f$良定义的。取任意两个代表元 $\theta_1, \theta_2$ 使得 $[\theta_1] = [\theta_2]$
  3. 这意味着存在整数 $k$ 使得 $\theta_2 = \theta_1 + 2k\pi$
  4. 我们计算输出的差:

$t\theta_2 - t\theta_1 = t(\theta_2 - \theta_1) = t(2k\pi) = 2\pi \cdot (tk)$

  1. 因为 $t$ 是整数,$k$ 也是整数,所以它们的乘积 $tk$ 也是一个整数。
  2. 我们把 $j=tk$。则 $t\theta_2 - t\theta_1 = 2j\pi$,其中 $j$ 是整数。
  3. 根据定义,这正是 $t\theta_1 \equiv t\theta_2 \pmod{2\pi}$ 的意思。
  4. 所以 $[t\theta_1] = [t\theta_2]$
  5. 我们证明了,只要输入是同一个等价类,输出也必然是同一个等价类
  6. 因此,当 $t$ 是整数时,$f$良定义的。
  7. 证明完毕。
∑ [公式拆解]
  • $\mathbb{R} / 2 \pi \mathbb{Z}$: 读作 "R mod 2 pi Z",实数集对子群 $2\pi\mathbb{Z}$商群$2\pi\mathbb{Z} = \{..., -4\pi, -2\pi, 0, 2\pi, 4\pi, ...\}$
  • $\theta_{1} \equiv \theta_{2} \bmod 2 \pi$: 读作 "theta 1 is congruent to theta 2 modulo 2 pi"。
  • $\exists k \in \mathbb{Z}$: "存在一个整数 k"。
  • $F(\theta)=t \theta$: 这是作用在实数上的函数
  • $f([\theta])=[t\theta]$: 这是试图在等价类上定义的函数
💡 [数值示例]

示例1: $t \in \mathbb{Z}$ 的情况 (良定义)

  • $t=3$$f([\theta]) = [3\theta]$
  • 我们来检验等价类 $[\pi/2]$
  • 代表元 $\theta_1 = \pi/2$$f([\pi/2]) = [3\pi/2]$
  • 另一个代表元 $\theta_2 = \pi/2 + 2\pi = 5\pi/2$
  • $f([5\pi/2]) = [3 \cdot (5\pi/2)] = [15\pi/2]$
  • 我们来检查 $[3\pi/2]$$[15\pi/2]$ 是否是同一个等价类
  • 它们的差是 $15\pi/2 - 3\pi/2 = 12\pi/2 = 6\pi = 3 \times (2\pi)$
  • 因为差是 $2\pi$ 的整数倍,所以它们是同一个等价类良定义

示例2: $t \notin \mathbb{Z}$ 的情况 (非良定义)

  • $t=1/2$$f([\theta]) = [\theta/2]$
  • 我们来检验等价类 $[0]$
  • 代表元 $\theta_1 = 0$$f([0]) = [0/2] = [0]$
  • 另一个代表元 $\theta_2 = 2\pi$
  • $f([2\pi]) = [(2\pi)/2] = [\pi]$
  • 对于同一个输入 $[0]$,我们用代表元 0 算出的输出是 $[0]$,用代表元 $2\pi$ 算出的输出是 $[\pi]$
  • 由于 $[0] \neq [\pi]$,一个输入对应了多个输出。所以这个函数是非良定义的。
⚠️ [易错点]
  1. 与上一题的类比: 这道题的逻辑和上一题几乎完全一样,只是把 $\mathbb{Z}, n, m$ 换成了 $\mathbb{R}, 2\pi, 2\pi$ (目标集合也是 $\mathbb{R}/2\pi\mathbb{Z}$),把乘法 $n=qm$ 换成了加法群中的包含关系 $2\pi\mathbb{Z} \subseteq 2\pi\mathbb{Z}$。这里的条件 $t \in \mathbb{Z}$ 的本质是,乘法映射 $F(\theta)=t\theta$ 必须把子群 $2\pi\mathbb{Z}$ 映射到自身(或其子群)内部。$F(2k\pi) = 2k t \pi$。要让 $F(2k\pi)$ 仍然在 $2\pi\mathbb{Z}$ 里,即 $2k t \pi$$2\pi$ 的整数倍,就需要 $kt$ 是整数,这对所有整数 $k$ 成立的条件就是 $t$ 是整数。
  2. $t=0$: 如果 $t=0$, $f([\theta])=[0]$ 是一个常数函数$t=0$ 是整数,所以它是良定义的。
  3. $t$ 是有理数: 如果 $t=p/q$ 是有理数,那么 $tk=pk/q$。为了让 $pk/q$ 对所有整数 $k$ 都是整数,必须 $q=1$,即 $t$ 是整数。所以仅仅有理数是不够的。
📝 [总结]
  1. 本题探讨了在商群 $\mathbb{R}/2\pi\mathbb{Z}$ 上定义一个由标量乘法 $F(\theta)=t\theta$ 诱导的函数 $f([\theta])=[t\theta]$良定义性问题。
  2. 通过严谨的推导,我们证明了该函数良定义充要条件是标量 $t$ 必须是一个整数。
  3. 其核心在于,代表元的选取差异是 $2\pi$ 的整数倍,经过 $t$ 乘了之后,这个差异 $t \cdot (2k\pi)$ 仍然必须是 $2\pi$ 的整数倍,这就要求 $tk$ 必须是整数(对任意整数k),从而迫使 $t$ 必须是整数。
🎯 [存在目的]
  1. 推广良定义性: 将在离散集合 $\mathbb{Z}/n\mathbb{Z}$ 上学习到的“良定义”思想,推广到连续集合构成的商群 $\mathbb{R}/2\pi\mathbb{Z}$ 上。
  2. 理解商群同态: 这个问题本质上是在问,什么样的线性映射 $F(\theta)=t\theta$ 可以“降格”为从商群到自身的同态。这种由高维/大空间映射到低维/商空间映射的“降格”问题是代数拓扑中的核心议题。
  3. 连接代数与几何: $\mathbb{R}/2\pi\mathbb{Z}$ 在几何上是单位圆 $U(1)$函数 $f([\theta])=[t\theta]$$t \in \mathbb{Z}$ 时,对应于圆上的一个映射 $z \mapsto z^t$ ($z=e^{i\theta}$)。这道题从代数角度解释了为什么 $z \mapsto z^t$ 这种映射在 $t$ 是整数时性质特别好(比如是良定义群同态),而 $t$ 不是整数时(如 $z \mapsto \sqrt{z}$)会产生多值性等问题。
🧠 [直觉心智模型]
  1. 想象一个可以无限旋转的圆形跑道(周长 $2\pi$ km)。一个等价类 $[\theta]$ 就是跑道上的一个位置。$\theta$ 是总里程数,$[\theta]$ 是你当前在跑道上的位置。跑了 $\theta$ km 和 $\theta+2\pi$ km,你都在同一个位置。
  2. 函数 $f$ 的意思是:你告诉我你现在的位置(由总里程数 $\theta$ 代表),我让你未来的目标总里程数变成 $t$ 倍,即 $t\theta$。然后我再问你目标位置在哪里。
  3. 为什么 $t$ 必须是整数?
  4. 假设你和我在同一个位置,但我比你多跑了整整一圈 ($k=1$)。我的总里程是 $\theta_2=\theta_1+2\pi$,你的总里程是 $\theta_1$
  5. 现在我们的新目标总里程分别是 $t\theta_2$$t\theta_1$
  6. 为了让我们的新目标位置也相同,我们的新总里程数之差 $t\theta_2 - t\theta_1 = t(2\pi)$ 也必须是整数圈!
  7. 也就是说 $t(2\pi)$ 必须等于 $j \cdot (2\pi)$,其中 $j$ 是某个整数。
  8. 这意味着 $t$ 必须是整数。
  9. 如果 $t=1/2$(半程马拉松?),我跑了 $2\pi$ km,你在起点。我们的新目标里程分别是 $\pi$ km 和 0 km。我们的新目标位置一个在跑道半圈处,一个在起点,位置不同了!所以这个规则(乘以1/2)是有问题的。
💭 [直观想象]
  1. 把实数轴想象成一根无限长的绳子,上面有刻度。
  2. $\mathbb{R}/2\pi\mathbb{Z}$ 是把这根绳子在一个周长为 $2\pi$ 的轮子上缠绕起来。绳子上的点 $\theta$$\theta+2\pi$ 会落在轮子上的同一个位置。
  3. $F(\theta)=t\theta$ 是一个对绳子进行“拉伸”或“压缩”的操作(如果 $t>1$ 是拉伸,$t<1$ 是压缩)。
  4. $f$良定义的吗?这个问题是问:对整根绳子进行拉伸(乘以$t$)之后,再把它缠绕到轮子上,原来落在同一个位置的点,现在是否还落在同一个位置?
  5. 原来 $\theta$$\theta+2\pi$ 落在同一个位置。拉伸后变成 $t\theta$$t(\theta+2\pi) = t\theta + 2\pi t$
  6. 为了让 $t\theta$$t\theta + 2\pi t$ 在轮子上还落在同一个位置,它们必须相差整数圈,即 $2\pi t$ 必须是 $2\pi$ 的整数倍。
  7. $2\pi t = j \cdot (2\pi)$,这意味着 $t$ 必须是整数。
  8. 如果 $t=3$,拉伸后,原来相差一圈的点,现在相差三圈,但它们仍然落在轮子上的同一个位置。
  9. 如果 $t=1/2$,压缩后,原来相差一圈的点,现在只相差半圈,它们就落在轮子上的对径位置了,不再是同一个位置。
81.21. 习题 1.21

📜 [原文8]

将以下各项写成 $a+b i$ 的形式:

(a) $(2+3 i)(1-i)$

(b) $\frac{2+3 i}{1-i}$

(c) $(1-4 i)(1+4 i)$

📖 [逐步解释]

这道题是关于复数的基本运算,目标是把运算结果化为标准形式 $a+bi$,其中 $a$实部$b$虚部

(a) $(2+3 i)(1-i)$

  1. 这是一个复数乘法。运算规则类似于多项式乘法,使用分配律(FOIL方法:First, Outer, Inner, Last),并记住一个核心规则:$i^2 = -1$
  2. $(2+3i)(1-i) = 2 \cdot 1 + 2 \cdot (-i) + 3i \cdot 1 + 3i \cdot (-i)$
  3. $= 2 - 2i + 3i - 3i^2$
  4. 合并实部虚部。现在,我们有 $i^2$ 项,需要把它转换成实数。
  5. $= 2 - 2i + 3i - 3(-1)$
  6. $= 2 - 2i + 3i + 3$
  7. 现在,把所有实数项加在一起,所有带 $i$ 的项(虚数项)加在一起。
  8. 实部: $2 + 3 = 5$
  9. 虚部: $-2i + 3i = ( -2 + 3 )i = 1i = i$
  10. 组合起来,结果是 $5 + i$
  11. 所以,标准形式是 $a=5, b=1$

(b) $\frac{2+3 i}{1-i}$

  1. 这是一个复数除法。处理复数除法的标准技巧是,将分子和分母同时乘以分母的共轭复数
  2. 分母是 $1-i$。它的共轭复数$1+i$。(共轭复数就是把虚部的符号变反)。
  3. 这样做的目的是利用 $(x-yi)(x+yi) = x^2 + y^2$ 这个性质,使得分母变成一个实数,从而消除分母中的 $i$
  4. $\frac{2+3 i}{1-i} = \frac{(2+3 i)}{(1-i)} \cdot \frac{(1+i)}{(1+i)}$
  5. 现在,我们分别计算分子和分母。
  6. 分子: $(2+3i)(1+i)$
    • $= 2 \cdot 1 + 2 \cdot i + 3i \cdot 1 + 3i \cdot i$
    • $= 2 + 2i + 3i + 3i^2$
    • $= 2 + 5i + 3(-1)$
    • $= 2 + 5i - 3$
    • $= -1 + 5i$
  7. 分母: $(1-i)(1+i)$
    • $= 1 \cdot 1 + 1 \cdot i - i \cdot 1 - i \cdot i$
    • $= 1 + i - i - i^2$
    • $= 1 - (-1)$
    • $= 1 + 1 = 2$
    • (或者直接用公式 $1^2 + (-1)^2 = 1+1=2$
  8. 现在把分子和分母组合起来:

$\frac{-1+5i}{2}$

  1. 为了写成标准的 $a+bi$ 形式,我们把实部和虚部分开:

$= -\frac{1}{2} + \frac{5}{2}i$

  1. 所以,标准形式是 $a=-1/2, b=5/2$

(c) $(1-4 i)(1+4 i)$

  1. 这个形式正好是一个复数 $z=1-4i$ 与其共轭复数 $\bar{z}=1+4i$ 相乘。
  2. 我们可以像 (a) 一样按部就班地使用分配律:
    • $= 1 \cdot 1 + 1 \cdot (4i) - (4i) \cdot 1 - (4i)(4i)$
    • $= 1 + 4i - 4i - 16i^2$
    • $= 1 - 16(-1)$
    • $= 1 + 16 = 17$
  3. 或者,我们可以直接使用公式 $z \cdot \bar{z} = |z|^2 = a^2+b^2$
  4. 对于 $z=1-4i$,我们有 $a=1, b=-4$
  5. 所以 $(1-4i)(1+4i) = 1^2 + (-4)^2 = 1 + 16 = 17$
  6. 为了写成 $a+bi$ 的形式,结果是 $17 + 0i$
  7. 所以,标准形式是 $a=17, b=0$
∑ [公式拆解]
  • $i$: 虚数单位,定义为 $i^2 = -1$
  • $z = a+bi$: 复数的标准形式。$a = \text{Re}(z)$实部$b = \text{Im}(z)$虚部
  • $\bar{z} = a-bi$: 复数 $z$共轭 (conjugate)。
  • $z_1 \cdot z_2 = (a+bi)(c+di) = (ac-bd) + (ad+bc)i$: 复数乘法公式。
  • $\frac{z_1}{z_2} = \frac{z_1 \cdot \bar{z_2}}{z_2 \cdot \bar{z_2}} = \frac{z_1 \cdot \bar{z_2}}{|z_2|^2}$: 复数除法的方法。
  • $|z|^2 = z \cdot \bar{z} = (a+bi)(a-bi) = a^2+b^2$: 复数的平方。
💡 [数值示例]

题目本身就是纯数值计算。这里提供额外的例子。

示例1 (乘法): $(3-i)(2+5i)$

  • $= 3(2) + 3(5i) -i(2) -i(5i)$
  • $= 6 + 15i - 2i - 5i^2$
  • $= 6 + 13i - 5(-1)$
  • $= 6 + 13i + 5 = 11 + 13i$

示例2 (除法): $\frac{i}{2+i}$

  • 分母的共轭$2-i$
  • $= \frac{i(2-i)}{(2+i)(2-i)}$
  • 分子: $i(2-i) = 2i - i^2 = 2i - (-1) = 1+2i$
  • 分母: $(2+i)(2-i) = 2^2 + 1^2 = 4+1=5$
  • 结果: $\frac{1+2i}{5} = \frac{1}{5} + \frac{2}{5}i$

示例3 (共轭相乘): $(-2+3i)(-2-3i)$

  • $= (-2)^2 + 3^2 = 4+9=13$
  • 结果是 $13+0i$
⚠️ [易错点]
  1. 符号错误: 在计算中,特别是处理负号和 $i^2 = -1$ 时,很容易出错。例如,$-3i \cdot (-i) = +3i^2 = -3$
  2. 除法忘记共轭: 用别的方法做除法(比如设结果为 $a+bi$ 再解方程)虽然可行,但乘以共轭是最直接高效的方法,一定要掌握。
  3. 分子分母算错: 在做除法时,分子和分母的乘法是两个独立的计算,任何一个出错都会导致最终结果错误。要分步仔细计算。
  4. 结果形式: 题目要求写成 $a+bi$ 的形式,像 $\frac{-1+5i}{2}$ 这样的答案虽然没错,但不是最标准的形式,最好写成 $-\frac{1}{2} + \frac{5}{2}i$。对于纯实数或纯虚数的结果,也要写成标准形式,如 $17+0i$$0+5i$
📝 [总结]
  1. (a) 演示了复数乘法,使用分配律并结合 $i^2=-1$ 进行化简。
  2. (b) 演示了复数除法,通过乘以分母的共轭来使分母实数化,从而得到标准形式。
  3. (c) 演示了复数与其共轭相乘,结果总是一个实数,等于该复数的平方。
  4. 这三种运算是复数代数的基础。
🎯 [存在目的]
  1. 基本功训练: 确保学生熟练掌握复数的加、减、乘、除四则运算,这是后续学习复分析和将复数应用于其他数学、物理、工程领域(如群论、信号处理、量子力学)的必备技能。
  2. 熟悉代数结构: $\mathbb{C}$ 在加法和乘法下构成一个域 (field),这意味着它有非常良好和完整的代数性质。这些运算练习就是对这些性质的具体体验。
  3. 为后续铺垫: 许多(如 $U(1)$, $\mu_n$)和矩阵群元素都与复数有关。熟练掌握复数运算是理解这些的结构的前提。
🧠 [直觉心智模型]
  1. 可以把复数 $a+bi$ 想象成二维平面上的一个向量 $(a,b)$
  2. 加法就是向量的平行四边形法则。
  3. 乘法在几何上对应着“旋转”和“缩放”。一个复数 $z_1$ 乘以 $z_2$,结果向量的长度是两个原向量长度的乘积,结果向量的角度是两个原向量角度的和。
  4. 除法则是“逆向旋转”和“长度相除”。
  5. 乘以共轭$z \cdot \bar{z}$ 得到 $|z|^2$。几何上,$\bar{z}$$z$ 关于x轴的对称向量。乘以 $\bar{z}$ 相当于把 $z$ 的角度加倍为 0 或 360 度(如果用 $z/|z|$$\bar{z}/|z|$ 的话),并把长度变为 $|z|^2$
💭 [直观想象]
  1. (a) $(2+3i)(1-i)$: 想象向量 $(2,3)$$(1,-1)$。我们想知道它们相乘后的新向量
  2. $(2+3i)$ 的角度 $\theta_1 = \arctan(3/2)$,长度 $r_1 = \sqrt{2^2+3^2}=\sqrt{13}$
  3. $(1-i)$ 的角度 $\theta_2 = -45^\circ$,长度 $r_2 = \sqrt{1^2+(-1)^2}=\sqrt{2}$
  4. 结果向量的长度应该是 $r_1 r_2 = \sqrt{26}$,角度应该是 $\theta_1 + \theta_2$
  5. 我们的代数结果是 $5+i$。它的长度是 $\sqrt{5^2+1^2}=\sqrt{26}$。吻合!它的角度是 $\arctan(1/5)$。所以 $\arctan(3/2) - 45^\circ = \arctan(1/5)$
  6. (b) $\frac{2+3 i}{1-i}$: 结果向量的长度是 $\sqrt{13}/\sqrt{2} = \sqrt{6.5}$,角度是 $\theta_1 - \theta_2$
  7. 我们的代数结果是 $-1/2 + (5/2)i$。它的长度是 $\sqrt{(-1/2)^2 + (5/2)^2} = \sqrt{1/4 + 25/4} = \sqrt{26/4} = \sqrt{13/2} = \sqrt{6.5}$。吻合!
91.22. 习题 1.22

📜 [原文9]

$r$ 是一个正实数,设 $z$ 是一个绝对值为 1 的复数(即 $z \in U(1)$)。$|r z|$ 是什么?使用这一点,证明由

$$ F(r, z)=r z $$

定义的函数是一个双射,其中 $\mathbb{R}^{>0}=\{t \in \mathbb{R}: t>0\}$正实数集,通过明确地找到一个逆函数来证明。(提示:如果 $w \in \mathbb{C}^{*}$,则 $w=|w| \cdot \frac{w}{|w|}$。使用这个来定义逆函数。)

📖 [逐步解释]

这道题旨在揭示复数乘法的几何意义,并证明非零复数极坐标表示的唯一性。

它要我们证明一个函数 $F: \mathbb{R}^{>0} \times U(1) \to \mathbb{C}^*$ 是一个双射

  • 理解函数 F:
  • 定义域: $\mathbb{R}^{>0} \times U(1)$。它的一个输入是有序对 $(r, z)$
  • $r$ 是一个正实数 (代表长度或模)。
  • $z$ 是一个模为 1 的复数 (在复平面上位于单位圆上,代表方向或角度)。
  • 值域: $\mathbb{C}^* = \mathbb{C} - \{0\}$,所有非零复数集合
  • 函数规则: $F(r, z) = r \cdot z$。就是把代表方向的单位复数 $z$ 的长度拉伸 $r$ 倍。

第一部分: $|r z|$ 是什么?

  1. 我们利用复数模的乘法性质: $|z_1 z_2| = |z_1| |z_2|$
  2. 这里,$z_1 = r$ (一个实数,可以看作 $r+0i$复数),$z_2 = z$
  3. $|rz| = |r| \cdot |z|$
  4. 因为 $r$ 是一个正实数 ($r \in \mathbb{R}^{>0}$),所以 $|r| = r$
  5. 因为 $z$ 是一个绝对值为 1 的复数 ($z \in U(1)$),所以 $|z|=1$
  6. 因此,$|rz| = r \cdot 1 = r$
  7. 结论: $|rz|$ 的值就是 $r$。这符合我们的直觉:一个长度为1的向量,被拉伸 $r$ 倍后,新长度就是 $r$

第二部分: 证明 F 是一个双射

证明一个函数双射,最直接的方法之一就是找到它的逆函数。如果一个函数 $F: A \to B$ 有一个逆函数 $G: B \to A$ 使得 $G \circ F = \text{id}_A$$F \circ G = \text{id}_B$ (即 $G(F(a))=a$ 对所有 $a \in A$ 成立,且 $F(G(b))=b$ 对所有 $b \in B$ 成立),那么 $F$ 就是一个双射

  1. 定义逆函数 G:
    • 我们的目标是定义一个函数 $G: \mathbb{C}^* \to \mathbb{R}^{>0} \times U(1)$
    • 输入是一个非零复数 $w \in \mathbb{C}^*$
    • 输出必须是一个有序对 $(r, z)$,其中 $r$ 是正实数,$z$ 是单位复数
    • 我们利用题目给的提示:$w = |w| \cdot \frac{w}{|w|}$
    • 这个分解非常巧妙。我们来分析一下:
    • $|w|$: 是 $w$。因为 $w \in \mathbb{C}^*$ (非零),所以 $|w|$ 是一个正实数。这正好可以作为我们要找的 $r$
    • $\frac{w}{|w|}$: 这是一个新的复数。它的$|\frac{w}{|w|}| = \frac{|w|}{||w||} = \frac{|w|}{|w|} = 1$。所以它是一个单位复数。这正好可以作为我们要找的 $z$
    • 所以,我们定义逆函数 $G$ 如下:
    • 这个定义是合理的,因为 $|w| \in \mathbb{R}^{>0}$$\frac{w}{|w|} \in U(1)$,所以输出确实在目标集合 $\mathbb{R}^{>0} \times U(1)$ 中。
  2. 验证 G 是 F 的逆函数:

我们需要验证两个方向的复合

  • 验证 $G(F(r,z)) = (r,z)$:
  1. 输入是 $(r,z) \in \mathbb{R}^{>0} \times U(1)$
  2. $F(r,z) = rz$。这是一个非零复数,我们把它记作 $w$
  3. 现在计算 $G(w) = G(rz)$
  4. 根据 $G$ 的定义,$G(w) = \left(|w|, \frac{w}{|w|}\right)$
  5. 我们代入 $w=rz$$G(rz) = \left(|rz|, \frac{rz}{|rz|}\right)$
  6. 在第一部分我们已经证明了 $|rz|=r$
  7. 所以 $G(rz) = \left(r, \frac{rz}{r}\right)$
  8. $\frac{rz}{r} = z$
  9. 因此,$G(rz) = (r, z)$
  10. 这一方向的验证完成。$G \circ F$恒等函数
  • 验证 $F(G(w)) = w$:
  1. 输入是 $w \in \mathbb{C}^*$
  2. $G(w) = \left( |w|, \frac{w}{|w|} \right)$。这是一个有序对,我们把它记作 $(r,z)$,其中 $r=|w|, z=\frac{w}{|w|}$
  3. 现在计算 $F(r,z)$
  4. 根据 $F$ 的定义,$F(r,z) = r \cdot z$
  5. 我们把 $r$$z$ 的表达式代回去:

$F\left(|w|, \frac{w}{|w|}\right) = |w| \cdot \frac{w}{|w|}$

  1. 这个表达式显然就等于 $w$
  2. 这一方向的验证完成。$F \circ G$恒等函数
  3. 结论:
    • 因为我们成功找到了一个逆函数 $G$,所以原函数 $F$ 是一个双射

这个双射的本质就是复数极坐标表示。任何一个非零复数 $w$ 都可以被唯一地表示为一个正的长度 $r=|w|$ 和一个方向(角度)$z=w/|w|$ 的组合。

∑ [公式拆解]

$$ F(r, z)=r z $$

  • $F$: 函数名。
  • $(r, z)$: 函数的输入,一个有序对
  • $r \in \mathbb{R}^{>0}$: $r$ 是正实数。
  • $z \in U(1)$: $z$ 是一个为1的复数,即 $z$ 位于复平面的单位圆上。
  • $rz$: 函数的输出,一个实数和一个复数的乘法。

$$ w=|w| \cdot \frac{w}{|w|} $$

  • $w$: 任意非零复数
  • $|w|$: $w$绝对值,是一个正实数,代表其长度。
  • $\frac{w}{|w|}$: $w$ 除以自身的长度。这个操作叫做“归一化”(normalization),结果是一个与 $w$ 方向相同但长度为1的向量(单位复数)。
  • 这个公式说明任何非零复数都可以分解为一个“长度”和一个“方向”的乘积。
💡 [数值示例]

示例1:

  • F的方向: 设输入为 $(r,z) = (5, i)$
  • $r=5$ 是正实数。$z=i$ 的模 $|i|=1$,所以 $i \in U(1)$
  • $F(5, i) = 5 \cdot i = 5i$。输出是 $5i$
  • G的方向: 设输入为 $w = 5i$
  • 我们来计算 $G(5i)$
  • $r = |5i| = |5| \cdot |i| = 5 \cdot 1 = 5$
  • $z = \frac{5i}{|5i|} = \frac{5i}{5} = i$
  • $G(5i) = (5, i)$
  • 我们看到 $G(F(5,i))=(5,i)$,验证了逆函数关系。

示例2:

  • F的方向: 设输入为 $(r,z) = \left(2, \frac{\sqrt{2}}{2} + i \frac{\sqrt{2}}{2}\right)$
  • $r=2$ 是正实数。$z$ 的模 $|z| = \sqrt{(\frac{\sqrt{2}}{2})^2 + (\frac{\sqrt{2}}{2})^2} = \sqrt{1/2 + 1/2} = \sqrt{1}=1$
  • $F\left(2, \frac{\sqrt{2}}{2} + i \frac{\sqrt{2}}{2}\right) = 2 \left(\frac{\sqrt{2}}{2} + i \frac{\sqrt{2}}{2}\right) = \sqrt{2} + i\sqrt{2}$
  • G的方向: 设输入为 $w = \sqrt{2} + i\sqrt{2}$
  • $r = |w| = \sqrt{(\sqrt{2})^2 + (\sqrt{2})^2} = \sqrt{2+2} = \sqrt{4} = 2$
  • $z = \frac{w}{|w|} = \frac{\sqrt{2} + i\sqrt{2}}{2} = \frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$
  • $G(\sqrt{2} + i\sqrt{2}) = \left(2, \frac{\sqrt{2}}{2} + i \frac{\sqrt{2}}{2}\right)$
  • 再次验证了逆函数关系。
⚠️ [易错点]
  1. 零复数: 这个问题的所有讨论都建立在 $\mathbb{C}^*$ (非零复数集合) 上。零复数 $w=0$ 是一个特殊情况,因为提示中的分解 $w = |w| \cdot \frac{w}{|w|}$ 会导致分母为零,是无定义的。$F$值域也恰好是 $\mathbb{C}^*$ 而不是 $\mathbb{C}$,因为 $r>0$$|z|=1$,所以 $|rz|=r>0$,结果永远不可能是0。
  2. 逆函数的输出类型: 要记住 $G$ 的输出是一个有序对 $(r,z)$,而不是一个单一的数。
  3. 证明双射: 虽然可以通过分别证明单射满射来证明双射,但题目明确要求“通过明确地找到一个逆函数来证明”,这是一种更强大且更具构造性的证明方法。
📝 [总结]
  1. 本题通过构造一个函数 $F(r,z)=rz$ 及其逆函数 $G(w)=(|w|, w/|w|)$,证明了从“(正长度,方向)”的集合 $\mathbb{R}^{>0} \times U(1)$ 到“非零复数集合 $\mathbb{C}^*$ 之间存在一个双射
  2. 这个双射复数极坐标表示 $w=re^{i\theta}$ 提供了坚实的理论基础,其中 $r$ 对应 $|w|$$e^{i\theta}$ 对应单位复数 $z$
  3. 它揭示了任何非零复数都可以被唯一地分解为一个代表“大小”的正实数和一个代表“方向”的单位复数的乘积。
🎯 [存在目的]
  1. 建立极坐标思想: 这是将复数从代数形式 $a+bi$ 过渡到几何/极坐标形式 $re^{i\theta}$ 的关键一步。极坐标形式在处理复数乘法、乘方和开方时极为方便。
  2. 练习构造逆函数: 这是一个构造并验证逆函数的经典练习,是函数理论中的一个重要技能。
  3. 理解群的结构: 这个结论可以被看作是一个群同构的声明。$(\mathbb{C}^*, \cdot)$ 是一个乘法群$(\mathbb{R}^{>0}, \cdot)$ 也是一个乘法群$(U(1), \cdot)$ 还是一个乘法群。这个双射实际上揭示了 $\mathbb{C}^*$直积群 $\mathbb{R}^{>0} \times U(1)$同构的。这意味着要研究非零复数的乘法,我们可以分开独立地研究正实数的乘法(就是缩放)和单位复数的乘法(就是旋转)。
  4. 几何直观: 强化复数与二维向量的类比,并将乘法操作与几何上的“缩放”和“旋转”操作等同起来。
🧠 [直觉心智模型]
  1. 想象你要向你的一个机器人朋友描述二维平面上的任意一个点(非原点)。
  2. 你有两种描述方法:
  1. 笛卡尔坐标: “向东走 a 米,再向北走 b 米”,即 $(a,b)$$a+bi$
  2. 极坐标: “朝向某个方向,然后直走 r 米”,即 $(r, \theta)$$(r, z)$
    • 函数 $F$ 就是从“极坐标”描述转换到“最终位置”的过程。
    • 函数 $G$ 就是从“最终位置”反推出“极坐标”描述的过程:
    • r = |w|: “你离我多远?” -> 得到距离 $r$
    • z = w/|w|: “你现在所在位置的方向是?” -> 得到单位方向向量 $z$
    • 这道题证明了这两种描述方法是一一对应、可以完美相互转换的。
💭 [直观想象]
  1. $F$: 你有一个橡皮筋,一端钉在原点。它本来长度为1,指向方向 $z$。现在你把它拉长到 $r$ 倍。它的另一端最终指向的点就是 $w=rz$
  2. $G$: 你看到橡皮筋的另一端在点 $w$
  3. 你拿出尺子量了它离原点的距离,得到了 $|w|$。这就是 $r$
  4. 你记录下它指向的方向,即从原点到 $w$ 的单位方向向量 $w/|w|$。这就是 $z$
  5. 这个过程显然是可逆的,并且对于任何一个不在原点的点 $w$,你总能唯一地确定它的距离和方向。
101.23. 习题 1.23

📜 [原文10]

(i) 找出表达式 $\sqrt{i}$ 的所有可能值,换句话说,描述(以 $a+b i$ 的形式)所有满足 $w^{2}=i$复数 $w$。有多少个这样的 $w$?同样,找出 $1+i$ 的所有可能的平方根

(ii) 以 $a+b i$ 的形式写出三次单位根集合 $\mu_{3}$ 中的元素。对以下各项也这样做:四次单位根集合 $\mu_{4}$ 中的元素八次单位根集合 $\mu_{8}$ 中的元素

📖 [逐步解释]

这道题要求我们求解复数平方根单位根

(i) 求解平方根

1. 找出 $\sqrt{i}$

  • 方法一:代数方法
  1. $w = a+bi$$i$ 的一个平方根
  2. 那么 $w^2 = i$
  3. $(a+bi)^2 = a^2 + 2abi + (bi)^2 = a^2 - b^2 + 2abi$
  4. 所以我们有 $a^2 - b^2 + 2abi = 0 + 1i$
  5. 比较实部虚部,我们得到一个方程组:
    • $a^2 - b^2 = 0$ (方程1)
    • $2ab = 1$ (方程2)
  6. 从方程1,我们得到 $a^2 = b^2$,这意味着 $a=b$$a=-b$
  7. 我们来检验这两种情况:
    • 情况A: $a=b$
    • 情况B: $a=-b$
  8. 因此,我们找到了两个平方根$\frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$$-\frac{\sqrt{2}}{2} - i\frac{\sqrt{2}}{2}$
  9. 总共有 2 个这样的 $w$
  • 方法二:极坐标方法
  1. 首先将 $i$ 表示成极坐标形式 $re^{i\theta}$
  2. $i = 0+1i$。它的模 $r = |i| = \sqrt{0^2+1^2} = 1$
  3. 它的角度 $\theta$ 满足 $\cos\theta=0, \sin\theta=1$,所以 $\theta = \pi/2$ (或 $90^\circ$)。
  4. 所以 $i = 1 \cdot e^{i(\pi/2 + 2k\pi)}$ (加上 $2k\pi$ 是因为角度的周期性,k是整数)。
  5. 我们要求 $w$ 使得 $w^2 = i$。设 $w$极坐标形式是 $se^{i\phi}$
  6. $w^2 = (se^{i\phi})^2 = s^2 e^{i2\phi}$
  7. 所以 $s^2 e^{i2\phi} = 1 \cdot e^{i(\pi/2 + 2k\pi)}$
  8. 比较角度
    • $s^2 = 1 \implies s=1$ (因为模总是正数)。
    • $2\phi = \pi/2 + 2k\pi \implies \phi = \frac{\pi}{4} + k\pi$
  9. 我们通过取不同的整数 $k$ 来找不同的解。
    • $k=0$ 时, $\phi = \pi/4$
    • $k=1$ 时, $\phi = \pi/4 + \pi = 5\pi/4$
    • $k=2$ 时, $\phi = \pi/4 + 2\pi$,这和 $k=0$ 的角度是同一个方向,得到相同的解。
  10. 同样,我们得到了两个解,它们互为相反数。

2. 找出 $1+i$ 的所有可能的平方根

  • 我们使用极坐标方法,因为它更通用。
  1. $1+i$ 表示成极坐标形式。
  2. 模: $r = |1+i| = \sqrt{1^2+1^2} = \sqrt{2}$
  3. 角度: $\theta = \arctan(1/1) = \pi/4$
  4. 所以 $1+i = \sqrt{2} e^{i(\pi/4 + 2k\pi)}$
  5. $w = se^{i\phi}$ 是其平方根$w^2 = s^2 e^{i2\phi}$
  6. 比较角度
    • $s^2 = \sqrt{2} \implies s = (\sqrt{2})^{1/2} = 2^{1/4}$ (2的四次方根)。
    • $2\phi = \pi/4 + 2k\pi \implies \phi = \frac{\pi}{8} + k\pi$
  7. 取不同的 $k$ 值:
    • $k=0$: $\phi_1 = \pi/8$
    • $k=1$: $\phi_2 = \pi/8 + \pi = 9\pi/8$
  8. 这两个解 $w_1$$w_2$$1+i$ 的两个平方根
  9. 虽然题目要求写成 $a+bi$ 形式,但 $\cos(\pi/8)$$\sin(\pi/8)$ 不是初等有理数,通常写成这个三角形式就足够了。(如果要计算,可以使用半角公式:$\cos(\pi/8) = \sqrt{\frac{1+\cos(\pi/4)}{2}} = \sqrt{\frac{1+\sqrt{2}/2}{2}} = \frac{\sqrt{2+\sqrt{2}}}{2}$)。

(ii) 求解单位根

单位根是方程 $z^n=1$ 的解。

1. 三次单位根 $\mu_3$ ($z^3=1$)

  1. 将 1 表示为极坐标形式: $1 = 1 \cdot e^{i(0+2k\pi)}$
  2. $z = se^{i\phi}$$z^3 = s^3 e^{i3\phi}$
  3. 比较角度
    • $s^3=1 \implies s=1$单位根的模总是1。
    • $3\phi = 2k\pi \implies \phi = \frac{2k\pi}{3}$
  4. $k=0, 1, 2$ (取更多 $k$ 值会开始重复):
    • $k=0$: $\phi_0 = 0$$z_0 = e^{i0} = \cos(0)+i\sin(0) = 1 + 0i = 1$
    • $k=1$: $\phi_1 = 2\pi/3$$z_1 = e^{i2\pi/3} = \cos(2\pi/3) + i\sin(2\pi/3) = -\frac{1}{2} + i\frac{\sqrt{3}}{2}$
    • $k=2$: $\phi_2 = 4\pi/3$$z_2 = e^{i4\pi/3} = \cos(4\pi/3) + i\sin(4\pi/3) = -\frac{1}{2} - i\frac{\sqrt{3}}{2}$
  5. 所以 $\mu_3 = \left\{1, -\frac{1}{2} + i\frac{\sqrt{3}}{2}, -\frac{1}{2} - i\frac{\sqrt{3}}{2}\right\}$

2. 四次单位根 $\mu_4$ ($z^4=1$)

  1. $s=1$, $4\phi = 2k\pi \implies \phi = \frac{k\pi}{2}$
  2. $k=0, 1, 2, 3$
    • $k=0$: $\phi_0 = 0$$z_0 = e^{i0} = 1$
    • $k=1$: $\phi_1 = \pi/2$$z_1 = e^{i\pi/2} = \cos(\pi/2)+i\sin(\pi/2) = i$
    • $k=2$: $\phi_2 = \pi$$z_2 = e^{i\pi} = \cos(\pi)+i\sin(\pi) = -1$
    • $k=3$: $\phi_3 = 3\pi/2$$z_3 = e^{i3\pi/2} = \cos(3\pi/2)+i\sin(3\pi/2) = -i$
  3. 所以 $\mu_4 = \{1, i, -1, -i\}$

3. 八次单位根 $\mu_8$ ($z^8=1$)

  1. $s=1$, $8\phi = 2k\pi \implies \phi = \frac{k\pi}{4}$
  2. $k=0, 1, 2, 3, 4, 5, 6, 7$
    • $k=0: z_0 = e^{i0} = 1$
    • $k=1: z_1 = e^{i\pi/4} = \cos(\pi/4)+i\sin(\pi/4) = \frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$
    • $k=2: z_2 = e^{i\pi/2} = i$
    • $k=3: z_3 = e^{i3\pi/4} = \cos(3\pi/4)+i\sin(3\pi/4) = -\frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$
    • $k=4: z_4 = e^{i\pi} = -1$
    • $k=5: z_5 = e^{i5\pi/4} = -\frac{\sqrt{2}}{2} - i\frac{\sqrt{2}}{2}$
    • $k=6: z_6 = e^{i3\pi/2} = -i$
    • $k=7: z_7 = e^{i7\pi/4} = \frac{\sqrt{2}}{2} - i\frac{\sqrt{2}}{2}$
  3. 这8个根就是 $\mu_8$ 的所有元素
∑ [公式拆解]
  • $w = \sqrt{z}$: 求 $z$平方根,即找 $w$ 使得 $w^2=z$
  • $z = re^{i\theta}$: 复数极坐标形式,其中 $r=|z|$$\theta = \arg(z)$辐角
  • De Moivre's Formula (棣莫弗公式)的变体: $(re^{i\theta})^n = r^n e^{in\theta}$。求 $n$ 次根是这个公式的逆运算。
  • $z^{1/n}$: $z$$n$ 次根。如果 $z=re^{i(\theta+2k\pi)}$,那么它的 $n$$n$ 次根是:

$w_k = r^{1/n} e^{i(\frac{\theta+2k\pi}{n})}$ for $k=0, 1, 2, \dots, n-1$

  • $\mu_n$: $n$单位根集合,即 $z^n=1$ 的所有解。
💡 [数值示例]

题目本身就是具体的数值计算。这里再补充一个。

示例: 找出 $-4$ 的所有平方根

  • 代数方法: $w=a+bi, w^2 = a^2-b^2+2abi = -4+0i$
  • $a^2-b^2 = -4$
  • $2ab=0 \implies a=0$$b=0$
  • 如果 $a=0$, 则 $-b^2=-4 \implies b^2=4 \implies b=\pm 2$。得到解 $w=2i$$w=-2i$
  • 如果 $b=0$, 则 $a^2=-4$, 实数 $a$ 无解。
  • 所以平方根$\pm 2i$
  • 极坐标方法: $-4 = 4 e^{i(\pi+2k\pi)}$
  • $w^2 = s^2 e^{i2\phi}$
  • $s^2=4 \implies s=2$
  • $2\phi = \pi+2k\pi \implies \phi = \pi/2 + k\pi$
  • $k=0: \phi=\pi/2$$w_1 = 2e^{i\pi/2} = 2i$
  • $k=1: \phi=3\pi/2$$w_2 = 2e^{i3\pi/2} = -2i$
  • 结果相同。
⚠️ [易错点]
  1. 根的个数: 代数基本定理保证复数域上的 $n$ 次方程恰好有 $n$ 个根(计算重数)。因此,一个非零复数$n$ 次根恰好有 $n$ 个。在计算时不要遗漏。
  2. 角度的周期性: 在使用极坐标方法时,必须在原始角度 $\theta$ 上加上 $2k\pi$,这是找到所有根的关键。如果忘了加,就只能找到一个根。
  3. 代数方法的局限: 对于求 $\sqrt{1+i}$ 这种实部虚部都不为零的复数的根,代数方法会导出非常复杂的方程,而极坐标方法则非常直观和程序化。
  4. 三角函数值: 计算 $a+bi$ 形式时,需要知道常用角度(如 $\pi/6, \pi/4, \pi/3, \pi/2$ 等)的 $\sin$$\cos$ 值。
📝 [总结]
  1. (i) 求解复数平方根有两种主要方法:代数法(解方程组)和极坐标法。极坐标法更为通用和强大。一个非零复数总是有两个平方根,它们互为相反数。
  2. (ii) 求解 $n$单位根$z^n=1$ 的解)的最佳方法是极坐标法。$n$单位根总是有 $n$ 个,它们在复平面的单位圆上均匀分布,构成一个正 $n$ 边形的顶点。
🎯 [存在目的]
  1. 掌握复数开方: 开方运算是复数运算的重要组成部分,在解方程、复分析等领域有广泛应用。
  2. 深入理解极坐标: 本题是复数极坐标表示法威力的绝佳展示。它将复杂的代数问题转化为简单的几何问题(角度除法和模开方)。
  3. 引入单位根群: 单位根集合 $\mu_n$乘法下构成一个重要的有限循环群。这道题让学生首次具体地接触和计算这些元素,是群论学习的重要例子。
  4. 几何直观: 求解单位根的过程,实际上是在单位圆上画出正 $n$ 边形的过程,这加强了代数几何之间的深刻联系。
🧠 [直觉心智模型]
  1. 求n次根:
  2. 想象一个复数 $z$ 是平面上的一个点。它有一个长度(模 $r$)和一个角度(辐角 $\theta$)。
  3. 找它的 $n$ 次根,就是找另一个点 $w$,使得把 $w$ “自己乘自己 $n$ 次”后,能得到 $z$
  4. 极坐标下,“乘”就是“长度相乘,角度相加”。
  5. 所以,“$w$$n$ 次”就是“$w$ 的长度自乘 $n$ 次,$w$ 的角度自加 $n$ 次”。
  6. 反过来,求 $w$ 就意味着:
  7. $w$ 的长度是 $z$ 长度的 $n$ 次算术根 ($r^{1/n}$)。
  8. $w$ 的角度是 $z$ 角度的 $1/n$ ($\theta/n$)。
  9. 为什么有n个根? 因为 $z$ 的角度其实是 $\theta, \theta+360^\circ, \theta+720^\circ, \dots$。这些角度除以 $n$ 之后,就变成了 $\theta/n, \theta/n+360/n, \theta/n+720/n, \dots$,它们在前 $n$ 个是不同的,之后就开始循环。这 $n$ 个不同的角度就对应了 $n$ 个不同的根。
💭 [直观想象]
  1. 求八次单位根 $\mu_8$:
  1. 你要找8个复数,它们自己乘自己8次后都等于1。
  2. 你知道它们都在单位圆上。
  3. 第一个最简单的解是 1。
  4. $n$ 个根在单位圆上均匀分布,形成一个正 $n$ 边形。所以我们要找一个内接于单位圆的正八边形,且一个顶点在 $(1,0)$
  5. 这个正八边形的顶点之间的夹角是 $360^\circ / 8 = 45^\circ$
  6. $(1,0)$ 开始 (角度0),每次增加 $45^\circ$ (即 $\pi/4$),画出所有的顶点:
    • $0^\circ \to 1$
    • $45^\circ \to \frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$
    • $90^\circ \to i$
    • $135^\circ \to -\frac{\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}$
    • $180^\circ \to -1$
    • ... 以此类推,直到 $315^\circ$
  7. 这个几何图像完美地对应了代数计算的结果。
111.24. 习题 1.24

📜 [原文11]

(i) 对于 $n \in \mathbb{N}$,考虑由 $f_{n}(z)=z^{n}$ 定义的函数 $f_{n}: \mathbb{C} \rightarrow \mathbb{C}$$f_{n}$ 何时是单射满射

(ii) 考虑指数函数 $f(z)=e^{z}=e^{a}(\cos b+i \sin b)$,其中 $z=a+b i$。(此处我们将 $f$ 视为从 $\mathbb{C}$$\mathbb{C}$ 的一个函数。)对于写成极坐标形式复数 $w=r(\cos \theta+i \sin \theta)$(因此 $r \geq 0$),写出方程 $f(z)=w$ 的所有可能$f$单射吗?满射吗?$\operatorname{Im} f$ 是什么?

📖 [逐步解释]

这道题考察两个重要的复变函数:幂函数指数函数的性质。

(i) 幂函数 $f_n(z) = z^n$

  • 单射性 (Injective):
  • 一个函数单射的,如果不同的输入总是有不同的输出。即 $f(z_1)=f(z_2) \implies z_1=z_2$
  • 我们来检验 $f_n(z)=z^n$$z_1^n = z_2^n \implies z_1 = z_2$
  • 当 n=1 时: $f_1(z)=z$恒等函数。显然 $z_1=z_2 \implies z_1=z_2$。所以 $f_1$单射的。
  • 当 n > 1 时:
  • 我们考虑方程 $z^n=1$。根据上一题的知识,这个方程在复数域内有 $n$ 个不同的解($n$单位根)。
  • 例如,对于 $n=2$, $z^2=1$ 的解是 $z=1$$z=-1$。我们有 $f_2(1)=1$$f_2(-1)=1$。两个不同的输入(1 和 -1)得到了相同的输出(1)。所以 $f_2$ 不是单射的。
  • 对于任意 $n>1$,取 $z_1=1$$z_2=e^{i2\pi/n}$ (一个非1的 $n$单位根)。
  • $z_1 \neq z_2$
  • 但是 $f_n(z_1) = 1^n = 1$$f_n(z_2) = (e^{i2\pi/n})^n = e^{i2\pi} = 1$
  • 我们找到了两个不同的输入,它们的输出相同。
  • 因此,当 $n>1$ 时,$f_n$ 不是单射的。
  • 结论: $f_n$单射的,当且仅当 $n=1$
  • 满射性 (Surjective):
  • 一个函数满射的,如果它的值域覆盖了整个目标空间。即对于目标空间 $\mathbb{C}$ 中的任意元素 $w$,我们总能找到一个输入 $z \in \mathbb{C}$ 使得 $f_n(z) = w$
  • 这个问题就是问:对于任意复数 $w \in \mathbb{C}$,方程 $z^n=w$ 是否总是有解?
  • 代数基本定理告诉我们,任何一个复系数$n$ 次多项式在复数域内都恰好有 $n$ 个根。
  • 方程 $z^n - w = 0$ 就是一个 $n$ 次多项式方程。因此,它总是有解的。
  • 更具体地,我们可以用上一题的极坐标方法来构造解。任何复数 $w$ (包括0) 都可以写成 $w=re^{i\theta}$。它的一个 $n$ 次根是 $z = r^{1/n} e^{i\theta/n}$
  • 因此,对于任意 $w \in \mathbb{C}$,我们总能找到一个 $z$ 使得 $z^n=w$
  • 结论: 对于所有 $n \in \mathbb{N}$ ($n \geq 1$),$f_n$ 都是满射的。

(ii) 指数函数 $f(z) = e^z$

  • 求解方程 $f(z)=w$:
  1. $z=a+bi$, $w=r(\cos\theta+i\sin\theta)=re^{i\theta}$
  2. $f(z)=e^z=e^{a+bi}=e^a \cdot e^{bi}$
  3. 根据欧拉公式,$e^{bi} = \cos b + i \sin b$
  4. 所以 $f(z) = e^a(\cos b + i \sin b)$
  5. 我们要解的方程是 $e^a(\cos b + i \sin b) = r(\cos \theta + i \sin \theta)$
  6. 这是一个极坐标形式的等式。我们比较辐角
    • 比较模: 左边的模是 $|e^a(\cos b+i\sin b)| = |e^a| \cdot |\cos b+i\sin b| = e^a \cdot 1 = e^a$ (因为 $a$ 是实数,$e^a > 0$)。右边的模是 $r$
    • 比较辐角: 左边的辐角是 $b$,右边的辐角是 $\theta$。两个复数相等,它们的辐角可以相差 $2\pi$ 的整数倍。
  7. 现在我们从这两个关系中解出 $a$$b$
    • $e^a = r$ 解出 $a$$a = \ln(r)$。这个解是存在的,只要 $r>0$。如果 $w=0$,则 $r=0$$e^a=0$ 无解,说明 $e^z$ 永远不等于0。
    • $b$ 已经解出来了:$b = \theta + 2k\pi, k \in \mathbb{Z}$
  8. 所以,对于任意非零复数 $w=re^{i\theta}$,方程 $e^z=w$ 的所有是:

$z = a+bi = \ln(r) + i(\theta + 2k\pi)$,其中 $k$ 是任意整数。

  1. 这个表达式通常被称为复对数 $\log(w)$,它是一个多值函数
  • 单射性:
  • $f$单射的吗?如果 $f(z_1)=f(z_2)$,是否 $z_1=z_2$
  • 我们取两个不同的输入:$z_1 = a+bi$$z_2 = a+b'i$,其中 $b' = b+2\pi$。显然 $z_1 \neq z_2$
  • $f(z_1) = e^a e^{ib}$
  • $f(z_2) = e^a e^{i(b+2\pi)} = e^a e^{ib} e^{i2\pi} = e^a e^{ib} \cdot 1 = f(z_1)$
  • 我们找到了两个不同的输入 $z_1$$z_2=z_1+2\pi i$,它们的输出是相同的。
  • 因此,$f(z)=e^z$ 不是单射的。它具有以 $2\pi i$ 为周期的周期性。
  • 满射性:
  • $f$满射的吗?即对于任意 $w \in \mathbb{C}$,方程 $e^z=w$ 总有解吗?
  • 从上面的分析我们看到,如果 $w=0$,那么 $r=0$$e^a=0$ 无解。
  • 这意味着 0 不在函数 $f(z)=e^z$值域中。
  • 既然目标空间 $\mathbb{C}$ 包含 0,而 $f$值域不包含 0,那么 $f$ 不是满射的。
  • Im f (f 的像集):
  • 像集 (Image) 就是函数所有可能输出值的集合
  • 从我们的分析中,对于任何非零的复数 $w=re^{i\theta}$ ($r>0$),我们都能找到一个 $z = \ln(r)+i\theta$ 使得 $e^z=w$
  • $w=0$ 是无法达到的。
  • 所以,$f(z)=e^z$像集是所有非零复数集合
  • $\operatorname{Im}(f) = \mathbb{C} - \{0\} = \mathbb{C}^*$
∑ [公式拆解]
  • $f_n(z)=z^n$: $n$次幂函数
  • $f(z)=e^z$: 复指数函数
  • $e^{a+bi} = e^a \cdot e^{bi} = e^a(\cos b + i\sin b)$: 复指数函数的定义,基于实数指数函数和欧拉公式。
  • $\operatorname{Im} f$: 函数 $f$像集值域,是 $\text{Image}(f)$ 的简写。
💡 [数值示例]

(i) 幂函数

  • 非单射: $f_4(z)=z^4$
  • $f_4(i) = i^4 = (i^2)^2 = (-1)^2 = 1$
  • $f_4(1) = 1^4 = 1$
  • 输入 $i \neq 1$,但输出相同。所以非单射
  • 满射: 求解 $z^3 = 8i$
  • $w=8i$。模 $r=8$,角度 $\theta=\pi/2$
  • $8i = 8 e^{i(\pi/2+2k\pi)}$
  • $z=se^{i\phi}$$s^3=8 \implies s=2$$3\phi=\pi/2+2k\pi \implies \phi=\pi/6+2k\pi/3$
  • $k=0$: $z_0 = 2e^{i\pi/6} = 2(\cos(\pi/6)+i\sin(\pi/6)) = 2(\frac{\sqrt{3}}{2}+i\frac{1}{2}) = \sqrt{3}+i$
  • 我们可以验证 $(\sqrt{3}+i)^3 = 8i$

(ii) 指数函数

  • 求解 $e^z = 1+i$:
  • $w=1+i$。模 $r=\sqrt{2}$,角度 $\theta=\pi/4$
  • $a = \ln(r) = \ln(\sqrt{2}) = \frac{1}{2}\ln 2$
  • $b = \theta+2k\pi = \pi/4+2k\pi$
  • 所以所有解为 $z = \frac{1}{2}\ln 2 + i(\frac{\pi}{4}+2k\pi)$ for $k \in \mathbb{Z}$
  • 非单射:
  • $f(i\pi) = e^{i\pi} = -1$
  • $f(i3\pi) = e^{i3\pi} = e^{i\pi}e^{i2\pi} = -1 \cdot 1 = -1$
  • $i\pi \neq i3\pi$,但输出相同。
⚠️ [易错点]
  1. (i) $n=1$单射的特殊情况,容易被忽略。
  2. (i) 满射性依赖于代数基本定理,或复数开任意次方的能力。要与实数中的情况区分,例如 $x^2=-1$ 在实数中无解,但在复数中有解。
  3. (ii) 复指数实指数性质的差异:实指数函数 $e^x$单射的,但复指数函数 $e^z$ 是周期函数,不是单射的。
  4. (ii) $e^z$ 的值永远不为0。这是复分析中的一个重要定理 (Picard小定理的特例),也是和实指数函数 $e^x$ 相同的性质。这导致了它不是满射$\mathbb{C}$ 的。
  5. (ii) 复对数 $\log(z)$ 是一个多值函数,因为指数函数的周期性。这是复分析和实分析的另一个关键区别。
📝 [总结]
  1. (i) 幂函数 $f_n(z)=z^n$复数域上,当 $n=1$ 时是双射(实际是恒等函数)。当 $n>1$ 时,它既不是单射(多对一)又是满射的(任何复数都能作为其输出)。
  2. (ii) 指数函数 $f(z)=e^z$复数域上,不是单射的(以 $2\pi i$ 为周期),也不是满射的(值域不包含0)。它的像集是所有非零复数 $\mathbb{C}^*$。求解 $e^z=w$ dẫn đến khái niệm 复对数,它是一个多值函数
🎯 [存在目的]
  1. 对比实函数和复函数: 这道题旨在揭示从实数域 $\mathbb{R}$ 扩展到复数$\mathbb{C}$ 后,一些基本函数(幂函数指数函数)的性质发生的巨大变化。例如 $z^n$ 变得满射,而 $e^z$ 失去了单射性。
  2. 理解基本复变函数: 幂函数指数函数复变函数理论的基石。理解它们的映射性质(如单射性、满射性、周期性、值域)是学习复分析的前提。
  3. 代数基本定理的应用: 再次强调代数基本定理复数域中的普适性和强大威力。
  4. 引入多值函数: 通过求解 $e^z=w$ 引入了复对数的多值性,这是复分析中一个核心且深刻的概念,与黎曼面等高级思想有关。
🧠 [直觉心智模型]
  1. $f_n(z)=z^n$:
  2. 极坐标下,$z=re^{i\theta} \mapsto z^n = r^n e^{in\theta}$
  3. 这个映射将复平面上的一个点,模变为 $r^n$,角度变为 $n\theta$
  4. 非单射:角度为 $\theta, \theta+2\pi/n, \theta+4\pi/n, \dots$ 的点,乘以 $n$ 之后角度都变成了 $n\theta$,所以它们会被映射到同一个方向。这就像把一个圆形披萨切成 $n$ 块,然后把这 $n$ 块叠在一起。
  5. 满射:任何一个目标点 $w=Re^{i\phi}$,我总能找到一个源点,它的模是 $R^{1/n}$,角度是 $\phi/n$
  6. $f(z)=e^z$:
  7. $z=a+bi \mapsto e^a e^{ib}$
  8. 这个映射将复平面上的一个点 $(a,b)$ 映射到另一个点,其模为 $e^a$,角度为 $b$
  9. 非单射:输入点在垂直方向上移动 $2\pi$(从 $a+bi$$a+b(i+2\pi)$),$a$ 不变,$b$ 变成 $b+2\pi$。输出的模 $e^a$ 不变,角度 $b$ 变成 $b+2\pi$,这代表同一个角度。所以输出不变。
  10. 非满射:输出的模是 $e^a$。因为 $a$ 是实数,所以 $e^a$ 永远是正数。输出的模永远不可能是0。所以原点 $(0,0)$ 永远无法被达到。
💭 [直观想象]
  1. $f(z)=z^2$: 想象复平面是一张无限大的纸。这个函数把整张纸“对折”了一下。右半平面(实部>0)被映射到整个平面(除了正实轴),左半平面也被映射到整个平面。每个点(除了原点)都有两个“原像”。比如 4 的原像是 2 和 -2。$i$ 的原像是 $\frac{\sqrt{2}}{2}(1+i)$$-\frac{\sqrt{2}}{2}(1+i)$
  2. $f(z)=e^z$: 想象 $z$ 平面是一个无限的水平条带区域,高度为 $2\pi$ (例如从 $y=0$$y=2\pi$)。$e^z$ 函数会把这个无限长的条带“展开”,映射到整个 $w$ 平面(除了原点)。$z$ 平面中,在这个条带上方和下方的其他条带,也都会被重复地映射到同一个 $w$ 平面。这就解释了它的周期性。
121.25. 习题 1.25

📜 [原文12]

(i) 计算 $\left(\begin{array}{ll}1 & 2 \\ 3 & 4\end{array}\right) \cdot\left(\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right)$ 以及 $\left(\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right) \cdot\left(\begin{array}{ll}1 & 2 \\ 3 & 4\end{array}\right)$。它们相同吗?

(ii) 计算 $\left(\begin{array}{ll}1 & 2 \\ 1 & 2\end{array}\right) \cdot\left(\begin{array}{cc}-2 & 6 \\ 1 & -3\end{array}\right)$。这两个因子中任何一个有逆矩阵吗?

📖 [逐步解释]

这道题考察矩阵乘法的基本计算和两个重要性质:交换律可逆性

(i) 矩阵乘法与交换律

矩阵乘法的规则:结果矩阵的第 $i$ 行第 $j$ 列的元素,是第一个矩阵的第 $i$ 行与第二个矩阵的第 $j$ 列对应元素相乘再求和的结果。

$(AB)_{ij} = \sum_k A_{ik} B_{kj}$

1. 计算第一个乘积:

$A = \begin{pmatrix}1 & 2 \\ 3 & 4\end{pmatrix}$$B = \begin{pmatrix}1 & -1 \\ 1 & 1\end{pmatrix}$。计算 $A \cdot B$

  • 结果 (1,1) 位置: A的第一行 (1, 2) $\cdot$ B的第一列 (1, 1) $= 1 \cdot 1 + 2 \cdot 1 = 1+2=3$
  • 结果 (1,2) 位置: A的第一行 (1, 2) $\cdot$ B的第二列 (-1, 1) $= 1 \cdot (-1) + 2 \cdot 1 = -1+2=1$
  • 结果 (2,1) 位置: A的第二行 (3, 4) $\cdot$ B的第一列 (1, 1) $= 3 \cdot 1 + 4 \cdot 1 = 3+4=7$
  • 结果 (2,2) 位置: A的第二行 (3, 4) $\cdot$ B的第二列 (-1, 1) $= 3 \cdot (-1) + 4 \cdot 1 = -3+4=1$
  • 所以,$\left(\begin{array}{ll}1 & 2 \\ 3 & 4\end{array}\right) \cdot\left(\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right) = \left(\begin{array}{ll}3 & 1 \\ 7 & 1\end{array}\right)$

2. 计算第二个乘积:

现在计算 $B \cdot A$

  • 结果 (1,1) 位置: B的第一行 (1, -1) $\cdot$ A的第一列 (1, 3) $= 1 \cdot 1 + (-1) \cdot 3 = 1-3=-2$
  • 结果 (1,2) 位置: B的第一行 (1, -1) $\cdot$ A的第二列 (2, 4) $= 1 \cdot 2 + (-1) \cdot 4 = 2-4=-2$
  • 结果 (2,1) 位置: B的第二行 (1, 1) $\cdot$ A的第一列 (1, 3) $= 1 \cdot 1 + 1 \cdot 3 = 1+3=4$
  • 结果 (2,2) 位置: B的第二行 (1, 1) $\cdot$ A的第二列 (2, 4) $= 1 \cdot 2 + 1 \cdot 4 = 2+4=6$
  • 所以,$\left(\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right) \cdot\left(\begin{array}{ll}1 & 2 \\ 3 & 4\end{array}\right) = \left(\begin{array}{cc}-2 & -2 \\ 4 & 6\end{array}\right)$

3. 比较结果:

  • 第一个结果是 $\begin{pmatrix}3 & 1 \\ 7 & 1\end{pmatrix}$
  • 第二个结果是 $\begin{pmatrix}-2 & -2 \\ 4 & 6\end{pmatrix}$
  • 这两个矩阵显然不相同。
  • 结论: 它们不相同。这表明矩阵乘法在一般情况下是不可交换的。即 $AB \neq BA$

(ii) 零因子与矩阵的可逆性

1. 计算乘积:

$C = \begin{pmatrix}1 & 2 \\ 1 & 2\end{pmatrix}$$D = \begin{pmatrix}-2 & 6 \\ 1 & -3\end{pmatrix}$。计算 $C \cdot D$

  • 结果 (1,1) 位置: (1, 2) $\cdot$ (-2, 1) $= 1(-2)+2(1) = -2+2=0$
  • 结果 (1,2) 位置: (1, 2) $\cdot$ (6, -3) $= 1(6)+2(-3) = 6-6=0$
  • 结果 (2,1) 位置: (1, 2) $\cdot$ (-2, 1) $= 1(-2)+2(1) = -2+2=0$
  • 结果 (2,2) 位置: (1, 2) $\cdot$ (6, -3) $= 1(6)+2(-3) = 6-6=0$
  • 所以,$\left(\begin{array}{ll}1 & 2 \\ 1 & 2\end{array}\right) \cdot\left(\begin{array}{cc}-2 & 6 \\ 1 & -3\end{array}\right) = \left(\begin{array}{ll}0 & 0 \\ 0 & 0\end{array}\right)$
  • 结果是零矩阵

2. 判断因子是否有逆矩阵:

  • 一个 $n \times n$ 的方阵 $M$逆矩阵充要条件是它的行列式 $\det(M)$ 不为零。
  • 对于一个 $2 \times 2$ 矩阵 $\begin{pmatrix}a & b \\ c & d\end{pmatrix}$,其行列式$ad-bc$
  • 判断矩阵 C 的可逆性:
  • $C = \begin{pmatrix}1 & 2 \\ 1 & 2\end{pmatrix}$
  • $\det(C) = 1 \cdot 2 - 2 \cdot 1 = 2-2=0$
  • 因为行列式为0,所以矩阵 $C$ 没有逆矩阵。这样的矩阵被称为奇异矩阵退化矩阵
  • 判断矩阵 D 的可逆性:
  • $D = \begin{pmatrix}-2 & 6 \\ 1 & -3\end{pmatrix}$
  • $\det(D) = (-2) \cdot (-3) - 6 \cdot 1 = 6-6=0$
  • 因为行列式为0,所以矩阵 $D$ 也没有逆矩阵
  • 结论: 两个因子都没有逆矩阵
  • 深层联系: 这个例子说明,两个非零的矩阵相乘,结果可以是零矩阵。这和我们在 $\mathbb{Z}/12\mathbb{Z}$ 中看到的 $[3]\cdot[4]=[0]$ 类似。在矩阵环中,这些不可逆的矩阵 (奇异矩阵) 扮演了零因子的角色。如果一个矩阵 $M$零因子 (即存在非零矩阵 $N$ 使得 $MN=0$$NM=0$),那么它必然是不可逆的。证明:如果 $M$ 可逆,存在 $M^{-1}$,那么 $M^{-1}(MN) = M^{-1}0 \implies (M^{-1}M)N=0 \implies IN=0 \implies N=0$,这与 $N$ 非零矛盾。
∑ [公式拆解]
  • $\left(\begin{array}{ll}a & b \\ c & d\end{array}\right) \cdot \left(\begin{array}{ll}e & f \\ g & h\end{array}\right) = \left(\begin{array}{ll}ae+bg & af+bh \\ ce+dg & cf+dh\end{array}\right)$: $2 \times 2$ 矩阵乘法公式。
  • $\det\left(\begin{array}{ll}a & b \\ c & d\end{array}\right) = ad-bc$: $2 \times 2$ 矩阵行列式公式。
💡 [数值示例]

题目本身就是具体的数值计算。这里补充一个。

示例1 (不可交换):

  • $A=\begin{pmatrix}1&0\\1&1\end{pmatrix}, B=\begin{pmatrix}1&1\\0&1\end{pmatrix}$
  • $AB = \begin{pmatrix}1&0\\1&1\end{pmatrix}\begin{pmatrix}1&1\\0&1\end{pmatrix} = \begin{pmatrix}1&1\\1&2\end{pmatrix}$
  • $BA = \begin{pmatrix}1&1\\0&1\end{pmatrix}\begin{pmatrix}1&0\\1&1\end{pmatrix} = \begin{pmatrix}2&1\\1&1\end{pmatrix}$
  • $AB \neq BA$

示例2 (零因子):

  • $A=\begin{pmatrix}1&1\\1&1\end{pmatrix}, B=\begin{pmatrix}1&-1\\-1&1\end{pmatrix}$
  • $AB = \begin{pmatrix}1&1\\1&1\end{pmatrix}\begin{pmatrix}1&-1\\-1&1\end{pmatrix} = \begin{pmatrix}1-1 & -1+1 \\ 1-1 & -1+1\end{pmatrix} = \begin{pmatrix}0&0\\0&0\end{pmatrix}$
  • $\det(A) = 1-1=0$$\det(B)=1-1=0$。两者都不可逆。
⚠️ [易错点]
  1. 乘法顺序: 矩阵乘法 $A \cdot B$ 中,A的行乘以B的列,顺序不能错。
  2. 交换律的误用: 习惯了实数乘法交换律的学生,可能会不假思索地认为矩阵乘法也是可交换的,这是一个根本性的错误。只有在非常特殊的情况下(例如,一个矩阵与它的逆矩阵、单位矩阵,或者两个都是对角矩阵等),矩阵乘法才是可交换的。
  3. 判断可逆性: 对于小矩阵,计算行列式是判断可逆性的最快方法。对于大矩阵,可以通过高斯消元看是否能化为单位矩阵来判断。
  4. 零因子: 看到 $AB=0$ 不要想当然地认为 $A=0$$B=0$。这个性质只在整环(如整数、实数、复数)中成立。矩阵环不是一个整环
📝 [总结]
  1. (i) 通过一个具体的 $2 \times 2$ 矩阵计算,清晰地展示了矩阵乘法是不可交换的。
  2. (ii) 通过另一个例子,展示了两个非零矩阵的乘积可以是零矩阵,并揭示了这与矩阵可逆性(或奇异性)有关:这些作为零因子矩阵,其行列式都为零,因此它们都是不可逆的。
🎯 [存在目的]
  1. 练习基本运算: 确保学生掌握矩阵乘法行列式的计算。
  2. 建立核心概念: 引入矩阵代数的两个最核心、最反直觉的性质:
  1. 非交换性: 这是矩阵作为线性变换复合的必然结果。先旋转再拉伸,和先拉伸再旋转,结果通常不同。
  2. 存在零因子: 这说明矩阵的世界比实数或复数的世界更“奇怪”,某些非零矩阵没有乘法逆元
    • 为群论铺垫: 一般线性群 $GL_n(\mathbb{R})$ (所有可逆 $n \times n$ 矩阵集合) 是群论中最重要的例子之一。理解矩阵可逆性是理解这个的入场券。非交换性也使得 $GL_n(\mathbb{R})$ (当 $n>1$) 成为一个典型的非阿贝尔群
🧠 [直觉心智模型]
  1. 把一个 $2 \times 2$ 矩阵看作对二维平面的一种线性变换(如旋转、缩放、剪切、反射)。
  2. 矩阵乘法 $A \cdot B$ 对应于变换复合:先做 $B$ 变换,再做 $A$ 变换
  3. (i) 非交换性:
  4. $A$ 可能是“沿y轴拉伸2倍”,$B$ 可能是“旋转45度”。
  5. 先旋转再拉伸,与先拉伸再旋转,一个点最终到达的位置是不同的。这就是 $AB \neq BA$ 的几何解释。
  6. (ii) 零因子与不可逆:
  7. 一个不可逆的矩阵(奇异矩阵)是一个“降维”变换。例如,本题中的矩阵 $C = \begin{pmatrix}1 & 2 \\ 1 & 2\end{pmatrix}$ 会把整个二维平面“压扁”到直线 $y=x$ 上。因为它的两行是线性相关的,$C(x,y) = (x+2y, x+2y)$
  8. 矩阵 $D = \begin{pmatrix}-2 & 6 \\ 1 & -3\end{pmatrix}$ 也会把平面压扁到另一条直线上。
  9. $C \cdot D = 0$ 的几何意义是:$D$ 变换先把整个平面压到某条过原点的直线 $L$ 上,然后 $C$ 变换作用在这条直线 $L$ 上时,恰好把 $L$ 上的所有点都变换到了原点。这说明直线 $L$ 位于 $C$ 变换的“零空间”中。
💭 [直观想象]
  1. (i) 想象你有一张照片。
  2. 操作A: 将照片横向拉伸一倍。
  3. 操作B: 将照片旋转90度。
  4. $A \cdot B$: 先旋转90度,变成竖的,再横向拉伸,照片会变“胖”。
  5. $B \cdot A$: 先横向拉伸,照片变“宽”,再旋转90度,照片会变“高”。
  6. 最终得到的两张照片形状不同。
  7. (ii) 想象一个投影仪。
  8. 矩阵 $C$ 就像一个投影仪,它把三维空间中的物体投影到二维的幕布上。这是一个降维操作,信息丢失了,所以不可逆(你无法从二维的投影完美恢复三维的物体)。
  9. $C \cdot D = 0$矩阵 $D$ 先把一个物体变成另一个物体,然后矩阵 $C$ 这个投影仪再去看这个新物体时,发现它恰好在投影仪的“盲点”里,投影出来一片漆黑(零矩阵)。
131.26. 习题 1.26

📜 [原文13]

如果矩阵 $A \in \mathbb{M}_{n}(\mathbb{R})$对称的,则 ${ }^{t} A=A$。通过一个例子证明两个 $2 \times 2$ 对称矩阵乘积不一定是对称的。

📖 [逐步解释]

这道题要求我们验证一个关于对称矩阵乘法的性质。

  1. 理解对称矩阵:
    • 一个方阵 $A$对称的,如果它等于它自身的转置 ($A = {}^tA$)。
    • 转置操作就是将矩阵的行和列互换,即 $({}^tA)_{ij} = A_{ji}$
    • 对于一个 $2 \times 2$ 矩阵 $\begin{pmatrix} a & b \\ c & d \end{pmatrix}$,它的转置$\begin{pmatrix} a & c \\ b & d \end{pmatrix}$
    • 要使它成为对称矩阵,必须 $b=c$。所以任何 $2 \times 2$ 对称矩阵都具有 $\begin{pmatrix} a & b \\ b & d \end{pmatrix}$ 的形式。主对角线上的元素 $a,d$ 可以任意,但副对角线上的两个元素必须相等。
  2. 问题的核心:
    • 我们要证明的命题是:“对称矩阵集合矩阵乘法下不是封闭的”。
    • 换句话说,取两个对称矩阵 $A$$B$ ($A={}^tA, B={}^tB$),它们的乘积 $AB$ 不一定还是对称的。
    • 要证明 $AB$对称的,我们需要验证 $(AB) = {}^t(AB)$
    • 我们知道转置的性质: ${}^t(AB) = {}^tB \cdot {}^tA$
    • 因为 $A, B$对称的,所以 ${}^tA=A, {}^tB=B$
    • 所以 ${}^t(AB) = B \cdot A$
    • 因此,要使 $AB$ 成为对称矩阵,我们必须有 $AB = {}^t(AB) = BA$
    • 也就是说,两个对称矩阵的乘积是对称的,当且仅当这两个矩阵是可交换的 ($AB=BA$)。
    • 我们在上一个习题中已经知道,矩阵乘法通常是不可交换的。所以我们只需要找到两个不可交换的对称矩阵,就能构造出反例。
  3. 构造例子:
    • 我们需要找两个 $2 \times 2$对称矩阵 $A$$B$,计算它们的乘积 $AB$,然后检查 $AB$ 是否对称
    • 让我们选取简单的、非对角的对称矩阵
    • $A = \begin{pmatrix} 1 & 2 \\ 2 & 3 \end{pmatrix}$。这是一个对称矩阵
    • $B = \begin{pmatrix} 4 & 5 \\ 5 & 6 \end{pmatrix}$。这也是一个对称矩阵
    • 现在计算它们的乘积 $AB$:
    • (1,1)位置: $1 \cdot 4 + 2 \cdot 5 = 4+10=14$
    • (1,2)位置: $1 \cdot 5 + 2 \cdot 6 = 5+12=17$
    • (2,1)位置: $2 \cdot 4 + 3 \cdot 5 = 8+15=23$
    • (2,2)位置: $2 \cdot 5 + 3 \cdot 6 = 10+18=28$
    • 所以 $AB = \begin{pmatrix} 14 & 17 \\ 23 & 28 \end{pmatrix}$
    • 现在检查 $AB$ 是否是对称矩阵
    • 一个矩阵对称的,当且仅当它的 $(1,2)$ 位置的元素等于 $(2,1)$ 位置的元素。
    • 在这个结果中,$(1,2)$ 位置是 17,$(2,1)$ 位置是 23。
    • 因为 $17 \neq 23$,所以这个结果矩阵不是对称的。
    • 我们成功地找到了一个反例。
∑ [公式拆解]
  • ${}^t A$: 矩阵 $A$转置 (transpose)。有时也记作 $A^T$$A'$
  • ${}^t A = A$: 定义对称矩阵的公式。
  • ${}^t(AB) = {}^tB \cdot {}^tA$: 矩阵乘积转置等于转置反向乘积。这是转置操作的一个关键性质。
💡 [数值示例]

题目本身就是要求举一个例子。除了正文中使用的例子,我们还可以举一个更简单的。

示例2:

  • $A = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}$。这是对称的。
  • $B = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$。这也是对称的。
  • 计算 $AB$:

$AB = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}$

  • 这个结果矩阵$(1,2)$ 元素是 1,$(2,1)$ 元素是 0。它们不相等,所以结果不是对称的。
  • 我们再计算 $BA$ 来验证不可交换性:

$BA = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} = \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}$

  • 确实 $AB \neq BA$,所以乘积不是对称的,这与我们的理论分析一致。
⚠️ [易错点]
  1. 特殊情况: 如果不加思考地选择矩阵,可能会碰巧选到可交换的例子,从而无法构成反例。
  2. 例如,如果 $A$ 是单位矩阵 $I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (对称),那么 $IB=B$$BI=B$,乘积总是对称的。
  3. 如果 $A$$B$ 都是对角矩阵(例如 $A=\begin{pmatrix}1&0\\0&2\end{pmatrix}, B=\begin{pmatrix}3&0\\0&4\end{pmatrix}$),它们是可交换的,乘积也是对角矩阵,因此也是对称的。
  4. 结论的误解: 这道题不是说对称矩阵的乘积永远不对称,而是说“不一定”是对称的。要找到一个“不对称”的例子就足以证明这个命题。
  5. 加法 vs 乘法: 对称矩阵集合矩阵加法下是封闭的。如果 $A, B$对称的,则 ${}^t(A+B) = {}^tA + {}^tB = A+B$,所以 $A+B$ 也是对称的。不要把加法和乘法的性质混淆。
📝 [总结]
  1. 本题通过构造一个具体的反例,证明了对称矩阵集合对于矩阵乘法是不封闭的。
  2. 其根本原因在于矩阵乘法的不可交换性,以及乘积的转置等于转置反向乘积 (${}^t(AB)={}^tB{}^tA$) 这一性质。
  3. 两个对称矩阵 $A, B$ 的乘积 $AB$对称的,当且仅当 $A$$B$ 可交换 ($AB=BA$)。
🎯 [存在目的]
  1. 检验对性质的理解: 这道题不仅仅是计算,更是检验学生是否理解对称转置的定义和性质,特别是 ${}^t(AB) = {}^tB {}^tA$ 这一关键规则。
  2. 理解“封闭性”: “封闭性”是代数结构(如向量空间)的基本概念。一个集合在一个运算下是否封闭,决定了它是否能构成一个独立的代数世界。此题表明,所有 $n \times n$ 对称矩阵集合在乘法下不能构成一个半群
  3. 培养举反例的能力: 在数学中,证明一个普适性命题是错误的,只需要举出一个反例即可。这是一种重要的数学思维和证明技巧。
  4. 引出更深的结构: 虽然对称矩阵在乘法下不封闭,但它们在其他方面有非常重要的性质(例如,所有特征值都是实数,总能被正交对角化),并且与其他代数结构李代数约当代数有关。
🧠 [直觉心智模型]
  1. 对称矩阵对应于自伴随线性变换。在几何上,它们通常代表在某些正交方向上的拉伸或压缩,而没有旋转或剪切的成分。
  2. 乘积不一定对称:
  3. 变换 $B$ 是在某组正交基上的拉伸。
  4. 变换 $A$ 是在另一组不同的正交基上的拉伸。
  5. 先做 $B$ 再做 $A$,相当于先按一组轴线拉伸,再按另一组旋转过的轴线拉伸。这个复合的变换过程很可能会引入“剪切”的成分,使得最终的变换不再是纯粹的拉伸,从而不再是对称的。
💭 [直观想象]
  1. 想象你有一块方形的、质地均匀的海绵。
  2. 对称变换A: 沿水平和垂直方向拉伸它。它变成一个矩形,但轴线还是水平和垂直的。
  3. 对称变换B: 沿对角线方向拉伸它。它变成一个菱形。
  4. 现在考虑复合变换。
  5. 如果你先执行变换B,把海绵变成菱形,然后再执行变换A,对这个菱形进行水平和垂直的拉伸,最终的形状很可能是一个没有对称轴的普通平行四边形。这个最终的形变就不再是对称的了。
141.27. 习题 1.27

📜 [原文14]

以下哪些矩阵 (i) 属于 $G L_{2}(\mathbb{R})$;(ii) 属于 $S L_{2}(\mathbb{R})$;(iii) 属于 $O_{2}(\mathbb{R})$;(iv) 属于 $S O_{2}(\mathbb{R})$

$$ \left(\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right) ; \quad\left(\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right) ; \quad\left(\begin{array}{cc} 2 & 3 \\ -3 & 2 \end{array}\right) ; \quad\left(\begin{array}{cc} 4 & 5 \\ 1 & 1 \end{array}\right) ; \quad\left(\begin{array}{cc} 1 & 1 \\ 0 & 1 \end{array}\right) ; \quad\left(\begin{array}{cc} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \end{array}\right) . $$

注意:你可以假设包含关系 $S O_{2}(\mathbb{R}) \subseteq S L_{2}(\mathbb{R}) \subseteq G L_{2}(\mathbb{R})$$O_{2}(\mathbb{R}) \subseteq G L_{2}(\mathbb{R})$

最后,验证 $A=\left(\begin{array}{ccc}\frac{1}{\sqrt{6}} & -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{6}} & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} \\ \frac{2}{\sqrt{6}} & 0 & -\frac{1}{\sqrt{3}}\end{array}\right)$ 是一个正交矩阵

📖 [逐步解释]

这道题要求我们将给定的矩阵归类到不同的矩阵群中,并验证一个 $3 \times 3$ 矩阵正交性

第一部分:矩阵分类

首先,我们需要明确各个矩阵群的定义:

  • $GL_n(\mathbb{R})$ (一般线性群): 所有 $n \times n$可逆实数矩阵集合。条件是 $\det(A) \neq 0$
  • $SL_n(\mathbb{R})$ (特殊线性群): $GL_n(\mathbb{R})$ 的一个子群,要求行列式恰好为 1。条件是 $\det(A) = 1$
  • $O_n(\mathbb{R})$ (正交群): $GL_n(\mathbb{R})$ 的一个子群,其元素为所有正交矩阵。条件是 $A^T A = I$ (或者等价地 $A^{-1}=A^T$)。这个条件蕴含了 $\det(A) = \pm 1$。对于 $2 \times 2$ 矩阵,这意味着它的列向量标准正交的(即它们都是单位向量,且相互垂直)。
  • $SO_n(\mathbb{R})$ (特殊正交群): $O_n(\mathbb{R})$$SL_n(\mathbb{R})$ 的交集。即行列式为 1 的正交矩阵。这些矩阵在几何上对应于“保向的刚体运动”(即旋转)。

现在我们逐个分析给定的 $2 \times 2$ 矩阵

  1. $A_1 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (单位矩阵 I)
    • $\det(A_1) = 1 \cdot 1 - 0 \cdot 0 = 1$
    • 因为 $\det \neq 0$,所以属于 $GL_2(\mathbb{R})$
    • 因为 $\det = 1$,所以属于 $SL_2(\mathbb{R})$
    • $A_1^T A_1 = I \cdot I = I$。所以是正交矩阵,属于 $O_2(\mathbb{R})$
    • 正交矩阵$\det=1$,所以属于 $SO_2(\mathbb{R})$
    • 结论: 属于所有四个群。
  2. $A_2 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$ (置换矩阵)
    • $\det(A_2) = 0 \cdot 0 - 1 \cdot 1 = -1$
    • 因为 $\det \neq 0$,属于 $GL_2(\mathbb{R})$
    • 因为 $\det \neq 1$,不属于 $SL_2(\mathbb{R})$ (因此也不属于 $SO_2(\mathbb{R})$)。
    • 向量$(0,1)$$(1,0)$。它们的长度都是1,它们的点积是 $0 \cdot 1 + 1 \cdot 0 = 0$,所以它们是标准正交的。因此 $A_2$正交矩阵。属于 $O_2(\mathbb{R})$
    • 结论: 属于 $GL_2(\mathbb{R})$$O_2(\mathbb{R})$
  3. $A_3 = \begin{pmatrix} 2 & 3 \\ -3 & 2 \end{pmatrix}$
    • $\det(A_3) = 2 \cdot 2 - 3 \cdot (-3) = 4 + 9 = 13$
    • 因为 $\det \neq 0$,属于 $GL_2(\mathbb{R})$
    • 因为 $\det \neq 1$,不属于 $SL_2(\mathbb{R})$
    • 向量$(2,-3)$。它的长度的平方是 $2^2+(-3)^2 = 13 \neq 1$。所以它不是正交矩阵。不属于 $O_2(\mathbb{R})$
    • 结论: 只属于 $GL_2(\mathbb{R})$
    • (注:这个矩阵可以写成 $\sqrt{13} \begin{pmatrix} 2/\sqrt{13} & 3/\sqrt{13} \\ -3/\sqrt{13} & 2/\sqrt{13} \end{pmatrix}$,是一个旋转和一个缩放的复合。)
  4. $A_4 = \begin{pmatrix} 4 & 5 \\ 1 & 1 \end{pmatrix}$
    • $\det(A_4) = 4 \cdot 1 - 5 \cdot 1 = -1$
    • 因为 $\det \neq 0$,属于 $GL_2(\mathbb{R})$
    • 因为 $\det \neq 1$,不属于 $SL_2(\mathbb{R})$
    • 向量$(4,1)$。它的长度的平方是 $4^2+1^2=17 \neq 1$。所以不是正交矩阵
    • 结论: 只属于 $GL_2(\mathbb{R})$
  5. $A_5 = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$ (剪切矩阵)
    • $\det(A_5) = 1 \cdot 1 - 1 \cdot 0 = 1$
    • 因为 $\det \neq 0$,属于 $GL_2(\mathbb{R})$
    • 因为 $\det = 1$,属于 $SL_2(\mathbb{R})$
    • 向量$(1,0)$$(1,1)$。第二个向量的长度是 $\sqrt{1^2+1^2}=\sqrt{2} \neq 1$。所以不是正交矩阵。不属于 $O_2(\mathbb{R})$
    • 结论: 属于 $GL_2(\mathbb{R})$$SL_2(\mathbb{R})$
  6. $A_6 = \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \end{pmatrix}$
    • $\det(A_6) = \frac{1}{\sqrt{2}}(-\frac{1}{\sqrt{2}}) - \frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}} = -\frac{1}{2} - \frac{1}{2} = -1$
    • 属于 $GL_2(\mathbb{R})$
    • 不属于 $SL_2(\mathbb{R})$
    • 向量$\mathbf{c}_1 = (\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})$$\mathbf{c}_2 = (\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}})$
    • $|\mathbf{c}_1|^2 = (\frac{1}{\sqrt{2}})^2 + (\frac{1}{\sqrt{2}})^2 = 1/2+1/2=1$
    • $|\mathbf{c}_2|^2 = (\frac{1}{\sqrt{2}})^2 + (-\frac{1}{\sqrt{2}})^2 = 1/2+1/2=1$
    • $\mathbf{c}_1 \cdot \mathbf{c}_2 = \frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}} + \frac{1}{\sqrt{2}}(-\frac{1}{\sqrt{2}}) = 1/2-1/2=0$
    • 向量标准正交的,所以是正交矩阵。属于 $O_2(\mathbb{R})$
    • 结论: 属于 $GL_2(\mathbb{R})$$O_2(\mathbb{R})$。(这是关于 $y=x$ 这条线的反射变换)

第二部分:验证 $3 \times 3$ 矩阵的正交性

一个矩阵 $A$正交的,当且仅当它的所有列(或所有行)构成一组标准正셔틀버스 (orthonormal basis)。这意味着:

  1. 每个列向量的长度(模)都是 1 (单位向量)。
  2. 任意两个不同的列向量相互垂直(它们的点积为 0)。

给定的矩阵是 $A=\left(\begin{array}{ccc}\frac{1}{\sqrt{6}} & -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{6}} & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}}

\\frac{2}{\sqrt{6}} & 0 & -\frac{1}{\sqrt{3}}\end{array}\right)$ 是一个正交矩阵

一个矩阵 $A$正交的,当且仅当它的所有列(或所有行)构成一组标准正交基 (orthonormal basis)。这意味着:

  1. 每个列向量的长度(模)都是 1 (单位向量)。
  2. 任意两个不同的列向量相互垂直(它们的点积为 0)。

我们来验证 $A$ 的三个列向量 $\mathbf{c}_1, \mathbf{c}_2, \mathbf{c}_3$ 是否满足这两个条件。

$\mathbf{c}_{1}=\left(\begin{array}{c}\frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{6}} \\ \frac{2}{\sqrt{6}}\end{array}\right)$, $\mathbf{c}_{2}=\left(\begin{array}{c}-\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \\ 0\end{array}\right)$, $\mathbf{c}_{3}=\left(\begin{array}{c}\frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{3}} \\ -\frac{1}{\sqrt{3}}\end{array}\right)$

1. 检查长度

  • $|\mathbf{c}_1|^2 = (\frac{1}{\sqrt{6}})^2 + (\frac{1}{\sqrt{6}})^2 + (\frac{2}{\sqrt{6}})^2 = \frac{1}{6} + \frac{1}{6} + \frac{4}{6} = \frac{6}{6} = 1$。所以 $|\mathbf{c}_1|=1$
  • $|\mathbf{c}_2|^2 = (-\frac{1}{\sqrt{2}})^2 + (\frac{1}{\sqrt{2}})^2 + 0^2 = \frac{1}{2} + \frac{1}{2} + 0 = 1$。所以 $|\mathbf{c}_2|=1$
  • $|\mathbf{c}_3|^2 = (\frac{1}{\sqrt{3}})^2 + (\frac{1}{\sqrt{3}})^2 + (-\frac{1}{\sqrt{3}})^2 = \frac{1}{3} + \frac{1}{3} + \frac{1}{3} = \frac{3}{3} = 1$。所以 $|\mathbf{c}_3|=1$

所有列向量都是单位向量

2. 检查正交性(点积为0)

  • $\mathbf{c}_1 \cdot \mathbf{c}_2 = (\frac{1}{\sqrt{6}})(-\frac{1}{\sqrt{2}}) + (\frac{1}{\sqrt{6}})(\frac{1}{\sqrt{2}}) + (\frac{2}{\sqrt{6}})(0) = -\frac{1}{\sqrt{12}} + \frac{1}{\sqrt{12}} + 0 = 0$
  • $\mathbf{c}_1 \cdot \mathbf{c}_3 = (\frac{1}{\sqrt{6}})(\frac{1}{\sqrt{3}}) + (\frac{1}{\sqrt{6}})(\frac{1}{\sqrt{3}}) + (\frac{2}{\sqrt{6}})(-\frac{1}{\sqrt{3}}) = \frac{1}{\sqrt{18}} + \frac{1}{\sqrt{18}} - \frac{2}{\sqrt{18}} = 0$
  • $\mathbf{c}_2 \cdot \mathbf{c}_3 = (-\frac{1}{\sqrt{2}})(\frac{1}{\sqrt{3}}) + (\frac{1}{\sqrt{2}})(\frac{1}{\sqrt{3}}) + (0)(-\frac{1}{\sqrt{3}}) = -\frac{1}{\sqrt{6}} + \frac{1}{\sqrt{6}} + 0 = 0$

任意两个不同的列向量都相互垂直。

因为 $A$ 的列向量构成一组标准正交基,所以 $A$ 是一个正交矩阵

∑ [公式拆解]
  • $GL_n(\mathbb{R})$: General Linear Group. 所有 $n \times n$ 可逆实数矩阵
  • $SL_n(\mathbb{R})$: Special Linear Group. 所有 $n \times n$ 行列式为 1 的实数矩阵
  • $O_n(\mathbb{R})$: Orthogonal Group. 所有 $n \times n$ 正交实数矩阵
  • $SO_n(\mathbb{R})$: Special Orthogonal Group. 所有 $n \times n$ 行列式为 1 的正交实数矩阵
  • $\det(A)$: 矩阵 $A$行列式
  • $A^T A = I$: 正交矩阵的定义之一 ($A^T$$A$转置$I$ 是单位矩阵)。
  • $\mathbf{u} \cdot \mathbf{v}$: 向量 $\mathbf{u}$$\mathbf{v}$ 的点积。
  • $|\mathbf{u}|$: 向量 $\mathbf{u}$ 的长度或模。
💡 [数值示例]

题目本身就是一系列具体的数值例子。

⚠️ [易错点]
  1. 定义混淆: 初学者很容易混淆 $SL_n$$O_n$ 的定义。$SL_n$ 只关心行列式为1,矩阵本身可以是任意可逆的(比如剪切矩阵)。$O_n$ 关心的是矩阵是否保持长度和角度(即列向量是否为标准正交基),其行列式只能是+1或-1。
  2. 计算行列式: 对于 $2 \times 2$ 以上的矩阵行列式计算容易出错。
  3. 检查正交性: 检查正交矩阵时,不仅要检查列向量相互垂直(点积为0),还要检查每个列向量自身的长度是否为1。两者缺一不可。
  4. 包含关系: 要记住这些群的包含关系 $SO_n \subset SL_n \subset GL_n$$SO_n \subset O_n \subset GL_n$。一个矩阵属于 $SO_n$ 意味着它自动属于其他所有群。
📝 [总结]
  1. 本题通过计算一系列 $2 \times 2$ 矩阵行列式和检查其列向量正交性,将它们分门别类到不同的矩阵群中。
  2. 这个过程具体展示了 $GL_2, SL_2, O_2, SO_2$ 这几个重要的定义和它们之间的关系。
  3. 最后,通过验证一个 $3 \times 3$ 矩阵的列向量构成标准正交基,确认了其正交性
🎯 [存在目的]
  1. 熟悉重要的矩阵群: $GL_n, SL_n, O_n, SO_n$李群理论和群表示论中最核心的研究对象。本题是对这些基本的第一次具体接触。
  2. 练习矩阵属性判断: 巩固行列式的计算和正交性的判断,这些都是线性代数的基本功。
  3. 连接代数与几何: 这些矩阵群都有非常重要的几何意义。
  4. $GL_n$: 所有保持原点不变、保持直线直线的可逆线性变换
  5. $SL_n$: 保持体积不变的线性变换
  6. $O_n$: 保持长度和角度不变的刚体运动(旋转和反射)。
  7. $SO_n$: 只包含旋转的、保持定向的刚体运动

本题是理解这些几何意义的代数基础。

🧠 [直觉心智模型]
  1. 想象一个“矩阵筛选机”。
  2. 第一关 $\det \neq 0$?通过的进入 $GL_2$。没通过的被淘汰。
  3. 第二关 $\det = 1$?从 $GL_2$ 里通过的进入 $SL_2$
  4. 另一条线上,第三关 “列向量是否标准正交”?从 $GL_2$ 里通过的进入 $O_2$
  5. 第四关,同时在 $SL_2$$O_2$ 两个名单上的矩阵,被选入最终的精英俱乐部 $SO_2$
  6. 题目中的六个矩阵就在这个流水线上走了一遍。
💭 [直观想象]
  1. $A_1$ (单位矩阵): 什么都不做。它当然是可逆、保体积、保长度、保定向的。
  2. $A_2$ (置换矩阵): 交换x和y轴,相当于关于直线 $y=x$ 的反射。这是刚体运动,保长度,但不保定向(比如一个右手坐标系变成了左手坐标系),所以 $\det=-1$
  3. $A_3$: 是一个旋转和缩放的复合。它改变长度,所以不是正交的。
  4. $A_5$ (剪切矩阵): 想象一摞扑克牌,把它推斜。这个过程面积不变,所以 $\det=1$。但显然长度和角度都变了,所以不是正交的。
  5. $A_6$: 是关于某条直线的反射。和 $A_2$ 类似,是刚体运动但改变了定向。
151.28. 习题 1.28

📜 [原文15]

$A_{\theta}=\left(\begin{array}{cc}\cos \theta & -\sin \theta \\ \sin \theta & \cos \theta\end{array}\right)$ 且设 $B_{\theta}=\left(\begin{array}{cc}\cos \theta & \sin \theta \\ \sin \theta & -\cos \theta\end{array}\right)$$2 \times 2$ 正交矩阵 (取决于一个实数 $\theta$),其中 $\det A_{\theta}=1$$\det B_{\theta}=-1$。最后,设 $R=B_{0}= \left(\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right)$。证明 $A_{\theta_{1}} A_{\theta_{2}}=A_{\theta_{1}+\theta_{2}}$$A_{\theta}^{-1}=A_{-\theta}$。计算 $B_{\theta}^{2}$$B_{\theta}^{-1}$。证明 $B_{\theta}=A_{\theta} R$$R^{2}=I$,因此 $R=R^{-1}$

使用上述恒等式,证明:$A_{\theta}=B_{\theta} R, R B_{\theta}=A_{-\theta}$(计算 $A_{-\theta}=A_{\theta}^{-1}=\left(B_{\theta} R\right)^{-1}$)。证明 $R^{-1} A_{\theta} R=R B_{\theta}=A_{-\theta}$。使用此恒等式再次计算 $B_{\theta}^{2}=A_{\theta} R B_{\theta}$。还证明 $B_{\theta_{1}} B_{\theta_{2}}=A_{\theta_{1}-\theta_{2}}, A_{\theta_{1}} B_{\theta_{2}}=B_{\theta_{1}+\theta_{2}}, B_{\theta_{1}} A_{\theta_{2}}=B_{\theta_{1}-\theta_{2}}, R A_{\theta}=B_{-\theta}, A_{\theta} R A_{\theta}^{-1}= A_{\theta} R A_{-\theta}=B_{2\theta}$。(注意:请高效地使用上述基本恒等式来证明其余部分。不要从头开始证明所有内容。)

📖 [逐步解释]

这道题是 $SO_2(\mathbb{R})$ (旋转矩阵) 和 $O_2(\mathbb{R})-SO_2(\mathbb{R})$ (反射矩阵) 内部运算关系的大演练。$A_\theta$ 代表逆时针旋转 $\theta$ 角,$B_\theta$ 代表关于过原点且与x轴夹角为 $\theta/2$直线的反射。

1. 证明基本恒等式

  • $A_{\theta_{1}} A_{\theta_{2}}=A_{\theta_{1}+\theta_{2}}$: (旋转的复合)
  • $A_{\theta_1}A_{\theta_2} = \begin{pmatrix} \cos\theta_1 & -\sin\theta_1 \\ \sin\theta_1 & \cos\theta_1 \end{pmatrix} \begin{pmatrix} \cos\theta_2 & -\sin\theta_2 \\ \sin\theta_2 & \cos\theta_2 \end{pmatrix}$
  • $= \begin{pmatrix} \cos\theta_1\cos\theta_2-\sin\theta_1\sin\theta_2 & -\cos\theta_1\sin\theta_2-\sin\theta_1\cos\theta_2 \\ \sin\theta_1\cos\theta_2+\cos\theta_1\sin\theta_2 & -\sin\theta_1\sin\theta_2+\cos\theta_1\cos\theta_2 \end{pmatrix}$
  • 使用三角和差角公式: $\cos(x+y)=\cos x \cos y - \sin x \sin y$, $\sin(x+y)=\sin x \cos y + \cos x \sin y$
  • $= \begin{pmatrix} \cos(\theta_1+\theta_2) & -\sin(\theta_1+\theta_2) \\ \sin(\theta_1+\theta_2) & \cos(\theta_1+\theta_2) \end{pmatrix} = A_{\theta_1+\theta_2}$。得证。
  • $A_{\theta}^{-1}=A_{-\theta}$: (旋转的逆)
  • 使用上一条结论,$A_\theta A_{-\theta} = A_{\theta+(-\theta)} = A_0 = \begin{pmatrix} \cos 0 & -\sin 0 \\ \sin 0 & \cos 0 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = I$
  • 因为 $A_\theta A_{-\theta} = I$,所以根据逆矩阵的定义,$A_{-\theta}$ 就是 $A_\theta$逆矩阵。得证。
  • $B_{\theta}^{2}$: (反射两次)
  • $B_\theta^2 = \begin{pmatrix} \cos\theta & \sin\theta \\ \sin\theta & -\cos\theta \end{pmatrix} \begin{pmatrix} \cos\theta & \sin\theta \\ \sin\theta & -\cos\theta \end{pmatrix}$
  • $= \begin{pmatrix} \cos^2\theta+\sin^2\theta & \cos\theta\sin\theta-\sin\theta\cos\theta \\ \sin\theta\cos\theta-\cos\theta\sin\theta & \sin^2\theta+\cos^2\theta \end{pmatrix}$
  • 使用 $\cos^2\theta+\sin^2\theta=1$
  • $= \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = I$。所以 $B_\theta^2 = I$
  • $B_{\theta}^{-1}$:
  • $B_\theta^2 = I$,即 $B_\theta B_\theta = I$,可知 $B_\theta$逆矩阵就是它自身。$B_\theta^{-1}=B_\theta$
  • $B_{\theta}=A_{\theta} R$:
  • $A_\theta R = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} = \begin{pmatrix} \cos\theta\cdot 1 - \sin\theta\cdot 0 & \cos\theta\cdot 0 - \sin\theta\cdot(-1) \\ \sin\theta\cdot 1 + \cos\theta\cdot 0 & \sin\theta\cdot 0 + \cos\theta\cdot(-1) \end{pmatrix}$
  • $= \begin{pmatrix} \cos\theta & \sin\theta \\ \sin\theta & -\cos\theta \end{pmatrix} = B_\theta$。得证。
  • $R^{2}=I, R=R^{-1}$:
  • $R^2 = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} = \begin{pmatrix} 1\cdot 1+0\cdot 0 & 1\cdot 0+0\cdot(-1) \\ 0\cdot 1+(-1)\cdot 0 & 0\cdot 0+(-1)\cdot(-1) \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = I$
  • 因此 $R^{-1}=R$

2. 证明后续恒等式 (高效使用已有结论)

  • $A_{\theta}=B_{\theta} R$:
  • 从已证的 $B_\theta = A_\theta R$ 出发,两边同时右乘 $R$
  • $B_\theta R = (A_\theta R)R = A_\theta (R^2) = A_\theta I = A_\theta$。得证。
  • $R B_{\theta}=A_{-\theta}$:
  • $RB_\theta = R(A_\theta R) = (RA_\theta)R$
  • 我们先计算 $RA_\theta$:

$RA_\theta = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} = \begin{pmatrix} \cos\theta & -\sin\theta \\ -\sin\theta & -\cos\theta \end{pmatrix}$

  • 我们再看 $A_{-\theta}$:

$A_{-\theta} = \begin{pmatrix} \cos(-\theta) & -\sin(-\theta) \\ \sin(-\theta) & \cos(-\theta) \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}$

  • 两者不相等。这里可能是我对题意的理解有误,或者题目的提示链条有误。让我们直接计算 $RB_\theta$
  • $RB_\theta = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \begin{pmatrix} \cos\theta & \sin\theta \\ \sin\theta & -\cos\theta \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}$
  • 这正好等于 $A_{-\theta}$。所以 $RB_\theta = A_{-\theta}$ 成立。
  • (那么 $R(A_\theta R)$ 的思路是错的,因为矩阵不满足交换律)
  • $R^{-1} A_{\theta} R=R B_{\theta}=A_{-\theta}$:
  • 这是一个等式链。我们已经证明了 $RB_\theta = A_{-\theta}$
  • 现在证明 $R^{-1}A_\theta R = A_{-\theta}$。因为 $R^{-1}=R$,所以就是要证 $RA_\theta R = A_{-\theta}$
  • $RA_\theta R = (RA_\theta)R = \begin{pmatrix} \cos\theta & -\sin\theta \\ -\sin\theta & -\cos\theta \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}$
  • 这正好是 $A_{-\theta}$。所以 $RA_\theta R = A_{-\theta}$ 成立。
  • 因此整个等式链 $R^{-1} A_{\theta} R = A_{-\theta}$$RB_{\theta}=A_{-\theta}$ 均成立。但 $R^{-1}A_\theta R$$RB_\theta$ 之间没有直接关系。题目可能是想让我们分别证明它们都等于 $A_{-\theta}$
  • $B_{\theta}^{2}=A_{\theta} R B_{\theta}$:
  • 我们计算右边:$A_\theta R B_\theta = A_\theta (R B_\theta)$
  • 利用刚证的 $RB_\theta = A_{-\theta}$
  • $= A_\theta A_{-\theta} = A_{\theta-\theta} = A_0 = I$
  • 而我们早已证明 $B_\theta^2=I$。所以等式成立。
  • $B_{\theta_{1}} B_{\theta_{2}}=A_{\theta_{1}-\theta_{2}}$:
  • $B_{\theta_1} B_{\theta_2} = (A_{\theta_1}R)(A_{\theta_2}R) = A_{\theta_1}(RA_{\theta_2})R$
  • 我们知道 $RA_\theta R = A_{-\theta}$,所以 $RA_\theta = A_{-\theta} R^{-1} = A_{-\theta} R$
  • 将此代入 $RA_{\theta_2}$,得到 $A_{-\theta_2}R$
  • 所以 $A_{\theta_1}(RA_{\theta_2})R = A_{\theta_1}(A_{-\theta_2}R)R = A_{\theta_1}A_{-\theta_2}(R^2) = A_{\theta_1}A_{-\theta_2}I = A_{\theta_1-\theta_2}$。得证。
  • $A_{\theta_{1}} B_{\theta_{2}}=B_{\theta_{1}+\theta_{2}}$:
  • $A_{\theta_1} B_{\theta_2} = A_{\theta_1} (A_{\theta_2}R) = (A_{\theta_1}A_{\theta_2})R = A_{\theta_1+\theta_2} R$
  • 根据 $B_\theta=A_\theta R$ 的定义, $A_{\theta_1+\theta_2}R = B_{\theta_1+\theta_2}$。得证。
  • $B_{\theta_{1}} A_{\theta_{2}}=B_{\theta_{1}-\theta_{2}}$:
  • $B_{\theta_1} A_{\theta_2} = (A_{\theta_1}R)A_{\theta_2} = A_{\theta_1}(RA_{\theta_2})$
  • 利用 $RA_\theta=A_{-\theta}R$。所以 $RA_{\theta_2}=A_{-\theta_2}R$
  • $= A_{\theta_1}(A_{-\theta_2}R) = (A_{\theta_1}A_{-\theta_2})R = A_{\theta_1-\theta_2} R$
  • 根据定义,这等于 $B_{\theta_1-\theta_2}$。得证。
  • $R A_{\theta}=B_{-\theta}$:
  • $RA_\theta = A_{-\theta}R$ (上面推导过)。
  • $A_{-\theta}R = B_{-\theta}$ (根据定义)。得证。
  • $A_{\theta} R A_{\theta}^{-1}= A_{\theta} R A_{-\theta}=B_{2\theta}$:
  • $A_\theta R A_\theta^{-1} = A_\theta R A_{-\theta}$ (因为 $A_\theta^{-1}=A_{-\theta}$)。
  • $= A_\theta (R A_{-\theta})$
  • 利用 $RA_\theta=B_{-\theta}$,令 $\theta \to -\theta$,得到 $RA_{-\theta} = B_{-(-\theta)} = B_\theta$
  • 所以 $= A_\theta B_\theta$
  • 利用 $A_{\theta_1}B_{\theta_2}=B_{\theta_1+\theta_2}$,令 $\theta_1=\theta_2=\theta$
  • $A_\theta B_\theta = B_{\theta+\theta} = B_{2\theta}$。得证。
∑ [公式拆解]
  • $A_{\theta}=\left(\begin{array}{cc}\cos \theta & -\sin \theta \\ \sin \theta & \cos \theta\end{array}\right)$: 旋转矩阵
  • $B_{\theta}=\left(\begin{array}{cc}\cos \theta & \sin \theta \\ \sin \theta & -\cos \theta\end{array}\right)$: 反射矩阵
  • $R = \left(\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right)$: 关于x轴的反射矩阵
💡 [数值示例]

示例: 验证 $B_{\pi/2} B_{\pi/3} = A_{\pi/6}$

  • $B_{\pi/2} = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$
  • $B_{\pi/3} = \begin{pmatrix} 1/2 & \sqrt{3}/2 \\ \sqrt{3}/2 & -1/2 \end{pmatrix}$
  • $B_{\pi/2}B_{\pi/3} = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1/2 & \sqrt{3}/2 \\ \sqrt{3}/2 & -1/2 \end{pmatrix} = \begin{pmatrix} \sqrt{3}/2 & -1/2 \\ 1/2 & \sqrt{3}/2 \end{pmatrix}$
  • $A_{\pi/6} = \begin{pmatrix} \cos(\pi/6) & -\sin(\pi/6) \\ \sin(\pi/6) & \cos(\pi/6) \end{pmatrix} = \begin{pmatrix} \sqrt{3}/2 & -1/2 \\ 1/2 & \sqrt{3}/2 \end{pmatrix}$
  • 两者相等,验证了 $B_{\theta_1}B_{\theta_2}=A_{\theta_1-\theta_2}$ (这里 $\theta_1-\theta_2 = \pi/2-\pi/3 = \pi/6$)。
⚠️ [易错点]
  1. 矩阵乘法不可交换: 这是所有计算的根基,绝对不能搞错顺序。$A(RB) \neq (AR)B$
  2. 三角函数公式: 对和差角公式、倍角公式的熟练掌握是直接计算的基础。
  3. 高效证明: 题目的要求是高效证明,即尽可能利用已证的代数等式,而不是每次都回到矩阵元素层面做暴力计算。这需要对代数结构有更深的理解。
📝 [总结]
  1. 本题系统地推导了 $SO(2)$ (旋转矩阵 $A_\theta$) 和 $O(2)-SO(2)$ (反射矩阵 $B_\theta$) 之间的代数关系。
  2. 揭示了几个核心规律:
  3. 旋转 + 旋转 = 旋转 ($A_{\theta_1}A_{\theta_2}=A_{\theta_1+\theta_2}$)
  4. 反射 + 反射 = 旋转 ($B_{\theta_1}B_{\theta_2}=A_{\theta_1-\theta_2}$)
  5. 旋转 + 反射 = 反射 ($A_{\theta_1}B_{\theta_2}=B_{\theta_1+\theta_2}$)
  6. 反射 + 旋转 = 反射 ($B_{\theta_1}A_{\theta_2}=B_{\theta_1-\theta_2}$)
  7. 任何反射矩阵 $B_\theta$ 都可以分解为一个旋转 $A_\theta$ 和一个标准的x轴反射 $R$ 的乘积。
🎯 [存在目的]
  1. 深入理解O(2)的结构: 这道题实际上是在探索二维正交群 $O(2)$ 的内部结构。它表明 $O(2)$ 是由旋转子群 $SO(2)$ 和一个反射(例如 $R$)生成的。$O(2)$ 的任何元素都可以表示成 $A_\theta$$A_\theta R$ 的形式。
  2. 群和陪集: $SO(2)$$O(2)$ 的一个正规子群$O(2)$ 可以被分解为两个陪集$SO(2)$ (所有旋转) 和 $SO(2)R$ (所有反射)。这道题的计算就是这些陪集之间运算规则的具体体现。
  3. 代数技巧训练: 训练学生在抽象的代数层面进行符号推导的能力,而不是仅仅停留在数值计算。
  4. 几何与代数的统一: 将几何直觉(两次反射等于一次旋转)与严格的矩阵代数推导统一起来。
🧠 [直觉心智模型]
  1. $A_\theta$ 看作“旋转操作”,$B_\theta$ 看作“反射操作”。$R$ 是一个最简单的“反射操作”(沿x轴反射)。
  2. $B_\theta = A_\theta R$: 任何一个反射,都可以通过“先旋转到x轴,再沿x轴反射,再旋转回去”来实现。这道题给出的分解 $B_\theta = A_\theta R$ 更简单:先做一个标准的x轴反射,再把整个结果旋转一下。
  3. $B_{\theta_1}B_{\theta_2}=A_{\theta_1-\theta_2}$: 想象两面镜子以一定角度放置,一个物体在它们之间连续反射两次,最终的效果等同于一次旋转。旋转的角度是两面镜子法线夹角的两倍。这个物理现象就是该矩阵等式的几何体现。
💭 [直观想象]
  1. 你有一支画笔,初始指向东方(正x轴)。
  2. $A_{\theta_1}A_{\theta_2}$: 先逆时针转 $\theta_2$ 度,再逆时针转 $\theta_1$ 度,结果是总共转了 $\theta_1+\theta_2$ 度。
  3. $B_\theta^2=I$: 你面对镜子(反射线),看到了你的像。你的像再通过镜子反射一次,看到的就是你自己原来的位置。操作两次等于没动。
  4. $B_{\theta_1}B_{\theta_2}=A_{\theta_1-\theta_2}$: 你面前有两面镜子。你先被镜子2反射,你的像再被镜子1反射。你最终的像相对于你本人,只是旋转了一个角度,并没有左右颠倒。
161.29. 习题 1.29

📜 [原文16]

(i) 在习题 1.28 的符号中,证明

$$ A_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta+\alpha), \sin (\theta+\alpha)) ; \quad B_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta-\alpha), \sin (\theta-\alpha)) $$

这里我们将 $(\cos \alpha, \sin \alpha)$ 写成一个(向量,但实际意义是

$$ \left(\begin{array}{cc} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{array}\right) \cdot\binom{\cos \alpha}{\sin \alpha}=\binom{\cos (\theta+\alpha)}{\sin (\theta+\alpha)} ; \quad\left(\begin{array}{cc} \cos \theta & \sin \theta \\ \sin \theta & -\cos \theta \end{array}\right) \cdot\binom{\cos \alpha}{\sin \alpha}=\binom{\cos (\theta-\alpha)}{\sin (\theta-\alpha)} $$

(注意:一个快速证明方法是使用习题 1.28 中关于 $A_{\theta_{1}} A_{\theta_{2}}$$B_{\theta_{1}} A_{\theta_{2}}$恒等式,因为 $\binom{\cos \alpha}{\sin \alpha}=A_{\alpha} \cdot \mathbf{e}_{1}$。)使用这一点来将 $A_{\theta}$ 解释为旋转矩阵。从上述内容,给出另一个论证 $B_{\theta}^{2}=I$

(ii) 进一步证明,如果

$$ \begin{aligned} & \mathbf{u}_{1}=(\cos \theta / 2, \sin \theta / 2) \\ & \mathbf{u}_{2}=(-\sin \theta / 2, \cos \theta / 2)=(\cos (\theta / 2+\pi / 2), \sin (\theta / 2+\pi / 2)) \end{aligned} $$

$$ B_{\theta} \cdot \mathbf{u}_{1}=\mathbf{u}_{1} ; \quad B_{\theta} \cdot \mathbf{u}_{2}=-\mathbf{u}_{2} $$

换句话说,$B_{\theta}$ 是通过原点和 $\mathbf{u}_{1}$直线垂直反射。(这也从恒等式 $B_{\theta}=A_{\theta / 2} R A_{\theta / 2}^{-1}$ 得出。)特别地,$S O_{2}$元素旋转,而 $O_{2}-S O_{2}$元素反射

(iii) 上述内容表明 $B_{\theta}$ 总是具有特征向量 $\mathbf{u}_{1}$$\mathbf{u}_{2}$,分别对应特征值 1 和 -1。$A_{\theta}$ 何时具有非零(特征向量?从几何上解释你的答案。

📖 [逐步解释]

这道题深入探讨 $A_\theta$$B_\theta$ 的几何意义。

(i) 变换作用在向量上

  1. 证明 $A_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta+\alpha), \sin (\theta+\alpha))$:
    • 方法一: 直接计算
    • 方法二: 使用提示
    • 向量 $\mathbf{v} = \binom{\cos\alpha}{\sin\alpha}$ 是旋转矩阵 $A_\alpha$ 的第一列。令 $\mathbf{e}_1=\binom{1}{0}$,则 $\mathbf{v} = A_\alpha \mathbf{e}_1$
    • $A_\theta \mathbf{v} = A_\theta (A_\alpha \mathbf{e}_1) = (A_\theta A_\alpha) \mathbf{e}_1$
    • 根据习题1.28, $A_\theta A_\alpha = A_{\theta+\alpha}$
    • 所以结果是 $A_{\theta+\alpha} \mathbf{e}_1$,这正是 $A_{\theta+\alpha}$ 的第一列,即 $\binom{\cos(\theta+\alpha)}{\sin(\theta+\alpha)}$。得证。
  2. 证明 $B_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta-\alpha), \sin (\theta-\alpha))$:
    • 方法一: 直接计算
    • 方法二: 使用提示
    • $B_\theta \mathbf{v} = B_\theta (A_\alpha \mathbf{e}_1) = (B_\theta A_\alpha)\mathbf{e}_1$
    • 根据习题1.28,$B_{\theta_1}A_{\theta_2} = B_{\theta_1-\theta_2}$。这里 $\theta_1=\theta, \theta_2=\alpha$
    • 所以结果是 $B_{\theta-\alpha} \mathbf{e}_1$,这正是 $B_{\theta-\alpha}$ 的第一列,即 $\binom{\cos(\theta-\alpha)}{\sin(\theta-\alpha)}$。得证。
  3. 解释与论证:
    • $A_\theta$ 的解释: $A_\theta$ 将一个角度为 $\alpha$ 的单位向量变换成一个角度为 $\theta+\alpha$ 的单位向量。这正是将该向量逆时针旋转 $\theta$ 角的操作。因此,$A_\theta$旋转矩阵
    • $B_\theta^2=I$ 的另一个论证:
    • $B_\theta$ 将角度为 $\alpha$向量变成角度为 $\theta-\alpha$向量
    • 再对结果作用一次 $B_\theta$$B_\theta$ 将角度为 $\beta=\theta-\alpha$向量变成角度为 $\theta-\beta$向量
    • $\theta - \beta = \theta - (\theta-\alpha) = \alpha$
    • 所以,连续作用两次 $B_\theta$,一个角度为 $\alpha$向量先变成角度 $\theta-\alpha$,再变回角度 $\alpha$。它回到了原来的位置。
    • 因为这对任意角度 $\alpha$ 都成立,所以 $B_\theta^2$恒等变换,即 $B_\theta^2=I$

(ii) 反射的特征向量

  • 证明 $B_{\theta} \cdot \mathbf{u}_{1}=\mathbf{u}_{1}$:
  • $\mathbf{u}_1$ 的角度是 $\theta/2$
  • 根据(i)的结论,$B_\theta$ 作用在 $\mathbf{u}_1$ 上,得到的向量角度是 $\theta - (\theta/2) = \theta/2$
  • 因为 $B_\theta$正交矩阵,它保持向量长度不变。所以作用后的向量长度仍然是1,角度是 $\theta/2$。它就是 $\mathbf{u}_1$ 本身。
  • 证明 $B_{\theta} \cdot \mathbf{u}_{2}=-\mathbf{u}_{2}$:
  • $\mathbf{u}_2$ 的角度是 $\theta/2+\pi/2$
  • $B_\theta$ 作用后,角度变为 $\theta - (\theta/2+\pi/2) = \theta/2 - \pi/2$
  • $-\mathbf{u}_2$ 是什么?它是将 $\mathbf{u}_2$ 旋转 $\pi$ 得到的向量
  • 所以 $-\mathbf{u}_2$ 的角度是 $(\theta/2+\pi/2) + \pi = \theta/2+3\pi/2$
  • 角度 $\theta/2-\pi/2$$\theta/2+3\pi/2$ 相差 $2\pi$,所以它们代表同一个方向。
  • 因此,$B_\theta \mathbf{u}_2$$-\mathbf{u}_2$ 具有相同的模1和相同的方向。它们是同一个向量
  • 几何解释:
  • 向量 $\mathbf{u}_1$ 的方向角是 $\theta/2$。通过原点和 $\mathbf{u}_1$直线就是反射轴。
  • $B_\theta \mathbf{u}_1 = \mathbf{u}_1$ 说明,反射轴上的向量在反射下保持不变。
  • 向量 $\mathbf{u}_2$ 的方向角是 $\theta/2+\pi/2$,它与 $\mathbf{u}_1$ 垂直。
  • $B_\theta \mathbf{u}_2 = -\mathbf{u}_2$ 说明,与反射轴垂直的向量在反射下被反向。
  • 这正是轴反射的几何定义。所以 $B_\theta$ 是关于过原点、与x轴夹角为 $\theta/2$直线垂直反射

(iii) $A_\theta$ 的实特征向量

  • 一个矩阵 $M$特征向量 $\mathbf{v}$ 满足 $M\mathbf{v} = \lambda\mathbf{v}$,其中 $\lambda$特征值。这意味着矩阵特征向量的作用只是进行缩放,而不改变其方向(或只反向)。
  • $A_\theta$ 的作用是旋转 $\theta$ 角。
  • 要使一个非零向量 $\mathbf{v}$ 经过旋转后方向不变或恰好反向,只有两种可能:
  1. 旋转角度 $\theta=0$ (或 $2k\pi$)。此时 $A_0=I$ (单位矩阵)。$I\mathbf{v}=\mathbf{v}$ 对所有向量 $\mathbf{v}$ 都成立。所以所有非零向量都是特征向量特征值为 1。
  2. 旋转角度 $\theta=\pi$ (或 $\pi+2k\pi$)。此时 $A_\pi = \begin{pmatrix}-1&0\\0&-1\end{pmatrix} = -I$$(-I)\mathbf{v}=-\mathbf{v}$ 对所有向量 $\mathbf{v}$ 都成立。所以所有非零向量都是特征向量特征值为 -1。
    • 对于任何其他的旋转角度 $\theta \in (0, 2\pi), \theta \neq \pi$,任何非零向量的方向都会被改变。因此,$A_\theta$ 没有(实的)特征向量
    • 结论: $A_\theta$ 具有非零实特征向量,当且仅当 $\theta$$\pi$ 的整数倍,即 $\theta = k\pi, k \in \mathbb{Z}$
📝 [总结]
  1. (i) 验证并从几何上解释了旋转矩阵 $A_\theta$ 和反射矩阵 $B_\theta$ 对单位向量的作用:$A_\theta$ 使角度增加 $\theta$$B_\theta$ 使角度变为 $\theta - \alpha$
  2. (ii) 证明了 $B_\theta$特征向量特征值,从而揭示了其几何本质是关于角度为 $\theta/2$直线的反射。这部分总结了 $SO(2)$元素是旋转,$O(2)-SO(2)$元素是反射。
  3. (iii) 分析了旋转矩阵 $A_\theta$实特征向量的存在条件,只有旋转0度或180度时才存在。
🎯 [存在目的]
  1. 深化几何理解: 这道题是线性代数核心思想的完美体现——将矩阵代数与线性变换的几何图像联系起来。
  2. 引入特征值和特征向量: 这是对特征值特征向量概念的一次非常直观的几何介绍。特征向量就是变换过程中的“不变方向”。
  3. 理解正交矩阵的分类: 进一步阐明所有二维正交矩阵要么是旋转,要么是反射,并给出了从代数行列式)和几何特征向量)两方面区分它们的方法。
🧠 [直觉心智模型]
  1. (i) $A_\theta$ 是一个“加法器”,给你的角度加上 $\theta$$B_\theta$ 是一个“减法器”,用固定的 $\theta$ 减去你的角度。
  2. (ii) 一面镜子 $B_\theta$ 放在角度为 $\theta/2$ 的地方。
  3. 沿着镜面方向看(向量 $\mathbf{u}_1$),什么都没变。所以特征值是1。
  4. 垂直于镜面方向看(向量 $\mathbf{u}_2$),你的像在你的正后方。所以特征值是-1。
  5. (iii) 一个旋转的风车。只有当它不转($\theta=0$)或转了半圈($\theta=\pi$)时,风车叶片的方向才可能和原来相同或恰好相反。在任何其他角度,叶片方向都变了。
💭 [直观想象]
  1. 你站在原点,手持一支激光笔,指向角度 $\alpha$
  2. $A_\theta$: 你把整个身体(和激光笔)逆时针转了 $\theta$ 度,现在激光指向 $\theta+\alpha$
  3. $B_\theta$: 房间里有一面镜子,它的方向是 $\theta/2$。你手持激光笔指向角度 $\alpha$,镜子里的那束光,它的方向是 $\theta-\alpha$
  4. $A_\theta$特征向量:你站在一个旋转平台上。平台旋转时,你手中的激光笔射出的光线方向要保持不变。只有平台不转,或者转了180度,才有可能。
171.30. 习题 1.30

📜 [原文17]

向量 $(x, y)$ 解释为对应于复数 $z= x+i y$,证明在习题 1.28 的符号中,$A_{\theta}$ 对应于将 $z$ 乘以 $e^{i \theta}$,即对应于函数 $a_{\theta}(z)=e^{i \theta} z$,而 $R$ 对应于由 $r(z)=\bar{z}$ 定义的函数 $r: \mathbb{C} \rightarrow \mathbb{C}$。使用这一点找出对应于 $B_{\theta}=A_{\theta} R$函数,并给出恒等式 $R^{-1} A_{\theta} R=A_{-\theta}$ 的另一个证明。

📖 [逐步解释]

这道题在 $\mathbb{R}^2$ 上的线性变换$\mathbb{C}$ 上的复数运算之间建立了一座桥梁。

1. 证明 $A_\theta$ 对应于乘以 $e^{i\theta}$

  • 一个向量 $(x,y)$ 对应复数 $z=x+iy$
  • $A_\theta$ 作用在 $(x,y)$ 上,得到新向量 $(x', y')$:

$\begin{pmatrix}x'\\y'\end{pmatrix} = A_\theta \begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix}\cos\theta & -\sin\theta \\ \sin\theta & \cos\theta\end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix}x\cos\theta - y\sin\theta \\ x\sin\theta + y\cos\theta\end{pmatrix}$

  • 这个新向量对应的新复数$z' = (x\cos\theta-y\sin\theta) + i(x\sin\theta+y\cos\theta)$
  • 现在我们计算复数运算 $e^{i\theta}z$

$e^{i\theta}z = (\cos\theta+i\sin\theta)(x+iy) = (x\cos\theta - y\sin\theta) + i(x\sin\theta + y\cos\theta)$

  • 两个结果完全相同。因此,$A_\theta$矩阵变换等价于乘以复数 $e^{i\theta}$

2. 证明 $R$ 对应于共轭 $r(z)=\bar{z}$

  • $R$ 作用在 $(x,y)$ 上,得到新向量 $(x', y')$:

$\begin{pmatrix}x'\\y'\end{pmatrix} = R \begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix}1 & 0 \\ 0 & -1\end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix}x \\ -y\end{pmatrix}$

  • 这个新向量对应的新复数$z' = x-iy$
  • 而原始复数 $z=x+iy$共轭 $\bar{z}$ 正好是 $x-iy$
  • 因此,$R$矩阵变换等价于取复共轭

3. 找出对应于 $B_\theta = A_\theta R$ 的函数

  • 矩阵的乘积对应于函数复合
  • $B_\theta$ 的变换等价于先进行 $R$ 变换,再进行 $A_\theta$ 变换。
  • $z \xrightarrow{R \text{ 对应}} \bar{z} \xrightarrow{A_\theta \text{ 对应}} e^{i\theta}\bar{z}$
  • 所以,对应于 $B_\theta$复数运算是 $b_\theta(z) = e^{i\theta}\bar{z}$

4. 给出 $R^{-1} A_{\theta} R=A_{-\theta}$ 的另一个证明

  • 我们将这个矩阵等式“翻译”成复数运算的等式。
  • $R^{-1}$ 对应于 $r^{-1}(z)$。因为 $R^2=I$,所以 $R^{-1}=R$,对应函数也是 $r(z)=\bar{z}$
  • $A_\theta$ 对应于 $a_\theta(z) = e^{i\theta}z$
  • $R$ 对应于 $r(z)=\bar{z}$
  • $A_{-\theta}$ 对应于 $a_{-\theta}(z) = e^{-i\theta}z$
  • 我们要证明的矩阵等式 $R^{-1}A_\theta R = A_{-\theta}$ 翻译过来就是:

$r^{-1} \circ a_\theta \circ r = a_{-\theta}$

  • 我们来计算左边的复合函数作用在任意 $z$ 上的结果:

$(r^{-1} \circ a_\theta \circ r)(z) = r^{-1}(a_\theta(r(z)))$

$= r(a_\theta(\bar{z}))$ (因为 $r^{-1}=r$)

$= r(e^{i\theta}\bar{z})$

$= \overline{e^{i\theta}\bar{z}}$

  • 利用共轭的性质 $\overline{z_1 z_2} = \overline{z_1}\overline{z_2}$$\overline{\bar{z}}=z$:

$= \overline{e^{i\theta}} \cdot \overline{\bar{z}}$

$= e^{-i\theta} \cdot z$

  • 这个结果正好是 $a_{-\theta}(z)$ 的定义。
  • 因为对于任意 $z$,两个复合函数的结果都相同,所以这两个函数是相等的。
  • 这就证明了对应的矩阵等式成立。
📝 [总结]
  1. 本题在二维实向量空间 $\mathbb{R}^2$ 上的线性变换与一维复向量空间 $\mathbb{C}$ 上的运算之间建立了一个完美的同构关系。
  2. 旋转矩阵 $A_\theta$ 对应于乘以单位复数 $e^{i\theta}$
  3. x轴反射矩阵 $R$ 对应于取复共轭
  4. 更一般的反射矩阵 $B_\theta$ 对应于先取共轭再乘以 $e^{i\theta}$ 的复合运算。
  5. 通过将矩阵运算翻译成更简洁的复数运算,我们可以更方便、更深刻地证明和理解这些矩阵之间的恒等式。
🎯 [存在目的]
  1. 展示同构思想: 这是同构(isomorphism)思想的绝佳例子。两个看起来不同的数学世界($\mathbb{R}^2$上的矩阵变换 和 $\mathbb{C}$上的复数运算)实际上具有完全相同的结构。我们可以利用一个世界里的简单性去理解另一个世界里的复杂性。
  2. 统一几何图像: 将旋转和反射的几何意义统一在复数乘法和共轭的框架下,提供了一个更优雅、更强大的视角。
  3. 代数技巧: 展示了如何通过转换到另一个数学领域来简化证明。复数代数矩阵代数更简单(例如,复数乘法是可交换的,而矩阵不是),这使得证明过程更清晰。
🧠 [直觉心智模型]
  1. 想象你有两种语言来描述二维世界里的操作。
  2. 语言A (矩阵): 用一套复杂的规则(矩阵乘法)来描述旋转、反射等。
  3. 语言B (复数): 用另一套规则(复数乘法、共轭)来描述。
  4. 这道题告诉你,这两种语言之间有一个完美的“词典”,可以相互翻译。
  5. 矩阵Aθ = 乘以e^{iθ}
  6. 矩阵R = 取共轭
  7. 现在要证明一个在语言A里很啰嗦的句子($R^{-1}A_\theta R = A_{-\theta}$),你可以把它翻译成语言B,发现它变成了一个非常简洁明了的句子($\overline{e^{i\theta}\bar{z}} = e^{-i\theta}z$),然后轻松证明它,再翻译回来即可。

2. 第 2 章

2. 1. 二元结构与群

12.1.1. 2.1. 二元运算与二元结构
12.1.1.1. 1.1. 基本定义

📜 [原文18]

代数的本质是将两个事物组合起来得到第三个。我们将其定义如下:

定义 1.1.1. 设 $X$ 是一个非空集合$X$ 上的二元运算是一个函数 $F: X \times X \rightarrow X$

📖 [逐步解释]
  1. 核心思想: 代数研究的是“运算”。最基本的运算就是把两个东西(元素)放在一起,通过某种规则,产生出一个新的东西。例如,小学学的加法,就是把两个数(如3和5)放在一起,通过加法规则,得到一个新的数(8)。
  2. 形式化定义: 为了用严格的数学语言描述这个过程,我们使用函数的概念。
    • 输入: 我们需要两个元素作为输入。这两个元素都来自同一个集合 $X$。取两个元素并考虑它们的顺序,这恰好构成了一个有序对 $(a, b)$。所有这样的有序对集合就是笛卡尔积 $X \times X$。所以,二元运算定义域$X \times X$
    • 输出: 运算的结果也必须是 $X$ 中的一个元素。这一点非常重要,保证了运算是“封闭”的。所以,二元运算值域$X$
    • 运算即函数: 综上所述,一个二元运算就是一个从 $X \times X$$X$函数。这个定义精确地捕捉了“将两个 $X$ 中的元素组合成一个 $X$ 中的元素”这一过程。
💡 [数值示例]
  • 示例1 (整数加法):
  • $X = \mathbb{Z}$ (整数集)。
  • 二元运算是加法 '+'。
  • 它是一个函数 $F: \mathbb{Z} \times \mathbb{Z} \to \mathbb{Z}$
  • 例如,输入有序对 $(3, 5) \in \mathbb{Z} \times \mathbb{Z}$,输出是 $F(3, 5) = 3+5=8 \in \mathbb{Z}$
  • 输入有序对 $(-2, 7) \in \mathbb{Z} \times \mathbb{Z}$,输出是 $F(-2, 7) = -2+7=5 \in \mathbb{Z}$
  • 示例2 (取最大值):
  • $X = \mathbb{R}$ (实数集)。
  • 定义一个运算 '$*$' 为取两个数中较大的一个。
  • 这是一个函数 $F: \mathbb{R} \times \mathbb{R} \to \mathbb{R}$,规则是 $F(a,b) = \max(a,b)$
  • 例如,输入 $(3.14, -5) \in \mathbb{R} \times \mathbb{R}$,输出是 $F(3.14, -5) = 3.14 \in \mathbb{R}$
⚠️ [易错点]
  1. 非空集合: 定义中要求 $X$ 是一个非空集合。在空集合上无法定义二元运算,因为笛卡尔积 $\emptyset \times \emptyset = \emptyset$,从空出发的函数除非值域也为空,否则难以定义。
  2. 封闭性: 函数值域$X$ 这一点隐含了“封闭性”。即 $X$ 中的元素经过运算后,结果不能跑到 $X$ 外面去。例如,除法不是 $\mathbb{Z}$ 上的二元运算,因为 $3 \div 5 = 0.6$,结果不在 $\mathbb{Z}$ 中。
📝 [总结]

二元运算是对“运算”这一概念的数学形式化。它是一个特殊的函数,接受同一集合中的两个元素作为输入,并保证产生该集合中的一个元素作为输出。

22.1.1.2. 运算符号

📜 [原文19]

然而,我们不将函数 $(a, b)$ 上的值写成 $F(a, b)$,而是使用一些中间符号来表示这个值,例如 $a+b$$a \cdot b$,通常简写为 $ab$,或 $a \circ b$。目前,我们经常使用 $a * b$ 来表示一个泛型二元运算

📖 [逐步解释]
  1. 函数写法的繁琐: 如果每次都写 $F(a,b)$,会非常不直观和冗长。例如,写 $F(F(a,b), c)$ 就远不如写 $(a+b)+c$ 清晰。
  2. 中缀表示法: 因此,我们习惯使用“中缀表示法”,即把运算符号放在两个操作数(运算的元素)的中间。
  3. 常用符号:
    • +: 通常用于具有交换律的运算(如数的加法、向量加法)。
    • · 或省略不写 (如 $ab$): 通常用于具有结合律的运算,不一定可交换(如数的乘法、矩阵乘法)。
    • , , , 等: 用于表示一个抽象的、未指定的泛型二元运算。在学习抽象代数的初期, (星号) 是最常用的泛型符号
🎯 [存在目的]

这部分内容是为了说明符号的约定,使后续的数学表达更简洁、更符合人们的习惯。数学不仅仅是逻辑,好的符号系统是高效思考和交流的关键。

32.1.1.3. 二元结构的定义

📜 [原文20]

定义 1.1.2. 一个二元结构 $(X, *)$ 是由一个集合 $X$$X$ 上的一个二元运算组成的

📖 [逐步解释]
  1. 打包: 这个定义非常简单,它只是把一个集合和定义在其上的一个二元运算“打包”在一起,给这个整体一个名字,叫做“二元结构”。
  2. 关注整体: 这提示我们,在代数中,我们关心的不仅仅是集合本身,也不仅仅是运算规则本身,而是集合和运算结合在一起形成的这个整体结构。不同的运算可以赋予同一个集合完全不同的代数性质。
  3. 表示: 用有序对 $(X, *)$ 来表示,第一个分量是“舞台”(集合),第二个分量是“剧本”(运算规则)。
💡 [数值示例]
  • $(\mathbb{Z}, +)$: 整数集合和加法运算构成一个二元结构
  • $(\mathbb{Z}, \cdot)$: 整数集合和乘法运算构成另一个不同的二元结构
  • $(\mathbb{R}^{>0}, \cdot)$: 正实数集合和乘法运算构成一个二元结构
  • $(\mathcal{P}(X), \cup)$: 一个集合 $X$幂集并集运算构成一个二元结构
📝 [总结]

二元结构是一个包含集合和作用于该集合二元运算的数学对象。它是后续要学习的半群等更复杂的代数结构的最基本形态。

42.1.1.4. 例子

📜 [原文21]

1.1.3. 例子多得数不胜数。例如,使用 $+$,我们有 $(\mathbb{N},+),(\mathbb{Z},+),(\mathbb{Q},+),(\mathbb{R},+),(\mathbb{C},+)$,以及向量空间矩阵的例子,例如 $\left(\mathbb{R}^{n},+\right)$$\left(\mathbb{M}_{n, m}(\mathbb{R}),+\right)$。使用减法,我们有 $(\mathbb{Z},-),(\mathbb{Q},-),(\mathbb{R},-),(\mathbb{C},-),\left(\mathbb{R}^{n},-\right)$$\left(\mathbb{M}_{n, m}(\mathbb{R}),-\right)$

对于乘法,我们有 $(\mathbb{N}, \cdot),(\mathbb{Z}, \cdot),(\mathbb{Q}, \cdot),(\mathbb{R}, \cdot),(\mathbb{C}, \cdot)$。如果我们定义 $\mathbb{Q}^{*}=\{a \in \mathbb{Q}: a \neq 0\}$$\mathbb{R}^{*}=\{a \in \mathbb{R}: a \neq 0\}, \mathbb{C}^{*}=\{a \in \mathbb{C}: a \neq 0\}$,则 $\left(\mathbb{Q}^{*}, \cdot\right),\left(\mathbb{R}^{*}, \cdot\right),\left(\mathbb{C}^{*}, \cdot\right)$ 也是二元结构。同样,$(U(1), \cdot)$$\left(\mu_{n}, \cdot\right)$二元结构。此外还有矩阵例子:$\left(\mathbb{M}_{n}(\mathbb{R}), \cdot\right),\left(G L_{n}(\mathbb{R}), \cdot\right),\left(S L_{n}(\mathbb{R}), \cdot\right),\left(O_{n}, \cdot\right),\left(S O_{n}, \cdot\right)$

接下来,有函数复合的例子:对于一个集合 $X$$\left(X^{X}, \circ\right)$$\left(S_{X}, \circ\right)$

我们还看到了在等价类集合上的二元运算的例子。例如,$(\mathbb{Z} / n \mathbb{Z},+),(\mathbb{Z} / n \mathbb{Z}, \cdot)$, 和 $(\mathbb{R} / 2 \pi \mathbb{Z},+)$ 都是二元结构的例子。这里,例如,给定 $[a],[b] \in \mathbb{Z} / n \mathbb{Z}$,我们定义 $[a]+[b]=[a+b]$$[a] \cdot[b]=[a b]$。正如我们所看到的,这些运算良定义的。$\mathbb{R} / 2 \pi \mathbb{Z}$ 上的加法定义类似。(但是 $\mathbb{R} / 2 \pi \mathbb{Z}$ 上没有自然的乘法二元运算。)

最后,还有许多更任意的例子。例如,对于一个集合 $X$,我们可以简单地定义 $a * b=b$ 对于所有 $a, b \in X$:要“组合”两个元素,你总是选择第二个。另一个例子是一个“常数二元运算:对于一个非空集合 $X$ 和一个固定元素 $c \in X$,定义 $a * b=c$ 对于所有 $a, b \in X$

📖 [逐步解释]

这部分通过大量例子来巩固二元结构的概念,并展示其广泛性。

  1. 基于数的加法:
    • $(\mathbb{N},+), (\mathbb{Z},+), \dots, (\mathbb{C},+)$: 自然数、整数、有理数、实数、复数在通常的加法下都是二元结构
    • $(\mathbb{R}^n, +), (\mathbb{M}_{n,m}(\mathbb{R}), +)$: 同样,n维向量$n \times m$ 矩阵在它们各自的加法下也是二元结构
  2. 基于数的减法:
    • 减法在整数、有理数、实数、复数向量矩阵上也是二元运算,因此也构成二元结构
    • 注意:$(\mathbb{N}, -)$ 不是一个二元结构,因为减法在 $\mathbb{N}$ 上不封闭(例如 $3-5=-2 \notin \mathbb{N}$)。
  3. 基于数的乘法:
    • $\mathbb{N}, \mathbb{Z}, \mathbb{Q}, \mathbb{R}, \mathbb{C}$ 在通常乘法下都是二元结构
    • $\mathbb{Q}^*, \mathbb{R}^*, \mathbb{C}^*$: 这些是去掉了0之后有理数、实数、复数集合。它们在乘法下依然是封闭的(两个非零数相乘结果非零),所以也是二元结构
    • $U(1), \mu_n$: 单位复数$n$ 次单位根集合,在复数乘法下都是封闭的,构成二元结构
  4. 基于矩阵乘法:
    • $\mathbb{M}_n(\mathbb{R})$: 所有 $n \times n$ 实数矩阵集合。两个 $n \times n$ 矩阵相乘结果还是 $n \times n$ 矩阵,所以 $(\mathbb{M}_n(\mathbb{R}), \cdot)$二元结构
    • $GL_n, SL_n, O_n, SO_n$: 这些都是可逆矩阵行列式为1的矩阵正交矩阵等特殊矩阵集合。它们各自在矩阵乘法下都是封闭的,因此也都构成二元结构
  5. 基于函数复合:
    • $X^X$: 从集合 $X$到自身的所有函数集合。两个这样的函数 $f, g$ 复合$f \circ g$ 仍然是从 $X$$X$函数,所以 $(\_X^X, \circ)$二元结构
    • $S_X$: 从集合 $X$到自身的所有双射置换)的集合。两个双射复合仍然是双射,所以 $(S_X, \circ)$ 也是二元结构
  6. 基于等价类的运算:
    • $(\mathbb{Z}/n\mathbb{Z}, +), (\mathbb{Z}/n\mathbb{Z}, \cdot)$: 我们已经看到,在模n同余类上可以良定义地定义加法和乘法。
    • $(\mathbb{R}/2\pi\mathbb{Z}, +)$: 类似地,在角度的等价类上可以良定义地定义加法。
    • (注:$\mathbb{R}/2\pi\mathbb{Z}$ 上没有自然的乘法。比如 $f([\theta])=[\theta^2]$ 就不是良定义的)。
  7. 任意(Exotic)的例子:
    • $a*b = b$: “投影到第二个分量”的运算。例如,在 $\mathbb{Z}$ 上,$3*5=5, 7*(-2)=-2$
    • $a*b = c$: 常数运算。例如,在 $\mathbb{Z}$ 上定义 $a*b=0$,那么 $3*5=0, 7*(-2)=0$
    • 这些例子说明二元运算不一定要有“好的”性质(如结合律交换律),定义本身非常宽泛。
🎯 [存在目的]

这部分旨在通过丰富的例子,让读者建立对二元结构这一概念的广度和深度的认识,表明它遍布数学的各个角落,从我们最熟悉的数到抽象的矩阵函数等价类,都可以被统一到这个框架下。

52.1.1.5. 关于封闭性的备注

📜 [原文22]

备注 1.1.4. 在小学时,讨论二元运算时,人们经常提到“封闭性”,它大致上是说,对于 $a, b \in X$$a * b$定义好的,并且 $a * b \in X$。对于我们来说,这个性质内置于二元运算定义中,它被定义为从 $X \times X$$X$ 的一个函数。例如,减法不是 $\mathbb{N}$ 上的二元运算。同样,如果 $\mathbb{Q}^{*}$ 是非零有理数集加法不是 $\mathbb{Q}^{*}$ 上的二元运算,因为 $\mathbb{Q}^{*}$加法下不是封闭的,换句话说,加法函数没有在 $\mathbb{Q}^{*}$ 中的所有元素对定义,至少如果我们想要求对于所有 $a, b \in \mathbb{Q}^{*}$$a+b \in \mathbb{Q}^{*}$ 的话。

📖 [逐步解释]
  1. 小学概念 vs. 形式化定义: 在初等教育中,“封闭性”被当作是运算的一个需要检验的性质。例如,“整数集合在加法下是封闭的,但在除法下不封闭”。
  2. 内置于定义: 在抽象代数的语境下,我们对“二元运算”的定义更为严格。一个在集合 $X$ 上的二元运算被定义为一个函数 $f: X \times X \to X$
  3. 关键在于值域: 这个定义的值域被强制指定为 $X$。这意味着,对于任何来自 $X$ 的输入对 $(a,b)$,其输出 $a*b$ 必须也落在 $X$ 中。如果对于某个输入对,输出跑到了 $X$ 之外,那么这个操作就根本不满足我们对“$X$上的二元运算”的定义。
  4. 重新审视例子:
    • 减法在 $\mathbb{N}$: 运算 $3-5=-2$。输入 $(3,5)$$\mathbb{N} \times \mathbb{N}$ 中,但输出 $-2$ 不在 $\mathbb{N}$ 中。所以,减法根本就不是一个从 $\mathbb{N} \times \mathbb{N}$$\mathbb{N}$函数。因此,它不是 $\mathbb{N}$ 上的二元运算
    • 加法在 $\mathbb{Q}^*$: $\mathbb{Q}^*$ 是非零有理数集。运算 $3+(-3)=0$。输入 $(3,-3)$$\mathbb{Q}^* \times \mathbb{Q}^*$ 中,但输出 $0$ 不在 $\mathbb{Q}^*$ 中。所以,加法也不是 $\mathbb{Q}^*$ 上的二元运算
  5. 总结: 在我们的框架下,“封闭性”不是一个需要检验的性质,而是“二元运算”这个概念的定义本身所固有的。当我们说“$*$$X$ 上的一个二元运算”时,就已经默认了它是封闭的。
🎯 [存在目的]

这则备注是为了澄清一个重要的术语和概念上的转变。它要求读者从初等的、描述性的理解(“检查是否封闭”)过渡到代数的、定义性的理解(“封闭性是定义的一部分”)。这有助于建立更严谨的数学思维。

62.1.1.6. 有限集的运算表

📜 [原文23]

如果 $X$ 是一个包含 $n$元素有限集,比如说我们枚举 $X=\left\{x_{1}, \ldots, x_{n}\right\}$,那么 $X$ 上的二元运算可以用一个来描述:

📖 [逐步解释]
  1. 动机: 对于拥有无限元素集合(如 $\mathbb{Z}$),我们无法列出所有运算的可能。但对于有限集,这是可能的。
  2. 构造方法:
    • 创建一个 $n \times n$ 的方格表(也叫凯莱表, Cayley table)。
    • 将表的行和列用集合 $X$$n$元素 $x_1, \dots, x_n$ 进行标记。
    • 在第 $i$ 行和第 $j$ 列交叉的那个单元格里,填入元素 $x_i * x_j$ 的值。
  3. 完备性: 这个表完全地、无歧义地定义了二元运算 $*$。给定任意两个元素 $x_i, x_j$,我们只需查表就能找到它们的运算结果。
  4. 封闭性体现: 封闭性在这个表上体现为:表中的每一个单元格里填入的元素,都必须是来自集合 $X=\{x_1, ..., x_n\}$ 中的元素,不能出现任何“外来”元素
💡 [数值示例]
  • 示例: 考虑集合 $X = \{0, 1\}$ 和运算“逻辑与”($\land$)。
  • 运算表如下:
$\land$ 0 1
0 0 0
1 0 1
  • 例如,要找 $1 \land 0$ 的结果,就看第 '1' 行和第 '0' 列,交叉点是 0。
  • 示例: 考虑 $\mathbb{Z}/3\mathbb{Z} = \{[0], [1], [2]\}$ 上的加法。
  • 运算表如下:
$+$ [0] [1] [2]
[0] [0] [1] [2]
[1] [1] [2] [0]
[2] [2] [0] [1]
  • 例如,$[2]+[2] = [4] = [1]$,这对应于表中第 '[2]' 行和第 '[2]' 列的交叉点是 [1]
🎯 [存在目的]

这部分介绍了凯莱表,它是研究有限群和其他有限代数结构的一个非常重要和直观的工具。通过观察运算表的模式(如对角线是否对称可以判断交换律),可以方便地分析一个二元结构的各种性质。

3. 行间公式索引

  1. $\Delta_{X}=\{(x, x): x \in X\}$
    • 一句话解释: 定义集合X的对角线,即所有两个分量都相等的有序对集合
  2. $\pi_{1}(x, y)=x ; \quad \quad \pi_{2}(x, y)=y$
    • 一句话解释: 定义从笛卡尔积到其分量的投影函数$\pi_1$取第一个分量,$\pi_2$取第二个分量。
  3. $\chi_{A}(x)= \begin{cases}0, & \text { if } x \notin A \\ 1, & \text { if } x \in A\end{cases}$
    • 一句话解释: 定义子集A的特征函数,如果元素在A中则取值为1,否则为0。
  4. $\mathbf{q}-\mathbf{p}=\mathbf{q}+(-\mathbf{p})=\left(b_{1}-a_{1}, \ldots, b_{n}-a_{n}\right)$
    • 一句话解释: 定义向量减法及其坐标表示,即对应分量相减。
  5. $G=\{([x], y): \text { there exists an element } a \in[x] \text { such that } F(a)=y\}$
    • 一句话解释: 定义一个从商集出发的关系,用于判断何时可以诱导出良定义函数
  6. $\left(x_{1}, x_{2}\right) \sim\left(y_{1}, y_{2}\right) \Longleftrightarrow x_{1} \sim_{1} y_{1} \text { and } x_{2} \sim_{2} y_{2} .$
    • 一句话解释: 在笛卡尔积上定义一个关系,当且仅当两个分量在各自的关系下都等价。
  7. $F(r, z)=r z$
    • 一句话解释: 定义一个从(正实数, 单位复数)到非零复数函数,即复数极坐标表示法。
  8. $\left(\begin{array}{ll}1 & 0 \\0 & 1\end{array}\right) ; \quad\left(\begin{array}{ll}0 & 1 \\1 & 0\end{array}\right) ; \quad \ldots$
    • 一句话解释: 列举了一系列用于分类的 $2 \times 2$ 矩阵示例。
  9. $A=\left(\begin{array}{ccc}\frac{1}{\sqrt{6}} & -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{6}} & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} \\ \frac{2}{\sqrt{6}} & 0 & -\frac{1}{\sqrt{3}}\end{array}\right)$
    • 一句话解释: 给出一个用于验证正交性$3 \times 3$ 矩阵
  10. $A_{\theta}=\left(\begin{array}{cc}\cos \theta & -\sin \theta \\ \sin \theta & \cos \theta\end{array}\right)$ 且设 $B_{\theta}=\left(\begin{array}{cc}\cos \theta & \sin \theta \\ \sin \theta & -\cos \theta\end{array}\right)$
    • 一句话解释: 定义二维旋转矩阵$A_\theta$和反射矩阵$B_\theta$
  11. $A_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta+\alpha), \sin (\theta+\alpha)) ; \quad B_{\theta}(\cos \alpha, \sin \alpha)=(\cos (\theta-\alpha), \sin (\theta-\alpha))$
    • 一句话解释: 描述旋转和反射矩阵作用在单位向量上的几何效果。
  12. $\left(\begin{array}{cc}\cos \theta & -\sin \theta \\ \sin \theta & \cos \theta\end{array}\right) \cdot\binom{\cos \alpha}{\sin \alpha}=\binom{\cos (\theta+\alpha)}{\sin (\theta+\alpha)}$
    • 一句话解释: 旋转矩阵作用于列向量的具体计算形式。
  13. $\mathbf{u}_{1}=(\cos \theta / 2, \sin \theta / 2)$
    • 一句话解释: 定义反射矩阵$B_\theta$的一个特征向量,它位于反射轴上。
  14. $B_{\theta} \cdot \mathbf{u}_{1}=\mathbf{u}_{1} ; \quad B_{\theta} \cdot \mathbf{u}_{2}=-\mathbf{u}_{2}$
    • 一句话解释: 描述反射矩阵对其特征向量的作用:反射轴上的向量不变,垂直于反射轴的向量反向。

[[END_OF_RESPONSE]]所有解释内容已全部输出完毕。