📝 我的笔记

还没有笔记

选中页面文字后点击「高亮」按钮添加

5.1_群作用与西罗定理_群作用.1.ZH解释

📜 原文
📖 逐步解释
∑ 公式拆解
💡 数值示例
⚠️ 易错点
📝 总结
🎯 存在目的
🧠 直觉心智模型
💭 直观想象

11. 第 5 章 群作用和西罗定理

11.1. 1. 群作用

1. 1.1. 1.1. 定义和示例

📜 [原文1]

我们遇到的大多数群都与某些其他结构相关。

📖 [逐步解释]

这句话是本章内容的引言,旨在说明这个抽象的代数概念在数学和物理学的实际应用中,通常不是孤立存在的,而是通过“作用”于其他数学对象(即“其他结构”)来体现其价值和意义。

  • 群 (Group):在数学中,是一个集合,连同一个在该集合上定义的二元运算,满足四个基本性质:封闭性、结合律、存在单位元和存在逆元。这是一个非常基础和核心的代数结构。例如,整数集合与加法运算构成一个群。
  • 其他结构 (Other Structures):这里的“结构”是一个广义的术语,指任何数学对象或集合。常见的例子包括:
  • 几何对象:如点、线、多边形、多面体、球面等。
  • 向量空间:如我们熟悉的二维平面 $\mathbb{R}^2$ 或三维空间 $\mathbb{R}^3$
  • 集合本身:可以是一个包含任何元素的集合,比如 {1, 2, 3, ..., n}
  • 其他代数结构:一个群也可以作用于另一个群。

这句话的核心思想是,研究一个群的性质,往往可以通过观察它如何“操控”或“变换”其他对象来更直观、更深入地理解。这种“操控”或“变换”就是所谓的“群作用”。

💡 [数值示例]
  • 示例1:正方形的对称群 $D_4$
  • $D_4$ 是正方形的所有对称操作(旋转和翻转)构成的群,共有8个元素(旋转0°, 90°, 180°, 270°,以及关于四条对称轴的翻转)。
  • 其他结构:一个具体的正方形,或者更简单地,正方形的四个顶点集合,可以记为 $V = \{v_1, v_2, v_3, v_4\}$
  • 相关性$D_4$ 中的每个元素(比如“旋转90°”)都可以被看作是对顶点集合 $V$ 的一种变换。旋转90°会将顶点 $v_1$ 移动到 $v_2$ 的位置, $v_2$$v_3$ 的位置,以此类推。这种“相关”就是群作用。
  • 示例2:实数乘法群 $\mathbb{R}^*$
  • $\mathbb{R}^*$ 是所有非零实数在乘法运算下构成的群。
  • 其他结构:二维平面 $\mathbb{R}^2$,即所有形如 $(x, y)$ 的向量的集合。
  • 相关性$\mathbb{R}^*$ 中的一个元素,比如数字 2,可以作用于平面上的任何一个向量,比如 $(1, 3)$。作用方式是标量乘法:$2 \cdot (1, 3) = (2, 6)$。这个操作将向量拉伸为其长度的两倍。这就是群 $\mathbb{R}^*$ 与结构 $\mathbb{R}^2$ 之间的关联。
⚠️ [易错点]
  1. “相关”不是模糊概念:初学者可能觉得“相关”这个词很模糊。在数学中,这种“相关”将被精确地定义为“群作用”,它有严格的数学公理。
  2. 并非所有群都直观地与其他结构相关:存在一些纯粹为了理论研究而构造的抽象群,它们可能没有立即可见的几何或物理对应。但即使是这些群,也总能找到它们可以作用的集合(例如,群自身)。
  3. 群与结构的关系不是唯一的:同一个群可能以不同的方式作用于同一个结构。例如,一个群既可以通过旋转作用于一个正方形,也可以通过“什么都不做”(平凡作用)来作用于它。
📝 [总结]

本句是引子,点明了群论研究的一个重要方向:将抽象的与具体的数学结构联系起来。这种联系是通过“群作用”这一核心概念来实现的,它为我们提供了一个强大的工具,用以分析群的性质和结构的对称性。

🎯 [存在目的]

这句话的目的是为了引出“群作用”这一核心概念。它告诉读者,为什么我们需要学习群作用?因为在实践中,群几乎总是以作用的形式出现,研究群作用是理解群在各个领域(如几何、物理、化学、密码学)中应用的关键。

🧠 [直觉心智模型]

你可以把想象成一个“工具箱”,里面装满了各种“操作工具”(如旋转、翻转、拉伸、置换等)。而“其他结构”就像是“待加工的物体”(如一个木块、一张纸、一串珠子)。“群作用”就是你从工具箱里拿出一个工具,对这个物体进行一次操作的过程。

💭 [直观想象]

想象你手里有一个魔方。所有可能转动魔方的方式(比如,转动顶层90°,翻转整个魔方等)的集合,构成了一个(魔方群)。而魔方本身,包括它所有的小色块,就是那个“其他结构”。当你执行一个转动操作时,就是里的一个元素在作用于魔方的色块这个结构上。


📜 [原文2]

例如,几何学或物理学中出现的群通常是几何对象(如 $D_{n}$)的对称群或空间(如 $S O_{3}$)的变换群。

📖 [逐步解释]

这句话紧接着前一句,给出了两个具体的例子来说明群是如何与其他结构相关的。它指出了在几何学和物理学这两个重要领域中,群最常见的两种表现形式:对称群变换群

  • 几何学或物理学中出现的群:这是限定了讨论的范围。在这些应用驱动的学科里,群的概念非常具体。
  • 几何对象的对称群 (Symmetry group of a geometric object)
  • 几何对象:如一个正n边形、一个立方体、一个晶体结构。
  • 对称:一个操作被称为对象的“对称”,如果操作之后,对象看起来和原来一模一样,占据的空间也完全相同。
  • 对称群:一个几何对象的所有对称操作的集合,以操作的“复合”(即连续执行两个操作)为群运算,构成一个群。这个群精确地描述了该对象的对称性质。
  • $D_n$:这是二面体群 (Dihedral group) 的标准符号。它是一个具体的例子,代表正n边形的所有对称操作构成的群。例如,$D_3$是等边三角形的对称群,$D_4$是正方形的对称群。$D_n$中的元素作用于那个正n边形。
  • 空间的变换群 (Transformation group of a space)
  • 空间:通常指一个向量空间,比如三维欧几里得空间 $\mathbb{R}^3$
  • 变换:指从空间到其自身的某种函数或映射,通常要求保持某些性质,比如距离、角度或体积。
  • 变换群:满足特定性质的一组变换,在函数复合下构成一个群。
  • $S O(3)$:这是三维特殊正交群 (Special Orthogonal group in 3 dimensions) 的标准符号。它代表了三维空间中所有保持原点不变、保持距离和方向(即不含镜像翻转)的旋转操作。物理学中,刚体的转动就是由 $S O(3)$ 来描述的。$S O(3)$ 中的元素作用于整个三维空间 $\mathbb{R}^3$
💡 [数值示例]
  • 示例1:$D_3$ 作为等边三角形的对称群
  • 几何对象:一个顶点标记为1, 2, 3的等边三角形。
  • $D_3$ 的元素
  1. 恒等操作(不动)。
  2. 绕中心逆时针旋转120°。
  3. 绕中心逆时针旋转240°。
  4. 关于过顶点1的对称轴的翻转。
  5. 关于过顶点2的对称轴的翻转。
  6. 关于过顶点3的对称轴的翻转。
    • 这6个操作的集合构成了群 $D_3$。每个操作都作用于这个三角形,使其看起来没变,但顶点的标签位置变了。
    • 示例2:$S O(2)$ 作为二维平面的变换群
    • 空间:二维平面 $\mathbb{R}^2$
    • $S O(2)$:所有绕原点的二维旋转操作。每个旋转操作可以由一个角度 $\theta$ 来参数化。
    • 作用:一个旋转矩阵 $R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$ 属于 $S O(2)$。它作用于平面上的一个点(向量)$\begin{pmatrix} x \\ y \end{pmatrix}$,通过矩阵乘法得到一个新的点 $\begin{pmatrix} x' \\ y' \end{pmatrix} = R(\theta) \begin{pmatrix} x \\ y \end{pmatrix}$。例如,旋转90° ($ \theta = \pi/2 $) 会把点 $(1, 0)$ 变换到 $(0, 1)$
⚠️ [易错点]
  1. $D_n$ 不是几何对象$D_n$ 是一个,是“操作”的集合;而正n边形是几何对象,是“被操作”的对象。不要混淆二者。原文的括号“(如 $D_n$)”是指“对称群”的例子,而不是“几何对象”的例子。
  2. $S O(3)$$\mathbb{R}^3$ 的区别$S O(3)$旋转操作的集合(群),而 $\mathbb{R}^3$的集合(空间)。$S O(3)$ 的元素是函数,而 $\mathbb{R}^3$ 的元素是点/向量。
  3. 对称群与变换群的联系:对称群可以看作是一种特殊的变换群。例如,$D_n$$\mathbb{R}^2$ 的一个变换子群,其特殊之处在于它保持一个特定的正n边形不变。
📝 [总结]

这句话通过两个核心范例——对称群 $D_n$变换群 $S O(3)$——阐明了群在几何与物理中的核心角色。对称群捕捉了物体的内在对称性,而变换群描述了空间本身的性质。这两种群都是通过“作用”于相应的几何对象或空间来展现其意义的。

🎯 [存在目的]

本句旨在将抽象的群论与读者可能已经熟悉的几何和物理概念联系起来,降低学习门槛,并激发学习动机。它通过具体的、有名的群 ($D_n$, $S O(3)$) 来实例化上一句的宏观论述,为接下来正式定义“群作用”铺平道路。

🧠 [直觉心智模型]
  1. 对称群 $D_n$:想象你有一把特制的饼干模具(比如一个星形模具)。对称群就是所有能让模具“咔哒”一声完美复位(即旋转或翻转后仍能盖回原印)的操作集合。
  2. 变换群 $S O(3)$:想象你置身于一个巨大的、空旷的球形房间的中心。变换群 $S O(3)$ 就是你作为观察者,所有可能的“转头”方式(可以朝任何方向转动任意角度)。当你转头时,整个房间的景象(即空间)在你眼中发生了对应的“变换”。
💭 [直观想象]
  1. $D_n$:拿一张正方形纸片放在桌上,用笔描出它的轮廓。现在,你可以通过旋转或翻转这张纸片,让它重新完美地放回轮廓里。所有这些“放回去”的动作,集合起来就是 $D_4$
  2. $S O(3)$:想象一个悬浮在空中的地球仪。你可以用手拨动它,让它绕任何轴旋转。所有这些可能的纯旋转(不包括把地球仪内外翻转这种诡异操作)就构成了 $S O(3)$。每一次拨动,都是一个 $S O(3)$ 里的元素在作用于地球仪所在的这个三维空间。

📜 [原文3]

这种关系背后的思想是群作用:

📖 [逐步解释]

这句话是一个承上启下的句子,它正式点明了本章的核心主题。

  • 这种关系:指的是前文所描述的,群(如 $D_n$, $S O(3)$)与其它结构(如正n边形,三维空间 $\mathbb{R}^3$)之间的关联。这种关联表现为群的元素可以“操作”或“变换”那个结构。
  • 背后的思想:意味着数学家们已经将这种普遍存在的“关系”提炼、抽象成一个统一的、精确的数学概念。
  • 是群作用 (is a group action):这正式给出了这个核心概念的名称。接下来的内容将会围绕“群作用”的严格定义、性质和应用展开。

简而言之,这句话的作用就是为一个即将被正式定义的重要概念命名,并告诉读者,我们之前讨论的所有例子,都可以被“群作用”这个统一的理论框架所描述。

💡 [数值示例]

因为这是一个概念引入句,本身不包含可计算的元素,但我们可以回顾之前的例子来理解“群作用”这个标签的含义:

  • 示例1$D_4$(群)作用于正方形的四个顶点(集合$X$)。“旋转90°”这个群元素,将顶点1映射到顶点2。这个映射就是群作用的一个具体体现。
  • 示例2$SO(3)$(群)作用于三维空间 $\mathbb{R}^3$(集合$X$)。“绕z轴旋转90°”这个群元素,将点 $(1,0,0)$ 映射到点 $(0,1,0)$。这个映射也是群作用的具体体现。
⚠️ [易错点]
  1. 群作用是一个“动词”:不要把群作用理解成一个静态的物体。它是一个过程,一个描述“如何操作”的规则。群是主语,结构是宾语,群作用是谓语。
  2. 即将有严格定义:虽然目前我们通过例子来感受“群作用”是什么,但必须清楚,数学上的“群作用”有一套不容含糊的公理化定义,以确保其逻辑的严谨性。
📝 [总结]

本句是一个枢纽,它将前面通过具体例子建立的直观感受,与后面即将展开的严谨数学理论连接起来。它告诉我们,所有那些“对称”、“变换”的例子,都可以被一个叫做“群作用”的普适概念所概括。

🎯 [存在目的]

这句话的目的是进行一次“概念聚焦”。它把前面发散的、例证性的讨论收敛到一个单一的术语上,为读者建立一个清晰的认知目标:接下来要学习和理解的就是“群作用”这个概念。

🧠 [直觉心智模型]

想象你在学习烹饪。你已经看过别人做过几道菜:炒青菜时,锅铲(工具)在翻动青菜(食材);烤蛋糕时,烤箱(工具)在加热面糊(食材)。现在,老师告诉你:“这些操作背后的共同原理,我们称之为‘热处理’”。“群作用”就扮演着“热处理”这个角色的作用,它是一个更高层次的抽象概念,统一了各种具体的操作。

💭 [直观想象]

如同物理学中,我们观察到苹果落地、月亮绕地球转等现象,然后牛顿告诉你:“这些现象背后的思想是‘万有引力’”。同样地,我们观察到旋转正方形、转动地球仪等操作,数学家告诉你:“这种关系背后的思想是‘群作用’”。

1. 1.2. 定义 1.1.1

📜 [原文4]

$G$ 是一个群,$X$ 是一个集合。那么 $G$$X$ 上的一个作用是一个函数 $F: G \times X \rightarrow X$,我们记 $F(g, x)=g \cdot x$,满足:

(1) 对于所有 $g_{1}, g_{2} \in G$$x \in X$, $g_{1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1} g_{2}\right) \cdot x$

(2) 对于所有 $x \in X$, $1 \cdot x=x$

📖 [逐步解释]

这是群作用的正式数学定义,是本章乃至后续所有内容的基础。我们来逐句、逐符号地拆解它。

  • $G$ 是一个群,$X$ 是一个集合。
  • 这是定义的前提条件。我们需要两个基本的“原料”:一个 $G$(提供“操作”的集合)和一个集合 $X$(提供“被操作对象”的集合)。
  • $G$ 拥有群结构(封闭的二元运算、结合律、单位元、逆元)。
  • $X$ 在这里可以只是一个普通的集合,没有要求它有额外的结构(比如加法或乘法),它就是一堆元素的聚集。
  • 那么 $G$$X$ 上的一个作用是一个函数 $F: G \times X \rightarrow X$
  • 函数 $F$:群作用的本质是一个函数
  • 定义域 $G \times X$:这个函数的输入是一个“有序对” $(g, x)$,其中 $g$ 是来自群 $G$ 的一个元素, $x$ 是来自集合 $X$ 的一个元素。这就像输入“一个操作”和“一个对象”。
  • 值域 $X$:这个函数的输出是集合 $X$ 中的一个元素。这意味着,用 $G$ 中的一个元素 $g$ 去作用于 $X$ 中的一个元素 $x$,结果仍然是 $X$ 中的一个元素。集合 $X$ 在这个作用下是“封闭”的。
  • 我们记 $F(g, x)=g \cdot x$
  • 这纯粹是为了书写方便而引入的简写符号
  • 原始的函数写法 $F(g, x)$ 比较繁琐。
  • 新的写法 $g \cdot x$ 更直观,看起来就像是“$g$ 作用在 $x$ 上”或者“$g$ 乘以 $x$”,读作 "g dot x" 或 "g acts on x"。这个点 · 就是群作用的标志。
  • 满足:
  • 一个任意的函数 $F: G \times X \rightarrow X$ 并不能都叫做群作用。它必须满足下面两条非常重要的公理。
  • (1) 对于所有 $g_{1}, g_{2} \in G$$x \in X$, $g_{1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1} g_{2}\right) \cdot x$
  • 结合律公理 (Associativity Axiom):这条规则描述了“连续作用”的行为。
  • 左边 $g_{1} \cdot\left(g_{2} \cdot x\right)$:表示一个两步过程。第一步,先用 $g_2$ 作用于 $x$,得到一个新元素 $x' = g_2 \cdot x$。第二步,再用 $g_1$ 作用于这个新元素 $x'$
  • 右边 $\left(g_{1} g_{2}\right) \cdot x$:表示一个一步过程。第一步,先在$G$ 内部,将 $g_1$$g_2$ 按照群的运算规则进行运算,得到一个新的群元素 $g_3 = g_1 g_2$。第二步,直接用这个“复合后”的新元素 $g_3$ 作用于原始的 $x$
  • 等号的意义:这条公理要求上述两种方式得到的结果必须完全相同。换句话说,先连续作用,等价于先在群内复合再作用。这保证了群作用与群自身的运算结构是相容的。
  • (2) 对于所有 $x \in X$, $1 \cdot x=x$
  • 单位元公理 (Identity Axiom):这条规则描述了群中“单位元”的行为。
  • $1$:这里的 $1$ 是群 $G$单位元(Identity element)。
  • $1 \cdot x = x$:表示用群的单位元去作用于集合 $X$ 中的任何元素 $x$,结果就是 $x$ 本身,什么都没有改变。
  • 意义:单位元在群作用中扮演了“无操作”或“恒等变换”的角色,这符合我们对单位元的直觉。
∑ [公式拆解]
  • $G$:一个群 (Group)。
  • $X$:一个集合 (Set)。
  • $F: G \times X \rightarrow X$:一个函数 $F$,其定义域是 $G$$X$ 的笛卡尔积,值域是 $X$
  • $g, g_1, g_2 \in G$:表示 $g, g_1, g_2$ 都是群 $G$ 中的元素。
  • $x \in X$:表示 $x$ 是集合 $X$ 中的一个元素。
  • $g \cdot x$:群作用的简写,表示群元素 $g$ 作用在集合元素 $x$ 上的结果。
  • $g_1 g_2$:这是在$G$ 内部的运算,不是群作用。表示 $g_1$$g_2$ 按照群的乘法规则复合。
  • $1$:群 $G$ 的单位元。
💡 [数值示例]
  • 示例1:$SO(2)$ 作用于 $\mathbb{R}^2$
  • $G$$SO(2)$,二维旋转群。元素是旋转矩阵 $R(\theta)$。群运算是矩阵乘法。单位元是 $R(0) = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$(单位矩阵)。
  • 集合 $X$$\mathbb{R}^2$,二维平面上的点(向量)。元素是 $\mathbf{v} = \begin{pmatrix} x \\ y \end{pmatrix}$
  • 作用 $g \cdot x$:定义为矩阵乘法 $R(\theta) \mathbf{v}$
  • 验证公理(1)
  • $g_1 = R(\theta_1)$, $g_2 = R(\theta_2)$, $\mathbf{v} \in \mathbb{R}^2$
  • 左边:$g_1 \cdot (g_2 \cdot \mathbf{v}) = R(\theta_1) (R(\theta_2) \mathbf{v})$
  • 右边:$(g_1 g_2) \cdot \mathbf{v} = (R(\theta_1) R(\theta_2)) \mathbf{v}$
  • 根据矩阵乘法的结合律,左右两边是相等的。并且我们知道旋转矩阵的性质 $R(\theta_1) R(\theta_2) = R(\theta_1 + \theta_2)$,所以这两种方式都等于 $R(\theta_1 + \theta_2) \mathbf{v}$。公理(1)成立。
  • 验证公理(2)
  • 单位元是 $1 = R(0) = \mathbf{I}$ (单位矩阵)。
  • $1 \cdot \mathbf{v} = R(0) \mathbf{v} = \mathbf{I} \mathbf{v} = \mathbf{v}$。公理(2)成立。
  • 因此,矩阵乘法是 $SO(2)$$\mathbb{R}^2$ 上的一个合法的群作用。
  • 示例2:整数加法群 $\mathbb{Z}$ 作用于实数轴 $\mathbb{R}$
  • $G$$(\mathbb{Z}, +)$,整数加法群。元素是整数 $n$。群运算是普通加法。单位元是 $0$
  • 集合 $X$$\mathbb{R}$,实数集合。
  • 作用 $n \cdot x$:定义为平移操作 $n \cdot x = x + n$
  • 验证公理(1)
  • $g_1 = n_1, g_2 = n_2 \in \mathbb{Z}$, $x \in \mathbb{R}$
  • 左边:$n_1 \cdot (n_2 \cdot x) = n_1 \cdot (x + n_2) = (x + n_2) + n_1 = x + n_2 + n_1$
  • 右边:$(n_1 + n_2) \cdot x = x + (n_1 + n_2) = x + n_1 + n_2$
  • 由于实数加法满足结合律和交换律,左右两边相等。公理(1)成立。
  • 验证公理(2)
  • 单位元是 $1 = 0$
  • $0 \cdot x = x + 0 = x$。公理(2)成立。
  • 因此,平移操作是整数加法群在实数轴上的一个合法的群作用。
⚠️ [易错点]
  1. 混淆群运算和群作用:在公理(1)的右边 (g1 g2) 是群内的运算,而 · 才是群作用。这是两种不同的运算。
  2. 忘记验证两条公理:任何声称是群作用的定义,都必须严格验证这两条公理是否满足。缺一不可。
  3. 单位元的对应:必须用群的单位元去验证公理(2),而不是随便用数字1。对于加法群,单位元是0。
📝 [总结]

群作用是一个将抽象的 $G$ 与一个集合 $X$ 联系起来的数学结构。它本质上是一个函数 $F: G \times X \rightarrow X$,通常简写为 $g \cdot x$。这个函数必须满足两条基本规则:结合律公理(连续作用等价于复合后作用)和单位元公理(群的单位元作用于任何元素都等于该元素本身)。这两条公理保证了群作用忠实地反映了群自身的代数结构。

🎯 [存在目的]

这个定义的目的是为“对称”、“变换”等直观概念提供一个严谨、统一的数学框架。通过这个定义,我们可以运用代数(群论)的工具来研究几何、组合、物理等领域中的问题。它是连接抽象代数与具体应用的桥梁。

🧠 [直觉心智模型]
  1. $G$:一套指令集(如 "向左转", "向上平移")。
  2. 集合 $X$:一张地图。
  3. 群作用 $g \cdot x$:在地图上的点 $x$ 执行指令 $g$ 后到达的新位置。
  4. 公理(1):执行指令 $g_2$ 后再执行指令 $g_1$,和你直接执行一个“先做 $g_2$ 再做 $g_1$ ”的复合指令,效果是一样的。
  5. 公理(2):“原地不动”指令作用在任何点上,那个点还是在原地。
💭 [直观想象]

想象你正在用 Photoshop 编辑一张图片。

  1. 集合 $X$:是图片上所有像素点的集合。
  2. $G$:是 Photoshop 工具箱里的一部分操作,比如“旋转90度”、“水平翻转”、“亮度增加10%”等,这些操作可以复合(先旋转再翻转)。
  3. 群作用:你选择一个操作(比如“旋转90度”,这是 $g$),然后应用到整张图片(图片中的每个像素 $x$ 都被作用了)。
  4. 公理(1):你先对图片执行“旋转90度”,再执行“水平翻转”,得到的结果,应该和你直接执行一个复合操作“旋转90度并水平翻转”得到的结果完全一样。
  5. 公理(2):工具箱里有一个“无操作”或“恒等”的滤镜(单位元 $1$),你把它应用到图片上,图片不会有任何变化。

📜 [原文5]

当作用 $F$ 被理解时,我们称 $X$$G$-集。(正如我们将看到的,存在群 $G$ 和集合 $X$ 的例子,其中 $X$ 有不止一种有趣的 $G$ 作用,因此 $X$ 以不止一种方式成为 $G$-集。)

📖 [逐步解释]

这句话引入了一个术语和一个重要的提醒。

  • 当作用 $F$ 被理解时,我们称 $X$$G$-集。
  • 术语引入:这里定义了一个新的名词 $G$-集 ($G$-set)
  • 含义:一个集合 $X$ 如果配备了一个群 $G$ 在其上的作用,那么我们就给这个集合 $X$ 一个新的身份,称它为 "$G$ 的一个集合",简称 $G$-集
  • 语境依赖:“当作用 $F$ 被理解时” (when the action F is understood) 这个状语很重要。意思是,当我们谈论一个 $G$-集时,我们心中已经明确了是哪个群 $G$ 以及是通过哪种作用方式联系起来的。如果作用方式不明确,就不能简单地称 $X$$G$-集。
  • (正如我们将看到的,...)
  • 重要的提醒:括号里的内容是对前面术语的一个补充说明,强调了“作用方式”的重要性。
  • $X$ 有不止一种有趣的 $G$ 作用:同一个群 $G$ 和同一个集合 $X$ 之间,可以定义多种不同的、都满足群作用公理的函数 $F$
  • 因此 $X$ 以不止一种方式成为 $G$-集:这意味着,当我们说“$X$ 是一个 $G$-集”时,我们必须清楚我们指的是哪一种作用下的 $G$-集。不同的作用会引发完全不同的数学性质和结论。
💡 [数值示例]
  • 示例:群 $G = \mathbb{Z}_2 = \{0, 1\}$ (模2加法群)和集合 $X = \mathbb{R}^2$ (二维平面)
  • 作用方式1:平凡作用
  • 定义:$0 \cdot (x, y) = (x, y)$$1 \cdot (x, y) = (x, y)$
  • 验证:这满足群作用公理。在这种作用下,$X$ 是一个 $\mathbb{Z}_2$-集。
  • 作用方式2:关于原点中心对称
  • 定义:$0 \cdot (x, y) = (x, y)$$1 \cdot (x, y) = (-x, -y)$
  • 验证:
  • 公理(2):$0 \cdot (x, y) = (x, y)$ 成立。
  • 公理(1):需要验证 $g_1 \cdot (g_2 \cdot (x,y)) = (g_1+g_2) \cdot (x,y)$。最关键的是 $1 \cdot (1 \cdot (x,y)) = (1+1)\cdot(x,y)$
  • 左边:$1 \cdot (1 \cdot (x,y)) = 1 \cdot (-x, -y) = (-(-x), -(-y)) = (x, y)$
  • 右边:$(1+1)\cdot(x,y) = 0 \cdot (x,y) = (x, y)$
  • 两边相等,公理(1)成立。
  • 在这种作用下,$X$ 也成为一个 $\mathbb{Z}_2$-集。
  • 结论:同一个集合 $\mathbb{R}^2$ 可以通过“平凡作用”和“中心对称作用”两种不同的方式,成为同一个群 $\mathbb{Z}_2$$G$-集。这两种 $G$-集的性质是截然不同的(第一种什么都没动,第二种产生了翻转)。
⚠️ [易错点]
  1. 默认的作用:在很多数学语境中,如果提到某个群和某个集合,通常会有一个“标准”或“自然”的作用方式被默认。例如,提到 $S_n$ 和集合 $\{1, ..., n\}$,默认作用就是置换。但作为初学者,最好时刻保持清醒,思考当前讨论的是哪一种作用。
  2. $G$-集不是一种新的集合$G$-集不是一种与普通集合并列的类型。它是一个普通集合 $X$ 附加了一个来自群 $G$ 的作用结构。它是一个“带有额外信息的集合”。
📝 [总结]

本句定义了 $G$-集 这个方便的术语,用来指代一个已经被群 $G$ 作用的集合 $X$。同时,它也发出了一个关键的警告:同一个群 $G$ 和集合 $X$ 可以有多种不同的作用方式,从而构成多种性质不同的 $G$-集。因此,在讨论 $G$-集时,必须明确上下文中的作用方式是什么。

🎯 [存在目的]

引入 $G$-集 这个术语是为了简化后续的表述。有了它,我们就不必每次都重复“一个被群 $G$ 作用的集合 $X$”,而可以直接说“一个 $G$-集 $X$”。括号里的内容则是为了培养严谨的数学思维,防止因忽略不同作用方式而导致的混淆和错误。

🧠 [直觉心智模型]
  1. $G$-集:就像给一个普通的“学生”(集合 $X$)分配了一个“导师”(群 $G$)。这个学生就成了“某某导师的学生”。
  2. 不止一种作用:同一个学生可以有不同的导师(比如一个学术导师,一个生活导师)。虽然还是那个学生,但因为导师不同,他接受的指导(作用)也不同,他的发展路径可能也不同。所以,当我们说“小明是李老师的学生”时,我们明确了是哪个老师。
💭 [直观想象]

想象一个普通的白色魔方(集合 $X$)。

  1. 如果我们定义一套“标准转动”规则(群 $G_1$),那么这个魔方就成了一个 $G_1$-集。
  2. 如果我们允许“拆开重装”的操作(群 $G_2$),那么同一个魔方又成了另一个 $G_2$-集。
  3. 如果我们只允许“贴贴纸”(群 $G_3$),那么它又成了 $G_3$-集。

虽然物理上都是那个白色魔方,但在不同的“游戏规则”(作用)下,它作为数学对象的身份($G$-集)是不同的。


📜 [原文6]

请注意,群作用与二元结构不同。在二元结构中,我们结合 $X$ 的两个元素得到 $X$ 的第三个元素(我们结合两个苹果得到一个苹果)。在群作用中,我们结合 $G$ 的一个元素与 $X$ 的一个元素得到 $X$ 的一个元素(我们结合一个苹果和一个橙子得到另一个橙子)。

📖 [逐步解释]

这段话旨在通过类比,辨析两个容易混淆的数学概念:群作用 (Group Action)二元结构 (Binary Structure) / 二元运算 (Binary Operation)

  • 请注意,群作用与二元结构不同。
  • 这是一个明确的提示,要求读者注意区分。
  • 二元结构:通常指一个集合 $X$ 配备一个二元运算。二元运算是一个函数 $\circ: X \times X \rightarrow X$,它取集合 $X$ 中的两个元素,经过运算后得到 $X$ 中的一个新元素。我们熟悉的加法、乘法都是二元运算。
  • 在二元结构中,我们结合 $X$ 的两个元素得到 $X$ 的第三个元素...
  • 这描述了二元运算的本质:操作的对象和产生的结果都来自同一个集合 $X$
  • 函数形式是 $\circ: X \times X \rightarrow X$
  • (我们结合两个苹果得到一个苹果):这是一个非常生动的比喻。想象一个“苹果汁”操作:输入是一个苹果和另一个苹果,输出还是一个苹果(可能是它们的混合物,但种类没变)。
  • 在群作用中,我们结合 $G$ 的一个元素与 $X$ 的一个元素得到 $X$ 的一个元素...
  • 这描述了群作用的本质:操作的发起者 $g$ 来自群 $G$,被操作者 $x$ 来自集合 $X$,而结果 $g \cdot x$ 仍然在集合 $X$ 中。
  • 函数形式是 $F: G \times X \rightarrow X$
  • (我们结合一个苹果和一个橙子得到另一个橙子):这是与之对应的比喻。
  • 橙子:代表被作用的集合 $X$ 的元素。
  • 苹果:代表作用者群 $G$ 的元素。
  • 操作:可以想象成“用苹果给橙子染色”。比如,一个“红苹果”(群元素)作用在一个“黄橙子”(集合元素)上,得到一个“红橙子”(集合元素)。结果的类别(橙子)没有变,但状态变了。操作的发起者(苹果)和被操作者(橙子)来自不同的集合。
💡 [数值示例]
  • 二元结构的例子:实数加法
  • 集合 $X = \mathbb{R}$
  • 二元运算 $\circ$ 是加法 +
  • 函数形式是 $+: \mathbb{R} \times \mathbb{R} \rightarrow \mathbb{R}$
  • 示例:取两个 $\mathbb{R}$ 的元素 3.142.713.14 + 2.71 = 5.85,结果 5.85 仍然在 $\mathbb{R}$ 中。两个“实数”进去,一个“实数”出来。
  • 群作用的例子:整数平移实数
  • $G = \mathbb{Z}$(整数加法群)。
  • 集合 $X = \mathbb{R}$(实数集合)。
  • 群作用 · 定义为 $n \cdot x = x + n$
  • 函数形式是 $F: \mathbb{Z} \times \mathbb{R} \rightarrow \mathbb{R}$
  • 示例:取一个 $G$ 的元素 -5 和一个 $X$ 的元素 3.14,作用结果是 $-5 \cdot 3.14 = 3.14 + (-5) = -1.86$。结果 -1.86$X$ 中。一个“整数”和一个“实数”进去,一个“实数”出来。
⚠️ [易错点]
  1. 群自身上的作用:一个特殊情况是群 $G$ 作用于其自身(即 $X=G$)。这时,输入是 $G \times G \rightarrow G$,看起来和二元运算很像。
  2. 左乘作用$g \cdot x = gx$ (群自身的乘法)。这时,群作用的函数恰好就是群的二元运算函数。
  3. 共轭作用$g \cdot x = gxg^{-1}$。这个函数 $F(g, x) = gxg^{-1}$ 就不是群自身的二元运算了。
  4. 所以,即使 $X=G$,也要根据作用的定义来判断,不能想当然地认为它就是群的二元运算。
📝 [总结]

这段话的核心区别在于输入的来源

  1. 二元运算:操作的两个输入都来自同一个集合 $X$。($X \times X \rightarrow X$)
  2. 群作用:操作的两个输入来自两个可能不同的集合:一个来自 $G$,一个来自集合 $X$。($G \times X \rightarrow X$)

这个区别是根本性的,理解它有助于避免概念混淆。

🎯 [存在目的]

作者预见到了初学者可能会将“群作用”与之前学过的“二元运算”相混淆,因为它们都涉及两个输入一个输出。因此,通过明确的对比和生动的比喻,提前澄清这个潜在的困惑点,帮助读者建立清晰的概念边界。

🧠 [直觉心智模型]
  1. 二元运算:是“内部合成”。像是两个乐高积木块(都属于“积木”这个集合)拼成一个新的积木块。
  2. 群作用:是“外部改造”。像是一只手(来自“手”的集合 $G$)拿起一块乐高积木(来自“积木”的集合 $X$),把它移动到另一个位置。积木还是那块积木,但它的状态(位置)变了。
💭 [直观想象]
  1. 二元运算:化学反应。氢气($H_2$)和氧气($O_2$)反应,生成水($H_2O$)。两种“分子”反应,生成一种新的“分子”。(这里为了比喻,忽略了配平,并且把它们都看作“分子”集合的元素)。
  2. 群作用:烹饪。厨师(来自“人”的集合 $G$)拿起一个鸡蛋(来自“食材”的集合 $X$),把它煎熟。结果是一个“熟鸡蛋”,它仍然是“食材”集合 $X$ 的一员。厨师并没有变成食材。

1. 1.3. 示例 1.1.2

📜 [原文7]

(1) 平凡作用:对于所有 $g \in G$$x \in X$, $g \cdot x=x$

📖 [逐步解释]

这是群作用中最简单、最基础的一种形式,被称为平凡作用 (Trivial Action)

  • 定义: 对于任何来自群 $G$ 的元素 $g$,以及任何来自集合 $X$ 的元素 $x$,作用的结果永远是 $x$ 本身。
  • 含义: 群里的所有元素,包括单位元和非单位元,作用在集合的元素上时,都表现为“什么也不做”。被作用的元素 $x$ 的状态没有任何改变。

我们来验证它是否满足群作用的两条公理:

  • 验证公理(1):$g_{1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1} g_{2}\right) \cdot x$
  • 左边:$g_{1} \cdot\left(g_{2} \cdot x\right)$。根据平凡作用的定义,$g_2 \cdot x = x$。所以左边等于 $g_1 \cdot x$。再根据定义,$g_1 \cdot x = x$。所以左边最终结果是 $x$
  • 右边:$\left(g_{1} g_{2}\right) \cdot x$。令 $g_3 = g_1 g_2$,这是群里的一个新元素。根据平凡作用的定义,$g_3 \cdot x = x$。所以右边结果也是 $x$
  • 左边 = 右边,公理(1)成立。
  • 验证公理(2):$1 \cdot x=x$
  • 根据平凡作用的定义,对于所有 $g \in G$ 都有 $g \cdot x=x$。群的单位元 $1$ 当然也是 $G$ 的一个元素,所以 $1 \cdot x = x$ 自然成立。公理(2)成立。

既然两条公理都满足,平凡作用确实是一个合法的群作用。

💡 [数值示例]
  • 示例1: $D_4$ 在正方形顶点集合上的平凡作用
  • $G = D_4$(正方形对称群)。
  • 集合 $X = \{v_1, v_2, v_3, v_4\}$(四个顶点)。
  • 作用:$g \cdot v_i = v_i$ 对于任何 $g \in D_4$ 和任何顶点 $v_i$
  • 例如,取“旋转90度”这个操作 $r_{90} \in D_4$。在自然作用下,$r_{90} \cdot v_1 = v_2$。但在平凡作用下,$r_{90} \cdot v_1 = v_1$。什么都没发生。
  • 示例2: 实数乘法群 $\mathbb{R}^*$$\mathbb{R}^2$ 上的平凡作用
  • $G = \mathbb{R}^*$
  • 集合 $X = \mathbb{R}^2$
  • 作用:$t \cdot (x,y) = (x,y)$ 对于任何 $t \in \mathbb{R}^*$ 和任何点 $(x,y) \in \mathbb{R}^2$
  • 例如,取 $t=2 \in \mathbb{R}^*$。在标量乘法作用下,$2 \cdot (1,3) = (2,6)$。但在平凡作用下,$2 \cdot (1,3) = (1,3)$。向量保持原样。
⚠️ [易错点]
  1. 不要与自然作用混淆:对于很多群和集合的组合,存在一个非常“自然”的、非平凡的作用。平凡作用是人为定义的一种最简单的作用,它忽略了群元素可能具有的任何几何或代数意义。
  2. 任何群和任何集合都可以定义平凡作用:平凡作用的普适性在于它的定义不依赖于 $G$$X$ 的任何特定属性。只要有群和集合,就能定义平凡作用。
📝 [总结]

平凡作用是群作用的一个基本例子,其核心特征是群中的任何元素作用于集合中的任何元素都不会使其发生任何改变。它总是满足群作用的公理,是我们可以为任何群和集合定义的“最懒惰”的作用。

🎯 [存在目的]
  1. 作为基础示例:它是理解群作用定义后最容易验证和掌握的例子。
  2. 作为参照物:其他“有趣”的、非平凡的作用,可以通过与平凡作用的对比来彰显其特性。
  3. 理论上的重要性:在某些理论构建和分类中,平凡作用是不可或缺的一类。例如,一个群作用的“核”就是那些表现得像平凡作用的元素的集合。
🧠 [直觉心智模型]

平凡作用就像一个“坏掉的工具箱”。无论你从里面拿出锤子、扳手还是螺丝刀(群元素 $g$),去对一个物体(集合元素 $x$)进行操作,结果什么都没发生,物体还是老样子。

💭 [直观想象]

你对着电脑屏幕上的一个像素点(元素 $x$),按键盘上的任意一个键(群元素 $g$),比如'A'键、'Shift'键或'Ctrl'键。在“平凡作用”下,这个像素点的颜色、位置没有任何变化。所有的按键都“失灵”了。


📜 [原文8]

(2) 群 $\mathbb{R}^{*}$ 通过标量乘法作用于向量空间 $\mathbb{R}^{n}$:给定 $t \in \mathbb{R}^{*}$$\mathbf{v} \in \mathbb{R}^{n}$,设 $t \cdot \mathbf{v}=t \mathbf{v} \in \mathbb{R}^{n}$ 为标量乘法。这是作用的事实源于标量乘法的熟知性质:$t_{1}\left(t_{2} \mathbf{v}\right)=\left(t_{1} t_{2}\right) \mathbf{v}$$1 \mathbf{v}=\mathbf{v}$,对于所有 $t_{1}, t_{2} \in \mathbb{R}^{*}$$\mathbf{v} \in \mathbb{R}^{n}$。(当然,这些性质对于 $t_{1}, t_{2} \in \mathbb{R}$ 也成立,但 $\mathbb{R}$ 在乘法下不是群。此外,标量乘法还有与标量或向量的加法相关的附加性质。)

📖 [逐步解释]

这个例子展示了一个非常实用和常见的群作用:标量乘法

  • $\mathbb{R}^{*}$
  • 符号 $\mathbb{R}$ 代表所有实数的集合。
  • 上标 * (星号) 通常表示从集合中去掉加法单位元(即0)。所以 $\mathbb{R}^{*} = \mathbb{R} - \{0\}$,是所有非零实数的集合。
  • 这个集合在乘法运算下构成一个
  • 封闭性:两个非零实数相乘,结果还是非零实数。
  • 结合律$(a \times b) \times c = a \times (b \times c)$
  • 单位元:是数字 1
  • 逆元:任何非零实数 $t$ 的逆元是 $1/t$
  • 向量空间 $\mathbb{R}^{n}$
  • 这是我们的集合 $X$。它是一个 $n$ 维实数向量空间。
  • 元素是形如 $\mathbf{v} = (v_1, v_2, ..., v_n)$ 的向量。
  • 作用方式:$t \cdot \mathbf{v}=t \mathbf{v}$ (标量乘法)
  • 这里的 · 是群作用的符号,而右边的 $t\mathbf{v}$ 是我们在线性代数中熟悉的标量乘法
  • 标量乘法定义为:$t(v_1, v_2, ..., v_n) = (tv_1, tv_2, ..., tv_n)$。即将向量的每个分量都乘以标量 $t$
  • 这个作用的几何意义是缩放:如果 $|t|>1$,向量被拉长;如果 $0<|t|<1$,向量被缩短;如果 $t<0$,向量方向反转。
  • 验证这是一个作用:
  • 公理(1):$t_{1} \cdot (t_{2} \cdot \mathbf{v}) = (t_1 t_2) \cdot \mathbf{v}$
  • 左边:$t_1 \cdot (t_2 \mathbf{v})$。根据定义,这等于标量乘法 $t_1(t_2\mathbf{v})$
  • 右边:$(t_1 t_2) \cdot \mathbf{v}$。根据定义,这等于标量乘法 $(t_1t_2)\mathbf{v}$
  • 线性代数的基本性质告诉我们,$t_1(t_2\mathbf{v}) = (t_1t_2)\mathbf{v}$。这个性质就是标量乘法与实数乘法的相容性结合律。所以公理(1)成立。
  • 公理(2):$1 \cdot \mathbf{v} = \mathbf{v}$
  • $\mathbb{R}^{*}$ 的单位元是 1
  • 根据定义,$1 \cdot \mathbf{v}$ 等于标量乘法 $1\mathbf{v}$
  • 线性代数的基本性质告诉我们,$1\mathbf{v} = \mathbf{v}$。所以公理(2)成立。
  • 括号里的补充说明:
  • “当然,这些性质对于 $t_{1}, t_{2} \in \mathbb{R}$ 也成立”: 指的是标量乘法的结合律和单位元律对于所有实数(包括0)都成立。
  • “但 $\mathbb{R}$ 在乘法下不是群”: 这是一个关键点。为什么我们选择 $\mathbb{R}^*$ 而不是 $\mathbb{R}$ 作为群?因为 0 在乘法下没有逆元 ($1/0$ 无定义),所以 $\mathbb{R}$ 和乘法不能构成一个群。群作用的定义要求 $G$ 必须是一个群。
  • “此外,标量乘法还有与标量或向量的加法相关的附加性质”: 这是提醒我们,$\mathbb{R}^n$ 不仅仅是一个集合,它还是一个向量空间,拥有更丰富的结构。标量乘法还满足分配律,如 $t(\mathbf{u}+\mathbf{v}) = t\mathbf{u} + t\mathbf{v}$$(t_1+t_2)\mathbf{v} = t_1\mathbf{v} + t_2\mathbf{v}$。但在讨论群作用时,我们只关心那两条核心公理,暂时忽略了这些额外的加法性质。
💡 [数值示例]
  • 示例1: $n=2$
  • $G = \mathbb{R}^*$
  • 集合 $X = \mathbb{R}^2$
  • 元素 $t_1=2, t_2=3 \in G$,向量 $\mathbf{v}=(1, -2) \in X$
  • 验证公理(1):
  • 左边:$2 \cdot (3 \cdot (1, -2)) = 2 \cdot (3, -6) = (6, -12)$
  • 右边:$(2 \times 3) \cdot (1, -2) = 6 \cdot (1, -2) = (6, -12)$
  • 两边相等。
  • 验证公理(2):
  • $1 \cdot (1, -2) = (1, -2)$
  • 示例2: $n=3$
  • $G = \mathbb{R}^*$
  • 集合 $X = \mathbb{R}^3$
  • 元素 $t_1=-1, t_2=0.5 \in G$,向量 $\mathbf{v}=(10, 0, -4) \in X$
  • 验证公理(1):
  • 左边:$-1 \cdot (0.5 \cdot (10, 0, -4)) = -1 \cdot (5, 0, -2) = (-5, 0, 2)$
  • 右边:$(-1 \times 0.5) \cdot (10, 0, -4) = -0.5 \cdot (10, 0, -4) = (-5, 0, 2)$
  • 两边相等。
⚠️ [易错点]
  1. 为什么是 $\mathbb{R}^*$ 而不是 $\mathbb{R}$:这是最关键的易错点。群作用的定义要求作用者来自一个$\mathbb{R}$ 在乘法下不是群,因为它包含0,而0没有乘法逆元。
  2. 群作用 vs. 向量空间:向量空间的八条公理比群作用的两条公理要多得多。群作用只关注了标量乘法的一部分性质。可以说,向量空间的定义内蕴了一个群作用(即 $\mathbb{R}^*$ 的标量乘法作用)。
📝 [总结]

线性代数中我们熟知的标量乘法,是非零实数乘法群 $\mathbb{R}^{*}$ 作用于向量空间 $\mathbb{R}^n$ 上的一个标准范例。其作用的结合律和单位元性质,正好对应了群作用定义中的两条公理。这个例子展示了抽象的群作用概念是如何根植于我们已有的数学知识之中的。

🎯 [存在目的]

这个例子的目的是:

  1. 联系旧知:将新的、抽象的群作用概念与学生熟悉的线性代数知识(标量乘法)联系起来,降低理解难度。
  2. 提供典范:标量乘法是一个非常重要且基础的群作用模型,在几何和物理中无处不在。
  3. 强调群的定义:通过辨析 $\mathbb{R}^*$$\mathbb{R}$,再次强调了群作用定义中“$G$ 是一个群”这一前提的严格性。
🧠 [直觉心智模型]

想象一条橡皮筋的一端固定在原点。

  1. 向量 $\mathbf{v}$:是橡皮筋上没有被拉伸时的一个点。
  2. 群元素 $t \in \mathbb{R}^*$:是一个“拉伸/压缩指令”。
  3. 作用 $t \cdot \mathbf{v}$
  4. 如果 $t=2$,就是把橡皮筋拉长到原来的两倍,点 $\mathbf{v}$ 就跑到了 $2\mathbf{v}$ 的位置。
  5. 如果 $t=0.5$,就是让橡皮筋收缩到原来的一半,点 $\mathbf{v}$ 跑到了 $0.5\mathbf{v}$ 的位置。
  6. 如果 $t=-1$,就是保持长度不变,但让橡皮筋穿过原点翻到反方向,点 $\mathbf{v}$ 跑到了 $-\mathbf{v}$ 的位置。
  7. 公理(1):先拉长3倍,再拉长2倍,和一次性拉长6倍,效果是一样的。
  8. 公理(2):拉长1倍,等于没动。
💭 [直观想象]

看着绘图软件里的一个矢量图形(比如一个箭头)。你使用“缩放”工具(这对应于 $\mathbb{R}^*$)来改变它的大小。

  1. 向量 $\mathbf{v}$:箭头本身。
  2. 群元素 $t$:你在缩放输入框里输入的比例,比如200%($t=2$)或50%($t=0.5$)。
  3. 群作用:执行缩放操作。

这个过程就是一个群作用。你不可能输入0%($t=0$),因为那样图形就消失了,这个操作是不可逆的,不属于群的操作。


📜 [原文9]

(3) $G L_{n}(\mathbb{R})$ 通过通常的规则 $A \cdot \mathbf{v}=A \mathbf{v}$ 作用于 $\mathbb{R}^{n}$,这是矩阵 $A$ 在向量 $\mathbf{v}$ 上的乘法,与 $F(\mathbf{v})$ 相同,其中 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{n}$ 是对应于 $A$ 的线性函数。类似地,$O_{n}$$S O_{n}$ 作用于 $\mathbb{R}^{n}$。请注意,$G L_{n}(\mathbb{R})$$S_{\mathbb{R}^{n}}$ 的子群,$S_{\mathbb{R}^{n}}$ 是从 $\mathbb{R}^{n}$ 到自身的所有双射的群,并且 $G L_{n}(\mathbb{R})$$\mathbb{R}^{n}$ 上的作用是由 $S_{\mathbb{R}^{n}}$$\mathbb{R}^{n}$ 上的作用诱导的,通过将函数 $F$ 应用于向量 $\mathbf{v}$。同样,子群 $O_{n}$$S O_{n}$$\mathbb{R}^{n}$ 上的作用是由 $G L_{n}(\mathbb{R})$ 的作用诱导的。这是一般情况的一部分:如果群 $G$ 作用于集合 $X$ 并且 $H \leq G$,那么 $H$ 也通过限制作用于 $X$

📖 [逐步解释]

这个例子介绍了另一类非常重要的群作用:矩阵群对向量空间的作用。

  • $G L_{n}(\mathbb{R})$ 作用于 $\mathbb{R}^{n}$:
  • $G = G L_{n}(\mathbb{R})$:这是 $n$ 维一般线性群 (General Linear group)。它包含了所有 $n \times n$可逆实数矩阵。群运算是矩阵乘法。单位元是 $n \times n$单位矩阵 $\mathbf{I}$
  • 集合 $X = \mathbb{R}^{n}$$n$ 维向量空间。
  • 作用方式 $A \cdot \mathbf{v}=A \mathbf{v}$:作用被定义为标准的矩阵与向量的乘法。输入一个 $n \times n$ 矩阵 $A$ 和一个 $n \times 1$ 的列向量 $\mathbf{v}$,输出一个新的 $n \times 1$ 的列向量。
  • 验证作用:
  • 公理(1):$A_1 \cdot (A_2 \cdot \mathbf{v}) = (A_1 A_2) \cdot \mathbf{v}$
  • 左边:$A_1 \cdot (A_2 \mathbf{v})$。根据定义,这等于矩阵乘法 $A_1(A_2 \mathbf{v})$
  • 右边:$(A_1 A_2) \cdot \mathbf{v}$。根据定义,这等于矩阵乘法 $(A_1 A_2)\mathbf{v}$
  • 矩阵乘法满足结合律,所以 $A_1(A_2 \mathbf{v}) = (A_1 A_2)\mathbf{v}$。公理(1)成立。
  • 公理(2):$\mathbf{I} \cdot \mathbf{v} = \mathbf{v}$
  • $G L_{n}(\mathbb{R})$ 的单位元是单位矩阵 $\mathbf{I}$
  • 根据定义,$\mathbf{I} \cdot \mathbf{v}$ 等于矩阵乘法 $\mathbf{I}\mathbf{v}$
  • 线性代数的基本性质是 $\mathbf{I}\mathbf{v} = \mathbf{v}$。公理(2)成立。
  • 与线性函数的关系:
  • 每个 $n \times n$ 矩阵 $A$ 都定义了一个线性变换 $F: \mathbb{R}^{n} \rightarrow \mathbb{R}^{n}$,其规则就是 $F(\mathbf{v}) = A\mathbf{v}$。所以说,矩阵作用于向量,等价于该矩阵对应的线性函数作用于向量。
  • 子群的作用:
  • $O_{n}$ (正交群 Orthogonal group):所有 $n \times n$ 正交矩阵的集合。正交矩阵的性质是 $A^T A = \mathbf{I}$,它保持向量的长度(范数)不变。它是 $G L_{n}(\mathbb{R})$ 的一个子群。
  • $S O_{n}$ (特殊正交群 Special Orthogonal group):所有 $n \times n$ 正交矩阵且行列式为1的集合。它在保持长度的基础上还保持空间的“定向”(不含镜像翻转)。它是 $O_n$ 的子群,也是 $G L_{n}(\mathbb{R})$ 的子群。
  • 类似地,$O_{n}$$S O_{n}$ 作用于 $\mathbb{R}^{n}$: 因为 $O_n$$S O_n$ 的元素本身就是 $G L_{n}(\mathbb{R})$ 的元素,所以它们作用于 $\mathbb{R}^n$ 的方式完全相同,都是通过矩阵乘法。由于它们是 $G L_{n}(\mathbb{R})$ 的子群,已经在大群里被验证过的群作用公理,在子群中自然也成立。
  • 更一般性的解释:
  • $S_{\mathbb{R}^{n}}$:这是集合 $\mathbb{R}^n$ 上所有双射(bijective functions,即一一对应的函数)构成的群,群运算是函数的复合。这是一个非常巨大、抽象的群。
  • $G L_{n}(\mathbb{R})$$S_{\mathbb{R}^{n}}$ 的子群: 每个可逆矩阵 $A$ 对应的线性变换 $F(\mathbf{v}) = A\mathbf{v}$ 都是一个从 $\mathbb{R}^n$$\mathbb{R}^n$ 的双射。因此,$G L_{n}(\mathbb{R})$ 可以看作是 $S_{\mathbb{R}^{n}}$ 中那些恰好是线性变换的双射构成的子群。
  • 作用的诱导 (Induced Action)
  1. 首先,有一个最普遍的作用:$S_{\mathbb{R}^{n}}$ 作用于 $\mathbb{R}^n$,方式是函数求值,即 $\sigma \cdot \mathbf{v} = \sigma(\mathbf{v})$,其中 $\sigma \in S_{\mathbb{R}^{n}}$
  2. 因为 $G L_{n}(\mathbb{R})$$S_{\mathbb{R}^{n}}$ 的子群,所以 $G L_{n}(\mathbb{R})$ 的作用可以看作是 $S_{\mathbb{R}^{n}}$ 作用的限制 (restriction)
  3. 同样,$O_n$$G L_{n}(\mathbb{R})$ 的子群,所以 $O_n$ 的作用也是 $G L_{n}(\mathbb{R})$ 作用的限制。
  • 一般结论: 如果群 $G$ 作用于集合 $X$ 并且 $H \leq G$(H是G的子群),那么 $H$ 也通过限制作用于 $X$。这是因为 $H$ 的元素都属于 $G$,并且 $H$ 的运算也是 $G$ 的运算,所以满足群作用公理的条件对于 $H$ 来说自动满足。
💡 [数值示例]
  • 示例1: $G = GL_2(\mathbb{R})$ 作用于 $X=\mathbb{R}^2$
  • $A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \in GL_2(\mathbb{R})$ (这是一个剪切变换矩阵)。
  • $\mathbf{v} = \begin{pmatrix} 2 \\ 1 \end{pmatrix} \in \mathbb{R}^2$
  • 作用结果:$A \cdot \mathbf{v} = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} 1\cdot2 + 1\cdot1 \\ 0\cdot2 + 1\cdot1 \end{pmatrix} = \begin{pmatrix} 3 \\ 1 \end{pmatrix}$。点 $(2,1)$ 被变换到了 $(3,1)$
  • 示例2: $G = SO_2(\mathbb{R})$ 作用于 $X=\mathbb{R}^2$
  • $SO_2(\mathbb{R})$$GL_2(\mathbb{R})$ 的子群。
  • $A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \in SO_2(\mathbb{R})$ (这是旋转90度的矩阵)。
  • $\mathbf{v} = \begin{pmatrix} 2 \\ 1 \end{pmatrix} \in \mathbb{R}^2$
  • 作用结果:$A \cdot \mathbf{v} = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} -1 \\ 2 \end{pmatrix}$。点 $(2,1)$ 被旋转到了 $(-1,2)$。这个作用保持了向量的长度:$\sqrt{2^2+1^2} = \sqrt{(-1)^2+2^2} = \sqrt{5}$
⚠️ [易错点]
  1. 可逆性是关键$G L_{n}(\mathbb{R})$ 要求矩阵是可逆的,这是它能构成一个群的根本原因。不可逆矩阵不能作为一般线性群的元素。
  2. 子群和父群的作用方式相同:子群 $H$ 作用于 $X$ 的方式和父群 $G$ 作用于 $X$ 的方式是完全一样的,只是我们把可选操作的范围从 $G$ 缩小到了 $H$
📝 [总结]

一般线性群 $G L_{n}(\mathbb{R})$ 及其子群(如正交群 $O_n$特殊正交群 $S O_n$)通过标准的矩阵乘法作用于向量空间 $\mathbb{R}^n$。这是一个核心的群作用范例,它将抽象的群论与线性代数中的几何变换(旋转、反射、缩放、剪切等)紧密联系起来。这个例子还引出了一个普遍原理:任何群作用都可以被限制到其任意子群上。

🎯 [存在目的]
  1. 建立代数与几何的桥梁:这个例子是群论在几何学中应用的核心。它表明矩阵群可以用来精确描述和研究几何变换。
  2. 引入子群作用的概念:通过 $O_n$$S O_n$ 的例子,自然地引入了“作用的限制”这一重要思想,即子群继承了父群的作用。
  3. 为后续概念铺垫:像轨道、稳定子等概念,在矩阵群作用于向量空间的例子中都有非常直观的几何解释。
🧠 [直觉心智模型]
  1. $\mathbb{R}^n$:想象成一块有弹性的、透明的橡胶块,上面画着网格。
  2. $G L_{n}(\mathbb{R})$:你对这块橡胶进行各种操作的集合,这些操作必须是“可逆的”(可以复原),并且保持直线仍然是直线。
  3. $A \in G L_{n}(\mathbb{R})$:一次具体的操作,比如你把橡胶块均匀拉伸、旋转、或剪切。
  4. $A \cdot \mathbf{v}$:原来在 $\mathbf{v}$ 位置的一个点,经过你这次操作后,跑到了新的位置。
  5. $O_n$$S O_n$:是你操作集合中的一个“子集”。
  6. $O_n$:只包含那些不改变任何两点之间距离的操作(刚性变换,如旋转和翻转)。
  7. $S O_n$:在 $O_n$ 的基础上,还排除了那些会把“左手手套”变成“右手手套”的翻转操作,只留下纯旋转。
💭 [直观想象]

打开一个3D建模软件。

  1. $\mathbb{R}^3$:是软件中的三维场景。
  2. $G L_3(\mathbb{R})$:是你可以对场景中的物体做的所有线性变换工具,包括缩放、旋转、倾斜等。
  3. $A \cdot \mathbf{v}$:你选中一个物体(其顶点坐标是 $\mathbf{v}$),然后使用一个变换工具 $A$,物体就移动和变形到了新的位置 $A\mathbf{v}$
  4. $S O_3(\mathbb{R})$:是你工具箱里的“旋转”工具集。它只能旋转物体,不能拉伸或压扁物体。这个工具集是所有变换工具的一个子集。

📜 [原文10]

此外,$O_{n}$$S O_{n}$ 作用于由以下定义的半径为 1 的 $(n-1)$-球面 $S^{n-1}$

$$ S^{n-1}=\left\{\mathbf{v} \in \mathbb{R}^{n}:\|\mathbf{v}\|=1\right\} $$

📖 [逐步解释]

这句话在前一个例子的基础上,进一步缩小了被作用的集合,从整个空间 $\mathbb{R}^n$ 缩小到一个特定的子集——单位球面 $S^{n-1}$

  • $O_{n}$$S O_{n}$: 我们已经知道,这是正交群特殊正交群。它们的核心特性是其矩阵表示的变换保持向量长度(范数)不变
  • 作用于... $(n-1)$-球面 $S^{n-1}$:
  • 球面 $S^{n-1}$: 这是一个几何对象的符号。它表示在 $n$ 维空间 $\mathbb{R}^n$ 中的一个单位球面。上标 $n-1$ 指的是球面的维度。一个 $k$ 维球面是局部看起来像 $\mathbb{R}^k$ 的曲面。
  • 为什么是 $n-1$ 维? 因为球面上的任意一点,它的邻域可以被 $n-1$ 个坐标参数化。例如,地球表面(2维球面)上的一个点,可以用经度和纬度(2个参数)来定位。
  • 作用的合法性:
  1. 我们已知 $O_n$$S O_n$ 作用于整个空间 $\mathbb{R}^n$
  2. 现在我们考虑一个特殊的子集 $X' = S^{n-1} \subset \mathbb{R}^n$
  3. 要想让 $O_n$$S O_n$ 能够作用于 $X'$,必须保证对于任何 $A \in O_n$ (或 $S O_n$) 和任何 $\mathbf{v} \in X'$, 作用的结果 $A\mathbf{v}$ 仍然在 $X'$ 中。
  4. 让我们来检查:
    • $\mathbf{v} \in S^{n-1}$,这意味着 $\|\mathbf{v}\| = 1$
    • $A \in O_n$。正交变换的定义就是它保持范数,即 $\|A\mathbf{v}\| = \|\mathbf{v}\|$
    • 因此,$\|A\mathbf{v}\| = \|\mathbf{v}\| = 1$
    • 这说明 $A\mathbf{v}$ 仍然是一个单位向量,所以 $A\mathbf{v} \in S^{n-1}$
  5. 结论:集合 $S^{n-1}$$O_n$$S O_n$ 的作用下是封闭的(或者叫不变的)。因此,$O_n$$S O_n$ 可以合法地作用于单位球面 $S^{n-1}$
∑ [公式拆解]

$$ S^{n-1}=\left\{\mathbf{v} \in \mathbb{R}^{n}:\|\mathbf{v}\|=1\right\} $$

  • $S^{n-1}$: $(n-1)$-维单位球面的符号。
  • $\{\...\}$: 集合的表示法,花括号内描述了集合的元素。
  • $\mathbf{v} \in \mathbb{R}^{n}$: 集合的元素 $\mathbf{v}$ 是来自 $n$ 维实数向量空间 $\mathbb{R}^n$ 的向量。
  • :: 读作“使得”(such that),它后面是筛选条件。
  • $\|\mathbf{v}\|$: 向量 $\mathbf{v}$欧几里得范数(或长度)。如果 $\mathbf{v} = (v_1, v_2, ..., v_n)$,那么 $\|\mathbf{v}\| = \sqrt{v_1^2 + v_2^2 + ... + v_n^2}$
  • $\|\mathbf{v}\|=1$: 这就是筛选条件,要求向量的长度必须等于1。
  • 整体含义: $S^{n-1}$$\mathbb{R}^n$ 中所有长度为1的向量的集合。
💡 [数值示例]
  • 示例1: $n=2$, 球面是 $S^1$
  • 公式:$S^1 = \{(x, y) \in \mathbb{R}^2 : \|(x,y)\| = \sqrt{x^2+y^2} = 1\}$。这就是我们熟悉的平面直角坐标系中的单位圆
  • $G = SO(2)$,即所有 $2 \times 2$ 旋转矩阵。
  • $\mathbf{v} = (1, 0) \in S^1$ (单位圆上的一个点)。
  • $A = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} \in SO(2)$
  • 作用结果:$A\mathbf{v} = (\cos\theta, \sin\theta)$
  • 验证:新点的长度是 $\sqrt{\cos^2\theta + \sin^2\theta} = \sqrt{1} = 1$。所以结果点 $(\cos\theta, \sin\theta)$ 仍然在单位圆 $S^1$ 上。
  • 示例2: $n=3$, 球面是 $S^2$
  • 公式:$S^2 = \{(x, y, z) \in \mathbb{R}^3 : \sqrt{x^2+y^2+z^2} = 1\}$。这是三维空间中的单位球面
  • $G = SO(3)$,三维旋转矩阵。
  • $\mathbf{v} = (0, 0, 1) \in S^2$ (球面的北极点)。
  • $A$ 是绕 $y$ 轴旋转90度的矩阵:$A = \begin{pmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ -1 & 0 & 0 \end{pmatrix} \in SO(3)$
  • 作用结果:$A\mathbf{v} = \begin{pmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ -1 & 0 & 0 \end{pmatrix} \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}$
  • 验证:北极点 $(0,0,1)$ 被旋转到了赤道上的点 $(1,0,0)$。新点的长度是 $\sqrt{1^2+0^2+0^2} = 1$,所以仍然在单位球面 $S^2$ 上。
⚠️ [易错点]
  1. 维度的混淆: $S^{n-1}$ 是在 $\mathbb{R}^n$ 空间里的对象。例如,$S^2$ (二维球面) 存在于 $\mathbb{R}^3$ (三维空间) 中。不要把上标和空间的维度搞混。
  2. $GL_n$ 不能保证作用于球面: 一般的 $G L_{n}(\mathbb{R})$ 矩阵(如拉伸或剪切矩阵)会改变向量的长度,所以它不能保证将球面上的点映射回球面。例如,矩阵 $A = \begin{pmatrix} 2 & 0 \\ 0 & 1 \end{pmatrix}$ 作用于点 $(1,0) \in S^1$,得到 $(2,0)$,这个点不在 $S^1$ 上。因此,我们不能说 $G L_{n}(\mathbb{R})$ 作用于 $S^{n-1}$
📝 [总结]

由于正交群 $O_n$特殊正交群 $S O_n$ 的变换保持向量长度不变,它们不仅能作用于整个 $n$ 维空间 $\mathbb{R}^n$,还能将其作用限制在任何以原点为中心的球面上。最典型的例子是作用于单位球面 $S^{n-1}$。这是群作用在几何学中一个至关重要的应用,描述了球面的旋转对称性。

🎯 [存在目的]

这个例子展示了群作用的一个重要特性:寻找在作用下的不变子集 (invariant subset)。整个空间 $\mathbb{R}^n$$O_n$ 作用下可以被分解为无穷多个不变子集,每个子集就是一个以原点为中心的球面。研究群在这些更小的、结构更简单的子集上的作用,通常比研究在整个空间上的作用更容易,也更能揭示问题的本质。

🧠 [直觉心智模型]

想象一个完美的篮球(单位球面 $S^2$)悬浮在空中。

  1. $SO(3)$: 你可以对这个篮球进行的所有纯旋转操作(用手拨动它绕任何轴旋转)。
  2. 作用: 每次旋转,篮球上的每个点都会移动到球面上一个新的位置。
  3. 不变性: 无论你怎么转,篮球还是那个篮球,它占据的空间不变,球面上的点永远不会跑到球的内部或外部。这就是说,球面这个集合在旋转群 $SO(3)$ 的作用下是“不变的”。
💭 [直观想象]

你正看着一个地球仪 ($S^2$)。

  1. $SO(3)$ 的一个元素就是你用手拨动地球仪,让它绕地轴自转,或者让它绕着穿过赤道的某根轴翻转。
  2. 北京这个点(球面上的一个元素 $\mathbf{v}$)经过你的拨动(群元素 $A$),跑到了莫斯科的位置(新的元素 $A\mathbf{v}$)。
  3. 重要的是,无论你怎么转,北京这个点永远不会跑到地心或者外太空去,它始终在地球表面上。所以,$SO(3)$ 确实作用于 $S^2$

📜 [原文11]

请注意,$S^{1}=U(1)$$\mathbb{R}^{2}$ 中的单位圆,$S^{2}$$\mathbb{R}^{3}$ 中的单位球面。半径为 $r>0$$(n-1)$-球面类似地定义,$O_{n}$$S O_{n}$ 也作用于半径为 $r$$(n-1)$-球面。

📖 [逐步解释]

这段话是对前面例子的具体化和推广。

  • 请注意,$S^{1}=U(1)$$\mathbb{R}^{2}$ 中的单位圆
  • $S^1$: 根据前面的定义,$n=2$ 时, $S^{2-1} = S^1$$\mathbb{R}^2$ 中的单位球面,也就是单位圆
  • $U(1)$: 这是另一个数学符号,代表 酉群 (Unitary group) of degree 1。它定义为所有绝对值为1的复数的集合,在复数乘法下构成一个群。即 $U(1) = \{z \in \mathbb{C} : |z|=1\}$
  • $S^1 = U(1)$: 这里是在说,单位圆 $S^1$ 和群 $U(1)$ 是可以被看作是同一个东西的。我们可以通过复平面将它们等同起来:$\mathbb{R}^2$ 中的点 $(x, y)$ 对应于复数 $z = x+iy$。那么,点在单位圆上的条件 $\sqrt{x^2+y^2}=1$ 就等价于复数的绝对值 $|z|=1$。因此,$S^1$ 作为点的集合与 $U(1)$ 作为复数的集合是完全对应的。这个等号在不同上下文中有细微差别:作为点的集合是相等的;而 $U(1)$ 还额外强调了其上的群结构(复数乘法),$S^1$ 在这里仅被看作一个被作用的集合
  • $S^{2}$$\mathbb{R}^{3}$ 中的单位球面
  • 这是 $n=3$ 的情况, $S^{3-1}=S^2$$\mathbb{R}^3$ 中的单位球面。这是我们日常生活中最熟悉的球面,像篮球、地球仪的表面。
  • 半径为 $r>0$$(n-1)$-球面类似地定义
  • 单位球面的半径是1。半径为 $r$ 的球面,其定义就是把条件 $\|\mathbf{v}\|=1$ 改成 $\|\mathbf{v}\|=r$
  • 它的数学表达式是:$\{\mathbf{v} \in \mathbb{R}^{n}:\|\mathbf{v}\|=r\}$
  • $O_{n}$$S O_{n}$ 也作用于半径为 $r$$(n-1)$-球面
  • 这与作用于单位球面是完全相同的逻辑。
  • $\mathbf{v}$ 是一个长度为 $r$ 的向量,即 $\|\mathbf{v}\|=r$
  • $A \in O_n$。因为正交变换保持长度,所以 $\|A\mathbf{v}\| = \|\mathbf{v}\| = r$
  • 这意味着作用后的向量 $A\mathbf{v}$ 仍然在半径为 $r$ 的球面上。
  • 因此,半径为 $r$ 的球面也是 $O_n$$S O_n$ 作用下的一个不变子集。
💡 [数值示例]
  • 示例1: $S^1$$U(1)$ 的等同
  • 单位圆上的点 $(\cos\theta, \sin\theta)$ 对应于复平面上的复数 $\cos\theta + i\sin\theta = e^{i\theta}$
  • 两个点 $(\cos\theta_1, \sin\theta_1)$$(\cos\theta_2, \sin\theta_2)$
  • 它们对应的复数在 $U(1)$ 群中相乘:$e^{i\theta_1} e^{i\theta_2} = e^{i(\theta_1+\theta_2)}$
  • 结果 $e^{i(\theta_1+\theta_2)}$ 对应的点是 $(\cos(\theta_1+\theta_2), \sin(\theta_1+\theta_2))$,它仍然在单位圆上。这展示了 $U(1)$ 的群运算在 $S^1$ 上的封闭性。
  • 示例2: $SO(2)$ 作用于半径为 $r=5$ 的圆
  • 集合是 $X = \{(x,y) \in \mathbb{R}^2 : x^2+y^2 = 25\}$
  • 取圆上的一个点 $\mathbf{v} = (3, 4)$。确实 $\|(3,4)\| = \sqrt{3^2+4^2} = \sqrt{9+16}=\sqrt{25}=5$
  • 取群中的一个元素 $A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \in SO(2)$ (旋转90度)。
  • 作用结果 $A\mathbf{v} = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 3 \\ 4 \end{pmatrix} = \begin{pmatrix} -4 \\ 3 \end{pmatrix}$
  • 验证:新点的长度是 $\|(-4,3)\| = \sqrt{(-4)^2+3^2} = \sqrt{16+9}=\sqrt{25}=5$。结果点仍然在半径为5的圆上。
⚠️ [易错点]
  1. $S^1$$U(1)$ 的区别:在严格的语境下,当我们说 $S^1$ 时,我们通常指它的拓扑或几何性质(作为一个空间)。当我们说 $U(1)$ 时,我们更强调它的群结构。但它们所包含的“点”的集合是一样的,所以经常被不加区分地使用。
  2. $r=0$ 的情况:如果半径 $r=0$,那么球面就只包含一个点:原点 $\mathbf{0}$。这个集合 $\{\mathbf{0}\}$ 在任何线性变换 $A$ 下都是不变的 ($A\mathbf{0} = \mathbf{0}$),所以任何 $GL_n(\mathbb{R})$ 的子群都作用于这个单点集,这是一个平凡的作用。$r>0$ 的条件排除了这种退化情况。
📝 [总结]

这段话通过具体的低维例子($S^1$ 单位圆和 $S^2$ 单位球面)来帮助读者理解 $(n-1)$-球面的概念,并指出了 $S^1$ 与复数群 $U(1)$ 之间的重要联系。然后,它将 $O_n$$S O_n$ 的作用从单位球面推广到了任意正半径 $r$ 的球面,其原理不变,因为正交变换保持任意长度,而不仅仅是单位长度。

🎯 [存在目的]
  1. 具体化:将抽象的 $S^{n-1}$ 概念用 $S^1$$S^2$ 这两个学生非常熟悉的对象来实例化。
  2. 建立联系:引入 $U(1)$,将群论与复分析联系起来,展示了数学不同分支间的内在统一性。
  3. 推广:将结论从单位球面推广到任意半径的球面,说明这个作用的普适性,并为后面讨论“轨道”概念埋下伏笔(同一个群作用下,所有同心球面都是不同的轨道)。
🧠 [直觉心智模型]
  1. $S^1=U(1)$:想象一个钟面。上面的每个时刻标记(比如1点、2点...12点)可以看作是单位圆上的点。我们也可以把这些标记看作是“旋转操作”(旋转1/12圈,2/12圈...),这些操作构成一个群。点和操作在这里可以互相转化,揭示了集合与群之间的深刻联系。
  2. 任意半径的球面:想象洋葱的结构。$O_n$$S O_n$ 的作用就像是同步旋转整个洋葱。在这个旋转过程中,每一层洋葱皮(一个特定半径的球面)上的点都只会在自己那层皮上移动,绝不会跑到别的皮层上去。每一层皮都是一个独立的作用舞台。
💭 [直观想象]

你用一个圆规画了很多个同心圆。

  1. 半径为 $r$ 的球面:就是你画的其中一个圆。
  2. $SO(2)$ 的作用:你把整张纸绕着圆心旋转任意角度。
  3. 不变性:旋转之后,你原来画的那个半径为 $r$ 的圆,会和它自己完美重合。圆上的每个点都移动到了这个圆上的新位置,但没有一个点会跑到另一个不同半径的圆上去。

📜 [原文12]

(4) $S_{n}$ 通过 $\sigma \cdot k=\sigma(k)$ 作用于 $\{1, \ldots, n\}$(这里我们使用 $S_{n}$ 中乘法作为函数复合的定义)。

📖 [逐步解释]

这个例子介绍了对称群 (Symmetric Group) 的自然作用,这是群论中最基本、最核心的作用之一。

  • $G = S_n$:
  • $S_n$对称群或称置换群
  • 它的元素是所有从集合 $\{1, 2, ..., n\}$ 到其自身的双射(即一一对应的函数)。这种双射被称为一个置换 (permutation)
  • 群运算函数的复合 (composition)。如果 $\sigma_1, \sigma_2 \in S_n$,那么它们的乘积 $\sigma_1 \sigma_2$ 是一个新的函数,定义为 $(\sigma_1 \sigma_2)(k) = \sigma_1(\sigma_2(k))$,即先应用 $\sigma_2$,再应用 $\sigma_1$
  • 单位元恒等置换 $\mathrm{Id}$,它使得 $\mathrm{Id}(k)=k$ 对所有 $k$ 成立。
  • 集合 $X = \{1, 2, ..., n\}$:
  • 这是一个包含 $n$ 个元素的有限集合。
  • 作用方式 $\sigma \cdot k = \sigma(k)$:
  • 作用的定义非常直观:群元素 $\sigma$ (一个函数) 作用于集合元素 $k$ (一个数字),结果就是将 $k$ 作为输入代入函数 $\sigma$ 中,得到的输出值 $\sigma(k)$
  • 这就是置换的本意:将数字 $k$ “移动”到位置 $\sigma(k)$
  • 验证这是一个作用:
  • 公理(1):$\sigma_1 \cdot (\sigma_2 \cdot k) = (\sigma_1 \sigma_2) \cdot k$
  • 左边:$\sigma_1 \cdot (\sigma_2 \cdot k)$。根据作用定义,括号里是 $\sigma_2(k)$。所以左边是 $\sigma_1 \cdot (\sigma_2(k))$。再根据作用定义,这等于 $\sigma_1(\sigma_2(k))$
  • 右边:$(\sigma_1 \sigma_2) \cdot k$。这里的 $\sigma_1 \sigma_2$ 是群内的运算,即函数复合。所以右边是 $(\sigma_1 \circ \sigma_2) \cdot k$。根据作用定义,这等于 $(\sigma_1 \circ \sigma_2)(k)$
  • 函数复合的定义就是 $(\sigma_1 \circ \sigma_2)(k) = \sigma_1(\sigma_2(k))$。所以左右两边相等。公理(1)成立。这正是原文括号里强调“使用函数复合定义”的原因,这个定义使得群作用的结合律公理与函数复合的结合律天然吻合。
  • 公理(2):$\mathrm{Id} \cdot k = k$
  • $S_n$ 的单位元是恒等置换 $\mathrm{Id}$
  • 根据作用定义,$\mathrm{Id} \cdot k = \mathrm{Id}(k)$
  • 根据恒等置换的定义,$\mathrm{Id}(k) = k$。公理(2)成立。
💡 [数值示例]
  • 示例1: $G=S_3, X=\{1, 2, 3\}$
  • $\sigma = (1\ 2\ 3)$ (循环表示法),即 $\sigma(1)=2, \sigma(2)=3, \sigma(3)=1$
  • $\tau = (1\ 2)$,即 $\tau(1)=2, \tau(2)=1, \tau(3)=3$
  • $k=1$
  • 验证公理(1): $\sigma \cdot (\tau \cdot 1) = (\sigma \tau) \cdot 1$
  • 左边:$\tau \cdot 1 = \tau(1) = 2$。所以 $\sigma \cdot (\tau \cdot 1) = \sigma \cdot 2 = \sigma(2) = 3$
  • 右边:先计算群内乘积 $\sigma \tau$
  • $(\sigma \tau)(1) = \sigma(\tau(1)) = \sigma(2) = 3$
  • $(\sigma \tau)(2) = \sigma(\tau(2)) = \sigma(1) = 2$
  • $(\sigma \tau)(3) = \sigma(\tau(3)) = \sigma(3) = 1$
  • 所以 $\sigma \tau = (1\ 3)$
  • 现在计算 $(\sigma \tau) \cdot 1 = (\sigma \tau)(1) = 3$
  • 左边 = 右边 = 3。
  • 示例2: $G=S_4, X=\{1, 2, 3, 4\}$
  • $\sigma = (1\ 2)(3\ 4)$,即 $\sigma(1)=2, \sigma(2)=1, \sigma(3)=4, \sigma(4)=3$
  • $k=3$
  • 作用结果:$\sigma \cdot 3 = \sigma(3) = 4$
  • 恒等元作用:$\mathrm{Id} \cdot 3 = \mathrm{Id}(3) = 3$
⚠️ [易错点]
  1. 函数复合的顺序:在群论中,$\sigma_1 \sigma_2$ 通常定义为“先用 $\sigma_2$ 再用 $\sigma_1$”。有些教科书可能采用相反的约定。务必遵循当前文本的定义(这里明确了是函数复合 $\sigma_1(\sigma_2(k))$),否则在计算复合置换时会出错。
  2. $S_n$ 作用的对象$S_n$ 最自然的作用对象是 $\{1, ..., n\}$,但它也可以作用于其他由这个集合派生出来的对象,如下文所述。
📝 [总结]

对称群 $S_n$ 通过函数求值的方式,自然地作用于集合 $\{1, 2, ..., n\}$。这种作用方式是置换概念的直接体现,即将集合中的元素重新排列。群作用的公理在这里完美地转化为函数复合的结合律和恒等函数的性质,使之成为群作用理论的一个原型示例。

🎯 [存在目的]
  1. 回归本源:群的概念最早就是从研究置换发展而来的。这个例子展示了群作用最原始、最核心的形式。
  2. 凯莱定理的基础:任何有限群都可以看作是某个对称群的子群(凯莱定理)。这个思想的根基就在于群可以作用于其自身,而这种作用可以被看作是一种置换。
  3. 组合学应用:在组合数学中,许多计数问题都依赖于 $S_n$ 在各种组合对象上的作用。
🧠 [直觉心智模型]
  1. 集合 $X=\{1, ..., n\}$:想象有 $n$ 个带编号的座位。
  2. $S_n$:所有可能的“换座位”方案的集合。
  3. 置换 $\sigma \in S_n$:一个具体的换座位方案。比如 $\sigma$ 方案要求“原来在1号座的人去2号座,2号座的人去3号座,...”。
  4. 作用 $\sigma \cdot k = \sigma(k)$:查询在 $\sigma$ 方案下,“原来在 $k$ 号座位上的人,应该去哪个新座位?”答案是 $\sigma(k)$ 号座位。
💭 [直观想象]

你在洗一副扑克牌。

  1. 集合 $X$:是这副牌中的所有牌(比如52张)。
  2. $S_{52}$:所有可能的洗牌方式。
  3. 一个具体的洗牌动作 $\sigma$:比如你做了一次完美的“交叉洗牌”。这是一个置换。
  4. 作用 $\sigma \cdot k$:原来在从上往下数第 $k$ 张位置的牌,经过这次洗牌后,跑到了新的第 $\sigma(k)$ 张位置。

📜 [原文13]

更一般地,如果 $X$ 是任何集合,$S_{X}$ 通过相同的公式作用于 $X$:给定 $\sigma \in S_{X}$$x \in X$,定义 $\sigma \cdot x=\sigma(x)$。要看到这确实是我们定义的作用,请注意,给定 $\sigma_{1}, \sigma_{2} \in S_{X}$$x \in X$

$$ \sigma_{1} \cdot\left(\sigma_{2} \cdot x\right)=\sigma_{1} \cdot\left(\sigma_{2}(x)\right)=\sigma_{1}\left(\sigma_{2}(x)\right)=\left(\sigma_{1} \circ \sigma_{2}\right)(x)=\left(\sigma_{1} \circ \sigma_{2}\right) \cdot x $$

因为 $S_{X}$ 上的群运算是函数复合。显然 $\operatorname{Id}_{X} \cdot x=\operatorname{Id}_{X}(x)=x$ 对于所有 $x \in X$。因此 $S_{X}$ 作用于 $X$

📖 [逐步解释]

这段话将上一个例子从有限集合 $\{1, ..., n\}$ 推广到了任意集合 $X$

  • 更一般地,如果 $X$ 是任何集合...
  • 这里的 $X$ 可以是有限集,也可以是无限集,比如实数集 $\mathbb{R}$ 或复数集 $\mathbb{C}$
  • $S_X$:
  • 这是对应于集合 $X$对称群
  • 定义:$S_X$ 是所有从集合 $X$ 到其自身的双射(一一对应函数)的集合。
  • 群运算:函数复合。
  • 单位元:恒等函数 $\mathrm{Id}_X$,定义为 $\mathrm{Id}_X(x) = x$ for all $x \in X$
  • $X = \{1, ..., n\}$ 时,$S_X$ 就是我们之前讨论的 $S_n$
  • 通过相同的公式作用于 $X$$\sigma \cdot x = \sigma(x)$
  • 作用的定义和之前完全一样:群元素 $\sigma$ (一个函数) 作用于集合元素 $x$,结果就是函数值 $\sigma(x)$
  • 要看到这确实是我们定义的作用...
  • 这里,作者详细地重演了一遍验证过程,以强调其普适性。
  • 验证公理(1)
  • 过程:$\sigma_{1} \cdot\left(\sigma_{2} \cdot x\right) = \sigma_{1} \cdot\left(\sigma_{2}(x)\right) = \sigma_{1}\left(\sigma_{2}(x)\right) = \left(\sigma_{1} \circ \sigma_{2}\right)(x) = \left(\sigma_{1} \circ \sigma_{2}\right) \cdot x$
  • 第一步 $\sigma_{1} \cdot\left(\sigma_{2} \cdot x\right)=\sigma_{1} \cdot\left(\sigma_{2}(x)\right)$:对括号内部应用作用的定义 $\sigma_2 \cdot x = \sigma_2(x)$
  • 第二步 $\sigma_{1} \cdot\left(\sigma_{2}(x)\right)=\sigma_{1}\left(\sigma_{2}(x)\right)$:对整个表达式应用作用的定义。此时被作用的对象是 $\sigma_2(x)$
  • 第三步 $\sigma_{1}\left(\sigma_{2}(x)\right)=\left(\sigma_{1} \circ \sigma_{2}\right)(x)$:这是函数复合的定义。
  • 第四步 $\left(\sigma_{1} \circ \sigma_{2}\right)(x)=\left(\sigma_{1} \circ \sigma_{2}\right) \cdot x$:再次应用作用的定义。注意,这里的 $\sigma_1 \circ \sigma_2$ 是群 $S_X$ 中的一个元素。
  • 结论:左边的起始表达式等于右边的最终表达式,公理(1)成立。其核心在于群作用的定义与群运算(函数复合)的定义完美契合。
  • 验证公理(2):
  • 显然 $\operatorname{Id}_{X} \cdot x=\operatorname{Id}_{X}(x)=x$ 对于所有 $x \in X$
  • 单位元是 $\mathrm{Id}_X$
  • 应用作用定义:$\mathrm{Id}_X \cdot x = \mathrm{Id}_X(x)$
  • 应用恒等函数定义:$\mathrm{Id}_X(x) = x$
  • 公理(2)成立。
  • 因此 $S_X$ 作用于 $X$
  • 这是一个总结论。因为两条公理都对任意集合 $X$ 成立,所以这个结论是普适的。
∑ [公式拆解]

$$ \sigma_{1} \cdot\left(\sigma_{2} \cdot x\right)=\sigma_{1} \cdot\left(\sigma_{2}(x)\right)=\sigma_{1}\left(\sigma_{2}(x)\right)=\left(\sigma_{1} \circ \sigma_{2}\right)(x)=\left(\sigma_{1} \circ \sigma_{2}\right) \cdot x $$

  • $\sigma_1, \sigma_2 \in S_X$: 两个来自对称群 $S_X$ 的元素,即两个从 $X$$X$的双射函数。
  • $x \in X$: 一个来自集合 $X$ 的元素。
  • $\cdot$: 群作用的符号。
  • $(\ )$: 函数应用的括号,如 $\sigma(x)$
  • $\circ$: 函数复合的符号。

这个公式链展示了如何通过连续应用定义,将群作用的结合律公理 左端 转化为群运算(函数复合)的内在属性 右端,从而证明公理成立。

💡 [数值示例]
  • 示例1: $X = \mathbb{Z}$ (整数集),$G=S_{\mathbb{Z}}$
  • $\sigma(k) = k+1$ (向右平移1位)。这是一个双射,其逆是 $\sigma^{-1}(k)=k-1$。所以 $\sigma \in S_{\mathbb{Z}}$
  • $\tau(k) = -k$ (取相反数)。这也是一个双射,其逆是它自身。所以 $\tau \in S_{\mathbb{Z}}$
  • $x=5 \in \mathbb{Z}$
  • 验证公理(1): $\sigma \cdot (\tau \cdot 5) = (\sigma \circ \tau) \cdot 5$
  • 左边:$\tau \cdot 5 = \tau(5) = -5$。所以 $\sigma \cdot (\tau \cdot 5) = \sigma \cdot (-5) = \sigma(-5) = -5+1 = -4$
  • 右边:先计算复合函数 $\sigma \circ \tau$
  • $(\sigma \circ \tau)(k) = \sigma(\tau(k)) = \sigma(-k) = -k+1$
  • 现在计算 $(\sigma \circ \tau) \cdot 5 = (\sigma \circ \tau)(5) = -5+1 = -4$
  • 左边 = 右边 = -4。
  • 示例2: $X = \mathbb{R}$ (实数集),$G=S_{\mathbb{R}}$
  • $\sigma(x) = x^3$。这是一个从 $\mathbb{R}$$\mathbb{R}$ 的双射。
  • $\tau(x) = 2x$。这也是一个双射。
  • $x=3 \in \mathbb{R}$
  • 验证公理(1): $\sigma \cdot (\tau \cdot 3) = (\sigma \circ \tau) \cdot 3$
  • 左边:$\tau \cdot 3 = \tau(3) = 2 \times 3 = 6$。所以 $\sigma \cdot (\tau \cdot 3) = \sigma \cdot 6 = \sigma(6) = 6^3 = 216$
  • 右边:计算复合函数 $\sigma \circ \tau$
  • $(\sigma \circ \tau)(x) = \sigma(\tau(x)) = \sigma(2x) = (2x)^3 = 8x^3$
  • 现在计算 $(\sigma \circ \tau) \cdot 3 = (\sigma \circ \tau)(3) = 8 \times 3^3 = 8 \times 27 = 216$
  • 左边 = 右边 = 216。
⚠️ [易错点]
  1. $S_X$ 的巨大性: 当 $X$ 是无限集时,$S_X$ 是一个极其庞大和复杂的群。例如,$S_{\mathbb{R}}$ 包含了所有 $\mathbb{R}$ 上的双射,远不止是简单的代数函数。
  2. 逻辑的普适性: 这个验证过程不依赖于 $X$ 的任何特性(有限、无限、离散、连续),只依赖于作用和群运算的定义。这是其一般性的关键。
📝 [总结]

这段话的核心是将“对称群作用于其基础集合”的结论从有限集推广到任意集合 $X$。它通过一步步的推导,严谨地证明了对于任何集合 $X$,其上的对称群 $S_X$(所有双射构成的群)都通过函数求值的方式 $(\sigma, x) \mapsto \sigma(x)$ 自然地作用于 $X$ 本身。这个作用是群论的基石之一。

🎯 [存在目的]
  1. 追求一般性:数学的核心思想之一就是追求普适的结论。将结论从 $S_n$ 推广到 $S_X$,展示了数学的抽象和力量。
  2. 夯实基础:通过完整地重述验证过程,确保读者对“为什么这是一个群作用”有深刻且牢固的理解。
  3. 引出后续:这个最一般的作用是后面讨论“任何群作用都可以看作是 $S_X$ 作用的特例”的基础。
🧠 [直觉心智模型]
  1. 集合 $X$: 一堆形状各异的鹅卵石。
  2. 对称群 $S_X$: 所有能将这堆鹅卵石“一一对应地重新摆放”的方案。
  3. $\sigma \in S_X$: 一个具体的摆放方案,它精确地告诉你,原来在位置A的鹅卵石,现在要被放到位置B。
  4. $\sigma \cdot x = \sigma(x)$: 如果 $x$ 是原来在某个位置的一颗鹅卵石,那么 $\sigma(x)$ 就是这个方案实施后,这颗鹅卵石的新位置。
💭 [直观想象]

想象一部字典。

  1. 集合 $X$: 字典里的所有单词。
  2. $S_X$: 所有可能的“加密/解密”方式,只要保证每个单词都能唯一地变成另一个单词,并且能唯一地变回来。
  3. $\sigma \in S_X$: 一本具体的密码本,比如“把每个单词的字母顺序倒过来”。"apple" -> "elppa"。
  4. $\sigma \cdot x$: 对单词 $x$ 进行加密。$\sigma \cdot \text{"apple"} = \text{"elppa"}$
  5. 公理(1): 先用密码本 $\tau$ 加密,再用密码本 $\sigma$ 加密,效果等同于用一本“复合密码本” $\sigma \circ \tau$ 直接加密。

📜 [原文14]

请注意,$S_{X}$ 作用于许多其他与 $X$ 相关的对象,例如幂集 $\mathcal{P}(X)$,即 $X$ 的所有子集的集合,通过公式,对于所有 $\sigma \in S_{X}$$A \subseteq X$

$$ \sigma \cdot A=\sigma(A)=\{\sigma(a): a \in A\} . $$

由于 $\#(\sigma \cdot A)=\#(A)$,如果 $A$ 是有限的,$S_{X}$ 也作用于 $\mathcal{P}(X)$ 的子集,该子集由 $X$ 的所有具有 2 个元素、或 3 个元素、或任何固定 $k$ 个元素的子集组成。

📖 [逐步解释]

这段话进一步扩展了群作用的应用范围:一个群不仅能作用于一个基本集合 $X$,还能作用于由 $X$ 派生出来的更复杂的结构,比如它的幂集

  • $S_{X}$ 作用于许多其他与 $X$ 相关的对象:这是一个概括性的陈述。意思是,一旦我们有了 $S_X$$X$ 上的基础作用,就可以“升级”或“提升(lift)”这个作用,让它去操作更复杂的对象。
  • 例如幂集 $\mathcal{P}(X)$,即 $X$ 的所有子集的集合:
  • 幂集 (Power Set) $\mathcal{P}(X)$: 这是集合 $X$ 的所有可能的子集构成的集合。
  • 如果 $X = \{1, 2\}$,那么它的子集有 $\emptyset$ (空集), $\{1\}$, $\{2\}$, $\{1, 2\}$。所以 $\mathcal{P}(X) = \{\emptyset, \{1\}, \{2\}, \{1, 2\}\}$
  • 现在,我们的新“被作用集合”是 $\mathcal{P}(X)$,它的元素是集合,而不是像之前那样的单个数字或向量。
  • 作用方式:$\sigma \cdot A = \sigma(A) = \{\sigma(a) : a \in A\}$:
  • $\sigma \in S_X$:作用者,还是原来的置换。
  • $A \subseteq X$: 被作用者,是 $X$ 的一个子集,即 $\mathcal{P}(X)$ 中的一个元素。
  • $\sigma \cdot A$: 作用的记号。
  • $\sigma(A)$: 是一个简写,表示 $\sigma$ 作用在集合 $A$ 上。
  • $\{\sigma(a) : a \in A\}$: 这是作用的精确定义。它的意思是:
  1. 遍历子集 $A$ 中的每一个元素 $a$
  2. 对每一个 $a$,计算出它在置换 $\sigma$ 下的像 $\sigma(a)$
  3. 把所有这些像收集起来,组成一个新的集合。这个新集合就是 $\sigma \cdot A$ 的结果。
    • 简而言之,就是将子集中的每个元素都进行置换,得到一个新的子集
  • 验证这是一个作用: (作者省略了,但我们可以自行验证)
  • 公理(1): $\sigma_1 \cdot (\sigma_2 \cdot A) = (\sigma_1 \sigma_2) \cdot A$
  • 左边:$\sigma_1 \cdot (\{\sigma_2(a) : a \in A\}) = \{\sigma_1(b) : b \in \{\sigma_2(a) : a \in A\}\} = \{\sigma_1(\sigma_2(a)) : a \in A\}$
  • 右边:$(\sigma_1 \sigma_2) \cdot A = \{(\sigma_1 \sigma_2)(a) : a \in A\} = \{\sigma_1(\sigma_2(a)) : a \in A\}$
  • 左右相等。
  • 公理(2): $\mathrm{Id}_X \cdot A = A$
  • $\mathrm{Id}_X \cdot A = \{\mathrm{Id}_X(a) : a \in A\} = \{a : a \in A\} = A$
  • 成立。
  • 所以这确实是一个合法的群作用。
  • 由于 $\#(\sigma \cdot A)=\#(A)$,如果 $A$ 是有限的:
  • $\#(\cdot)$: 表示集合的基数 (cardinality),即元素的个数。
  • 因为 $\sigma$ 是一个双射,它把不同的元素映射到不同的像。所以,如果原集合 $A$$k$ 个元素,那么由它们的像构成的新集合 $\sigma(A)$ 也必然有 $k$ 个元素。
  • 这说明,置换作用保持子集的大小
  • $S_{X}$ 也作用于...由所有具有...固定 $k$ 个元素的子集组成
  • 这是一个重要的推论。既然置换不改变子集的大小,那么一个大小为 $k$ 的子集,经过置换后,必然还是一个大小为 $k$ 的子集。
  • $\mathcal{P}_k(X)$$X$ 所有大小为 $k$ 的子集的集合。
  • 如果 $A \in \mathcal{P}_k(X)$,那么 $\sigma \cdot A$ 的大小也是 $k$,所以 $\sigma \cdot A \in \mathcal{P}_k(X)$
  • 这意味着 $\mathcal{P}_k(X)$$S_X$ 的作用下是封闭的(不变的)。
  • 因此,$S_X$ 不仅作用于整个幂集 $\mathcal{P}(X)$,还能将其作用限制在这些大小固定的子集构成的集合上。
∑ [公式拆解]

$$ \sigma \cdot A=\sigma(A)=\{\sigma(a): a \in A\} . $$

  • $\sigma \cdot A$: 记号,表示置换 $\sigma$ 作用于子集 $A$
  • $\sigma(A)$: 简写,表示 $\sigma$ 作用于 $A$ 的像集 (image set)。
  • $\{\sigma(a): a \in A\}$: 定义。
  • $a \in A$: 遍历 $A$ 中的所有元素 $a$
  • $\sigma(a)$: 计算每个 $a$ 的像。
  • $\{\dots\}$: 将所有的像收集起来构成一个新的集合。
💡 [数值示例]
  • 示例1: $X=\{1,2,3,4\}$, $G=S_4$
  • 作用于幂集:
  • $\sigma = (1\ 2)(3\ 4)$
  • 设子集 $A = \{1, 3\} \in \mathcal{P}(X)$
  • 作用结果: $\sigma \cdot A = \{\sigma(1), \sigma(3)\} = \{2, 4\}$。一个子集 $\{1,3\}$ 被变换成了另一个子集 $\{2,4\}$
  • 作用于固定大小的子集集合:
  • $k=2$。集合 $\mathcal{P}_2(X)$ 包含所有大小为2的子集,如 $\{1,2\}, \{1,3\}, \{1,4\}, \{2,3\}, \{2,4\}, \{3,4\}$。这个集合本身有 $\binom{4}{2}=6$ 个元素。
  • 我们看到,作用于 $\{1,3\}$ (大小为2) 的结果是 $\{2,4\}$ (大小也为2)。结果仍然在 $\mathcal{P}_2(X)$ 中。
  • $S_4$ 就在 $\mathcal{P}_2(X)$ 这个包含6个元素的集合上进行置换。
  • 示例2: 作用于空集和全集
  • $A = \emptyset$ (空集)。$\sigma \cdot \emptyset = \{\sigma(a) : a \in \emptyset\} = \emptyset$。空集总是不动的。
  • $A = X$ (全集)。$\sigma \cdot X = \{\sigma(a) : a \in X\}$。因为 $\sigma$ 是一个双射,像集 $\sigma(X)$ 仍然是 $X$。全集也总是不动的。
⚠️ [易错点]
  1. 作用对象的层次: 要分清作用的基本单位。在 $\sigma \cdot x$ 中,被作用的是单个元素 $x$。在 $\sigma \cdot A$ 中,被作用的是子集 $A$
  2. 不变子集 vs 不动元素: 在 $S_X$$\mathcal{P}(X)$ 的作用中,子集 $A$ 是一个“元素”。如果 $\sigma \cdot A = A$,我们称 $A$ 是一个不动点 (fixed point) of the action on $\mathcal{P}(X)$。这不意味着 $A$ 中的元素 $a$ 不动(即不要求 $\sigma(a)=a$)。例如,若 $\sigma=(1\ 2)$ 作用于 $X=\{1,2,3\}$,子集 $A=\{1,2\}$ 是一个不动点,因为 $\sigma \cdot \{1,2\} = \{\sigma(1), \sigma(2)\} = \{2,1\} = \{1,2\}$,但 $A$ 中的元素1和2都动了。
📝 [总结]

本段阐述了一个重要的思想:群作用的提升。一个在基础集合 $X$ 上的作用,可以被自然地“提升”为在更复杂的、由 $X$ 构造的集合(如幂集 $\mathcal{P}(X)$)上的作用。对于对称群 $S_X$ 而言,它作用于子集 $A$ 的方式是作用于 $A$ 中的每一个元素。由于置换保持元素数量,这个作用还可以被限制在所有等大小子集构成的集合上。

🎯 [存在目的]
  1. 展示作用的灵活性和扩展性:说明群作用不是一个僵化的概念,它可以被应用到各种抽象层次的对象上。
  2. 为组合学和几何学应用铺路:在许多领域,我们关心的不是单个元素的变换,而是某类“结构”(如一个图的边集、一个几何体的面集)的变换,这些结构本质上都是基础集合的子集。这个例子为研究这些结构的对称性提供了工具。
  3. 引出轨道和稳定子: 这个作用产生了丰富的轨道结构。例如,在 $S_4$ 作用于大小为2的子集时,所有6个大小为2的子集构成一个单一的轨道(任何一个二元子集都可以通过置换变成任何另一个)。
🧠 [直觉心智模型]
  1. 集合 $X$: 一群学生。
  2. 子集 $A \subseteq X$: 一个学生小组,比如“篮球队”。
  3. 置换 $\sigma \in S_X$: 学校进行了一次全校范围的“班级重组”。
  4. $\sigma \cdot A$: “篮球队”这个小组,在班级重组后,变成了哪些人组成的新小组。新小组的人数和原来一样多,但成员可能都换了。
  5. 作用于 $\mathcal{P}_k(X)$: 学校里所有“$k$人小组”的集合。班级重组后,任何一个 $k$ 人小组还是会变成一个 $k$ 人小组。这个“$k$人小组”的集合在重组操作下是封闭的。
💭 [直观想象]

你有一盒乐高积木(集合 $X$)。

  1. 你用其中的一些积木搭了一个小房子(子集 $A$)。
  2. 现在有一个“颜色替换”指令(置换 $\sigma$),比如“所有红色的积木换成蓝色,所有蓝色的换成红色”。
  3. $\sigma \cdot A$: 你对你的小房子里的每一块积木都执行这个颜色替换指令。结果你得到了一个结构一样,但颜色分布不同的小房子。
  4. $\#(\sigma \cdot A)=\#(A)$: 如果你的房子原来用了10块积木,颜色替换后它还是由10块积木组成的。
  5. 作用于 $\mathcal{P}_k(X)$: 如果你只考虑所有“由10块积木搭成的模型”的集合,那么颜色替换操作会将一个10块的模型变成另一个10块的模型。

📜 [原文15]

这里 $S_{X}$ 并没有什么特别之处:如果群 $G$ 作用于集合 $X$,那么它也作用于与 $X$ 相关的各种集合,例如 $\mathcal{P}(X)$$X \times X$

📖 [逐步解释]

这句话是对前面例子背后思想的进一步提炼和推广。

  • 这里 $S_{X}$ 并没有什么特别之处:
  • 这句话的意思是,前面例子中能够将作用从 $X$ 提升到 $\mathcal{P}(X)$ 的能力,并非 $S_X$ (对称群) 所独有。
  • 它的“不特别”在于,这个“提升作用”的原理是普适的。
  • 如果群 $G$ 作用于集合 $X$:
  • 这是推广的前提。我们不再局限于 $S_X$ 这个特定的群,而是考虑任意一个已经作用在 $X$ 上的群 $G$
  • 我们有一个已知的作用 $g \cdot x$ 满足两条公理。
  • 那么它也作用于与 $X$ 相关的各种集合,例如 $\mathcal{P}(X)$$X \times X$:
  • 这是推广的结论:这个任意的群 $G$ 也可以被用来定义在 $\mathcal{P}(X)$$X \times X$ (笛卡尔积) 等派生集合上的新作用。
  • 作用于 $\mathcal{P}(X)$:
  • 定义方式和 $S_X$ 的例子完全一样:对于 $g \in G$$A \subseteq X$,定义 $g \cdot A = \{g \cdot a : a \in A\}$
  • 验证过程也完全一样,因为验证只依赖于 $g \cdot a$ 满足群作用公理,而这正是我们的前提。
  • 作用于 $X \times X$:
  • $X \times X$ 是所有形如 $(x_1, x_2)$ 的有序对的集合,其中 $x_1, x_2 \in X$
  • 我们可以定义一个分量式作用 (component-wise action):对于 $g \in G$$(x_1, x_2) \in X \times X$,定义 $g \cdot (x_1, x_2) = (g \cdot x_1, g \cdot x_2)$
  • 也就是说,用同一个群元素 $g$ 分别作用于有序对的每一个分量。
  • 这个定义同样可以被验证为是一个合法的群作用。
💡 [数值示例]
  • 示例1: $G = SO(2)$ (旋转群) 作用于 $\mathcal{P}(\mathbb{R}^2)$
  • 我们已知 $SO(2)$ 通过矩阵乘法作用于 $\mathbb{R}^2$
  • $A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ (旋转90度)。
  • 设一个子集 $S = \{(1,0), (2,0)\} \subseteq \mathbb{R}^2$ (这是x轴上的两个点构成的集合)。
  • 作用结果: $A \cdot S = \{A \cdot (1,0), A \cdot (2,0)\} = \{(0,1), (0,2)\}$。x轴上的点集被旋转成了y轴上的点集。
  • 示例2: $G = (\mathbb{Z}, +)$ (整数加法群) 作用于 $\mathbb{R} \times \mathbb{R}$
  • 我们已知 $G$ 通过平移 $n \cdot x = x+n$ 作用于 $X=\mathbb{R}$
  • 现在我们让它作用于 $X \times X = \mathbb{R}^2$
  • 作用方式: $n \cdot (x, y) = (n \cdot x, n \cdot y) = (x+n, y+n)$
  • $n=5 \in \mathbb{Z}$ 和点 $(1, -3) \in \mathbb{R}^2$
  • 作用结果: $5 \cdot (1, -3) = (1+5, -3+5) = (6, 2)$
  • 几何上,这个作用是沿着向量 $(1,1)$ 的方向进行平移。注意这与之前 $SO(2)$ 作用于 $\mathbb{R}^2$ 的旋转是完全不同的几何变换。
⚠️ [易错点]
  1. 作用定义不是唯一的: 即使是对于派生集合,作用的定义也可能不唯一。例如,对于 $X \times X$,我们定义了分量式作用。在特定情况下,可能存在其他“有趣”的作用方式。我们这里给出的是最“自然”的推广。
  2. 不是所有 $G$ 的作用都能保持子集大小: 在 $S_X$ 的例子中,置换是双射,所以能保持子集大小。但对于一般的群 $G$,它的作用不一定是单射或满射的。例如,考虑一个将所有向量都映射到原点的“压扁”操作(这不是一个群作用,因为它不可逆),它显然不保持大小。但只要 $g \cdot x$ 对单个 $x$ 的映射是双射(即每个 $\ell_g(x)=g \cdot x$ 是一个双射),那么大小就会被保持。
📝 [总结]

这句话揭示了一个普遍的构造原理:任何在基础集合 $X$ 上的群作用,都可以被“自然地”推广(或提升)到由 $X$ 构造的派生集合(如幂集 $\mathcal{P}(X)$ 或笛卡尔积 $X \times X$)上。其推广方式通常是“分发”式的,即将群元素的作用“分发”到构成复杂对象的每个基础组件上。

🎯 [存在目的]

其目的在于展示群作用理论的强大威力、灵活性和可组合性。它告诉我们,我们不必为每一个新的、复杂的集合都从头开始发明和验证群作用。我们可以从一个简单的、基础的作用出发,像搭积木一样,构建出在更复杂结构上的作用。这体现了数学的抽象和构造之美。

🧠 [直觉心智模型]
  1. 基础作用 $g \cdot x$: 你有一个指令 $g$,可以把一个单块积木 $x$ 染成某种颜色。
  2. 提升到 $\mathcal{P}(X)$: 你用一些积木搭成了一个模型 $A$ (一个子集)。现在要对整个模型执行染色指令 $g$。最自然的方法就是,把模型里的每一块积木都拿出来,单独执行染色指令 $g$,然后再拼回去。
  3. 提升到 $X \times X$: 你有一对积木 $(x_1, x_2)$。对这对积木执行染色指令 $g$,最自然的方法就是,把 $x_1$$x_2$ 都染了,得到一对新的染色后的积木 $(g \cdot x_1, g \cdot x_2)$
💭 [直观想象]

想象一个滤镜应用(如 Instagram)。

  1. 集合 $X$: 所有可能的颜色值的集合。
  2. $G$: 一系列滤镜操作,比如“反相”、“增加饱和度”。
  3. $g \cdot x$: “反相”滤镜 $g$ 作用在“红色” $x$ 上,得到“青色” $g \cdot x$
  4. 作用于 $\mathcal{P}(X)$:
  5. 子集 $A$: 一张图片中用到的所有颜色的调色板。
  6. $g \cdot A$: 对整个调色板应用“反相”滤镜,得到一个新的调色板。
  7. 作用于 $X \times X$:
  8. 有序对 $(x_1, x_2)$: 一个渐变效果,从颜色 $x_1$ 渐变到 $x_2$
  9. $g \cdot (x_1, x_2)$: 对整个渐变应用“反相”滤镜,起点和终点颜色都被反相了,得到一个新的渐变 $(g \cdot x_1, g \cdot x_2)$

📜 [原文16]

(5) 设 $P_{n}$$\mathbb{R}^{2}$ 中的一个正 $n$-边形,$n \geq 3$。例如,我们可以将 $P_{n}$ 设为以原点为中心,顶点为

$$ \mathbf{p}_{k}=(\cos (2 \pi k / n), \sin (2 \pi k / n)), \quad k=0,1, \ldots, n-1 . $$

二面体群 $D_{n}$ 作用于 $P_{n}$ 以及顶点集 $\left\{\mathbf{p}_{0}, \ldots, \mathbf{p}_{n-1}\right\}$ 和边集 $\left\{\overline{\mathbf{p}_{0} \mathbf{p}_{1}}, \overline{\mathbf{p}_{1} \mathbf{p}_{2}}, \ldots, \overline{\mathbf{p}_{n-1} \mathbf{p}_{0}}\right\}$。使用上述符号,很容易看出(正如我们之前描述的)

$$ D_{n}=\left\{A \in O_{2}: A\left(P_{n}\right)=P_{n}\right\} . $$

📖 [逐步解释]

这个例子回到了引言中提到的二面体群,并给出了更精确的数学描述。

  • $P_{n}$$\mathbb{R}^{2}$ 中的一个正 $n$-边形,$n \geq 3$:
  • $P_n$: 代表一个正 $n$ 边形。这是一个几何对象。
  • $\mathbb{R}^2$: 它位于二维平面中。
  • $n \geq 3$: 多边形至少要有3条边(三角形)。
  • 例如,我们可以将 $P_{n}$ 设为以原点为中心,顶点为...:
  • 为了具体化,这里给出了顶点的坐标。这些顶点位于以原点为中心的单位圆上,并且均匀分布。
  • $\mathbf{p}_{k}=(\cos (2 \pi k / n), \sin (2 \pi k / n))$: 这是顶点 $k$ 的坐标公式。
  • $k=0, 1, ..., n-1$:顶点的索引。
  • $2\pi k/n$:是第 $k$ 个顶点与正x轴之间的夹角(以弧度计)。所有角度都是 $2\pi/n$ (360/n 度) 的整数倍。
  • 二面体群 $D_{n}$ 作用于...:
  • $G=D_n$: 二面体群,即正 $n$ 边形的所有对称操作(旋转和翻转)构成的群。
  • 作用于 $P_n$: $D_n$ 的每个元素都是一个作用于整个平面的变换(属于 $O_2$),这个变换恰好能让 $P_n$ 这个图形整体上看起来没变。所以 $D_n$ 自然作用于 $P_n$ 本身。
  • 作用于顶点集 $\left\{\mathbf{p}_{0}, \ldots, \mathbf{p}_{n-1}\right\}$:
  • 这是一个大小为 $n$ 的集合。
  • $D_n$ 中的一个对称操作(如旋转)会把一个顶点移动到另一个顶点的位置上。例如,逆时针旋转 $2\pi/n$ 会把顶点 $\mathbf{p}_k$ 移动到 $\mathbf{p}_{k+1}$ (模n) 的位置。这是一个在顶点集上的置换。
  • 作用于边集 $\left\{\overline{\mathbf{p}_{0} \mathbf{p}_{1}}, \ldots\right\}$:
  • $\overline{\mathbf{p}_k \mathbf{p}_{k+1}}$ 是连接顶点 $\mathbf{p}_k$$\mathbf{p}_{k+1}$ 的线段。
  • 一个对称操作同样会把一条边变换成另一条边。例如,逆时针旋转 $2\pi/n$ 会把边 $\overline{\mathbf{p}_k \mathbf{p}_{k+1}}$ 移动到边 $\overline{\mathbf{p}_{k+1} \mathbf{p}_{k+2}}$ 的位置。
  • 这可以看作是 $D_n$ 作用于顶点集的提升作用。边是由顶点对定义的,所以 $D_n$ 对顶点集的作用诱导了对边集的作用。
  • $D_{n}=\left\{A \in O_{2}: A\left(P_{n}\right)=P_{n}\right\}$:
  • 这是 $D_n$ 的一个集合论定义
  • $A \in O_2$: $D_n$ 的元素都是 $2 \times 2$正交矩阵。这意味着它们是刚性变换(旋转或反射),保持距离和角度。
  • $A(P_n) = P_n$: 这是筛选条件。我们只选取那些能让正n边形 $P_n$ 整体保持不变 (set-wise invariant) 的正交变换 $A$$A(P_n)$ 指的是将 $P_n$ 上的每一个点都经过 $A$ 变换后得到的新点的集合。这个新集合必须与原来的 $P_n$ 完全重合。
  • 总结: $D_n$正交群 $O_2$ 中,能使正 $n$ 边形 $P_n$ 保持不变的那些变换构成的子群
∑ [公式拆解]

$$ \mathbf{p}_{k}=(\cos (2 \pi k / n), \sin (2 \pi k / n)), \quad k=0,1, \ldots, n-1 . $$

  • $\mathbf{p}_k$: 第 $k$ 个顶点的向量表示。
  • $\cos, \sin$: 三角函数。
  • $2\pi k/n$: 角度(弧度)。$k=0$ 时是0度, $k=1$ 时是 $360/n$ 度,以此类推。这确保了 $n$ 个顶点在单位圆上均匀分布。

$$ D_{n}=\left\{A \in O_{2}: A\left(P_{n}\right)=P_{n}\right\} . $$

  • $D_n$: 二面体群。
  • $A \in O_2$: $A$ 是一个 $2 \times 2$ 的正交矩阵。
  • $A(P_n)$: $P_n$ 在变换 $A$ 下的像集。
  • $A(P_n) = P_n$: 像集与原集合相同。
💡 [数值示例]
  • 示例1: $n=4$ (正方形)
  • 顶点集 $X_v = \{\mathbf{p}_0, \mathbf{p}_1, \mathbf{p}_2, \mathbf{p}_3\} = \{(1,0), (0,1), (-1,0), (0,-1)\}$
  • 边集 $X_e = \{\overline{\mathbf{p}_0 \mathbf{p}_1}, \overline{\mathbf{p}_1 \mathbf{p}_2}, \overline{\mathbf{p}_2 \mathbf{p}_3}, \overline{\mathbf{p}_3 \mathbf{p}_0}\}$
  • $G = D_4$
  • 旋转作用: 设 $g$ 为逆时针旋转90度的操作,对应的矩阵是 $A_g = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$
  • 作用于顶点:$g \cdot \mathbf{p}_0 = A_g (1,0)^T = (0,1)^T = \mathbf{p}_1$
  • 作用于边:$g \cdot \overline{\mathbf{p}_0 \mathbf{p}_1} = \overline{g \cdot \mathbf{p}_0, g \cdot \mathbf{p}_1} = \overline{\mathbf{p}_1 \mathbf{p}_2}$
  • 翻转作用: 设 $h$ 为关于x轴的翻转操作,对应的矩阵是 $A_h = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}$
  • 作用于顶点:$h \cdot \mathbf{p}_1 = A_h (0,1)^T = (0,-1)^T = \mathbf{p}_3$
  • 作用于边:$h \cdot \overline{\mathbf{p}_0 \mathbf{p}_1} = \overline{h \cdot \mathbf{p}_0, h \cdot \mathbf{p}_1} = \overline{\mathbf{p}_0 \mathbf{p}_3}$
⚠️ [易错点]
  1. $A(P_n)=P_n$ vs $A(\mathbf{v})=\mathbf{v}$: $A(P_n)=P_n$集合相等,意思是 $P_n$ 里的点经过变换后还在 $P_n$ 里,只是可能换了位置。而 $A(\mathbf{v})=\mathbf{v}$逐点不变,除了单位元,很少有变换能做到这一点。不要混淆“集合不变”和“点不变”。
  2. $D_n$ 的元素: $D_n$ 包含 $n$ 个旋转(包括0度)和 $n$ 个翻转,共 $2n$ 个元素。
📝 [总结]

本例将二面体群 $D_n$ 置于群作用的框架下进行精确描述。$D_n$ 被定义为保持正 $n$ 边形 $P_n$ 不变的那些平面刚性变换(旋转和反射)的集合。这个群不仅作用于 $P_n$ 这个几何图形本身,还自然地作用在其顶点集边集上,这些作用是研究多边形对称性的基础。

🎯 [存在目的]
  1. 提供一个核心的、有限的、非交换的群作用例子$D_n$ (当 $n \geq 3$) 是最简单的非阿贝尔群之一,其作用非常直观。
  2. 连接抽象定义与几何直觉。它完美地诠释了“对称群”的概念,即一个物体的不变性变换群。
  3. 展示作用于派生集合。通过顶点集和边集的例子,再次强化了群作用可以被“提升”到相关结构上的思想。
🧠 [直觉心智模型]
  1. $P_n$: 一块正n边形的饼干。
  2. $D_n$: 你可以对这块饼干做的、能让它看起来和原来一模一样的所有操作(旋转特定角度、沿着对称轴翻面)。
  3. 作用于顶点集: 你在饼干的每个角上都用彩色糖豆做了标记。做一次对称操作后,你看一下,原来红色的糖豆跑到哪个角上去了。
  4. 作用于边集: 你在饼干的每条边上都涂了不同颜色的果酱。做一次对称操作后,你看一下,原来草莓味的边跑到哪里去了。
💭 [直观想象]

你面前有一把六角扳手(对应 $P_6$)。

  1. $D_6$: 你可以把扳手旋转60度、120度... 或者把它翻过来,它仍然能拧同一个六角螺母。这些操作的集合就是 $D_6$
  2. $D_6$ 作用于 $P_6$: 每次你执行一个操作,扳手这个物体本身发生了转动,但它作为一个“六角形”的形状没有变。
  3. $D_6$ 的定义: $O_2$ 是所有可能的平面刚性变换(可以把扳手移动到任何位置和角度)。$D_6$ 只包含其中那些能让扳手“回到原位”(即能重新套进同一个螺母)的操作。

📜 [原文17]

(6) 在与上一个示例部分类比的情况下,设 $S$$\mathbb{R}^{3}$ 中的一个正多面体(或柏拉图多面体),欧几里得、柏拉图以及柏拉图之前的毕达哥拉斯学派都知道它。我们不给出精确的定义。我们认为 $S$ 以原点为中心。在这里,与 $\mathbb{R}^{2}$ 中对于每个 $n \geq 3$ 都有一个正 $n$-边形的情况不同,只有 5 个正多面体。正多面体是多面体的一个例子,它有顶点、边和面。如果我们列出这些信息,我们有以下正多面体列表(其中 $v$ 是顶点数,$e$ 是边数,$f$ 是面数):

📖 [逐步解释]

这段话将前一个例子从二维的正多边形推广到三维的正多面体

  • 在与上一个示例部分类比的情况下: 这是一个引导,告诉读者接下来的逻辑与 $D_n$ 的例子是相似的:我们将要讨论一个三维几何体和它的对称群。
  • $S$$\mathbb{R}^{3}$ 中的一个正多面体(或柏拉图多面体):
  • $S$: 代表一个正多面体 (Regular Polyhedron),这是一个三维几何对象。
  • 柏拉图多面体 (Platonic Solid):这是正多面体的别称,因为古希腊哲学家柏拉图在《蒂迈欧篇》中对它们有深入的哲学论述。
  • 欧几里得、柏拉图、毕达哥拉斯学派: 提及这些名字是为了强调这些几何体的历史悠久和在数学史上的重要地位。
  • 我们不给出精确的定义: 作者在此处选择不给出正多面体的严格定义(即所有面都是全等的正多边形,且每个顶角汇集了相同数目的面),而是通过列举来让读者了解。
  • 我们认为 $S$ 以原点为中心: 这是一个重要的简化假设,确保对称操作是绕原点的旋转。
  • 在这里,...,只有 5 个正多面体:
  • 这是一个非常著名的数学事实。与二维情况(存在无穷多种正 $n$ 边形)形成鲜明对比,三维空间中符合正多面体严格定义的对象只有五种。这本身就是一个深刻的几何约束的结果。
  • 正多面体是多面体的一个例子,它有顶点、边和面:
  • 这介绍了构成多面体的三个基本元素:
  • 顶点 (Vertices):角点。
  • 边 (Edges):连接顶点的线段。
  • 面 (Faces):由边围成的平面多边形。
  • 如果我们列出这些信息...: 接下来通过一个表格来具体展示这五种正多面体和它们的属性。
  • $v$: 顶点数 (number of vertices)。
  • $e$: 边数 (number of edges)。
  • $f$: 面数 (number of faces)。
💡 [数值示例]

这段文字本身是在列举和介绍背景,不涉及计算,但我们可以从表格中提取信息来理解:

  • 以立方体为例:
  • 它有 $v=8$ 个顶点。
  • 它有 $e=12$ 条边。
  • 它有 $f=6$ 个面,每个面都是一个正方形。
  • 以四面体为例:
  • 它有 $v=4$ 个顶点。
  • 它有 $e=6$ 条边。
  • 它有 $f=4$ 个面,每个面都是一个等边三角形。
⚠️ [易错点]
  1. 正多面体的稀有性: 必须记住三维正多面体只有5个,这和二维情况有本质不同。这个事实来源于欧拉示性数和角度的几何限制。
  2. “正”的含义: “正”字非常关键,它要求面是全等的正多边形,并且顶角结构一致。如果放宽这些条件,那么多面体就有无穷多种了。
📝 [总结]

本段是为引入正多面体对称群做铺垫。它将讨论的舞台从二维平面 $\mathbb{R}^2$ 移到三维空间 $\mathbb{R}^3$,介绍了被作用的对象——五种著名的柏拉图多面体。通过列举它们的顶点、边、面数量,为后续讨论对称群作用于这些元素集合打下基础。

🎯 [存在目的]
  1. 从二维到三维的推广: 展示群作用的思想可以自然地从平面几何推广到立体几何。
  2. 引入新的、重要的作用对象: 正多面体是立体几何中最对称、最基本的对象,研究它们的对称群是群论在几何学中的一个经典应用。
  3. 提供具体的、有限的几何模型: 这五种具体的形状为后续讨论有限群(如 $A_4, S_4, A_5$)提供了直观的几何实现。
🧠 [直觉心智模型]

想象一套精美的、由水晶制成的几何模型玩具。这套玩具里只有五种形状:一个四面的、一个六面的(骰子)、一个八面的、一个十二面的和一个二十面的。本段内容就是在向你介绍这套玩具的“零件清单”。

💭 [直观想象]

你正在玩一套龙与地下城(D&D)的骰子。

  1. 四面体: d4 骰子。
  2. 立方体: d6 骰子,最常见的骰子。
  3. 八面体: d8 骰子。
  4. 十二面体: d12 骰子。
  5. 二十面体: d20 骰子。

这五种骰子的形状就是五种柏拉图多面体。本段就是在描述这些骰子的基本构成(有几个角、几条棱、几个面)。


📜 [原文18]

名称 $v$ $e$ $f$ $n$
四面体 4 6 4 3
立方体 8 12 6 4
八面体 6 12 8 3
十二面体 20 30 12 5
二十面体 12 30 20 3
📖 [逐步解释]

这张表格详细列出了五种正多面体的组合学特性。

  • 表格列的含义:
  • 名称 (Name): 正多面体的中文名。
  • $v$ (vertices): 顶点的数量。
  • $e$ (edges): 边的数量。
  • $f$ (faces): 面的数量。
  • $n$: 表格后面解释了,这是每个面是正几边形。
  • 逐行解读:
  • 四面体 (Tetrahedron):
  • 由4个顶点、6条边、4个面组成。
  • 每个面都是三角形 ($n=3$)。
  • 立方体 (Cube / Hexahedron):
  • 由8个顶点、12条边、6个面组成。
  • 每个面都是正方形 ($n=4$)。
  • 八面体 (Octahedron):
  • 由6个顶点、12条边、8个面组成。
  • 每个面都是三角形 ($n=3$)。
  • 十二面体 (Dodecahedron):
  • 由20个顶点、30条边、12个面组成。
  • 每个面都是正五边形 ($n=5$)。
  • 二十面体 (Icosahedron):
  • 由12个顶点、30条边、20个面组成。
  • 每个面都是三角形 ($n=3$)。
💡 [数值示例]

这张表格本身就是具体数值的集合。我们可以用它来验证一些关系。

  • 以立方体为例:
  • $v=8, e=12, f=6, n=4$
  • 以八面体为例:
  • $v=6, e=12, f=8, n=3$
  • 注意立方体和八面体的 $v$$f$ 数量是互换的,边数 $e$ 相同。这暗示了它们之间的“对偶”关系。
  • 以十二面体和二十面体为例:
  • 十二面体: $v=20, e=30, f=12, n=5$
  • 二十面体: $v=12, e=30, f=20, n=3$
  • 同样地,$v$$f$ 互换, $e$ 相同,它们也是一对对偶。
  • 以四面体为例:
  • $v=4, e=6, f=4, n=3$
  • 它的 $v$$f$ 相同,是“自对偶”的。
⚠️ [易错点]
  1. 数据的记忆: 不需要强行记住所有这些数字,关键是理解它们之间的关系,以及这些数字将如何被用于计算对称群的大小。
  2. 表格的准确性: 表格中的数据是经过几千年验证的数学事实,可以直接作为我们后续推理的依据。
📝 [总结]

该表格直观地呈现了五种柏拉图多面体的基本组合数据(顶点、边、面的数量以及面的形状)。这些数据不仅描述了这些几何体的构成,也为后面分析它们的对称群提供了基础信息。

🎯 [存在目的]
  1. 提供具体数据: 为后续的讨论提供确切的、可引用的数值。
  2. 暗示对偶关系: 通过数据的对称性(如立方体和八面体的v,f互换),巧妙地暗示了正多面体之间的对偶关系。
  3. 作为分析素材: 后续计算对称群大小时,会用到这些数字。例如,群的大小可以通过(面的数量)×(每个面的对称操作数)来计算。
🧠 [直觉心智模型]

这张表格就像是五种神圣生物的“身份卡”或“档案”。

  1. 名称: 生物的名字 (如:火蜥蜴)。
  2. $v$: 它有多少个“角”。
  3. $e$: 它身体的“骨架”有多少根骨头。
  4. $f$: 它身体表面有多少块“鳞片”。
  5. $n$: 每块鳞片是什么形状的(比如三角形鳞片或五边形鳞片)。
💭 [直观想象]

想象你在一个珠宝店里,柜台上有五颗完美切割的水晶。这张表格就是这五颗水晶的“鉴定证书”,上面精确地记录了每颗水晶有多少个尖角,多少条棱,多少个切面,以及每个切面的形状。


📜 [原文19]

这里 $n$ 是面的边数,面是正 $n$-边形。这可以通过上述数据确定,因为每条边恰好连接两个面,因此 $2 e=n f$。例如,十二面体的面是正五边形。请注意欧拉公式,在这种情况下它表示

$$ v-e+f=2 $$

📖 [逐步解释]

这段话解释了表格中最后一列 $n$ 的含义,并引入了两个重要的组合关系式。

  • 这里 $n$ 是面的边数,面是正 $n$-边形。
  • 这明确了 $n$ 的定义。$n=3$ 意味着面是等边三角形,$n=4$ 意味着面是正方形,$n=5$ 意味着面是正五边形。
  • 这可以通过上述数据确定,因为每条边恰好连接两个面,因此 $2e = nf$
  • 一个重要的计数原理: 这句话揭示了一个计算多面体边数的巧妙方法。
  • 思考方式1:从面的角度数边
  • 一个多面体有 $f$ 个面。
  • 每个面是正 $n$-边形,所以有 $n$ 条边。
  • 如果我们简单地把所有面的边数加起来,得到 $n \times f$
  • 思考方式2:重复计算的修正
  • 在上面的计算中,多面体的每一条边实际上都同时属于两个相邻的面
  • 因此,每条边都被我们数了两次
  • 为了得到真正的边数 $e$,我们必须将总数 $nf$ 除以2。
  • 结论: $e = \frac{nf}{2}$,或者写成更整洁的形式 $2e = nf$
  • 验证:
  • 立方体: $v=8, e=12, f=6, n=4$$2e = 2 \times 12 = 24$$nf = 4 \times 6 = 24$。公式成立。
  • 二十面体: $v=12, e=30, f=20, n=3$$2e = 2 \times 30 = 60$$nf = 3 \times 20 = 60$。公式成立。
  • 例如,十二面体的面是正五边形。
  • 这是一个具体的应用。对于十二面体,$f=12, e=30$
  • 使用公式 $2e=nf \implies n = \frac{2e}{f} = \frac{2 \times 30}{12} = \frac{60}{12} = 5$
  • 计算结果 $n=5$ 证实了十二面体的面是正五边形。
  • 请注意欧拉公式,在这种情况下它表示 $v-e+f=2$
  • 欧拉公式 (Euler's Formula) for polyhedra:这是拓扑学中的一个基本而深刻的定理,适用于所有与球面同胚的(即可以“吹气”变成球面的)多面体。
  • $v-e+f=2$: 顶点数减去边数加上面数,结果恒等于2。这个值被称为多面体的欧拉示性数 (Euler characteristic)
  • 验证:
  • 立方体: $v-e+f = 8 - 12 + 6 = 2$
  • 十二面体: $v-e+f = 20 - 30 + 12 = 2$
  • 读者可以自行验证其他三种正多面体,该公式都成立。
∑ [公式拆解]

$$ v-e+f=2 $$

  • $v$: 顶点 (vertex) 数量。
  • $e$: 边 (edge) 数量。
  • $f$: 面 (face) 数量。
  • 2: 欧拉示性数,对于所有简单多面体(没有洞的),这个值都是2。
💡 [数值示例]
  • 示例1: 验证 $2e=nf$
  • 八面体: $e=12, f=8, n=3$
  • $2e = 2 \times 12 = 24$
  • $nf = 3 \times 8 = 24$。相等。
  • 示例2: 验证欧拉公式
  • 四面体: $v=4, e=6, f=4$
  • $v-e+f = 4 - 6 + 4 = 2$
  • 八面体: $v=6, e=12, f=8$
  • $v-e+f = 6 - 12 + 8 = 2$
⚠️ [易错点]
  1. $2e=nf$ 的适用范围: 这个公式适用于所有封闭的多面体,不仅限于正多面体。
  2. 欧拉公式的适用范围: $v-e+f=2$ 适用于所有“简单”多面体(拓扑上是球面)。如果一个多面体有一个“洞”(比如一个相框的形状),那么欧拉示性数会是其他值(对于一个洞,是0)。
  3. 因果关系: 是几何约束(如所有面、所有顶角全等)导致了 $v,e,f$ 只能取那五组特定的整数值,而这些值恰好满足这两个代数公式。
📝 [总结]

本段补充了两个重要的组合恒等式,它们是理解多面体结构的关键。第一个公式 $2e=nf$ 是一个基于局部观察(每条边连接两个面)的计数关系,可以用来确定面的形状。第二个公式 $v-e+f=2$(欧拉公式)则是一个深刻的全局拓扑不变量,它揭示了所有简单多面体在“顶点-边-面”结构上的共性。

🎯 [存在目的]
  1. 深化理解: 从简单的罗列数据,到揭示数据背后的数学规律,加深了对多面体结构的理解。
  2. 展示数学工具: 引入了组合计数和拓扑学中的两个强大工具,展示了数学不同分支如何交叉应用于同一个问题。
  3. 约束的来源: 这两个公式是证明“为什么只有五种正多面体”的关键步骤。它们将几何问题转化为了一个解整数方程的问题,而该方程只有五个解。
🧠 [直觉心智模型]
  1. $2e=nf$: 想象你在给一个多面体框架的每条边都涂上油漆。如果你把每个面都拆开平铺,然后把每个面的所有边都涂一遍,你总共涂了 $nf$ “边次”。但因为组装起来后每条边都被两个面共享,所以你实际上一共只涂了 $e$ 条边,每条边涂了两遍。所以总“边次”是 $2e$。因此 $2e=nf$
  2. $v-e+f=2$: 把它想象成一个“宇宙常数”。对于任何一个星球形状的、由多边形板块拼成的世界,它上面的“大陆板块数量”($f$)减去“板块边界数量”($e$)加上“板块交汇点数量”($v$),结果永远是2。
💭 [直观想象]

拿一个足球。它是由正五边形和正六边形拼接而成的(这是一个半正多面体,或称阿基米德多面体)。

  1. $2e=nf$: 对于足球,不是所有面的边数 $n$ 都一样,所以公式需要修改。但原理相同:你可以数出五边形的数量 $f_5$ 和六边形的数量 $f_6$。总的“边次”是 $5f_5 + 6f_6$。因为每条边还是被共享,所以 $2e = 5f_5 + 6f_6$
  2. $v-e+f=2$: 即使对于足球这样的复杂多面体,你仍然可以去数出它的顶点数 $v$、边数 $e$ 和面数 $f = f_5+f_6$,然后会惊奇地发现 $v-e+f$ 仍然等于2。

📜 [原文20]

对于每个正多面体 $S$,都有一个相关的对偶多面体 $S^{\vee}$,其中 $S^{\vee}$ 的顶点数等于 $S$ 的面数,反之亦然。这里四面体是它自己的对偶,而立方体的对偶是八面体,十二面体的对偶是二十面体。

📖 [逐步解释]

这段话引入了对偶多面体 (Dual Polyhedron) 的概念。

  • 对偶多面体 $S^{\vee}$:
  • 对于每一个正多面体 $S$,都存在一个与之配对的“对偶”多面体,记作 $S^{\vee}$
  • 构造方法(直观理解):
  1. 在原多面体 $S$每个面的中心,放置一个新的顶点
  2. 如果 $S$ 中有两个面是相邻的(共享一条边),那么就在它们对应的两个新顶点之间连接一条新的
  3. 这些新的顶点和新的边会围成新的。每个新面的中心对应于 $S$ 的一个旧顶点。
    • 这个过程构造出来的新的多面体就是 $S^{\vee}$
  • $S^{\vee}$ 的顶点数等于 $S$ 的面数,反之亦然:
  • 这是对偶变换的核心结果。
  • $S$ 的顶点、边、面数为 $(v, e, f)$
  • $S^{\vee}$ 的顶点、边、面数为 $(v^{\vee}, e^{\vee}, f^{\vee})$
  • 对偶关系意味着:
  • $v^{\vee} = f$ (新顶点来自旧面的中心)
  • $f^{\vee} = v$ (新面对应旧顶点)
  • $e^{\vee} = e$ (新边对应旧边)
  • 具体对偶关系:
  • 四面体是它自己的对偶 (self-dual):
  • 四面体有 $(v,e,f)=(4,6,4)$
  • 它的对偶有 $(v^{\vee}, e^{\vee}, f^{\vee}) = (f, e, v) = (4, 6, 4)$
  • 得到的还是一个四面体。
  • 立方体的对偶是八面体:
  • 立方体: $(v,e,f)=(8,12,6)$
  • 其对偶: $(v^{\vee}, e^{\vee}, f^{\vee}) = (f, e, v) = (6, 12, 8)$
  • 这正好是八面体的 $(v,e,f)$ 数据。反之,八面体的对偶是立方体。
  • 十二面体的对偶是二十面体:
  • 十二面体: $(v,e,f)=(20,30,12)$
  • 其对偶: $(v^{\vee}, e^{\vee}, f^{\vee}) = (f, e, v) = (12, 30, 20)$
  • 这正好是二十面体的 $(v,e,f)$ 数据。反之亦然。
💡 [数值示例]
  • 示例1: 立方体 $\rightarrow$ 八面体
  • 想象一个立方体。它有6个面。
  • 在每个面的正中心打一个点。你得到了6个新顶点。
  • 观察立方体,比如顶面和前面是相邻的。那么,就在顶面中心的新顶点和前面中心的新顶点之间连一条线。
  • 对所有相邻的面都这样做,你最终会连出12条新的边。
  • 这6个新顶点和12条新边围成了一个八面体。你可以想象,立方体的每个旧顶点(比如右上角前方的顶点),它周围有三个旧面(顶、前、右),这三个面对应的三个新顶点(顶面中心、前面中心、右面中心)会构成一个新面(三角形)。因为立方体有8个顶点,所以新构成的八面体有8个三角形的面。
  • 示例2: 四面体 $\rightarrow$ 四面体
  • 想象一个正四面体。它有4个三角形的面。
  • 在每个三角形面的中心打一个点,得到4个新顶点。
  • 原来的任意两个面都是相邻的。所以,这4个新顶点之间两两相连。
  • 4个顶点两两相连,构成的恰好是另一个(通常更小的、倒置的)正四面体。
⚠️ [易错点]
  1. 对偶是一种几何变换: 对偶不仅仅是数字上的交换,它是一种具体的几何构造过程。
  2. 对偶的对偶是原始多面体: $(S^{\vee})^{\vee} = S$。这个操作做两次会回到原来(的形状)。
📝 [总结]

本段介绍了对偶多面体的概念,它通过一种“顶点-面互换”的几何构造,将五种柏拉图多面体两两配对(立方体-八面体,十二面体-二十面体),而四面体则与自身配对。这个概念揭示了这些几何体之间深刻的内在对称性和结构联系。

🎯 [存在目的]
  1. 揭示结构: 对偶性是几何学中的一个重要思想,它揭示了看似不同的对象之间可能存在的深刻联系。
  2. 简化问题: 正如下文将提到的,对偶多面体拥有相同的对称群。这意味着,我们只需要研究三个群(四面体群,立方体/八面体群,十二面体/二十面体群),就可以覆盖所有五种正多面体的对称性。这大大减少了研究的工作量。
  3. 提供新的视角: 有时从对偶的角度思考问题会更简单。例如,研究一个多面体的顶点对称性,等价于研究其对偶多面体的面对称性。
🧠 [直觉心智模型]

想象一个国家 $S$

  1. : 是国家的省份。
  2. 顶点: 是省份的交界点(比如三省交界)。
  3. : 是两个省之间的边界线。

现在构造一个“对偶国家” $S^{\vee}$

  1. 在每个省的省会(面中心)建一个“新首都”(新顶点)。
  2. 如果两个省接壤(共享边界),就在它们的新首都之间修一条“高铁”(新边)。
  3. 原来一个三省交界点,现在被三个新首都通过高铁围成了一个“新省份”(新面)。

这个新国家 $S^{\vee}$ 就是原国家 $S$ 的对偶。

💭 [直观想象]

拿一个透明的立方体盒子。

  1. 用胶带在每个面的正中心贴一个珠子。这是对偶图形的6个顶点。
  2. 现在,用细线连接任意两个相邻面上的珠子。比如,连接顶面和前面的珠子,连接顶面和右面的珠子...
  3. 当你把所有该连的线都连上后,你会发现在立方体盒子内部,这些珠子和细线构成了一个八面体的骨架。

📜 [原文21]

给定一个正多面体 $S$,我们定义它的对称群 $G(S)$

$$ G(S)=\left\{A \in S O_{3}: A(S)=S\right\} $$

那么 $G(S)$ 作用于 $S$,并作用于 $S$ 的顶点集、边集或面集。不难证明 $G(S)=G\left(S^{\vee}\right)$,所以只有三种形式为 $G(S)$ 的群。请注意(与 $D_{n}$ 的情况不同,在 $D_{n}$ 中我们允许 $O_{2}$ 的元素),我们只考虑 $S O_{3}$ 的元素。群 $G(S)$ 总是有限的,我们稍后会对此多说一点。

📖 [逐步解释]

这段话正式定义了正多面体的对称群,并指出了其关键性质。

  • 给定一个正多面体 $S$,我们定义它的对称群 $G(S)$ 为...
  • $G(S)$: 这是一个记号,代表多面体 $S$ 的对称群。
  • $G(S)=\left\{A \in S O_{3}: A(S)=S\right\}$:
  • 这是 $G(S)$ 的集合论定义,与 $D_n$ 的定义非常相似。
  • $A \in S O_3$: 对称群的元素是来自三维特殊正交群 $S O(3)$ 的变换。
  • $O_3$ (正交群) 包含所有三维空间中保持原点不变的刚性变换(旋转和反射)。
  • $S O_3$ (特殊正交群) 是 $O_3$ 的子群,它只包含那些行列式为+1的变换,即纯旋转,排除了所有包含反射的操作。
  • $A(S)=S$: 这是筛选条件,要求变换 $A$ 必须使多面体 $S$ 整体保持不变。
  • 定义总结: $S$ 的(旋转)对称群,是所有能让 $S$ 复原的、绕原点的空间旋转操作的集合。
  • 那么 $G(S)$ 作用于 $S$,并作用于 $S$ 的顶点集、边集或面集。
  • 这是群作用的直接应用。
  • 作用于 $S$: $G(S)$ 的定义本身就保证了它作用于 $S$
  • 作用于顶点集、边集、面集:
  • 一个旋转操作会把一个顶点变到另一个(或自身)顶点的位置,把一条边变到另一条边的位置,一个面变到另一个面的位置。
  • 这些都是 $G(S)$ 在相应派生集合上的诱导作用
  • 不难证明 $G(S)=G\left(S^{\vee}\right)$,所以只有三种形式为 $G(S)$ 的群。
  • $G(S)=G(S^{\vee})$: 一个多面体的对称群和其对偶多面体的对称群是同一个群
  • 直观理解: 任何一个使原多面体 $S$ 复原的旋转,必然也使其对偶多面体 $S^{\vee}$ 复原。因为对偶的构造(取面中心、连线)是与原几何体结构绑定的,旋转 $S$ 的同时,$S^{\vee}$ 也被以完全相同的方式旋转了。
  • 所以只有三种形式为 $G(S)$ 的群:
  1. 四面体群 $G(\text{四面体})$
  2. 立方体/八面体群 $G(\text{立方体}) = G(\text{八面体})$
  3. 十二面体/二十面体群 $G(\text{十二面体}) = G(\text{二十面体})$
    • 这意味着我们只需要研究这三个群。
  • 请注意(与 $D_{n}$ 的情况不同...),我们只考虑 $S O_{3}$ 的元素。
  • 关键区别: 在定义二维的 $D_n$ 时,我们允许来自 $O_2$ 的元素,这包括了翻转(一种反射)。但在定义三维的 $G(S)$ 时,我们特意将其限制在 $S O_3$ 内,只考虑纯旋转
  • 原因: 这是一种惯例。在三维中,通常将纯旋转构成的群称为“旋转对称群”或简称为“对称群”。如果包含反射,则称为“全对称群”,它会比 $G(S)$ 大一倍。本书在这里选择研究更基本、更核心的旋转对称群。
  • $G(S)$ 总是有限的,我们稍后会对此多说一点。
  • 这是一个重要事实。因为正多面体是具体的、有限的物体,能让它复原的旋转操作也只有有限多种。这与 $S O_3$ 本身是无限群形成对比。$G(S)$$S O_3$ 的一个有限子群
∑ [公式拆解]

$$ G(S)=\left\{A \in S O_{3}: A(S)=S\right\} $$

  • $G(S)$: 多面体 $S$ 的旋转对称群。
  • $A \in SO_3$: $A$ 是一个三维旋转变换。
  • $A(S)=S$: 变换 $A$ 保持多面体 $S$ 的集合不变。
💡 [数值示例]
  • 示例: 立方体 $S$ 的对称群 $G(S)$
  • 单位元: 恒等旋转(不动),属于 $G(S)$
  • 绕穿过对面中心轴的旋转:
  • 想象穿过上、下两个面中心的轴。可以绕此轴旋转90°, 180°, 270°。这3个非恒等旋转都属于 $G(S)$
  • 立方体有3对相对的面,所以这类轴有3根,提供了 $3 \times 3 = 9$ 个非恒等旋转。
  • 绕穿过对角顶点轴的旋转:
  • 想象穿过 $(1,1,1)$$(-1,-1,-1)$ 这两个顶点的轴。可以绕此轴旋转120°, 240°。这2个旋转属于 $G(S)$
  • 立方体有4对相对的顶点,所以这类轴有4根,提供了 $4 \times 2 = 8$ 个旋转。
  • 绕穿过对边中点轴的旋转:
  • 想象穿过顶面前边中点和底面后边中点的轴。可以绕此轴旋转180°。这个旋转属于 $G(S)$
  • 立方体有6对相对的边,所以这类轴有6根,提供了 $6 \times 1 = 6$ 个旋转。
  • 总数: $1$ (恒等) $+ 9 + 8 + 6 = 24$。所以立方体的旋转对称群 $G(\text{立方体})$ 是一个24阶的有限群。
⚠️ [易错点]
  1. 旋转群 vs 全对称群: 一定要注意这里定义的 $G(S)$ 只包含旋转。如果包含了反射(例如,通过一个平面的镜像操作),群的大小会加倍。
  2. $G(S)$$SO(3)$ 的子群: $G(S)$ 的元素是变换,运算是复合,它满足群的公理,并且所有元素都取自 $SO(3)$,所以它是一个子群。
📝 [总结]

本段为正多面体 $S$ 定义了其旋转对称群 $G(S)$,即所有使 $S$ 复原的三维空间旋转操作的集合。它指出了这个群可以作用于 $S$ 的顶点、边和面集上。由于对偶多面体共享同一个对称群,因此五种正多面体只对应三种不同的旋转对称群。最后,作者明确了这里的对称群只考虑旋转(是 $SO_3$ 的有限子群),暂时排除了反射。

🎯 [存在目的]
  1. 定义核心对象: 正式定义了本节的核心研究对象——正多面体的旋转对称群。
  2. 确立研究框架: 明确了研究方法,即通过群作用于顶点、边、面来分析群的结构。
  3. 简化问题域: 指出只需研究三个群,大大提高了研究效率。
  4. 设定范围: 通过与 $D_n$ 的对比,清晰地界定了当前讨论的对称群是纯旋转群,避免了与全对称群的混淆。
🧠 [直觉心智模型]
  1. $S$: 一个魔方(立方体)。
  2. $SO(3)$: 你可以把这个魔方在空中朝任何方向、转任何角度。
  3. $G(S)$: 所有那些转动方式,在转完之后,魔方看起来和转之前一模一样(不考虑贴纸颜色,只看形状)。比如,绕着某个轴转了90度,它看起来还是一个立方体。这些“有效”的转动,构成了魔方的旋转对称群。
💭 [直观想象]

你手里拿着一个水晶做的正十二面体。

  1. 你把它举到灯光下,慢慢转动它。
  2. 在转动的过程中,你会发现当它处于某些特定角度时,它反射光芒的样子和初始位置完全一样。
  3. 所有这些能让它“看起来一样”的纯粹转动姿态,集合在一起,就是 $G(\text{十二面体})$
  4. 然后你换一个水晶八面体,它的“看起来一样”的转动姿态,和水晶立方体是一样的。这说明 $G(\text{立方体}) = G(\text{八面体})$

📜 [原文22]

(7) 剩下的两个例子与群论更直接相关。如果 $G$ 是一个群,那么 $G$ 通过左乘作用于自身:$g \cdot x=g x$。群作用的公理只是 $G$ 中乘法的结合律 ($g_{1}\left(g_{2} x\right)=\left(g_{1} g_{2}\right) x$) 和恒等元的定义 ($1 x=x$ 对于所有 $x \in G$)。更一般地,如果 $H \leq G$ 是一个子群,不一定是正规子群,那么 $G$ 通过以下方式作用于左陪集 $G / H$ 的集合:$g \cdot(x H)=(g x) H$。证明这确实是一个作用与左乘的情况类似。

📖 [逐步解释]

这个例子介绍了两种非常核心的、纯代数的群作用,它们不依赖于任何外部几何对象。

  • 剩下的两个例子与群论更直接相关: 预示着接下来的作用是群论内部的构造,更具抽象性。
  • 第一种作用:左乘作用 (Action by Left Multiplication)
  • $G$ 作用于自身: 这里,作用者是群 $G$,被作用的集合也是 $G$ 本身 ($X=G$)。
  • 作用方式: $g \cdot x = gx$:
  • $g \in G$: 作用者。
  • $x \in G$: 被作用者。
  • $gx$: 结果。这里的乘法就是群 $G$ 自身的二元运算
  • 验证公理:
  • 作者指出,群作用的公理在这种情况下,直接退化成了群定义自身的公理。
  • 公理(1): $g_1 \cdot (g_2 \cdot x) = (g_1 g_2) \cdot x$
  • 左边: $g_1 \cdot (g_2 x) = g_1(g_2 x)$
  • 右边: $(g_1 g_2) \cdot x = (g_1 g_2)x$
  • 根据群的定义,群运算必须满足结合律 (Associativity),即 $g_1(g_2 x) = (g_1 g_2)x$。所以公理(1)自动成立。
  • 公理(2): $1 \cdot x = x$
  • 左边: $1 \cdot x = 1x$
  • 根据群的定义,单位元 (Identity element) $1$ 满足 $1x=x$。所以公理(2)自动成立。
  • 结论: 任何群都可以通过其自身的乘法(左乘)作用于其自身。这被称为正则作用 (Regular Action)
  • 第二种作用:在陪集上的左乘作用
  • 更一般地: 这是将上一种作用的推广。
  • 如果 $H \leq G$ 是一个子群: $H$$G$ 的一个子群。
  • 作用于左陪集 $G / H$ 的集合:
  • 被作用的集合 $X = G/H$: 它的元素不是 $G$ 中的单个元素,而是形如 $xH = \{xh : h \in H\}$左陪集。陪集是 $G$ 的子集。
  • 作用方式: $g \cdot (xH) = (gx)H$:
  • $g \in G$: 作用者。
  • $xH \in G/H$: 被作用者(一个陪集)。
  • $(gx)H$: 结果。先在群内计算 $g$ 乘以陪集的代表元 $x$ 得到 $gx$,然后用这个新元素 $gx$ 生成一个新的陪集。
  • 验证:
  • 这个作用是良定义的吗? 首先需要确认作用的定义不依赖于陪集代表元的选择。如果 $xH = yH$,那么 $y=xh$ for some $h \in H$。我们需要验证 $g \cdot (xH) = g \cdot (yH)$
  • $g \cdot (yH) = (gy)H = (g(xh))H = ((gx)h)H$
  • 因为 $h \in H$,根据陪集的性质,对于任何元素 $z$ 和任何 $h' \in H$,都有 $(zh')H = zH$。所以 $((gx)h)H = (gx)H$
  • 因此 $g \cdot (xH) = g \cdot (yH)$,作用是良定义的 (well-defined)
  • 公理(1): $g_1 \cdot (g_2 \cdot (xH)) = (g_1 g_2) \cdot (xH)$
  • 左边: $g_1 \cdot ((g_2 x)H) = (g_1(g_2 x))H = ((g_1 g_2)x)H$ (利用群的结合律)。
  • 右边: $(g_1 g_2) \cdot (xH) = ((g_1 g_2)x)H$
  • 左右相等。
  • 公理(2): $1 \cdot (xH) = xH$
  • 左边: $1 \cdot (xH) = (1x)H = xH$
  • 成立。
💡 [数值示例]
  • 示例1: 左乘作用于自身
  • $G = D_3 = \{e, r, r^2, s, sr, sr^2\}$ (等边三角形对称群)。
  • 作用者 $g=r$ (旋转120度)。
  • 被作用者 $x=s$ (一个翻转)。
  • 作用结果: $r \cdot s = rs$。在 $D_3$ 中,我们有关系 $rs = sr^2$。所以 $r \cdot s = sr^2$。群元素 $s$ 被变换成了群元素 $sr^2$
  • 示例2: 左乘作用于陪集
  • $G = S_3 = \{e, (12), (13), (23), (123), (132)\}$
  • 子群 $H = \{e, (12)\} \cong S_2$
  • 左陪集集合 $G/H$:
  • $eH = \{e, (12)\}$
  • $(13)H = \{(13), (13)(12)\} = \{(13), (123)\}$
  • $(23)H = \{(23), (23)(12)\} = \{(23), (132)\}$
  • $G/H$ 共有3个元素。
  • 设作用者 $g = (13) \in S_3$
  • 设被作用者 $X_1 = (23)H = \{(23), (132)\}$
  • 作用结果: $g \cdot X_1 = (13) \cdot ((23)H) = ((13)(23))H$
  • 计算群内乘积 $(13)(23) = (132)$
  • 所以结果是 $(132)H$。我们来找找这个陪集是谁:$(132) \in (23)H$ and $(132) \in (13)H$? No. $(132)H = \{(132), (132)(12)\} = \{(132), (23)\}$. Oh, $(132)H=(23)H$. Let's recheck the calculation.
  • $(13)(23) = (132)$, right.
  • Let's check $(132)H$. What is $(13)H$? $(13)H=\{(13), (13)(12)\} = \{(13),(123)\}$.
  • Let's check $(23)H$? $(23)H=\{(23), (23)(12)\} = \{(23),(132)\}$.
  • Let's check $(123)H$? $(123)H = \{(123), (123)(12)\} = \{(123), (13)\}$. So $(123)H = (13)H$.
  • The three distinct cosets are $H_1=\{e,(12)\}$, $H_2=\{(13),(123)\}$, $H_3=\{(23),(132)\}$.
  • Let's redo the action: $g=(13)$ on $X_1 = H_3 = (23)H$.
  • Result is $g \cdot X_1 = ((13)(23))H = (132)H$. Since $(132) \in H_3$, we have $(132)H=H_3$. So $(13) \cdot H_3 = H_3$. In this case, $H_3$ is a fixed point for the element $(13)$.
  • Let's try $g=(123)$ on $X_1 = H_1 = eH$.
  • Result is $g \cdot X_1 = (123) \cdot (eH) = (123e)H = (123)H = H_2$.
  • So, the element $(123)$ maps the coset $H_1$ to the coset $H_2$.
⚠️ [易错点]
  1. 左乘 vs 右乘: 我们可以类似地定义右乘作用 $g \cdot x = xg^{-1}$。注意这里的逆元是必须的,为了满足公理(1): $g_1 \cdot (g_2 \cdot x) = g_1 \cdot (xg_2^{-1}) = (xg_2^{-1})g_1^{-1} = x(g_1g_2)^{-1} = (g_1g_2) \cdot x$。如果定义成 $xg$,公理(1)就不满足了。
  2. 陪集作用的良定义性: 在处理陪集上的作用时,第一步永远是检查“良定义性”,确保作用的结果与代表元的选择无关。
  3. $H$ 不必是正规子群: 这是陪集作用的一个非常重要的特点。即使 $H$ 不是正规子群(此时 $G/H$ 不是一个群),$G$ 依然可以合法地作用于 $G/H$ 这个集合
📝 [总结]

本段介绍了两种纯代数构造的群作用:

  1. 左乘作用:任何群 $G$ 都可以通过其自身的群运算作用于其自身。这是一个基本而强大的作用,其合法性直接源于群的公理。
  2. 陪集上的左乘作用:任何群 $G$ 都可以通过左乘作用于其任意一个子群 $H$ 的左陪集空间 $G/H$ 上。这个作用是左乘作用的推广,并且不要求 $H$ 是正规的。
🎯 [存在目的]
  1. 展示群论的内部结构: 这两个例子表明,群论可以“自给自足”,在不借助外部几何对象的情况下,研究群自身的结构。
  2. 凯莱定理的理论基础: $G$ 在自身上的左乘作用,将每个群元素 $g$ 变成了一个置换(从 $G$$G$ 的双射)。这直接导向了凯莱定理——任何群都同构于一个置换群。
  3. 研究子群的工具: $G$$G/H$ 上的作用是研究子群 $H$ 与群 $G$ 关系的一个核心工具。例如,这个作用的性质(如传递性、不动点等)可以揭示关于子群 $H$ 的重要信息。
🧠 [直觉心智模型]
  1. 左乘作用于自身:
  2. $G$: 想象成一个巨大的、无限延伸的标尺,上面有整数刻度。
  3. 元素 $x \in G$: 标尺上的一个点,比如点3
  4. 作用者 $g \in G$: 一个“平移指令”,比如“向右平移5个单位”。
  5. $g \cdot x = g+x$: 在点3上执行“向右平移5个单位”,你到达了点8
  6. 作用于陪集:
  7. 子群 $H$: 比如所有偶数组成的子群 $2\mathbb{Z}$
  8. 陪集 $G/H$: 有两个陪集:偶数集 $0+2\mathbb{Z}$ 和奇数集 $1+2\mathbb{Z}$
  9. 作用者 $g \in \mathbb{Z}$: 比如“向右平移1个单位” ($g=1$)。
  10. 作用:
  11. $1 \cdot (\text{偶数集}) = \text{偶数集} + 1 = \text{奇数集}$
  12. $1 \cdot (\text{奇数集}) = \text{奇数集} + 1 = \text{偶数集}$
  13. 作用者1在这个只有两个元素(偶数集、奇数集)的集合上,实现了一个“交换”操作。
💭 [直观想象]

想象一个有12个小时的钟面。

  1. $G = \mathbb{Z}_{12}$ (模12加法群)。
  2. 子群 $H = \{0, 4, 8\}$ (由4的倍数构成)。
  3. 陪集 $G/H$:
  4. $0+H = \{0, 4, 8\}$ (12点,4点,8点)
  5. $1+H = \{1, 5, 9\}$ (1点,5点,9点)
  6. $2+H = \{2, 6, 10\}$ (2点,6点,10点)
  7. $3+H = \{3, 7, 11\}$ (3点,7点,11点)
  8. 这四个陪集在钟面上形成了四个等边三角形。
  9. 作用: 设作用者 $g=2$ (“拨快2小时”)。
  10. $g \cdot (1+H)$: $2 \cdot \{1,5,9\} = \{2+1, 2+5, 2+9\} \pmod{12} = \{3, 7, 11\} = 3+H$
  11. 这个作用把 $\{1,5,9\}$ 这个三角形,整体旋转到了 $\{3,7,11\}$ 这个三角形的位置。

📜 [原文23]

(8) $G$ 通过共轭 $i_{g}: i_{g}(x)=g x g^{-1}$ 作用于自身。(我们这样写是为了避免与左乘作用混淆,而不是写成 $g \cdot x$。)

📖 [逐步解释]

这个例子介绍了另一种重要的、纯代数的群作用:共轭作用 (Action by Conjugation)

  • $G$ 通过共轭...作用于自身:
  • 与左乘作用类似,作用者是群 $G$,被作用的集合也是 $G$ 本身 ($X=G$)。
  • 但是作用的方式完全不同。
  • 作用方式:$i_{g}(x)=g x g^{-1}$:
  • $i_g$: 作者引入了一个新的函数记号来表示共轭作用,以避免与之前的 · 混淆。$i_g$ 表示由元素 $g$ 决定的“共轭函数”或“内部自同构”。
  • $i_g(x)$: 表示 $g$ 共轭作用于 $x$ 的结果。
  • $g x g^{-1}$: 这是作用的定义。它是一个三步过程:
  1. 乘以 $g$
  2. 乘以 $x$
  3. 再乘以 $g$逆元 $g^{-1}$
    • 几何/代数意义: 共轭通常被理解为“在另一个元素的‘视角’下看待当前元素”。如果 $g$ 是一个坐标变换,那么 $gxg^{-1}$ 可以理解为:先变到旧坐标系 ($g^{-1}$),执行 $x$ 操作,再变回新坐标系 ($g$)。结果就是在新坐标系下执行了等价于 $x$ 的操作。
  • (我们这样写是为了避免与左乘作用混淆...):
  • 这是一个文体上的说明。因为 $G$ 作用于自身已经有了左乘作用 $g \cdot x = gx$,为了不让读者混淆两种不同的作用,作者特意换了一套符号 $i_g(x)$。在其他文献中,也可能写成 $g \cdot x = gxg^{-1}$,此时必须根据上下文判断是哪种作用。
💡 [数值示例]
  • 示例1: $G=D_4$ (正方形对称群)
  • 元素包括旋转 $r$ (90度) 和翻转 $s$ (水平)。
  • 设作用者 $g=r$,被作用者 $x=s$$g^{-1} = r^{-1} = r^3$ (旋转270度)。
  • 作用结果: $i_r(s) = r s r^{-1} = r s r^3$
  • $D_4$ 中,有关系 $sr=r^3s$
  • $r s r^3 = (rs)r^3 = (sr^3)r^3 = s r^6 = s r^2$ (因为 $r^4=e$)。
  • 作用的结果是 $sr^2$,这是另一个翻转操作(对角线翻转)。
  • 几何解释: $s$ 是水平翻转。$r$ 是旋转90度。$r s r^{-1}$ 的意思是:先逆时针转90度 ($r^{-1}$),然后做水平翻转,再顺时针转90度 ($r$)。最终效果等同于一次对角线翻转 ($sr^2$)。
  • 示例2: $G=GL_2(\mathbb{R})$ (2x2可逆矩阵群)
  • 设作用者 $g = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$ (剪切矩阵)。
  • 设被作用者 $x = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ (旋转90度矩阵)。
  • $g^{-1} = \begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix}$
  • 作用结果: $i_g(x) = gxg^{-1} = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix}$
  • $= \begin{pmatrix} 1 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & -2 \\ 1 & -1 \end{pmatrix}$
  • 旋转矩阵 $x$ 在剪切变换 $g$ 的“视角”下,变成了矩阵 $\begin{pmatrix} 1 & -2 \\ 1 & -1 \end{pmatrix}$
⚠️ [易错点]
  1. 共轭 vs 交换: 如果 $g$$x$ 是可交换的 (commute),即 $gx=xg$,那么 $gxg^{-1} = xgg^{-1} = x$。此时 $x$$g$ 的共轭作用下是不动点
  2. 阿贝尔群中的共轭: 如果群 $G$ 是阿贝尔群(所有元素都可交换),那么对于任何 $g,x \in G$,都有 $gxg^{-1}=x$。这意味着在阿贝尔群中,共轭作用总是平凡作用
📝 [总结]

共轭作用是群 $G$ 在其自身集合上的另一种重要的、自然的代数作用。其定义为 $i_g(x) = gxg^{-1}$。它深刻地反映了群的非交换性质,并成为研究群的内部结构(如共轭类、中心化子、正规子群)的核心工具。

🎯 [存在目的]
  1. 研究群的非交换性: 共轭作用的“有趣”程度直接衡量了一个群的非交换程度。
  2. 定义核心概念: 像共轭类 (conjugacy class) 和中心化子 (centralizer) 等群论核心概念,都是在共轭作用的框架下定义的。
  3. 识别结构: 共轭作用保持元素的很多性质,比如阶 (order)。所有在同一个共轭作用轨道(即共轭类)里的元素,都有相似的代数性质。
🧠 [直觉心智模型]
  1. $G$: 一个公司的所有员工。
  2. 元素 $x$: 员工小明,他的工作是“任务X”。
  3. 元素 $g$: 另一位员工作为“翻译”或“协调人”小红。
  4. 共轭作用 $gxg^{-1}$: 你想让小明去做“任务X”,但小明只会说中文。而最终的执行环境是英文环境。
  1. 小红 ($g$) 把你的中文指令“任务X”翻译成英文。
  2. 小明 ($x$) 执行这个指令。
  3. 小红 ($g^{-1}$) 把执行结果从英文翻译回中文给你。
    • 这个“翻译-执行-反向翻译”的整个过程,就是共轭作用 $gxg^{-1}$。它是在小红的“语境”($g$) 下执行了小明的任务 ($x$)。
💭 [直观想象]

你正在玩一个相机。

  1. 元素 $x$: 是一个“长焦”镜头。
  2. 元素 $g$: 是一个“广角附加镜”。
  3. 共轭作用 $gxg^{-1}$:
  1. 你先拧上广角附加镜 ($g$)。
  2. 然后你再装上长焦镜头 ($x$)。
  3. 最后你把广角附加镜拧下来 ($g^{-1}$)。(这里为了类比,假设拧上和拧下互为逆操作)。
    • 整个操作的净效果可能很奇怪,它既不是纯粹的长焦,也不是纯粹的广角,而是长焦镜头在广角附加镜的“扭曲”下呈现出的一种新效果。这就是共轭。

📜 [原文24]

要看到这是一个作用,请注意,对于所有 $g_{1}, g_{2} \in G$

$$ \begin{aligned} i_{g_{1}}\left(i_{g_{2}}(x)\right) & =i_{g_{1}}\left(g_{2} x g_{2}^{-1}\right)=g_{1}\left(g_{2} x g_{2}^{-1}\right) g_{1}^{-1}=\left(g_{1} g_{2}\right) x\left(g_{2}^{-1} g_{1}^{-1}\right) \\ & =\left(g_{1} g_{2}\right) x\left(g_{1} g_{2}\right)^{-1}=i_{g_{1} g_{2}}(x) \end{aligned} $$

这里我们使用了熟知的事实 $\left(g_{1} g_{2}\right)^{-1}=g_{2}^{-1} g_{1}^{-1}$

📖 [逐步解释]

这段内容是对共轭作用满足群作用公理(1)的详细验证。

  • 要看到这是一个作用,...: 表明下面的内容是证明过程。
  • 验证公理(1): $i_{g_1}(i_{g_2}(x)) = i_{g_1 g_2}(x)$
  • 这个等式就是群作用公理(1)在使用 $i_g(x)$ 记号下的形式。
  • 左边 $i_{g_1}(i_{g_2}(x))$:先用 $g_2$ 共轭作用于 $x$,再用 $g_1$ 共轭作用于其结果。
  • 右边 $i_{g_1 g_2}(x)$:先在群内将 $g_1$$g_2$ 相乘,然后用这个乘积 $g_1 g_2$ 共轭作用于 $x$
  • 证明过程就是要说明这两边是相等的。
  • 推导步骤:
  1. $i_{g_{1}}\left(i_{g_{2}}(x)\right) = i_{g_{1}}\left(g_{2} x g_{2}^{-1}\right)$
    • 这是第一步,将括号内的 $i_{g_2}(x)$ 按定义展开为 $g_2 x g_2^{-1}$
  2. $... = g_{1}\left(g_{2} x g_{2}^{-1}\right) g_{1}^{-1}$
    • 这是第二步,将外层的 $i_{g_1}$ 作用应用在 (g2 x g2^-1) 这个整体上。根据定义,就是用 $g_1$ 乘以这个整体,再乘以 $g_1$ 的逆。
  3. $... = \left(g_{1} g_{2}\right) x\left(g_{2}^{-1} g_{1}^{-1}\right)$
    • 这一步使用了群运算的结合律。括号 $g_1(g_2 x g_2^{-1})g_1^{-1}$ 可以重新组合。我们可以去掉内部的括号,看作 $g_1 g_2 x g_2^{-1} g_1^{-1}$,然后重新组合成 $(g_1 g_2) x (g_2^{-1} g_1^{-1})$
  4. $... = \left(g_{1} g_{2}\right) x\left(g_{1} g_{2}\right)^{-1}$
    • 这是关键的一步。它使用了群的一个基本性质:乘积的逆元等于逆元的反序乘积
    • $(ab)^{-1} = b^{-1}a^{-1}$
    • 将这个性质应用于 $(g_1 g_2)^{-1}$,我们得到 $(g_1 g_2)^{-1} = g_2^{-1} g_1^{-1}$
    • 因此,前一步表达式中的 $(g_2^{-1} g_1^{-1})$ 可以被替换为 $(g_1 g_2)^{-1}$
  5. $... = i_{g_{1} g_{2}}(x)$
    • 这是最后一步,将表达式 $\left(g_{1} g_{2}\right) x\left(g_{1} g_{2}\right)^{-1}$ 重新用 $i$ 的定义写回去。这里作用者是 $g_1 g_2$ 这个整体。
  • 结论: 经过一系列推导,我们证明了 $i_{g_1}(i_{g_2}(x)) = i_{g_1 g_2}(x)$,所以群作用的公理(1)对于共轭作用成立。
  • 这里我们使用了熟知的事实 $\left(g_{1} g_{2}\right)^{-1}=g_{2}^{-1} g_{1}^{-1}$
  • 作者特意点明了推导中最关键的一步所使用的定理,这个定理因为像穿袜子和脱袜子一样顺序相反,所以也被戏称为“袜子和鞋子定理” (Socks and Shoes Property)。(穿的时候先穿袜子再穿鞋,脱的时候必须先脱鞋再脱袜子)。
∑ [公式拆解]

$$ \begin{aligned} i_{g_{1}}\left(i_{g_{2}}(x)\right) & =i_{g_{1}}\left(g_{2} x g_{2}^{-1}\right)=g_{1}\left(g_{2} x g_{2}^{-1}\right) g_{1}^{-1}=\left(g_{1} g_{2}\right) x\left(g_{2}^{-1} g_{1}^{-1}\right) \\ & =\left(g_{1} g_{2}\right) x\left(g_{1} g_{2}\right)^{-1}=i_{g_{1} g_{2}}(x) \endaligned} $$

这是一个等式链,展示了从最左端推导到最右端的完整过程,每一步都依赖于群的定义或基本性质。

  • $i_{g}(x)$: $g$$x$ 的共轭作用。
  • $g x g^{-1}$: 共轭作用的定义。
  • $(g_1 g_2) x (g_2^{-1} g_1^{-1})$: 使用了结合律。
  • $(g_1 g_2)^{-1} = g_2^{-1} g_1^{-1}$: 关键的逆元性质。
💡 [数值示例]

我们用一个具体的群来走一遍这个证明。设 $G=D_4$, $g_1=r, g_2=s, x=r^2$

  • 左边: $i_r(i_s(r^2))$
  • $i_s(r^2) = s r^2 s^{-1}$。因为 $s$ 的逆是它自身 ($s^2=e$),所以 $s^{-1}=s$$s r^2 s = s (rs)r = s(sr^3)r = s^2 r^4 = e e = e$ ? Let's check the relation. $sr=r^{-1}s=r^3s$. $s r^2 s = s(r)rs = (sr)rs = (r^3s)rs = r^3(sr)s = r^3(r^3s)s = r^6s^2 = r^2$. So $i_s(r^2)=r^2$.
  • $i_r(i_s(r^2)) = i_r(r^2) = r r^2 r^{-1} = r^3 r^{-1} = r^2$
  • 所以左边结果是 $r^2$
  • 右边: $i_{rs}(r^2)$
  • 作用者是 $rs$$(rs)^{-1} = s^{-1}r^{-1} = sr^3$
  • $i_{rs}(r^2) = (rs) r^2 (rs)^{-1} = (rs) r^2 (sr^3)$
  • $rs r^2 s r^3 = (sr^3)r^2 s r^3 = s r^5 s r^3 = s r s r^3 = s (rs) r^3 = s(sr^3)r^3 = s^2 r^6 = r^2$
  • 右边结果也是 $r^2$
  • 结论: 左边=右边,验证了对于这组具体元素,公理(1)成立。
⚠️ [易错点]
  1. 逆元性质的顺序: $(g_1 g_2)^{-1} = g_2^{-1} g_1^{-1}$ 这个顺序绝对不能搞错。如果写成 $g_1^{-1} g_2^{-1}$,整个证明就无法进行下去。
  2. 结合律的应用: 证明中多次隐式地使用了结合律来重新组合表达式,这是群定义的基本保障。
📝 [总结]

本段通过一个详细的代数推导,严谨地证明了共轭作用满足群作用的结合律公理 (公理1)。证明的核心在于巧妙地运用了群的结合律乘积的逆元这两个基本性质,它完美地展示了群作用的定义是如何与群自身的基本公理和谐统一的。

🎯 [存在目的]

任何声称是群作用的定义都必须经过两条公理的检验。本段的目的就是完成对共轭作用的这个“合法性认证”过程中的第一步(也是最复杂的一步)。它向读者表明,共轭作用不是一个随意的定义,而是一个结构严谨、符合群论基本法则的数学构造。

🧠 [直觉心智模型]

回到“翻译”模型:

  1. $i_{g_2}(x)$: 用 $g_2$ (比如德语翻译) 的语境去执行任务 $x$
  2. $i_{g_1}(i_{g_2}(x))$: 对上面那个“在德语境下执行的任务”,再套上一层 $g_1$ (比如法语翻译) 的语境。过程是:先法翻德,再德执行,再德翻法。
  3. $i_{g_1 g_2}(x)$: $g_1 g_2$ 是一个复合翻译官,他能直接“法-德”互译。用这个复合翻译官的语境去执行任务 $x$
  4. 公理(1)成立:意味着这两种复杂的过程,最终效果是一样的。这保证了“语境切换”这个操作本身是自洽的、符合逻辑的。
💭 [直观想象]

想象你有一串指令来操控一个机器人。

  1. $x$: 指令 "前进5步"。
  2. $g_2$: 指令 "向右转90度"。
  3. $i_{g_2}(x) = g_2 x g_2^{-1}$: "向右转90度,前进5步,向左转90度"。净效果是机器人向右平移了5步。
  4. $g_1$: 指令 "向后转180度"。
  5. $i_{g_1}(i_{g_2}(x))$: 对“向右平移5步”这个净效果,再用“向后转”的语境来执行。即:"向后转,(向右平移5步),向前转"。净效果是机器人向左平移了5步。
  6. $g_1 g_2$: "向后转" 复合 "向右转" = "向左转"。
  7. $i_{g_1 g_2}(x)$: 用“向左转”的语境执行“前进5步”。即:“向左转,前进5步,向右转”。净效果也是机器人向左平移了5步。
  8. 两者效果相同,验证了公理。

📜 [原文25]

由于显然

$$ i_{1}(x)=1 x 1^{-1}=1 x 1=x $$

共轭确实给出了 $G$ 在自身上的一个作用。这个作用是平凡作用 $\Longleftrightarrow g x g^{-1}=x$ 对于所有 $g, x \in G \Longleftrightarrow g x=x g$ 对于所有 $g, x \in G \Longleftrightarrow G$阿贝尔群

📖 [逐步解释]

这段话完成了共轭作用的验证,并讨论了它在何种情况下会退化为平凡作用。

  • 由于显然 $i_{1}(x)=1 x 1^{-1}=1 x 1=x$
  • 这是对群作用公理(2)的验证。
  • $i_1(x)$: 用群的单位元 $1$ 来进行共轭作用。
  • $1 x 1^{-1}$: 根据共轭的定义展开。
  • $1^{-1}=1$: 单位元的逆元是它自身。
  • $1x1 = x$: 根据单位元的性质,$1x=x$$x1=x$
  • 结论: 公理(2)成立。
  • 共轭确实给出了 $G$ 在自身上的一个作用。
  • 这是一个总结。因为公理(1)和公理(2)都已验证成立,所以共轭是一种合法的群作用。
  • 这个作用是平凡作用 $\Longleftrightarrow g x g^{-1}=x$ 对于所有 $g, x \in G$
  • 平凡作用的定义: 对所有作用者 $g$ 和被作用者 $x$,都有 $g \cdot x = x$
  • $\Longleftrightarrow$: 逻辑等价符号,"当且仅当"。
  • 将平凡作用的定义套用到共轭作用上,就是:$i_g(x) = x$ 对于所有 $g,x \in G$
  • 展开 $i_g(x)$ 的定义,就得到 $gxg^{-1}=x$
  • $\Longleftrightarrow g x=x g$ 对于所有 $g, x \in G$
  • 这是从上一步推导出来的。
  • 如果 $gxg^{-1}=x$,我们在等式右边乘以 $g$
  • $(gxg^{-1})g = xg$
  • $gx(g^{-1}g) = xg$
  • $gx(1) = xg$
  • $gx = xg$
  • 这个式子意味着元素 $g$$x$可交换的 (commute)
  • $\Longleftrightarrow G$ 是阿贝尔群。
  • 阿贝尔群 (Abelian Group) 的定义就是:群中任意两个元素都是可交换的。
  • 前一步的结论是 "$gx=xg$ 对于所有 $g, x \in G$",这正是阿贝尔群的定义。
  • 结论: 共轭作用是一个平凡作用,当且仅当这个群本身是一个阿贝尔群。
  • 换句话说,对于非阿贝尔群,共轭作用必然不是平凡作用(即至少存在一对 $g,x$ 使得 $gxg^{-1} \neq x$)。共轭作用的“非平凡性”是衡量一个群“非交换”程度的标尺。
∑ [公式拆解]

$$ i_{1}(x)=1 x 1^{-1}=1 x 1=x $$

  • $i_1(x)$: 单位元1对元素x的共轭作用。
  • $1$: 群的单位元。
  • $1^{-1}$: 单位元的逆元。

这个等式链证明了共轭作用满足群作用的单位元公理。

💡 [数值示例]
  • 示例1: 阿贝尔群中的共轭作用
  • $G = (\mathbb{Z}, +)$ (整数加法群)。这是一个阿贝尔群。
  • 群运算是加法,单位元是0,逆元是相反数。
  • 共轭作用的“加法形式”是: $i_g(x) = g + x + (-g)$
  • $g=5, x=3$
  • $i_5(3) = 5 + 3 + (-5) = 8 - 5 = 3$
  • 结果 $i_5(3) = 3$,等于 $x$ 本身。
  • 因为加法满足交换律和结合律,$g+x-g = g-g+x = 0+x = x$ 永远成立。
  • 所以在整数加法群中,共轭作用就是平凡作用。
  • 示例2: 非阿贝尔群中的共轭作用
  • $G=D_4$。我们之前计算过 $i_r(s) = sr^2$
  • 因为 $s \neq sr^2$,所以 $i_r(s) \neq s$
  • 这表明 $D_4$ 中的共轭作用不是平凡作用,这也印证了 $D_4$ 是一个非阿贝尔群。
⚠️ [易错点]
  1. 不要忘记单位元的性质: 验证公理(2)依赖于单位元的两个核心性质:$1x=x$$1^{-1}=1$
  2. 阿贝尔群的判断: 一个群是阿贝尔群,必须是所有元素对都可交换。只要找到一对不可交换的元素,它就是非阿贝尔群,其共轭作用就不是平凡作用。
📝 [总结]

本段完成了共轭作用的合法性证明,并揭示了它与群的交换性之间的深刻联系。共轭作用满足单位元公理,因此是一个合法的群作用。更重要的是,共轭作用是否“平凡”(即什么都不做),直接等价于群是否是“阿贝尔群”(即完全可交换)。对于非阿贝尔群,共轭作用提供了一种研究其内部复杂结构的有效途径。

🎯 [存在目的]
  1. 完成证明: 补全对共轭作用合法性的证明。
  2. 建立重要等价关系: 将“共轭作用的平凡性”和“群的阿贝尔性”这两个分别来自群作用理论和基本群论的概念联系起来,建立了一个重要的等价关系。
  3. 深化理解: 让读者明白,共轭作用的意义恰恰在于其“非平凡性”,它专门用来刻画和研究群的非交换结构。
🧠 [直觉心智模型]
  1. 共轭作用是平凡作用: 公司里的所有员工都只听从直接指令,不理会“协调人”或“翻译”的存在。无论谁来传话,任务的执行方式都和原来一模一样。这意味着这个公司没有部门壁垒,沟通是完全透明和可交换的。这是一个“阿贝尔公司”。
  2. 共轭作用非平凡: 公司里部门(比如设计部、工程部)壁垒森严。一项“设计任务”,如果由“工程师”来传达和协调,其最终实现方式会和由“设计师”自己执行大相径庭。这就是非阿贝尔公司,共轭作用在这里扮演了重要角色。
💭 [直观想象]
  1. 阿贝尔群: 你在一条直线上。向前走5米再向后走3米,和先向后走3米再向前走5米,结果是一样的。共轭是平凡的。
  2. 非阿贝尔群: 你在一个迷宫里。先“右转”再“前进5步”,和你先“前进5步”再“右转”,最终到达的位置和朝向都可能完全不同。这里的操作是不可交换的,共轭作用会产生复杂的效果。

21.2. 1.2. 定义 1.1.3

📜 [原文26]

如果 $X$ 是一个 $G$-集,那么 $X$ 的一个 $G$-子集 $Y$ 是一个子集 $Y \subseteq X$,使得对于所有 $g \in G$$y \in Y, g \cdot y \in Y$。一个 $G$-子集本身就是一个 $G$-集。

📖 [逐步解释]

这段话定义了 $G$-子集,也叫不变子集 (Invariant Subset)

  • 如果 $X$ 是一个 $G$-集: 这是前提。我们已经有一个群 $G$ 作用在一个集合 $X$ 上。
  • 那么 $X$ 的一个 $G$-子集 $Y$ 是一个子集 $Y \subseteq X$:
  • 首先,$G$-子集 $Y$ 必须是原集合 $X$ 的一个普通子集
  • 使得对于所有 $g \in G$$y \in Y, g \cdot y \in Y$:
  • 这是成为 $G$-子集的核心条件
  • 含义: 从子集 $Y$ 中任取一个元素 $y$,再从群 $G$ 中任取一个元素 $g$,用 $g$ 作用于 $y$,得到的结果 $g \cdot y$ 必须仍然在子集 $Y$
  • 换句话说,子集 $Y$ 在群 $G$ 的所有作用下是封闭的 (closed)不变的 (invariant)。群里的任何操作都不能把 $Y$ 里的元素“踢出”到 $Y$ 外面去。
  • 一个 $G$-子集本身就是一个 $G$-集:
  • 这是一个直接的推论。
  • 既然对于任何 $g \in G$$y \in Y$,结果 $g \cdot y$ 都在 $Y$ 中,那么我们可以把作用 $G \times X \rightarrow X$ 限制 (restrict)$G \times Y \rightarrow Y$
  • 原来在 $X$ 上成立的两条群作用公理,对于 $Y$ 中的元素自然也成立。
  • 因此,$Y$ 配备上这个限制后的作用,就构成了一个新的、独立的 $G$-集。
💡 [数值示例]
  • 示例1: $O_n$ 作用于 $\mathbb{R}^n$
  • $G=O_n$, $X=\mathbb{R}^n$
  • 考虑子集 $Y = S^{n-1}$ (单位球面)。
  • 我们在前面已经验证过,对于任何 $A \in O_n$ 和任何 $\|\mathbf{v}\|=1$ 的向量 $\mathbf{v}$,其作用结果 $A\mathbf{v}$ 的长度仍然是1,即 $\|A\mathbf{v}\|=1$
  • 这意味着 $A\mathbf{v}$ 仍然在 $S^{n-1}$ 中。
  • 所以,$S^{n-1}$$\mathbb{R}^n$$O_n$ 作用下的一个 $O_n$-子集
  • 示例2: $S_4$ 作用于 $X=\{1,2,3,4\}$ 的幂集 $\mathcal{P}(X)$
  • $G=S_4$, $X' = \mathcal{P}(X)$
  • 考虑 $X'$ 的一个子集 $Y = \mathcal{P}_2(X)$,即所有大小为2的子集的集合。
  • $Y = \{\{1,2\}, \{1,3\}, \{1,4\}, \{2,3\}, \{2,4\}, \{3,4\}\}$
  • 我们在前面也讨论过,对于任何置换 $\sigma \in S_4$ 和任何大小为2的子集 $A \in Y$,其作用结果 $\sigma \cdot A$ 的大小仍然是2。
  • 这意味着 $\sigma \cdot A$ 仍然在 $Y$ 中。
  • 所以,$\mathcal{P}_2(X)$$\mathcal{P}(X)$$S_4$ 作用下的一个 $S_4$-子集
  • 示例3: 平凡子集
  • 对于任何 $G$-集 $X$,总存在两个平凡的 $G$-子集:
  1. 空集 $\emptyset$: 对于任何 $g \in G$, $g \cdot \emptyset = \{g \cdot y : y \in \emptyset\} = \emptyset$。空集总是 $G$-子集。
  2. 全集 $X$: 根据群作用的定义,对于任何 $g \in G, x \in X$,结果 $g \cdot x$ 必须在 $X$ 中。所以 $X$ 总是自身的 $G$-子集。
⚠️ [易错点]
  1. $G$-子集 vs 子群: $G$-子集 $Y$被作用集合 $X$ 的一个子集。而子群 $H$作用者群 $G$ 的一个子集。两者的概念和所属空间完全不同,切勿混淆。
  2. 不变不等于不动: $Y$ 是一个 $G$-子集(不变子集)意味着 $G$ 的作用把 $Y$ 作为一个整体映射回了自身 ($g \cdot Y = Y$)。但这不意味着 $Y$ 里面的每个元素都是不动的。如 $S_4$ 作用于 $Y=\mathcal{P}_2(X)$ 时,$\sigma=(12)$ 作用于 $\{1,3\}$ 得到 $\{2,3\}$,子集发生了变化,但仍在 $Y$ 中。
📝 [总结]

$G$-子集(或不变子集$Y$ 是一个 $G$-集 $X$ 中对群 $G$ 的所有作用都表现出封闭性的子集。也就是说,群 $G$ 的任何操作都无法将 $Y$ 中的元素变换到 $Y$ 之外。因此,我们可以将原作用限制在 $Y$ 上,使得 $Y$ 本身也成为一个独立的 $G$-集。

🎯 [存在目的]
  1. 分解复杂性: 研究一个大的、复杂的 $G$-集 $X$,往往可以被分解为研究其上一个个更小的、不可再分的 $G$-子集。这些“不可再分”的 $G$-子集就是下一节要讲的“轨道”。
  2. 识别结构: 寻找一个作用下的不变子集,是理解这个作用结构的关键步骤。不变子集揭示了作用的内在对称性和层次。
  3. 与子群类比: $G$-子集在 $G$-集中的地位,有点类似于子群在群中的地位,它们都是保持原结构(作用或群运算)封闭的子单位。
🧠 [直觉心智模型]
  1. $G$-集 $X$: 整个学校的学生。
  2. $G$: 学校组织的各种活动,比如“按班级重组”、“按社团活动”。
  3. $G$-子集 $Y$: 学校里的“篮球队”。
  4. 不变性: 无论学校怎么组织活动,比如全校学生按身高重新排队(一个 $G$ 中的作用),篮球队员可能会被打散到不同队伍里。但如果我们考虑一个特殊的作用,比如“篮球队内部训练”,那么无论怎么练,队员还是篮球队的队员,不会变成足球队的。在这种“内部训练”作用下,“篮球队”这个集合就是不变的。一个更好的例子是,如果 $G$ 是“选拔更高一级的校队”,$X$ 是全校学生,那么 $Y$=“校队成员”是一个 $G$-子集,因为从校队成员里选拔,结果还是校队成员(或者其子集)。一个更精确的类比是,如果 $G$ 的作用保持某种属性(例如,$G$的所有操作都保持身高不变),那么 $Y$=“所有身高1米8的学生”就是一个 $G$-子集。
💭 [直观想象]

你正在玩一个只有红色和蓝色两种积木的乐高盒。

  1. $G$-集 $X$: 所有的积木。
  2. $G$: 你的一系列操作,比如“把积木堆起来”、“把积木排成一排”。
  3. $G$-子集 $Y$: 所有“红色”的积木组成的集合。
  4. 不变性: 如果你的操作 $g$ 是“把所有积木都染成绿色”,那么 $Y$ 不是 $G$-子集,因为红色积木被你变成了绿色,跑出了“红色积木”这个集合。但如果你的操作 $g$ 是“把所有红色积木拿出来重新排列”,那么 $Y$ 就是一个 $G$-子集,因为无论你怎么排列,它们还都是红色的。

31.3. 1.3. 定义 1.1.4

📜 [原文27]

如果 $X_{1}$$X_{2}$$G$-集,从 $X_{1}$$X_{2}$$G$-集同构,或者简称为 $G$-同构,是一个双射 $f: X_{1} \rightarrow X_{2}$,使得对于所有 $g \in G$$x \in X$, $f(g \cdot x)=g \cdot f(x)$。在这种情况下,我们说 $X_{1}$$X_{2}$ 作为 $G$-集是同构的,或者 $G$-同构的,并记作 $X_{1} \cong_{G} X_{2}$。显然 $\operatorname{Id}_{X}$ 是一个 $G$-集同构。如果 $f: X_{1} \rightarrow X_{2}$ 是一个 $G$-集同构,那么 $f^{-1}$ 也是。同样,两个同构的复合仍然是一个同构。因此,与同构的通常定义一样,关系 $\cong_{G}$ 是自反的、对称的、和传递的。

📖 [逐步解释]

这段话定义了$G$-集同构,这是判断两个 $G$-集是否“本质上相同”的标准。

  • 如果 $X_{1}$$X_{2}$$G$-集: 前提是我们有两个集合,$X_1$$X_2$,并且同一个群 $G$ 已经分别在它们上面定义了作用。我们用 · 表示在两个集合上的作用,尽管它们可能是不同的函数。
  • $G$-集同构...是一个双射 $f: X_{1} \rightarrow X_{2}$:
  • 同构的核心是一个函数 $f$
  • 双射 (bijection): $f$ 必须是一一对应的。这意味着 $X_1$$X_2$ 作为普通集合,必须有相同数量的元素。$f$ 为它们之间建立了一个完美的配对。
  • 使得对于所有 $g \in G$$x \in X$, $f(g \cdot x)=g \cdot f(x)$:
  • 这是成为$G$-同构的核心条件,也被称为G-等变性 (G-equivariance)
  • 左边 $f(g \cdot x)$: 表示一个“先作用,后映射”的过程。
  1. $X_1$ 内部,用 $g$ 作用于 $x$,得到新元素 $g \cdot x$
  2. 将这个新元素通过函数 $f$ 映射到 $X_2$ 中,得到 $f(g \cdot x)$
    • 右边 $g \cdot f(x)$: 表示一个“先映射,后作用”的过程。
  3. 先将元素 $x \in X_1$ 通过函数 $f$ 映射到 $X_2$ 中,得到元素 $f(x) \in X_2$
  4. $X_2$ 内部,用同一个 $g$ 作用于 $f(x)$,得到新元素 $g \cdot f(x)$
    • 等号的意义: 这个条件要求上述两种路径得到的结果必须完全相同。它保证了映射 $f$ 保持了群作用的结构。无论是在作用前还是作用后进行映射,结果都一样。这可以用一个交换图来表示:
  • $X_{1} \cong_{G} X_{2}$:
  • 如果存在这样一个 $G$-同构 $f$,我们就说 $X_1$$X_2$ 作为 $G$-集是同构的。
  • 这意味着,从群 $G$ 的“视角”来看,$X_1$$X_2$ 是无法区分的。它们只是同一套“游戏规则”($G$ 的作用)在两个不同“游戏棋盘”($X_1, X_2$)上的实现,而 $f$ 就是棋盘之间的翻译器。
  • 关系 $\cong_{G}$ 是自反的、对称的、和传递的:
  • 这是一个重要的结论,说明“$G$-同构”是一种等价关系 (equivalence relation)
  • 自反性 (Reflexive): $X \cong_G X$。因为恒等映射 $\mathrm{Id}_X: X \rightarrow X$ 是一个双射,且 $\mathrm{Id}_X(g \cdot x) = g \cdot x = g \cdot \mathrm{Id}_X(x)$
  • 对称性 (Symmetric): 如果 $X_1 \cong_G X_2$,那么 $X_2 \cong_G X_1$。因为如果 $f$ 是一个 $G$-同构,它的逆映射 $f^{-1}$ 也是一个双射。我们需要验证 $f^{-1}(g \cdot y) = g \cdot f^{-1}(y)$。设 $y=f(x)$,则左边是 $f^{-1}(g \cdot f(x)) = f^{-1}(f(g \cdot x)) = g \cdot x = g \cdot f^{-1}(y)$。成立。
  • 传递性 (Transitive): 如果 $X_1 \cong_G X_2$$X_2 \cong_G X_3$,那么 $X_1 \cong_G X_3$。因为两个 $G$-同构(双射)的复合仍然是双射,并且也保持作用结构。
💡 [数值示例]
  • 示例:$D_4$ 作用于顶点和对角线
  • $G = D_4$
  • 集合 $X_1 = \{v_1, v_2, v_3, v_4\}$ (正方形的四个顶点)。$D_4$ 通过旋转和翻转置换这些顶点。
  • 集合 $X_2 = \{d_1, d_2, h, v\}$ (正方形的四个对称轴:两条对角线 $d_1, d_2$,一条水平中分线 $h$,一条垂直中分线 $v$)。$D_4$ 中的元素也会置换这些对称轴。例如,旋转90度会把水平轴 $h$ 变成垂直轴 $v$
  • 这两个 $G$-集是同构的吗?
  • $X_1$$X_2$ 的元素数量都是4,存在双射。但我们需要检查作用结构是否相同。
  • 考虑一个翻转操作 $s_h$ (沿水平中分线 $h$ 翻转)。
  • $X_1$ 中: $s_h$ 保持 $v_1, v_2$ 不动,交换 $v_3, v_4$
  • $X_2$ 中: $s_h$ 作用于 $h$ 本身, $h$ 是不动的 ($s_h \cdot h = h$)。
  • 设存在一个 $G$-同构 $f: X_1 \rightarrow X_2$。如果 $f(v_1) = h$,那么根据同构条件:
  • $f(s_h \cdot v_1) = s_h \cdot f(v_1)$
  • 左边: $f(v_1) = h$
  • 右边: $s_h \cdot h = h$
  • 这个条件满足了。
  • 但是,考虑旋转90度 $r$
  • $X_1$ 中: $r \cdot v_1 = v_2$
  • $X_2$ 中: $r \cdot h = v$
  • 根据同构条件:
  • $f(r \cdot v_1) = r \cdot f(v_1)$
  • $f(v_2) = r \cdot h = v$
  • 这意味着 $f$ 必须把 $v_1$ 映到 $h$,把 $v_2$ 映到 $v$。我们可以继续这样推导,但最终会发现无法构造一个在所有 $D_4$ 元素下都保持作用结构的双射。因为在 $X_1$ 上,没有任何元素能使两个顶点不动而交换另两个。但在 $X_2$ 上,$s_h$ 就能做到。它们的作用结构不同,所以 $X_1 \not\cong_G X_2$
⚠️ [易错点]
  1. 同构的群必须是同一个: 谈论 $G$-集同构时,作用在 $X_1$$X_2$ 上的必须是同一个群 $G$
  2. 双射只是必要条件: 两个 $G$-集元素数量相同,不代表它们就 $G$-同构。关键是作用的“模式”或“结构”要能通过双射对应起来。
  3. 同构 vs 同态: 与群同构类似,$G$-集之间也有同态(Morphism),它只要求是函数而不必是双射。同构是一种最强的等价关系。
📝 [总结]

$G$-集同构是判断两个 $G$-集是否“代数结构相同”的黄金标准。它要求存在一个双射 $f$,这个双射能够“尊重”群 $G$ 的作用,即满足G-等变性条件 $f(g \cdot x)=g \cdot f(x)$。这个条件保证了在两个集合上的作用结构可以被完美地相互“翻译”。$G$-同构关系是一种等价关系,它将所有 $G$-集划分为不同的等价类。

🎯 [存在目的]
  1. 定义“相同”: 在数学中,为任何一种代数结构(群、环、域、向量空间、G-集)定义相应的“同构”概念是至关重要的一步。它告诉我们何时可以认为两个对象是“一样的”,从而可以把对其中一个的研究成果直接应用到另一个上。
  2. 分类: 同构的概念是进行分类的基础。我们的目标之一就是将所有的 $G$-集(对于一个固定的群G)分门别类,直到每一个最基本的、不可再分的类型(通常是轨道),然后研究这些基本类型。
  3. 抽象与识别: 它使我们能够从具体的、表面的不同(如一个是顶点集,一个是边集)中识别出其背后共同的、抽象的作用模式。
🧠 [直觉心智模型]
  1. $X_1$: 一个英文版的棋盘游戏,有棋子和一套移动规则(由群 $G$ 给出)。
  2. $X_2$: 一个中文版的同一款棋盘游戏。
  3. $G$-同构 $f$: 一本“英汉-汉英游戏词典”。它告诉你英文棋盘上的“Pawn”对应中文棋盘上的“兵”,英文的“A1”格对应中文的“一-1”格。
  4. $f(g \cdot x)=g \cdot f(x)$: 这个条件保证了词典的正确性。它说:“在英文棋盘上,根据规则 $g$ 把棋子 $x$ 移动一步,然后查词典看新位置是什么”,这个结果,和你“先查词典把棋子 $x$ 在中文棋盘上的位置找到,然后在中文棋盘上按同样的规则 $g$ 移动一步”的结果,必须是完全一样的。
💭 [直观想象]
  1. $X_1$: 一个正方形的4个顶点 $\{1,2,3,4\}$
  2. $X_2$: 正方形的4条边 $\{a,b,c,d\}$
  3. $G=D_4$: 正方形的对称操作。
  4. 我们想看看这两个 $D_4$-集是否同构。
  5. 旋转90度,顶点1跑到2的位置,边a跑到b的位置。看起来似乎有对应关系。
  6. 但考虑一个沿对角线(穿过1和3)的翻转 $s$
  7. $X_1$ 中,顶点1和3不动,2和4交换。
  8. $X_2$ 中,邻接顶点1的两条边 $d$$a$ 会交换位置,邻接顶点3的两条边 $b$$c$ 也会交换位置。没有任何一条边是固定不动的。
  9. 作用的模式完全不同。所以这两个 $D_4$-集不是同构的。

41.4. 1.4. 命题 1.1.5

📜 [原文28]

我们在上面的一些例子中隐含地看到了以下原理:

📖 [逐步解释]

这句话是承上启下的引言。它告诉读者,接下来要陈述的命题(一个普遍原理),其实并不是全新的东西,它的思想已经在前面的例子中反复出现过了。作者通过这句话,引导读者从具体的例子回顾中提炼出抽象的规律。

  • 我们...隐含地看到了: "隐含地" (implicitly) 是关键词。意思是,虽然没有明确点出这个原理,但它是之前几个例子的共同基础。
  • 上面的一些例子:
  • 例子 (3): $O_n$$S O_n$$G L_n(\mathbb{R})$ 的子群,它们继承了 $G L_n(\mathbb{R})$$\mathbb{R}^n$ 上的作用。
  • 例子 (4) 的推广: 如果群 $G$ 作用于 $X$,我们可以将其作用提升到 $\mathcal{P}(X)$ 上。这里其实可以看作有一个从 $G$$S_{\mathcal{P}(X)}$ 的同态。
  • 以下原理: 预示着一个命题或定理即将到来。
📝 [总结]

这是一个路标性质的句子,它连接了过去的具体例子和未来的抽象理论,旨在说明数学规律的发现过程——从特殊到一般。

🎯 [存在目的]
  1. 教学法考虑: 帮助学生建立知识的连贯性,让他们意识到新的抽象定理并非凭空产生,而是对已有经验的总结和升华。
  2. 降低认知门槛: 在给出正式的、可能看起来很抽象的命题之前,先给读者一个心理预期,让他们知道这背后有熟悉的例子作为支撑,从而更容易接受和理解。

📜 [原文29]

1命题 1.1.5

如果 $X$ 是一个 $G$-集,并且 $f: G^{\prime} \rightarrow G$ 是一个同态,那么 $X$ 通过 $g^{\prime} \cdot x=f\left(g^{\prime}\right) \cdot x$ 成为一个 $G^{\prime}$-集。特别是,如果 $H \leq G$,那么一个 $G$-集 $X$ 也通过 $H$$G$ 的包含同态成为一个 $H$-集。

📖 [逐步解释]

这是本节提出的第一个正式命题,它描述了如何通过群同态来“传递”或“诱导”出一个新的群作用。

  • 前提条件:
  1. $X$ 是一个 $G$-集: 我们有一个已知的群 $G$ 在集合 $X$ 上的作用。我们记作 $g \cdot_G x$ (这里用下标区分)。
  2. $f: G^{\prime} \rightarrow G$ 是一个同态: 我们有一个新的群 $G'$,以及一个从 $G'$$G$ 的群同态 $f$
    • 同态 (homomorphism) 意味着 $f$ 保持群的运算结构,即对于所有 $g'_1, g'_2 \in G'$,都有 $f(g'_1 g'_2) = f(g'_1) f(g'_2)$
  • 结论: $X$ 通过 ... 成为一个 $G^{\prime}$-集
  • 我们可以利用已有的材料,在同一个集合 $X$ 上,定义一个的群 $G'$ 的作用。
  • 新作用的定义: $g^{\prime} \cdot x=f\left(g^{\prime}\right) \cdot x$
  • 左边 $g' \cdot x$: 这是我们要定义的新作用,作用者是来自新群 $G'$$g'$。为了清晰,我们记作 $g' \cdot_{G'} x$
  • 右边 $f(g') \cdot x$: 这是新作用的计算方式。
  1. 取一个新群的元素 $g' \in G'$
  2. 通过同态 $f$,将它“翻译”成旧群 $G$ 里的一个元素 $f(g')$
  3. 使用 $G$$X$ 上的旧作用,让 $f(g')$ 这个元素去作用于 $x$
    • 直观理解: 新群 $G'$ 的成员,要想在 $X$ 上“发号施令”,必须先通过“翻译官” $f$ 把自己的指令变成旧群 $G$ 能听懂的指令,然后再去执行。
  • 证明: 这个命题的后半部分给出了详细的证明。我们需要验证这个新定义的作用满足群作用的两条公理。
  • 特殊情况:子群:
  • 特别是,如果 $H \leq G$ ...: 这是一个非常重要且常见的特例。
  • $H \leq G$: $H$$G$ 的一个子群。
  • 包含同态 (inclusion homomorphism): 我们可以定义一个最简单的同态 $f: H \rightarrow G$,其定义就是 $f(h) = h$。这个同态就是把 $H$ 的元素看作是 $G$ 的元素,它显然保持群运算。
  • ... 成为一个 $H$-集:
  • 将这个包含同态代入上面的通用公式:$h \cdot x = f(h) \cdot x = h \cdot x$
  • 结论: 如果 $G$ 作用于 $X$,那么任何 $G$ 的子群 $H$ 都通过完全相同的作用方式作用于 $X$。我们只是把允许使用的操作从整个 $G$ 的工具箱,限制到了 $H$ 这个小工具箱。
  • 这就解释了为什么在例(3)中,$O_n$$S O_n$ 能继承 $G L_n(\mathbb{R})$ 的作用。
💡 [数值示例]
  • 示例1: 通用同态
  • $G = (\mathbb{Z}_4, +)$,群元素是 $\{0,1,2,3\}$ 模4加法。
  • $X = \mathbb{C}$ (复平面)。
  • $G$$X$ 上的作用是旋转:$k \cdot z = e^{i k \pi/2} z$ (旋转 $k \times 90$ 度)。
  • $0 \cdot z = z$
  • $1 \cdot z = iz$
  • $2 \cdot z = -z$
  • $3 \cdot z = -iz$
  • 现在设新群 $G' = (\mathbb{Z}, +)$ (整数加法群)。
  • 定义一个同态 $f: \mathbb{Z} \rightarrow \mathbb{Z}_4$,规则是 $f(n) = n \pmod 4$。例如 $f(5)=1, f(6)=2$
  • 根据命题,我们可以定义一个 $\mathbb{Z}$$\mathbb{C}$ 上的新作用:
  • $n \cdot_{\mathbb{Z}} z = f(n) \cdot_{\mathbb{Z}_4} z = (n \pmod 4) \cdot_{\mathbb{Z}_4} z$
  • 举例: 计算 $5 \cdot_{\mathbb{Z}} z$
  • $f(5) = 1$
  • 所以 $5 \cdot_{\mathbb{Z}} z = 1 \cdot_{\mathbb{Z}_4} z = iz$
  • 这意味着,在新作用下,整数5的作用效果等同于旋转90度。
  • 示例2: 子群特例
  • $G = D_4$ (正方形对称群) 作用于顶点集 $X=\{1,2,3,4\}$
  • 考虑 $D_4$ 的一个子群 $H = \{e, r, r^2, r^3\}$ (所有旋转操作构成的循环子群)。
  • 根据命题的特例,$H$ 也作用于 $X$
  • 作用方式完全一样:
  • $r \in H$ 作用于 $1$,结果是 $r(1)=2$
  • $r^2 \in H$ 作用于 $1$,结果是 $r^2(1)=3$
  • 我们只是把翻转操作从考虑中排除了。
⚠️ [易错点]
  1. 同态是关键: 如果 $f$ 不是一个同态,那么在证明新作用的公理(1)时, $f(g'_1 g'_2) = f(g'_1) f(g'_2)$ 这一步就会失败,整个结论不成立。
  2. 作用的传递方向: 作用是通过同态从 $G$ “传递”到 $G'$ 的,或者说 $G'$ 通过 $G$ 来间接作用。方向是 $G' \to G \to X$
📝 [总结]

命题 1.1.5 描述了一种构造新群作用的普适方法。只要我们有一个已知的 $G$-集 $X$,以及一个到 $G$ 的群同态 $f: G' \rightarrow G$,我们就能立刻定义一个新群 $G'$$X$ 上的作用。其方法是让 $G'$ 的元素先通过 $f$ “翻译”成 $G$ 的元素,再使用 $G$ 的旧作用。一个极其重要的特例是:任何群作用都可以被限制到其任意子群上。

🎯 [存在目的]
  1. 建立作用之间的联系: 这个命题不是孤立地看待每个群作用,而是揭示了不同群作用之间可以通过同态来相互关联和派生。
  2. 提供构造工具: 它是一个强大的理论工具,允许我们从已知的作用出发,系统地生成新的作用,而无需每次都从头验证。
  3. 统一解释: 它为前面例子中反复出现的“子群继承作用”的现象提供了统一的、严谨的理论解释。
🧠 [直觉心智模型]
  1. $G$-集 $X$: 一个只能识别“高级指令”的机器人。
  2. $G$: “高级指令”的集合,比如“执行清扫任务”。
  3. $G'$: “初级指令”的集合,比如“前进”、“左转”、“打开吸尘器”。
  4. 同态 $f: G' \rightarrow G$: 一本“编译器”或“宏定义手册”。它把一连串的初级指令组合翻译成一条高级指令。例如,f("前进; 左转; 打开吸尘器") = "执行清扫任务"
  5. 新作用 $g' \cdot x = f(g') \cdot x$: 你想让机器人执行初级指令 $g'$。机器人不认识。怎么办?
  1. 你先把 $g'$ 通过编译器 $f$ 翻译成高级指令 $f(g')$
  2. 然后把这个高级指令 $f(g')$ 发给机器人去执行。
    • 这样,你就成功地让机器人响应了你的初级指令。你为机器人定义了一套基于 $G'$ 的新作用。
💭 [直观想象]
  1. $G$-集 $X$: 一台只认“美元”的自动售货机。
  2. $G$: “美元”硬币的集合 $\{1¢, 5¢, 10¢, 25¢\}$(这里忽略群结构,仅作类比)。
  3. $G'$: “人民币”硬币的集合 $\{1角, 5角, 1元\}$
  4. 同态 $f: G' \rightarrow G$: 一个汇率转换器。$f(1元) = 15¢$ (假设汇率)。
  5. 新作用: 你想用人民币买东西。
  1. 你投入一个“1元”硬币 ($g'$).
  2. 机器不认识。但通过转换器 $f$,机器把它看作是“15美分”($f(g')$)。
  3. 机器按照“15美分”能买到的东西,给你吐出商品 ($f(g') \cdot x$)。
    • 这样,你就成功地用人民币(新群 $G'$)在这台只认美元(旧群 $G$)的机器(集合 $X$)上产生了作用。

📜 [原文30]

证明。给定 $g_{1}^{\prime}, g_{2}^{\prime} \in G^{\prime}$

$$ \begin{aligned} g_{1}^{\prime} \cdot\left(g_{2}^{\prime} \cdot x\right) & =g_{1}^{\prime} \cdot\left(f\left(g_{2}^{\prime}\right) \cdot x\right)=f\left(g_{1}^{\prime}\right) \cdot\left(f\left(g_{2}^{\prime}\right) \cdot x\right)=\left(\left(f\left(g_{1}^{\prime}\right) f\left(g_{2}^{\prime}\right)\right) \cdot x\right. \\ & =f\left(g_{1}^{\prime} g_{2}^{\prime}\right) \cdot x=\left(g_{1}^{\prime} g_{2}^{\prime}\right) \cdot x \end{aligned} $$

使用了 $f$ 是同态的事实。

📖 [逐步解释]

这是对命题1.1.5的证明的第一部分,即验证新定义的作用满足群作用的公理(1)(结合律公理)。

  • 前提:
  • 新作用的定义: $g' \cdot x = f(g') \cdot x$
  • $G$$X$ 上的旧作用 $g \cdot x$ 满足公理(1): $g_1 \cdot (g_2 \cdot x) = (g_1 g_2) \cdot x$
  • $f: G' \rightarrow G$ 是同态: $f(g'_1 g'_2) = f(g'_1) f(g'_2)$
  • 目标: 证明 $g'_{1} \cdot (g'_{2} \cdot x) = (g'_{1} g'_{2}) \cdot x$
  • 推导步骤:
  1. $g'_{1} \cdot (g'_{2} \cdot x) = g'_{1} \cdot (f(g'_{2}) \cdot x)$
    • 从左边开始。首先对括号内的 $g'_2 \cdot x$ 应用新作用的定义,将其替换为 $f(g'_2) \cdot x$
  2. $... = f(g'_{1}) \cdot (f(g'_{2}) \cdot x)$
    • 再次应用新作用的定义,这次是对于外层的 $g'_1$。它作用在 $(f(g'_2) \cdot x)$ 这个整体上,所以 $g'_1$ 被翻译成 $f(g'_1)$,然后使用旧作用 ·
  3. $... = (f(g'_{1}) f(g'_{2})) \cdot x$
    • 这一步是关键。表达式 $f(g'_{1}) \cdot (f(g'_{2}) \cdot x)$旧作用的形式。
    • $f(g'_1)$$f(g'_2)$ 都是旧群 $G$ 中的元素。
    • 因为旧作用满足公理(1),所以我们可以应用它:$g_1 \cdot (g_2 \cdot x) = (g_1 g_2) \cdot x$
    • 在这里,令 $g_1 = f(g'_1)$$g_2 = f(g'_2)$,就得到了这一步的转换。
  4. $... = f(g'_{1} g'_{2}) \cdot x$
    • 这一步使用了$f$ 是同态这一核心条件。
    • 我们将群 $G$ 内的乘积 $f(g'_1)f(g'_2)$ 替换为 $f(g'_1 g'_2)$
  5. $... = (g'_{1} g'_{2}) \cdot x$
    • 这是最后一步。我们观察到表达式 $f(g'_{1} g'_{2}) \cdot x$ 的形式。
    • 如果把 $g'_1 g'_2$ 看作一个整体,比如 $g'_3 = g'_1 g'_2$,那么这个表达式就是 $f(g'_3) \cdot x$
    • 根据新作用的定义,这恰好就是 $g'_3 \cdot x$,即 $(g'_{1} g'_{2}) \cdot x$
    • 这正是我们想要证明的等式的右边。
  • 使用了 $f$ 是同态的事实。: 作者点出了步骤3到步骤4转换的依据,这是整个证明的核心。没有同态性质,证明链就断了。
∑ [公式拆解]

这个证明本身就是一个大的公式推导链,拆解如上所述。

  • 第1、2、5步,是在新作用定义旧作用定义之间来回翻译。
  • 第3步,应用了旧作用的结合律公理
  • 第4步,应用了同态 $f$ 的性质

整个证明的精髓在于,将新群 $G'$ 上的结合律问题,通过同态 $f$ 转换成旧群 $G$ 上的结合律问题来解决。

💡 [数值示例]

我们用前面示例1的数据来走一遍证明过程。

  • $G'=\mathbb{Z}$, $G=\mathbb{Z}_4$, $X=\mathbb{C}$
  • $f(n) = n \pmod 4$
  • 旧作用 $k \cdot z = e^{ik\pi/2}z$
  • 新作用 $n \cdot z = f(n) \cdot z$
  • $g'_1=2, g'_2=3 \in \mathbb{Z}$
  • 目标: 证明 $2 \cdot (3 \cdot z) = (2+3) \cdot z = 5 \cdot z$
  • 左边: $2 \cdot (3 \cdot z)$
  1. $3 \cdot z = f(3) \cdot z = 3 \cdot z = -iz$
  2. $2 \cdot (3 \cdot z) = 2 \cdot (-iz) = f(2) \cdot (-iz) = 2 \cdot (-iz) = e^{i(2)\pi/2}(-iz) = (-1)(-iz) = iz$
    • 右边: $5 \cdot z$
  3. $5 \cdot z = f(5) \cdot z = 1 \cdot z = e^{i(1)\pi/2}z = iz$
    • 左边 = 右边,验证了对于这组具体元素,公理(1)成立。
⚠️ [易错点]
  1. 符号的精确性: 在思考或书写证明时,要非常清楚哪个 · 是新作用,哪个 · 是旧作用,哪个乘法是 $G'$ 内的,哪个是 $G$ 内的。虽然通常都用同一个符号,但脑中必须区分。
  2. 逻辑的流向: 证明的逻辑流是: 新作用 -> 旧作用 -> 旧作用公理 -> 同态性质 -> 新作用
📝 [总结]

本段通过严谨的代数推导,证明了由群同态诱导的新作用满足群作用的结合律公理。其核心技巧在于,利用新作用的定义作为“翻译”,将问题转化到旧作用的框架下,然后利用旧作用已知的公理和同态本身的性质来完成证明,最后再“翻译”回新作用的语言。

🎯 [存在目的]

一个命题或定理的价值,很大程度上取决于其证明的可靠性。这段证明是命题1.1.5的基石,它确保了我们通过同态构造新作用的方法是数学上可靠、无懈可击的。它展示了数学家如何利用已知结构的性质(旧作用的公理、同态的性质)来为新构造的结构(新作用)提供担保。

🧠 [直觉心智模型]

回到“编译器”模型。

  1. $g'_1, g'_2$: 两段初级代码。
  2. $g'_1 g'_2$: 将两段代码拼接起来。
  3. $f$: 编译器。
  4. $x$: 机器人。
  5. $g'_2 \cdot x$: 编译并执行 $g'_2$
  6. $g'_1 \cdot (g'_2 \cdot x)$: 编译并执行 $g'_2$后,再编译并执行 $g'_1$。(这里有点不精确,应该是对结果执行)
  7. 更精确的应该是:编译 $g'_2$ 得到 $f(g'_2)$,让机器人执行,得到结果 $x_1$。再编译 $g'_1$ 得到 $f(g'_1)$,让机器人对 $x_1$ 执行。
  8. $(g'_1 g'_2) \cdot x$: 先拼接代码,然后把整个长代码 $g'_1 g'_2$ 丢给编译器,得到一个优化后的高级指令 $f(g'_1 g'_2)$,让机器人执行。
  9. 证明: 一个好的编译器 ($f$是同态) 必须保证这两种方式效果一样。即 f(g'1 g'2) = f(g'1) f(g'2)。而一个好的机器人 (旧作用满足公理) 保证了高级指令的执行是符合结合律的。两者结合,保证了整个系统的逻辑自洽性。

📜 [原文31]

此外,如果 $1^{\prime}$$G^{\prime}$ 中的恒等元,那么 $f\left(1^{\prime}\right)=1$$G$ 中的恒等元,因此,对于所有 $x \in X$

$$ 1^{\prime} \cdot x=f\left(1^{\prime}\right) \cdot x=1 \cdot x=x $$

由此可见,公式 $g^{\prime} \cdot x=f\left(g^{\prime}\right) \cdot x$ 定义了 $G^{\prime}$$X$ 上的一个作用。

📖 [逐步解释]

这部分是命题1.1.5证明的收尾工作,验证新作用满足群作用的公理(2)(单位元公理)。

  • 此外,如果 $1^{\prime}$$G^{\prime}$ 中的恒等元,那么 $f(1^{\prime})=1$$G$ 中的恒等元:
  • $1'$: 这是新群 $G'$ 的单位元。
  • $1$: 这是旧群 $G$ 的单位元。
  • $f(1')=1$: 这是群同态的一个基本性质。任何群同态都必须将单位元映射到单位元。
  • 证明: $f(1') = f(1' \cdot 1') = f(1') f(1')$。在群 $G$ 中,设 $y=f(1')$,则 $y = y \cdot y$。两边乘以 $y^{-1}$,得到 $1 = y$。所以 $f(1')=1$
  • 作者在这里直接引用了这个“熟知的事实”。
  • 因此,对于所有 $x \in X$$1' \cdot x = f(1') \cdot x = 1 \cdot x = x$:
  • 这是验证公理(2)的推导链。
  • 目标: 证明 $1' \cdot x = x$
  • 第一步 $1' \cdot x = f(1') \cdot x$: 应用新作用的定义 $g' \cdot x = f(g') \cdot x$,这里 $g'=1'$
  • 第二步 $... = 1 \cdot x$: 使用了同态的性质 $f(1')=1$
  • 第三步 $... = x$: 使用了旧作用满足公理(2)的已知事实。
  • 由此可见,公式 $g^{\prime} \cdot x=f\left(g^{\prime}\right) \cdot x$ 定义了 $G^{\prime}$$X$ 上的一个作用。
  • 这是一个最终的结论。
  • 因为我们已经证明了新作用满足公理(1)(结合律)和公理(2)(单位元),所以根据定义,它是一个合法的、良定义的群作用。
  • 命题1.1.5得证。
∑ [公式拆解]

$$ 1^{\prime} \cdot x=f\left(1^{\prime}\right) \cdot x=1 \cdot x=x $$

  • $1'$: 群 $G'$ 的单位元。
  • $\cdot$ (第一个和第二个): 指的是新定义的、基于 $G'$ 的作用。
  • $f(1')$: 群同态 $f$ 作用于 $G'$ 的单位元。
  • $f(1')=1$: 同态的基本性质。
  • $\cdot$ (第三个): 指的是已知的、基于 $G$ 的旧作用。
  • $1 \cdot x = x$: 旧作用满足单位元公理。

这个等式链完美地展示了如何利用已知性质(同态性质、旧作用的公理)来证明新作用的性质。

💡 [数值示例]

继续使用之前的示例:$G'=\mathbb{Z}, G=\mathbb{Z}_4, X=\mathbb{C}$

  • $G'=\mathbb{Z}$ 的单位元是 $1'=0$
  • $G=\mathbb{Z}_4$ 的单位元是 $1=0$
  • 同态 $f(n) = n \pmod 4$
  • 验证同态性质: $f(1') = f(0) = 0 \pmod 4 = 0 = 1$。性质成立。
  • 验证新作用的公理(2): 证明 $1' \cdot z = z$,即 $0 \cdot z = z$
  • $0 \cdot z = f(0) \cdot z$ (根据新作用定义)
  • $= 0 \cdot z$ (因为 $f(0)=0$)
  • $= e^{i(0)\pi/2} z$ (根据旧作用定义)
  • $= e^0 z = 1 \cdot z = z$
  • 证明成立。
⚠️ [易错点]
  1. 区分两个单位元: 在证明中,$1'$$1$ 是分属不同群的两个不同(但有联系)的元素,必须严格区分。
  2. 同态性质是前提: 如果没有“同态把单位元映到单位元”这个性质,证明的第二步就不成立。
📝 [总结]

本段完成了命题1.1.5的证明,它通过一个简洁的等式链,验证了由同态诱导的新作用满足单位元公理。证明的关键是利用了“任何群同态都保持单位元”这一基本性质,以及旧作用本身满足单位元公理的事实。至此,命题1.1.5 被完全证明。

🎯 [存在目的]
  1. 确保严谨性: 这是一个完整数学证明不可或缺的部分。缺少对公理(2)的验证,整个命题的正确性就悬而未决。
  2. 再次强调同态的作用: 证明过程再次显示,同态 $f$ 如同一个桥梁,它把新群 $G'$ 的结构属性(如单位元 $1'$),忠实地传递到旧群 $G$ 中(变为单位元 $1$),从而使得新作用能够“继承”旧作用的优良性质。
🧠 [直觉心智模型]

回到“编译器”和“机器人”模型。

  1. $1'$: 在初级指令集 $G'$ 中的“空操作”或 "NOOP" (No Operation) 指令。
  2. $1$: 在高级指令集 $G$ 中的“空操作”指令。
  3. $f(1')=1$: 一个好的编译器,在遇到初级“空操作”时,应该把它翻译成高级“空操作”,而不是别的什么奇怪指令。
  4. $1' \cdot x = x$: 你让机器人执行初级“空操作”。
  1. 编译器 $f$ 把它翻译成高级“空操作” $f(1')=1$
  2. 机器人执行高级“空操作” $1 \cdot x$,根据定义,机器人什么也不做,状态还是 $x$
    • 整个过程符合预期,公理(2)成立。

51.5. 1.5. 示例 1.1.6

📜 [原文32]

如果 $G$ 是一个群,那么 $S_{G}$ 作用于 $G$ 并作用于 $G$ 的所有子集的集合 $\mathcal{P}(G)$。因此,Aut $G$ 也作用于它,Aut $G$$G$ 的自同构群(即从 $G$$G$ 的同构),它是 $S_{G}$ 在复合下的子群。请注意,Aut $G$ 也作用于 $G$ 的所有子群的集合,该集合是 $\mathcal{P}(G)$ 的一个子集,而 $S_{G}$ 不作用于该集合(因为从 $G$ 到自身的双射通常不会将子群映射到子群)。

📖 [逐步解释]

这个例子应用了命题1.1.5的子群特例,讨论了自同构群的作用。

  • 如果 $G$ 是一个群,那么 $S_{G}$ 作用于 $G$ ...:
  • 根据例(4)的推广,对于任何集合(这里集合是 $G$),其上的对称群 $S_G$ 都通过函数求值作用于它。即 $\sigma \cdot x = \sigma(x)$ for $\sigma \in S_G, x \in G$
  • ...并作用于 $G$ 的所有子集的集合 $\mathcal{P}(G)$:
  • 根据例(4)的再推广, $S_G$ 也作用于幂集 $\mathcal{P}(G)$。作用方式是 $\sigma \cdot A = \{\sigma(a) : a \in A\}$ for $A \subseteq G$
  • 因此,Aut $G$ 也作用于它:
  • Aut $G$: 这是 $G$自同构群 (Automorphism Group)
  • 自同构 (Automorphism): 是一个从群 $G$ 到其自身的同构 (isomorphism)。即一个双射 $\phi: G \rightarrow G$ 并且保持群运算 $\phi(xy)=\phi(x)\phi(y)$
  • 它是 $S_G$ ... 的子群:
  • $S_G$ 是所有从 $G$$G$双射
  • Aut $G$ 是其中那些既是双射又保持群运算的特殊双射。
  • 因此,Aut $G$$S_G$ 的一个子群。
  • 也作用于它: “它”指的是 $G$$\mathcal{P}(G)$
  • 应用命题1.1.5: 因为 Aut $G \leq S_G$,并且我们知道 $S_G$ 作用于 $G$$\mathcal{P}(G)$,根据命题1.1.5的子群特例,Aut $G$ 也通过完全相同的方式作用于 $G$$\mathcal{P}(G)$
  • 请注意,Aut $G$ 也作用于 $G$ 的所有子群的集合...:
  • 所有子群的集合: 设为 $\mathrm{Sub}(G)$。这是一个比 $\mathcal{P}(G)$ 小得多的集合,因为不是 $G$ 的所有子集都是子群。$\mathrm{Sub}(G) \subseteq \mathcal{P}(G)$
  • Aut $G$ 作用于 $\mathrm{Sub}(G)$:
  • 我们需要验证 $\mathrm{Sub}(G)$ 在 Aut $G$ 的作用下是不变的
  • $H \in \mathrm{Sub}(G)$ (即 $H$$G$ 的一个子群),并设 $\phi \in \mathrm{Aut}(G)$
  • 作用结果是 $\phi \cdot H = \{\phi(h) : h \in H\}$
  • 我们需要证明这个新集合 $\{\phi(h) : h \in H\}$ 也是 $G$ 的一个子群。
  • 同构保持子群结构:

这直接就是同构 (isomorphism) 的定义,即一个保持群运算的双射。

  • 一个子集...在...作用下是封闭的: 这是一个关键观察。如果一个集合 $A$ 在某个操作下是封闭的,意味着这个操作可以被限制在该集合上,形成一个新的、更小的作用体系。
  • 因此 Aut $G$ 也作用于...: 这是一个结论。因为自同构保持子群结构,所以我们可以放心地说,Aut $G$ 作用在 $\mathrm{Sub}(G)$ 这个集合上,而不会把一个子群变成“非子群”。
  • $S_{G}$ 不作用于该集合(因为从 $G$ 到自身的双射通常不会将子群映射到子群)。
  • 对比: 这里指出了 Aut $G$$S_G$ 的一个本质区别。
  • 一般的双射 $\sigma \in S_G$ 不一定保持群的乘法结构。因此,它不能保证将一个子群(一个具有代数结构的对象)映射到另一个子群。
  • 例子: 设 $G = \mathbb{Z}_4 = \{0, 1, 2, 3\}$,其子群 $H = \{0, 2\}$。考虑一个双射 $\sigma \in S_G$ 定义为 $\sigma(0)=0, \sigma(1)=3, \sigma(2)=1, \sigma(3)=2$
  • 作用在 $H$ 上:$\sigma \cdot H = \{\sigma(0), \sigma(2)\} = \{0, 1\}$
  • 集合 $\{0, 1\}$$\mathbb{Z}_4$ 中不是一个子群,因为 $1+1=2 \notin \{0,1\}$
  • 这个例子表明,$\mathrm{Sub}(G)$$S_G$ 的作用下不是封闭的,因此我们不能说 $S_G$ 作用于 $\mathrm{Sub}(G)$
  • 此外,我们有共轭同态 $f: G \rightarrow$ Aut $G$,定义为 $f(g)=i_{g}$,其中通常 $i_{g}(x)=g x g^{-1}$
  • 共轭同态: 这是一个非常重要的映射,它将群 $G$ 本身与它的自同构群联系起来。
  • $f(g)=i_g$: 这个映射将群中的每个元素 $g$ 对应到一个函数 $i_g$
  • 函数 $i_g(x) = gxg^{-1}$ 就是我们之前讨论过的共轭操作。
  • $i_g$ 是一个自同构:
  1. 同态性: $i_g(xy) = g(xy)g^{-1} = gx(g^{-1}g)yg^{-1} = (gxg^{-1})(gyg^{-1}) = i_g(x)i_g(y)$
  2. 双射性: $i_g$ 的逆函数是 $i_{g^{-1}}$,因为 $i_{g^{-1}}(i_g(x)) = g^{-1}(gxg^{-1})g = x$
    • 因此,每个 $i_g$ 都是 $G$ 的一个自同构,称为内部自同构 (Inner Automorphism)
    • $f$ 是一个同态: 我们需要验证 $f(g_1g_2) = f(g_1) \circ f(g_2)$,即 $i_{g_1g_2} = i_{g_1} \circ i_{g_2}$。这正是我们在例(8)中为验证共轭作用满足公理(1)时所做的推导。
  • 复合 $G \rightarrow$ Aut $G \rightarrow S_{G}$ 定义了 $G$ 通过共轭在自身上的作用。
  • 这是一个用命题1.1.5的视角来重新诠释共轭作用。
  1. 最底层的舞台是 $S_G$ 作用于集合 $G$
  2. 我们有一个从 $G$$S_G$ 的同态,这个同态是两步复合而成的:第一步是从 $G$ 到 Aut $G$ 的共轭同态 $f: g \mapsto i_g$,第二步是从 Aut $G$$S_G$ 的自然包含(因为 Aut $G$$S_G$ 的子群)。
  3. 根据命题1.1.5,这个复合的同态 $g \mapsto i_g$ 就诱导了 $G$$G$ 上的一个作用。
  4. 这个作用就是 $g \cdot x = (\text{复合映射}(g))(x) = i_g(x) = gxg^{-1}$,这正是共轭作用。
  • 特别是,$G$ 在自身上的共轭作用也定义了在 $G$ 的所有子群的集合上的作用,我们继续表示为 $i_{g}: i_{g}(H)=g H g^{-1}$
  • 逻辑链:
  1. 我们已知 Aut $G$ 作用于 $\mathrm{Sub}(G)$
  2. 我们有一个同态 $f: G \rightarrow \mathrm{Aut}(G)$
  3. 再次应用命题1.1.5,群 $G$ 通过同态 $f$ 诱导了一个在 $\mathrm{Sub}(G)$ 上的作用。
    • 作用方式: 对于 $g \in G$ 和子群 $H \in \mathrm{Sub}(G)$
    • $g \cdot H = f(g) \cdot H = i_g \cdot H$
    • 根据在幂集上的作用定义, $i_g \cdot H = \{i_g(h) : h \in H\} = \{ghg^{-1} : h \in H\}$
    • 这个新集合通常被简记为 $gHg^{-1}$
    • 结论: 群 $G$ 可以通过共轭作用于其所有子群的集合。这个作用将一个子群 $H$ 变换成另一个(同构的)子群 $gHg^{-1}$
💡 [数值示例]
  • 示例: $G=S_3$ 作用于其子群集合 $\mathrm{Sub}(S_3)$
  • $S_3$ 的子群有: $H_1=\{e\}$, $H_2=\{e,(12)\}$, $H_3=\{e,(13)\}$, $H_4=\{e,(23)\}$, $H_5=\{e,(123),(132)\}$, $H_6=S_3$
  • 设作用者 $g=(13) \in S_3$
  • 作用于子群 $H_2=\{e,(12)\}$:
  • 结果是 $gH_2g^{-1} = (13)\{e,(12)\}(13)^{-1}$。因为 $(13)^{-1}=(13)$
  • $H_2$ 中的元素进行共轭:
  • $g e g^{-1} = (13)e(13) = e$
  • $g(12)g^{-1} = (13)(12)(13) = (132)(13) = (23)$
  • 所以 $g \cdot H_2 = \{e, (23)\} = H_4$
  • 在这个作用下,子群 $H_2$ 被变换成了子群 $H_4$
  • 作用于子群 $H_5=\{e,(123),(132)\}$:
  • 设作用者 $g=(12) \in S_3$
  • 结果是 $gH_5g^{-1} = (12)H_5(12)^{-1}$
  • $H_5$ 中的元素进行共轭:
  • $g(123)g^{-1} = (12)(123)(12) = (23)(12) = (132)$
  • $g(132)g^{-1} = (12)(132)(12) = (13)(12) = (123)$
  • 所以 $g \cdot H_5 = \{e, (132), (123)\} = H_5$
  • 在这种情况下,$H_5$$g=(12)$ 的共轭作用下是不动点。一个在所有共轭作用下都不变的子群,被称为正规子群 (Normal Subgroup)
⚠️ [易错点]
  1. Aut G vs Inn G vs S_G: Aut $G$(自同构群)包含了所有保持结构的双射。Inn $G$(内部自同构群)是由共轭 $i_g$ 构成的,是 Aut $G$ 的一个正规子群。$S_G$(对称群)则包含了所有双射,不管保不保持结构。它们的作用能力是逐级递减的:$S_G$ 能作用的对象最少(纯集合),Aut $G$ 则能作用于有代数结构的对象(如子群集合)。
  2. $gHg^{-1}$ 的含义: 这个记号代表一个集合 $\{ghg^{-1} : h \in H\}$,而不是单个元素的乘积。
📝 [总结]

本例深入探讨了群作用的纯代数构造,阐明了几个关键点:

  1. 自同构群 Aut $G$ 因其保持群结构的特性,可以作用于子群的集合 $\mathrm{Sub}(G)$,而一般的对称群 $S_G$ 不能。
  2. $G$ 中的共轭操作 $i_g(x)=gxg^{-1}$ 本身就是一种自同构,并且映射 $g \mapsto i_g$ 是一个从 $G$ 到 Aut $G$群同态
  3. 利用命题1.1.5,这个同态诱导了 $G$$\mathrm{Sub}(G)$ 上的一个重要作用:$g \cdot H = gHg^{-1}$
🎯 [存在目的]
  1. 展示命题1.1.5的威力: 这是一个关于如何应用“同态诱导作用”这一原理的绝佳范例。
  2. 为正规子群概念铺垫: 通过共轭作用于子群集合,自然地引出了“在作用下保持不变的子群”这一概念,这正是正规子群的核心定义之一。
  3. 连接多个代数概念: 将对称群、自同构群、共轭、同态等多个核心概念在群作用的统一框架下组织起来,揭示了它们之间的深刻联系。
🧠 [直觉心智模型]
  1. $S_G$: 公司的“人事部”,可以任意调动所有员工的岗位(双射),但不保证调动后部门还能正常运作。
  2. Aut $G$: 公司的“组织架构师”,他们的调动方案(自同构)不仅保证每个人都有岗位,还保证调动后整个公司的组织架构和汇报关系(群结构)是自洽的、合理的。因此,一个部门被他调整后,还是一个有效的部门。
  3. $G$ 共轭作用于子群: 公司老板 $g$ 根据自己的“偏好”或“视角”,去“重组”一个部门 $H$。重组后的部门 $gHg^{-1}$ 在编制上和原来一样,还是一个合法的部门,但成员和职能可能已经面目全非。如果一个部门 $H$ 无论哪个老板来重组,它都还是它自己,那这个部门就是公司的“核心部门”(正规子群)。

61.6. 1.6. 引理 1.1.7

📜 [原文33]

使用命题 1.1.5,我们可以给出凯莱定理的部分推广。回想一下,对于 $G$ 在自身上的左乘作用,我们定义了一个双射 $\ell_{g}: G \rightarrow G$

$$ \ell_{g}(x)=g x $$

更一般地,设 $G$ 作用于一个集合 $X$,并定义 $\ell_{g}: X \rightarrow X$ 由公式

$$ \ell_{g}(x)=g \cdot x $$

📖 [逐步解释]

这段话是在引入一个重要的构造,它是将“群作用”和“置换群”联系起来的关键一步。

  • 使用命题 1.1.5,我们可以给出凯莱定理的部分推广。:
  • 凯莱定理 (Cayley's Theorem): 是群论的一个基本定理,它指出任何一个群 $G$ 都同构于某个对称群的子群。
  • 部分推广: 意味着我们将要得出的结论,在精神上和凯莱定理相似,但应用于更一般的情境(任意群作用,而不仅仅是左乘作用)。
  • 这里的论述逻辑是,通过将群作用转化为到 $S_X$ 的同态,我们实际上是将抽象的群 $G$ “表示”为了一组具体的置换。这个“表示”的思想,就是凯莱定理的核心精神。
  • 回想一下,...左乘作用,我们定义了一个双射 $\ell_g: G \rightarrow G$ ... $\ell_g(x)=gx$:
  • 这是在回顾构建凯莱定理证明时的关键一步。
  • 对于群 $G$ 在自身上的左乘作用,我们可以把每个群元素 $g$ 看作一个函数 $\ell_g$
  • 这个函数 $\ell_g$ 的功能就是“左乘 $g$”。
  • 双射: 之前已经证明过,这个函数 $\ell_g$ 是一个从 $G$$G$的双射。
  • 单射: 如果 $\ell_g(x_1) = \ell_g(x_2)$,即 $gx_1=gx_2$,两边左乘 $g^{-1}$$x_1=x_2$
  • 满射: 对于任何 $y \in G$,我们总能找到一个 $x=g^{-1}y$,使得 $\ell_g(x) = g(g^{-1}y) = y$
  • 因为 $\ell_g$ 是一个双射,所以 $\ell_g \in S_G$
  • 更一般地,设 $G$ 作用于一个集合 $X$,并定义 $\ell_{g}: X \rightarrow X$ 由公式 $\ell_{g}(x)=g \cdot x$:
  • 这是本节的核心构造。
  • 我们将上述思想进行推广
  • 不再局限于左乘作用,而是考虑任意一个$G$任意一个集合 $X$ 上的作用 $g \cdot x$
  • 对于群 $G$ 中的每一个元素 $g$,我们都定义一个相应的函数 $\ell_g$
  • 这个函数 $\ell_g$ 的定义域和值域都是 $X$
  • $\ell_g(x) = g \cdot x$: 函数 $\ell_g$ 的功能,就是执行“用元素 $g$ 进行群作用”这个操作。
  • 这里的 $\ell$ 可以理解为 "left" 的意思,代表 $g$ 是从左边作用的。
∑ [公式拆解]

$$ \ell_{g}(x)=g x $$

  • $\ell_g$: 由群元素 $g$ 定义的函数,称为“左平移 (left translation)”。
  • $x$: 函数的自变量,是群 $G$ 的一个元素。
  • $gx$: 函数的输出,是 $g$$x$ 在群内的乘积。

$$ \ell_{g}(x)=g \cdot x $$

  • $\ell_g$: 由群元素 $g$ 定义的函数,现在推广到任意群作用。
  • $x$: 函数的自变量,是集合 $X$ 的一个元素。
  • $g \cdot x$: 函数的输出,是 $g$ 作用于 $x$ 的结果。
💡 [数值示例]
  • 示例1: $G=SO(2)$ 作用于 $X=\mathbb{R}^2$
  • 群元素 $g = A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ (旋转90度)。
  • 那么我们就定义了一个函数 $\ell_A: \mathbb{R}^2 \rightarrow \mathbb{R}^2$
  • 这个函数的功能是: $\ell_A(\mathbf{v}) = A \cdot \mathbf{v} = A\mathbf{v}$
  • 如果输入 $\mathbf{v}=(2,1)$,那么输出 $\ell_A((2,1)) = (-1,2)$
  • 函数 $\ell_A$ 就是“将整个平面旋转90度”这个变换。
  • 示例2: $G=S_3$ 作用于 $X=\{1,2,3\}$
  • 群元素 $g = (123)$
  • 我们定义了一个函数 $\ell_{(123)}: \{1,2,3\} \rightarrow \{1,2,3\}$
  • 这个函数的功能是: $\ell_{(123)}(k) = (123) \cdot k = (123)(k)$
  • $\ell_{(123)}(1) = 2$
  • $\ell_{(123)}(2) = 3$
  • $\ell_{(123)}(3) = 1$
  • 函数 $\ell_{(123)}$ 就是置换 $(123)$ 本身。
⚠️ [易错点]
  1. $g$ vs $\ell_g$: 要严格区分群元素 $g$ 和由它定义的函数 $\ell_g$$g$ 是一个抽象的代数对象,而 $\ell_g$ 是一个具体的、在集合 $X$ 上操作的函数(即一个变换)。
  2. 这个构造对任何群作用都适用: 无论作用是平凡的、左乘的、共轭的还是几何的,我们总能为群中的每个元素 $g$ 配备一个函数 $\ell_g$
📝 [总结]

本段的核心思想是将群作用“函数化”。对于一个给定的 $G$-集 $X$,我们可以将群 $G$ 中的每一个元素 $g$ 都看作是集合 $X$ 上的一个变换(函数)$\ell_g$,这个变换的具体操作就是 $g$ 的群作用。这个构造是凯莱定理思想的直接推广,它为我们提供了一个从抽象群元素到具体集合变换的桥梁。

🎯 [存在目的]

本段的目的是建立一个关键的映射关系:从群 $G$$X$ 上的变换集合。接下来的引理将证明,我们构造出来的这些函数 $\ell_g$ 不仅是普通的函数,而且是双射,即置换。这最终将导向一个结论:任何群作用本质上都可以被理解为一个到对称群 $S_X$ 的同态,这正是凯莱定理精神的体现。

🧠 [直觉心智模型]
  1. $G$: 一个遥控器的所有按钮 $\{g_1, g_2, ...\}$
  2. 集合 $X$: 电视屏幕。
  3. 群作用 $g \cdot x$: 按下按钮 $g$ 后,屏幕上 $x$ 位置的像素点发生的变化。
  4. 函数 $\ell_g$: 按下按钮 $g$ 之后,整个电视屏幕所发生的整体变换
  5. 比如,$g$ 是“亮度+10”按钮,那么 $\ell_g$ 就是将整个屏幕变亮的那个“滤镜”或“效果”。

📜 [原文34]

1引理 1.1.7

符号如上,

(i) 对于所有 $g_{1}, g_{2} \in G, \ell_{g_{1}} \circ \ell_{g_{2}}=\ell_{g_{1} g_{2}}$

(ii) $\ell_{1}=\operatorname{Id}_{X}$

(iii) 对于所有 $g \in G, \ell_{g}$ 是从 $X$$X$ 的双射,即对于所有 $g \in G, \ell_{g} \in S_{X}$,并且 $\ell_{g}$ 的逆是 $\ell_{g^{-1}}$

📖 [逐步解释]

这个引理阐述了我们刚刚定义的函数 $\ell_g$ 的三个核心性质。

  • 符号如上: 意味着我们继续使用 $\ell_g(x) = g \cdot x$ 这个定义。
  • (i) 对于所有 $g_{1}, g_{2} \in G, \ell_{g_{1}} \circ \ell_{g_{2}}=\ell_{g_{1} g_{2}}$
  • o: 这里的 o函数的复合 (composition)
  • 左边 $\ell_{g_1} \circ \ell_{g_2}$: 是两个函数的复合。它代表“先应用函数 $\ell_{g_2}$,再对结果应用函数 $\ell_{g_1}$”。
  • 右边 $\ell_{g_1 g_2}$: 是一个函数。这个函数是由群中 $g_1$$g_2$乘积 $g_1 g_2$ 所定义的。
  • 等式的意义: 这个性质说明,函数的复合结构与群的乘法结构是对应的。“先用 $g_2$ 作用再用 $g_1$ 作用”这个两步操作,其效果等同于“直接用复合元素 $g_1 g_2$ 作用”这个一步操作。这其实是群作用公理(1)的“函数化”版本。
  • (ii) $\ell_{1}=\operatorname{Id}_{X}$
  • $\ell_1$: 是由群的单位元 1 所定义的函数。
  • $\mathrm{Id}_X$: 是集合 $X$ 上的恒等函数,即 $\mathrm{Id}_X(x)=x$ for all $x$
  • 等式的意义: 这个性质说明,由群单位元定义的函数,就是集合上的恒等变换(什么都不做)。这源自群作用的公理(2)。
  • (iii) 对于所有 $g \in G, \ell_{g}$ 是从 $X$$X$ 的双射...
  • 双射 (bijection): 即单射 (injective) 又是满射 (surjective)。
  • 即... $\ell_g \in S_X$: $S_X$ 就是 $X$ 上所有双射构成的对称群。说 $\ell_g$ 是双射,等价于说 $\ell_g$$S_X$ 的一个元素。
  • $\ell_g$ 的逆是 $\ell_{g^{-1}}$: 这句话给出了如何找到 $\ell_g$ 的逆函数。函数 $\ell_g$ 的逆函数,恰好就是由 $g$ 的逆元 $g^{-1}$ 所定义的那个函数 $\ell_{g^{-1}}$。这说明群中的逆元运算和函数求逆运算是对应的。
📝 [总结]

引理1.1.7揭示了映射 $g \mapsto \ell_g$ 的美妙性质:

(i) 它将群的乘法转换为了函数的复合

(ii) 它将群的单位元转换为了恒等函数

(iii) 它保证了每个 $\ell_g$ 都是一个可逆的变换(双射),并且群中的逆元对应于函数的

这三条性质联合起来,将在下一个推论中表明 $g \mapsto \ell_g$ 是一个从群 $G$ 到对称群 $S_X$群同态


📜 [原文35]

证明。(i) 我们必须检查对于所有 $x \in X, \ell_{g_{1}} \circ \ell_{g_{2}}(x)=\ell_{g_{1} g_{2}}(x)$。根据定义,

$$ \begin{aligned} \ell_{g_{1}} \circ \ell_{g_{2}}(x) & =\ell_{g_{1}}\left(\ell_{g_{2}}(x)\right)=\ell_{g_{1}}\left(g_{2} \cdot x\right) \\ & =g_{1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1} g_{2}\right) \cdot x=\ell_{g_{1} g_{2}}(x) \end{aligned} $$

📖 [逐步解释]

这是对引理1.1.7 (i) 的证明。

  • 我们必须检查...: 两个函数相等,意味着它们对于定义域中的任何一个输入,都给出相同的输出。所以我们需要对任意 $x \in X$ 验证 $\ell_{g_{1}} \circ \ell_{g_{2}}(x)=\ell_{g_{1} g_{2}}(x)$
  • 推导步骤:
  1. $\ell_{g_{1}} \circ \ell_{g_{2}}(x) = \ell_{g_{1}}(\ell_{g_{2}}(x))$
    • 这是函数复合的定义。
  2. $... = \ell_{g_{1}}(g_{2} \cdot x)$
    • 这是对括号内的 $\ell_{g_2}(x)$ 应用 $\ell$ 的定义,将其替换为 $g_2 \cdot x$
  3. $... = g_{1} \cdot (g_{2} \cdot x)$
    • 这是再次应用 $\ell$ 的定义,这次是对于外层的 $\ell_{g_1}$,它作用在 $g_2 \cdot x$ 这个元素上。
  4. $... = (g_{1} g_{2}) \cdot x$
    • 这是证明中最核心的一步,它直接使用了群作用的公理(1)(结合律公理)。
  5. $... = \ell_{g_1 g_2}(x)$
    • 这是最后一步,将表达式 $(g_1 g_2) \cdot x$$\ell$ 的定义反向写回去。这里作用者是 $g_1 g_2$ 这个整体。
  • 结论: 推导链的开头和结尾分别是待证等式的左边和右边作用于 $x$ 的结果,它们相等,所以函数 $\ell_{g_1} \circ \ell_{g_2}$$\ell_{g_1 g_2}$ 是同一个函数。
∑ [公式拆解]

这个推导链的每一步都非常清晰:

  • 复合定义 $\rightarrow$ $\ell$ 定义 $\rightarrow$ $\ell$ 定义 $\rightarrow$ 群作用公理(1) $\rightarrow$ $\ell$ 定义。

它本质上是把群作用的结合律公理用函数 $\ell_g$ 的语言重新翻译了一遍。


📜 [原文36]

(ii) 显然,对于所有 $x \in X, \ell_{1}(x)=1 \cdot x=x$,因此 $\ell_{1}=\operatorname{Id}_{X}$

📖 [逐步解释]

这是对引理1.1.7 (ii) 的证明。

  • $\ell_1(x) = 1 \cdot x$: 应用 $\ell$ 的定义,其中群元素是单位元 $1$
  • $... = x$: 使用群作用的公理(2)(单位元公理)。
  • 因此 $\ell_1 = \mathrm{Id}_X$: 因为对于任何输入 $x$,函数 $\ell_1$ 的输出都是 $x$,所以根据定义,$\ell_1$ 就是恒等函数 $\mathrm{Id}_X$

📜 [原文37]

(iii) 只需要证明 $\left(\ell_{g}\right)^{-1}=\ell_{g^{-1}}$,即 $\ell_{g} \circ \ell_{g^{-1}}=\ell_{g^{-1}} \circ \ell_{g}=\operatorname{Id}_{X}$。使用 (i) 和 (ii),

$$ \ell_{g} \circ \ell_{g^{-1}}=\ell_{g g^{-1}}=\ell_{1}=\operatorname{Id}_{X} $$

类似地 $\ell_{g^{-1}} \circ \ell_{g}=\operatorname{Id}_{X}$

特别注意,如果 $y=g \cdot x$,那么 $x=g^{-1} \cdot y$

📖 [逐步解释]

这是对引理1.1.7 (iii) 的证明。

  • 只需要证明 $\left(\ell_{g}\right)^{-1}=\ell_{g^{-1}}$:
  • 一个函数是双射,当且仅当它存在一个逆函数。
  • 所以,我们不需要分别去证单射和满射,只要能找到 $\ell_g$ 的逆函数,就能同时证明 $\ell_g$ 是双射。
  • 这里提出的猜想是:$\ell_g$ 的逆函数就是 $\ell_{g^{-1}}$
  • $\ell_{g} \circ \ell_{g^{-1}}=\ell_{g^{-1}} \circ \ell_{g}=\operatorname{Id}_{X}$:
  • 这是验证一个函数是另一个函数的逆函数的标准方法:将它们双向复合,看结果是否都是恒等函数。
  • 使用 (i) 和 (ii): 预告了将要使用的工具是本引理前面已经证明的两条性质。
  • 推导链:
  1. $\ell_{g} \circ \ell_{g^{-1}} = \ell_{g g^{-1}}$
    • 这是应用性质 (i),即 $\ell_{g_1} \circ \ell_{g_2} = \ell_{g_1 g_2}$。这里令 $g_1=g, g_2=g^{-1}$
  2. $... = \ell_1$
    • 这是因为在群 $G$ 内部, $g g^{-1} = 1$ (逆元定义)。
  3. $... = \mathrm{Id}_X$
    • 这是应用性质 (ii),即 $\ell_1 = \mathrm{Id}_X$
  • 类似地 $\ell_{g^{-1}} \circ \ell_{g}=\operatorname{Id}_{X}$:
  • 推导过程完全一样:$\ell_{g^{-1}} \circ \ell_g = \ell_{g^{-1}g} = \ell_1 = \mathrm{Id}_X$
  • 结论: 因为我们成功地找到了 $\ell_g$ 的逆函数(就是 $\ell_{g^{-1}}$),所以 $\ell_g$ 必然是一个双射,即 $\ell_g \in S_X$
  • 特别注意,如果 $y=g \cdot x$,那么 $x=g^{-1} \cdot y$:
  • 这是一个非常实用的推论,是对(iii)的另一种表述。
  • $y = g \cdot x$ 可以写作 $y = \ell_g(x)$
  • 两边用 $\ell_g$ 的逆函数 $\ell_{g^{-1}}$ 作用:$\ell_{g^{-1}}(y) = \ell_{g^{-1}}(\ell_g(x))$
  • 左边是 $g^{-1} \cdot y$
  • 右边是 $(\ell_{g^{-1}} \circ \ell_g)(x) = \mathrm{Id}_X(x) = x$
  • 所以 $x = g^{-1} \cdot y$
  • 直观意义: 如果 $g$$x$ “推”到了 $y$,那么 $g$ 的逆操作 $g^{-1}$ 就能把 $y$ “拉回”到 $x$

📜 [原文38]

2推论 1.1.8

如果 $X$ 是一个 $G$-集,那么由 $F(g)=\ell_{g}$ 定义的函数 $F: G \rightarrow S_{X}$ 是从 $G$$S_{X}$ 的同态。

📖 [逐步解释]

这个推论是引理1.1.7的直接结果,也是本节最重要的结论之一。

  • 如果 $X$ 是一个 $G$-集: 这是前提。
  • 那么由 $F(g)=\ell_{g}$ 定义的函数 $F: G \rightarrow S_{X}$...:
  • 我们定义了一个新的函数 $F$
  • 定义域: 是群 $G$
  • 值域: 是集合 $X$ 上的对称群 $S_X$
  • 映射规则 $F(g)=\ell_g$: 这个函数 $F$ 把群 $G$ 中的每个元素 $g$,映射到 $S_X$ 中的一个元素,这个元素就是我们之前定义的那个双射函数 $\ell_g$
  • 映射的合法性: 引理1.1.7(iii) 证明了每个 $\ell_g$ 确实是一个双射,所以 $\ell_g \in S_X$,因此这个映射的值域是正确的。
  • ...是从 $G$$S_X$ 的同态。
  • 同态 (homomorphism): 意味着 $F$ 保持群的运算结构。
  • $G$ 中的运算: 是群乘法。
  • $S_X$ 中的运算: 是函数的复合 o
  • 需要验证: $F(g_1 g_2) = F(g_1) \circ F(g_2)$
  • 证明:
  • 左边: $F(g_1 g_2) = \ell_{g_1 g_2}$ (根据 $F$ 的定义)。
  • 右边: $F(g_1) \circ F(g_2) = \ell_{g_1} \circ \ell_{g_2}$ (根据 $F$ 的定义)。
  • 在引理1.1.7(i)中,我们已经证明了 $\ell_{g_1 g_2} = \ell_{g_1} \circ \ell_{g_2}$
  • 因此,同态的条件成立。
📝 [总结]

推论1.1.8的结论是:任何一个群作用,都对应着一个从该群到被作用集合的对称群的同态。这个同态 $F: G \rightarrow S_X$ 就是通过映射 $g \mapsto \ell_g$ (其中 $\ell_g(x) = g \cdot x$) 来实现的。这个同态完美地将抽象的群 $G$ 的结构,“表示”为了一组在集合 $X$ 上的具体的置换。

🎯 [存在目的]
  1. 建立群作用的等价观点: 这个推论提供了看待群作用的第二个、也是更代数化的视角。
  2. 视角1(定义):群作用是一个满足两条公理的函数 $G \times X \rightarrow X$
  3. 视角2(推论):群作用是一个群同态 $G \rightarrow S_X$
  4. 理论的统一: 它将群作用理论与置换群和同态理论紧密地联系在了一起,使得我们可以运用关于同态的所有知识(如核、像)来研究群作用。
  5. 凯莱定理的推广: 当 $G$ 通过左乘作用于自身时,这个同态就是 $G \rightarrow S_G$。可以证明这个同态是单射,因此 $G$ 同构于 $S_G$ 的一个子群——这就是凯莱定理。所以本推论是凯莱定理思想在一般群作用上的体现。

📜 [原文39]

3备注 1.1.9

对于 $G$ 在自身上的左乘作用,同态 $F: G \rightarrow S_{G}$ 很容易看出是内射的;这是凯莱定理的内容。然而,在一般情况下,$F$ 不必是内射的。例如,如果 $G$ 通过平凡作用 $g \cdot x=x$ 作用于 $X$ 对于所有 $g \in G$,那么对于所有 $g \in G, \ell_{g}=\operatorname{Id}_{X}$,因此 $F$ 是平凡同态。

📖 [逐步解释]

这个备注是对推论1.1.8中同态 $F$ 的一个重要补充说明,讨论了它的核 (kernel)

  • 对于 $G$ 在自身上的左乘作用,同态 $F: G \rightarrow S_{G}$ 很容易看出是内射的:
  • 内射 (injective / one-to-one): 意味着同态的只包含单位元。即 $\ker(F)=\{1\}$
  • 核的定义: $\ker(F) = \{g \in G : F(g) = \text{Id}_{S_G}\}$。在 $S_G$ 中,单位元是恒等函数 $\mathrm{Id}_G$
  • 验证:
  • $F(g) = \mathrm{Id}_G \iff \ell_g = \mathrm{Id}_G$
  • $\ell_g = \mathrm{Id}_G \iff \ell_g(x) = x$ for all $x \in G$
  • $\iff gx = x$ for all $x \in G$
  • 在一个群中,如果 $gx=x$ 成立,那么两边右乘 $x^{-1}$ 可得 $g=1$
  • 所以,只有当 $g=1$ 时,才有 $F(g)=\mathrm{Id}_G$
  • 因此 $\ker(F)=\{1\}$,所以 $F$ 是单射。
  • 这是凯莱定理的内容: 凯莱定理指出 $G$ 同构于 $F(G)$,其证明的关键就是 $F$ 是单射。
  • 然而,在一般情况下,$F$ 不必是内射的。
  • 这是关键的提醒。对于任意的群作用,诱导出的同态 $F: G \rightarrow S_X$ 不一定是单射。
  • : $\ker(F) = \{g \in G : F(g) = \mathrm{Id}_X\} = \{g \in G : \ell_g = \mathrm{Id}_X\} = \{g \in G : g \cdot x = x \text{ for all } x \in X\}$
  • 核就是那些作用在 $X$任何元素上都像单位元一样“什么也不做”的群元素的集合。这个核有时被称为作用的忠实核 (kernel of faithfulness)。如果核是平凡的(只有单位元),则称作用是忠实的 (faithful)
  • 例如,如果 $G$ 通过平凡作用 ... $F$ 是平凡同态。
  • 平凡作用: $g \cdot x = x$ for all $g, x$
  • 在这种情况下,对于任何 $g \in G$,对应的函数 $\ell_g$ 都是 $\ell_g(x) = g \cdot x = x$
  • 这意味着,对于任何 $g \in G$,函数 $\ell_g$ 都是恒等函数 $\mathrm{Id}_X$
  • $F(g) = \ell_g = \mathrm{Id}_X$: 对于任何 $g \in G$,它都被 $F$ 映射到 $S_X$ 的单位元 $\mathrm{Id}_X$
  • 平凡同态: 一个将所有元素都映射到目标群的单位元的同态,称为平凡同态。
  • 在这种情况下,$\ker(F) = G$。如果 $G$ 不是平凡群,那么 $F$ 显然不是单射。
📝 [总结]

备注1.1.9指出了群作用和其诱导的同态 $F: G \rightarrow S_X$ 之间的一个重要关系:

  1. 这个同态 $F$ 不一定是单射。
  2. $F$ 的核是那些对 $X$ 中所有元素都作用为恒等的群元素。
  3. 当作用是忠实的(如左乘作用),$F$ 是单射,群 $G$ 可以被嵌入到 $S_X$ 中。
  4. 当作用不忠实(如平凡作用),$F$ 不是单射,多个群元素会被映射到同一个置换上,群的信息在映射中丢失了。

📜 [原文40]

我们也可以逆转推论的构造:给定一个同态 $F: G \rightarrow S_{X}$,由于 $S_{X}$ 作用于 $X$,根据命题 1.1.5,$X$ 成为一个 $G$-集。最后,刚刚描述的两种构造(从 $G$$X$ 上的作用到同态 $G \rightarrow S_{X}$,以及从同态 $G \rightarrow S_{X}$$G$$X$ 上的作用)是逆向构造。因此,$G$-集 $X$ 的概念等价于同态 $G \rightarrow S_{X}$ 的概念。

📖 [逐步解释]

这段话完成了本节的理论闭环,指出了“群作用”和“到对称群的同态”这两种描述是完全等价的。

  • 我们也可以逆转推论的构造:
  • 推论1.1.8的构造是:群作用 $\implies$ 同态 $G \rightarrow S_X$
  • 现在我们要考虑逆向构造:同态 $G \rightarrow S_X \implies$ 群作用
  • 给定一个同态 $F: G \rightarrow S_{X}$:
  • 这是逆向构造的出发点。我们有一个群 $G$,一个集合 $X$,以及一个从 $G$$X$ 的对称群 $S_X$ 的同态 $F$
  • 由于 $S_{X}$ 作用于 $X$:
  • 我们知道 $S_X$ 通过函数求值的方式自然地作用于 $X$,即 $\sigma \cdot x = \sigma(x)$
  • 根据命题 1.1.5,$X$ 成为一个 $G$-集:
  • 命题1.1.5说:如果有一个群(这里是 $S_X$)作用于一个集合(这里是 $X$),并且有一个到该群的同态(这里是 $F: G \rightarrow S_X$),那么我们就能诱导出一个新群(这里是 $G$)在该集合($X$)上的作用。
  • 这个诱导作用的定义是:$g \cdot x = F(g) \cdot x$
  • 因为 $S_X$ 的作用是函数求值,所以 $F(g) \cdot x = (F(g))(x)$
  • 所以,从一个同态 $F$ 出发,我们定义了一个群作用,其规则是 $g \cdot x = (F(g))(x)$
  • 两种构造是逆向构造:
  • 构造1 (作用 $\rightarrow$ 同态):
  • 输入:作用 $g \cdot x$
  • 输出:同态 $F_1: G \rightarrow S_X$ 定义为 $F_1(g) = \ell_g$,其中 $\ell_g(x)=g \cdot x$
  • 构造2 (同态 $\rightarrow$ 作用):
  • 输入:同态 $F: G \rightarrow S_X$
  • 输出:作用 $g \cdot_F x$ 定义为 $g \cdot_F x = (F(g))(x)$
  • 验证它们互为逆向:
  • 先1后2: 从一个作用 $g \cdot x$ 出发,得到同态 $F_1$。再用 $F_1$ 定义一个新作用 $g \cdot' x$
  • $g \cdot' x = (F_1(g))(x) = (\ell_g)(x) = g \cdot x$。新作用和原作用完全相同。
  • 先2后1: 从一个同态 $F$ 出发,得到作用 $g \cdot_F x$。再用这个作用定义一个新同态 $F'$
  • $F'(g) = \ell_g^{\text{new}}$,其中 $\ell_g^{\text{new}}(x) = g \cdot_F x = (F(g))(x)$
  • 这意味着函数 $\ell_g^{\text{new}}$ 和函数 $F(g)$ 对于任何输入 $x$ 都给出相同输出,所以它们是同一个函数。
  • 因此 $F'(g) = F(g)$。新同态和原同态完全相同。
  • 既然两种构造可以相互抵消,回到起点,它们就是互为逆的。
  • 因此,$G$-集 $X$ 的概念等价于同态 $G \rightarrow S_{X}$ 的概念。
  • 这是本节最核心、最高度的总结。
  • “等价”意味着这两种说法只是描述同一个数学对象的两种不同语言。我们可以根据需要,自由地在这两种视角之间切换。
  • 群作用视角: 更具体,更接近几何直觉,便于思考单个元素的变化。
  • 同态视角: 更抽象,更代数化,便于运用群同态的理论工具(如第一同构定理)。
📝 [总结]

本段画上了一个完美的圆。它展示了从“群作用”到“同态”的构造是可逆的。任何一个从群 $G$ 到对称群 $S_X$ 的同态,都可以唯一地定义一个 $G$$X$ 上的作用。反之亦然。因此,“$G$ 作用于 $X$” 和 “存在一个同态 $F:G \rightarrow S_X$” 这两种表述,在数学上是完全等价的。

22. 1.2. 轨道和同构子群

12.1. 2.1. 定义 1.2.1

📜 [原文41]

如果 $X$ 是一个 $G$-集,$x \in X$,那么 $X$轨道(在 $G$ 下)是集合 $G \cdot x= \{g \cdot x: g \in G\}$。因此 $G \cdot x \subseteq X$。显然 $G \cdot x$$X$ 的一个 $G$-子集,并且是包含 $x$ 的最小 $G$-子集。

📖 [逐步解释]

这是群作用理论中第一个核心概念——轨道 (Orbit) 的定义。

  • 如果 $X$ 是一个 $G$-集,$x \in X$: 这是前提。我们有一个群 $G$ 作用于集合 $X$,并且我们从 $X$指定了一个起始点 $x$
  • 那么 $X$ 的轨道...是集合 $G \cdot x= \{g \cdot x: g \in G\}$:
  • 轨道: 是一个集合,是 $X$ 的一个子集。
  • 记号: 轨道的标准记号是 $G \cdot x$,或者 $\mathrm{Orb}(x)$
  • 定义 $\{g \cdot x : g \in G\}$:
  1. 固定起始点 $x$
  2. 让群 $G$ 中的每一个元素 $g$ 都来作用于 $x$ 一次。
  3. 将所有可能得到的结果收集起来,组成一个集合。
    • 直观意义: 轨道是从一个点 $x$ 出发,在群 $G$ 的所有操作下,所能“到达”的所有点的集合。它是 $x$ 的“活动范围”。
  • 因此 $G \cdot x \subseteq X$:
  • 因为群作用的定义保证了 $g \cdot x$ 的结果总是在 $X$ 中,所以轨道 $G \cdot x$ 必然是 $X$ 的一个子集。
  • 显然 $G \cdot x$$X$ 的一个 $G$-子集:
  • 我们需要验证轨道 $G \cdot x$ 满足 $G$-子集的定义,即在 $G$ 的作用下是封闭的。
  • $y$ 是轨道 $G \cdot x$ 中的任意一个元素。根据定义,$y$ 可以被写成 $y = h \cdot x$ 的形式,其中 $h \in G$
  • 现在让群中任意一个元素 $g$ 作用于 $y$$g \cdot y = g \cdot (h \cdot x)$
  • 根据群作用的公理(1),$g \cdot (h \cdot x) = (gh) \cdot x$
  • 因为 $G$ 是群,所以 $g$$h$ 的乘积 $gh$ 仍然是 $G$ 的一个元素。
  • 因此,结果 $(gh) \cdot x$ 符合“$G$中某个元素作用于$x$”的形式,所以它必然也在轨道 $G \cdot x$ 中。
  • 这证明了轨道是封闭的,所以它是一个 $G$-子集。
  • 并且是包含 $x$ 的最小 $G$-子集:
  • 包含 $x$: 因为 $G$ 中有单位元 $1$,而 $1 \cdot x = x$,所以 $x$ 本身一定在轨道 $G \cdot x$ 中。
  • 最小:
  • $Y$ 是任何一个包含 $x$$G$-子集。
  • 因为 $Y$ 包含 $x$,并且 $Y$$G$ 的作用下是封闭的,所以对于任何 $g \in G$,作用的结果 $g \cdot x$ 都必须在 $Y$ 中。
  • 这意味着,所有形如 $g \cdot x$ 的元素都必须在 $Y$ 中。
  • 而这些元素的集合,恰好就是轨道 $G \cdot x$
  • 所以 $G \cdot x \subseteq Y$
  • 这表明,任何包含 $x$$G$-子集,都必然会包含整个轨道 $G \cdot x$。因此,轨道 $G \cdot x$ 是包含 $x$最小的那个 $G$-子集。
💡 [数值示例]
  • 示例1: $S_3$ 作用于 $X=\{1,2,3\}$
  • $G=S_3=\{e, (12), (13), (23), (123), (132)\}$
  • 求元素 1 的轨道 $G \cdot 1$:
  • $e \cdot 1 = 1$
  • $(12) \cdot 1 = 2$
  • $(13) \cdot 1 = 3$
  • $(23) \cdot 1 = 1$
  • $(123) \cdot 1 = 2$
  • $(132) \cdot 1 = 3$
  • 把所有结果收集起来(去掉重复的):$\{1, 2, 3\}$
  • 所以,$G \cdot 1 = \{1, 2, 3\} = X$
  • 在这个例子中,从1出发可以到达所有点。
  • 示例2: $D_4$ 作用于正方形的8个对称变换集合(顶点+边的中点)
  • 想象正方形放在坐标系中,顶点为 $(\pm 1, \pm 1)$
  • $X$ 是正方形本身。$G=D_4$
  • 求点 $(1,1)$ (右上角顶点) 的轨道: 旋转90, 180, 270度会把它送到 $(-1,1), (-1,-1), (1,-1)$。翻转也可以送到这些点。所以轨道是四个顶点组成的集合 $\{(\pm 1, \pm 1)\}$
  • 求点 $(1,0)$ (右边边的中点) 的轨道: 旋转90, 180, 270度会把它送到 $(0,1), (-1,0), (0,-1)$。所以轨道是四个边的中点组成的集合 $\{(1,0), (0,1), (-1,0), (0,-1)\}$
  • 求点 $(0,0)$ (中心点) 的轨道: 任何旋转或翻转都保持中心点不动。所以 $g \cdot (0,0) = (0,0)$ for all $g \in D_4$。轨道是 $\{(0,0)\}$
  • 在这个作用下,集合 $X$ (正方形) 被分成了多个轨道。
⚠️ [易错点]
  1. 轨道是集合的子集: 轨道是 $X$ 的一部分,不是 $G$ 的一部分。
  2. 起点决定轨道: 不同的起始点 $x$ 可能产生不同(或相同)的轨道。例如,在上面$D_4$的例子中,从 $(1,1)$ 出发和从 $(-1,1)$ 出发,得到的轨道是同一个(都是四个顶点的集合)。
  3. 最小性的理解: “最小”是就集合的包含关系而言的,不是就元素个数而言的。
📝 [总结]

轨道 $G \cdot x$ 是一个 $G$-集中与单个元素 $x$ 相关联的最重要的结构。它是由 $x$ 在群 $G$ 的所有变换下能够“演变”成的所有可能形态构成的集合。每个轨道自身都是一个“不可再分”的 $G$-子集,并且是包含其初始元素的最小的那个 $G$-子集。

22.2. 2.2. 示例 1.2.2

📜 [原文42]

$S_{n}$ 作用于 $\{1, \ldots, n\}$ 的情况下,给定 $\sigma \in S_{n}$,我们之前定义了 $\sigma$轨道 $O_{\sigma}(i)$。与当前定义的联系如下:之前意义上的 $\sigma$轨道$\langle\sigma\rangle$ 作为 $S_{n}$ 的子群作用于 $\{1, \ldots, n\}$轨道。换句话说,$O_{\sigma}(i)=\langle\sigma\rangle \cdot i$。实际上,两边都等于

$$ \left\{\sigma^{a}(i): a \in \mathbb{Z}\right\} $$

📖 [逐步解释]

这段话旨在澄清一个可能的混淆点,即之前在讨论单个置换时提到的“轨道”概念,与现在刚刚定义的、更普适的“群作用下的轨道”概念之间的关系。

  • $S_{n}$ 作用于 $\{1, \ldots, n\}$ 的情况下: 我们回到对称群作用于数字集合这个标准例子。
  • 给定 $\sigma \in S_n$,我们之前定义了 $\sigma$ 的轨道 $O_{\sigma}(i)$:
  • 回顾: 在讲置换的循环分解时,我们定义过单个置换 $\sigma$ 的轨道。例如,对于 $\sigma = (1\ 3\ 5)(2\ 4)$ in $S_5$,从1出发,$\sigma(1)=3, \sigma(3)=5, \sigma(5)=1$,所以 $\{1,3,5\}$ 是一个轨道。从2出发,$\sigma(2)=4, \sigma(4)=2$,所以 $\{2,4\}$ 是另一个轨道。
  • $O_\sigma(i)$: 是一个记号,表示从元素 $i$ 出发,在反复应用置换 $\sigma$ 的操作下能得到的所有元素的集合。
  • 与当前定义的联系如下: 这里开始建立桥梁。
  • 之前意义上的 $\sigma$ 的轨道是 $\langle\sigma\rangle$ 作为 $S_{n}$ 的子群作用于 $\{1, \ldots, n\}$ 的轨道:
  • 这是一个关键的转换。
  • $\langle\sigma\rangle$: 这表示由置换 $\sigma$ 生成的循环子群。它的元素是 $\sigma$ 的所有整数次幂:$\{\ldots, \sigma^{-2}, \sigma^{-1}, \sigma^0=e, \sigma^1, \sigma^2, \ldots\}$。这是一个 $S_n$ 的子群。
  • $\langle\sigma\rangle$ ... 作用于 $\{1, \ldots, n\}$: 根据命题1.1.5的子群特例,因为 $S_n$ 作用于 $\{1, ..., n\}$,所以其任何子群(包括 $\langle\sigma\rangle$)也通过同样的方式作用于它。
  • ...的轨道: 现在我们可以在这个新的群作用(作用群是 $\langle\sigma\rangle$,被作用集合是 $\{1, ..., n\}$)下,应用我们刚刚学到的轨道定义(定义1.2.1)。
  • 结论: 我们之前讲的“置换$\sigma$的轨道”,实际上等价于“由$\sigma$生成的循环子群$\langle\sigma\rangle$作用下的轨道”。
  • 换句话说,$O_{\sigma}(i)=\langle\sigma\rangle \cdot i$:
  • 这是对上面那句话的数学公式化。
  • 左边 $O_\sigma(i)$: 旧概念,置换 $\sigma$ 的轨道。
  • 右边 $\langle\sigma\rangle \cdot i$: 新概念,群 $\langle\sigma\rangle$ 作用下的轨道。根据定义1.2.1,它等于 $\{g \cdot i : g \in \langle\sigma\rangle\}$
  • 实际上,两边都等于 $\left\{\sigma^{a}(i): a \in \mathbb{Z}\right\}$:
  • 这给出了两者共同的、最具体的定义。
  • $g \in \langle\sigma\rangle$: 意味着 $g$ 一定可以被写成 $\sigma^a$ 的形式,其中 $a$ 是某个整数。
  • 所以 $\{g \cdot i : g \in \langle\sigma\rangle\} = \{\sigma^a \cdot i : a \in \mathbb{Z}\}$
  • 根据 $S_n$ 的作用定义,$\sigma^a \cdot i = \sigma^a(i)$
  • 所以,右边 $\langle\sigma\rangle \cdot i$ 就等于集合 $\{\sigma^a(i) : a \in \mathbb{Z}\}$
  • 而这个集合,恰好就是我们最初计算置换 $\sigma$ 的轨道时所做的:从 $i$ 出发,不断地应用 $\sigma$ (正整数次幂)和 $\sigma^{-1}$ (负整数次幂),看看能到达哪些地方。
∑ [公式拆解]

$$ \left\{\sigma^{a}(i): a \in \mathbb{Z}\right\} $$

  • $\sigma$: 一个置换。
  • $i$: 一个起始元素。
  • $\sigma^a$: $\sigma$$a$ 次幂。$\sigma^2 = \sigma \circ \sigma$, $\sigma^0=e$, $\sigma^{-1}$ 是逆置换。
  • $a \in \mathbb{Z}$: 指数 $a$ 取遍所有整数。
  • $\sigma^a(i)$: 将置换 $\sigma^a$ 应用于元素 $i$
  • $\{\dots\}$: 将所有可能得到的结果收集起来。
💡 [数值示例]
  • 示例: $G=S_5$, $\sigma=(1\ 3\ 5)(2\ 4)$
  • 旧概念: 求 $\sigma$ 的轨道 $O_\sigma(1)$
  • $\sigma(1)=3, \sigma(3)=5, \sigma(5)=1$。所以轨道是 $\{1,3,5\}$
  • 新概念: 求 $\langle\sigma\rangle$ 作用下 1 的轨道 $\langle\sigma\rangle \cdot 1$
  • 循环子群 $\langle\sigma\rangle = \{e, \sigma, \sigma^2, \sigma^3, \ldots\}$$\sigma$ 的阶是 $\mathrm{lcm}(3,2)=6$
  • $\langle\sigma\rangle = \{e, \sigma, \sigma^2, \sigma^3, \sigma^4, \sigma^5\}$
  • 计算轨道:
  • $e \cdot 1 = 1$
  • $\sigma \cdot 1 = 3$
  • $\sigma^2 \cdot 1 = \sigma(3) = 5$
  • $\sigma^3 \cdot 1 = \sigma(5) = 1$
  • $\sigma^4 \cdot 1 = \sigma(1) = 3$
  • $\sigma^5 \cdot 1 = \sigma(3) = 5$
  • 收集所有结果,得到 $\{1,3,5\}$
  • 两者结果完全相同
⚠️ [易错点]
  1. 群与元素的区别: 要区分“单个元素 $\sigma$”和“由它生成的群 $\langle\sigma\rangle$”。虽然在轨道计算上结果一样,但后者是更普适的群作用框架下的表述。
  2. 群作用的上下文: 我们现在讨论的“轨道”概念,作用者是一个。如果我们说“$\sigma$的轨道”,严格来说这是不精确的,我们应该理解为“由$\sigma$生成的循环子群的轨道”。
📝 [总结]

本段澄清了新旧两个“轨道”概念的关系。之前讨论的、与单个置换 $\sigma$ 相关的轨道,其实是更普适的群作用轨道概念的一个特例。它等价于将作用群限定为由 $\sigma$ 生成的那个小小的循环子群 $\langle\sigma\rangle$ 时,所得到的轨道。这两种说法的本质都是在看一个元素在 $\sigma$ 的反复作用下能“跑”多远。

32.3. 2.3. 命题 1.2.3

📜 [原文43]

$G$ 作用于集合 $X$,并定义 $x \sim_{G} y \Longleftrightarrow$ 存在一个 $g \in G$ 使得 $g \cdot x=y$。那么 $\sim_{G}$ 是一个等价关系,并且包含 $x$ 的等价类是轨道 $G \cdot x$。因此, $G$ 的两个轨道要么不相交,要么相同。

📖 [逐步解释]

这个命题揭示了轨道的根本性质:它们是某个等价关系下的等价类。这直接导致了一个重要推论:不同的轨道之间要么完全重合,要么毫无交集。

  • $G$ 作用于集合 $X$: 前提。
  • 并定义 $x \sim_{G} y \Longleftrightarrow$ 存在一个 $g \in G$ 使得 $g \cdot x=y$:
  • $\sim_G$: 定义了一个新的二元关系,读作 "$x$$y$ G-等价"。
  • $\Longleftrightarrow$: "当且仅当"。
  • 定义: 两个元素 $x$$y$ 是相关的 ($x \sim_G y$),当且仅当存在一个群元素 $g$ 能够把 $x$ 变换到 $y$
  • 直观意义: 两个元素在同一个轨道里,它们就是相关的。
  • 那么 $\sim_{G}$ 是一个等价关系:
  • 等价关系 (Equivalence Relation): 是一种满足三个性质的二元关系:自反性、对称性、传递性。
  • 证明:
  • 反身性 (Reflexivity): $x \sim_G x$
  • 证明:我们需要找到一个 $g \in G$ 使得 $g \cdot x = x$
  • $G$ 中有单位元 $1$,根据群作用公理(2), $1 \cdot x = x$
  • 所以我们找到了这样的 $g$(就是 $1$),因此 $x \sim_G x$ 成立。
  • 对称性 (Symmetry): 如果 $x \sim_G y$,那么 $y \sim_G x$
  • 证明:如果 $x \sim_G y$,根据定义,存在一个 $g \in G$ 使得 $g \cdot x = y$
  • 我们需要找到一个 $h \in G$ 使得 $h \cdot y = x$
  • 我们在引理1.1.7的证明结尾看到,如果 $g \cdot x = y$,那么 $g^{-1} \cdot y = x$
  • 因为 $g \in G$,所以它的逆元 $g^{-1}$ 也一定在 $G$ 中。
  • 所以我们找到了这样的 $h$(就是 $g^{-1}$),因此 $y \sim_G x$ 成立。
  • 传递性 (Transitivity): 如果 $x \sim_G y$ 并且 $y \sim_G z$,那么 $x \sim_G z$
  • 证明:如果 $x \sim_G y$,则存在 $g_1 \in G$ 使得 $g_1 \cdot x = y$
  • 如果 $y \sim_G z$,则存在 $g_2 \in G$ 使得 $g_2 \cdot y = z$
  • 我们需要找到一个 $h \in G$ 使得 $h \cdot x = z$
  • 将第一个式子代入第二个:$z = g_2 \cdot y = g_2 \cdot (g_1 \cdot x)$
  • 根据群作用公理(1),$g_2 \cdot (g_1 \cdot x) = (g_2 g_1) \cdot x$
  • 因为 $g_1, g_2 \in G$,所以它们的乘积 $g_2 g_1$ 也在 $G$ 中。
  • 所以我们找到了这样的 $h$(就是 $g_2 g_1$),因此 $x \sim_G z$ 成立。
  • 结论: 因为 $\sim_G$ 满足自反、对称、传递三个性质,所以它是一个等价关系。
  • 并且包含 $x$ 的等价类是轨道 $G \cdot x$:
  • 等价类 (Equivalence Class) of $x$: 在等价关系 $\sim$下,与 $x$ 相关的所有元素的集合,记作 $[x]$。即 $[x] = \{y \in X : x \sim y\}$
  • 证明:
  • $[x] = \{y \in X : x \sim_G y\}$
  • $= \{y \in X : \text{存在 } g \in G \text{ 使得 } g \cdot x = y\}$
  • 这个集合的描述,恰好就是轨道 $G \cdot x = \{g \cdot x : g \in G\}$ 的定义。
  • 结论: 轨道就是等价类。
  • 因此, $G$ 的两个轨道要么不相交,要么相同。
  • 这是等价关系理论的基本定理
  • 一个等价关系会将一个集合划分 (partition)成若干个互不相交的等价类,这些等价类的并集是原集合。
  • 应用到这里:
  1. 关系 $\sim_G$ 将集合 $X$ 划分成若干个等价类。
  2. 每个等价类就是一个轨道。
  3. 所以,$X$ 被划分成了若干个互不相交的轨道。
    • 具体来说:
    • 考虑两个轨道 $G \cdot x_1$$G \cdot x_2$
    • 如果它们有一个公共元素 $y$,即 $y \in G \cdot x_1$$y \in G \cdot x_2$
    • 那么 $x_1 \sim_G y$$x_2 \sim_G y$
    • 根据对称性和传递性,$x_1 \sim_G y$$y \sim_G x_2 \implies x_1 \sim_G x_2$
    • 既然 $x_1$$x_2$ 在同一个等价类里,那么它们的等价类(即轨道)必须是同一个:$G \cdot x_1 = G \cdot x_2$
    • 结论: 两个轨道只要有哪怕一个公共点,它们就必须完全重合。否则,它们就没有任何公共点。
📝 [总结]

命题1.2.3建立了群作用理论的一个基石:轨道是等价类。通过定义“能被群作用相互转换”为一种等价关系,命题证明了:

  1. 这种关系确实是一个合法的等价关系。
  2. 在这种关系下,每个元素的等价类恰好就是它的轨道。
  3. 由此推论,整个集合 $X$ 可以被完美地分解成一系列互不相交的轨道的并集。

42.4. 2.4. 定义 1.2.4

📜 [原文44]

如果 $X$ 是一个 $G$-集,并且对于 $X$ 中的一个(或等价地,所有) $x$, $G \cdot x=X$,我们说 $G$ 传递地作用于 $X$

📖 [逐步解释]

这个定义引入了一个非常重要的群作用类型:传递作用 (Transitive Action)

  • 如果 $X$ 是一个 $G$-集: 前提。
  • 并且对于 $X$ 中的一个 ... $x$, $G \cdot x=X$:
  • $G \cdot x = X$: 这是一个关键条件。它意味着,从某一个起始点 $x$ 出发,通过群 $G$ 的各种操作,可以到达集合 $X$ 中的任何一个点。
  • 换句话说,整个集合 $X$ 只有一个单一的轨道
  • (或等价地,所有):
  • 这是一个重要的补充,说明了条件的普适性。
  • 为什么等价?
  1. 假设对于某一个 $x_0 \in X$,有 $G \cdot x_0 = X$
  2. 现在我们任取 $X$ 中的另一个元素 $y$
  3. 我们要证明 $G \cdot y = X$ 也成立。
  4. 因为 $y \in X$ 并且 $G \cdot x_0 = X$,所以 $y$ 肯定在 $x_0$ 的轨道里。
  5. 根据命题1.2.3,如果两个元素在同一个轨道里,那么它们的轨道是相同的。
  6. 所以,$G \cdot y = G \cdot x_0$
  7. 又因为 $G \cdot x_0 = X$,所以 $G \cdot y = X$
    • 结论: 要判断一个作用是否是传递的,我们只需要任选一个起始点,计算它的轨道。如果这个轨道覆盖了整个集合 $X$,那么作用就是传递的。我们不必对所有点都进行检查。
  • 我们说 $G$ 传递地作用于 $X$:
  • 传递地 (transitive-ly): 是描述作用方式的副词。
  • 传递作用: 是一种所有点都“连通”的作用。集合 $X$ 在群 $G$ 的作用下是“均质的” (homogeneous),从任何一点都可以到达任何其他点。
💡 [数值示例]
  • 示例1: 传递作用
  • $S_n$ 作用于 $X=\{1, ..., n\}$
  • 我们之前计算过,对于起始点 1,其轨道 $S_n \cdot 1 = \{1, ..., n\} = X$
  • 因为轨道等于全集,所以这个作用是传递的
  • 这符合直觉:置换群可以把任意一个数字换到任意一个位置。
  • 示例2: 非传递作用
  • $D_4$ 作用于正方形 $P_4$
  • 集合 $X$ 是构成正方形的所有点的集合。
  • 我们之前看到,这个作用至少有两个不同的轨道:
  • 顶点轨道:$G \cdot (1,1) = \{(\pm 1, \pm 1)\}$
  • 边的中点轨道:$G \cdot (1,0) = \{(1,0), (0,1), (-1,0), (0,-1)\}$
  • 因为存在多个轨道,单个轨道不等于全集 $X$,所以这个作用是非传递的
  • 你永远无法通过旋转或翻转,把一个顶点移动到一个边的中点上。
  • 示例3: 传递作用的另一个例子
  • $G=SO(3)$ 作用于 $X=S^2$ (单位球面)
  • 任取球面上一点,比如北极点 $\mathbf{n}=(0,0,1)$
  • 对于球面上任何其他点 $\mathbf{p}$,我们总能找到一个旋转 $A \in SO(3)$,使得 $A \mathbf{n} = \mathbf{p}$。(例如,先绕z轴转动使得 $\mathbf{p}$ 位于xz平面,再绕y轴转动使得 $\mathbf{n}$ 移动到 $\mathbf{p}$ 的位置)。
  • 因此,$SO(3) \cdot \mathbf{n} = S^2 = X$
  • 所以 $SO(3)$ 在单位球面上是传递作用。这在数学上表达了“球面在任何点看起来都一样”的几何直觉。
⚠️ [易错点]
  1. 传递性依赖于群和集合: 同一个群,作用在不同的集合上,传递性可能不同。例如,$S_3$ 作用于 $\{1,2,3\}$ 是传递的,但如果让 $S_3$ 作用于 $\{1,2,3,4,5\}$(让它保持4,5不动),则作用不是传递的。
  2. 传递 vs 非传递: 一个群作用要么是传递的,要么是非传递的,二者必居其一。非传递作用意味着集合 $X$ 被分成了多个轨道。
📝 [总结]

当一个群作用只有一个轨道,且这个轨道就是整个被作用的集合 $X$ 时,我们称这个作用是传递的。这意味着从集合中的任何一点出发,都可以通过群中的某个操作到达集合中的任何其他点。这是一个非常重要的属性,它刻画了一类高度对称和“均质”的群作用。

52.5. 2.5. 示例 1.2.5

📜 [原文45]

(1) $S_{n}$ 传递地作用于 $\{1, \ldots, n\}$。这只是说,对于所有 $k \in\{1, \ldots, n\}$,存在一个 $\sigma \in S_{n}$ 使得 $\sigma(1)=k$,因此 $S_{n} \cdot 1=\{1, \ldots, n\}$ 并且只有一个轨道。同样,很容易看出 $A_{n}$ 对于 $n \geq 3$ 传递地作用于 $\{1, \ldots, n\}$,但对于 $n=2$ 不成立。但是,如果 $\sigma \in S_{n}$,那么子群 $\langle\sigma\rangle$ 传递地作用于 $\{1, \ldots, n\} \Longleftrightarrow$ $\sigma$ 只有一个轨道并且它有 $n$ 个元素 $\Longleftrightarrow$ $\sigma$ 是一个 $n$-循环。

📖 [逐步解释]

这个例子详细分析了对称群及其子群作用的传递性。

  • $S_{n}$ 传递地作用于 $\{1, \ldots, n\}$:
  • 这是一个结论性的重申。
  • 这只是说...: 下面是传递性的具体体现。
  • 对于所有 $k \in\{1, \ldots, n\}$,存在一个 $\sigma \in S_{n}$ 使得 $\sigma(1)=k$:
  • 这精确地说明了如何从起始点1到达任何其他点 $k$
  • 例如,要让 $\sigma(1)=k$,我们可以使用一个简单的置换(对换) $\sigma=(1\ k)$。这个置换交换1和k,保持其他元素不动。
  • 因此 $S_{n} \cdot 1=\{1, \ldots, n\}$ 并且只有一个轨道:
  • 因为从1可以到达所有点,所以1的轨道就是全集。
  • 根据定义,这个作用是传递的。
  • $A_{n}$ 对于 $n \geq 3$ 传递地作用于 $\{1, \ldots, n\}$:
  • $A_n$: 交错群 (Alternating Group),是 $S_n$ 中所有偶置换构成的子群。
  • $n \geq 3$: 这个条件是必需的。
  • 证明: 我们需要证明从一个点(比如1)可以到达任何其他点 $k$。即对于任意 $k \neq 1$,存在一个偶置换 $\sigma \in A_n$ 使得 $\sigma(1)=k$
  • 考虑一个三轮换 $\sigma = (1\ k\ j)$,其中 $j$ 是一个不同于1和k的第三个元素。因为 $n \geq 3$,所以这样的 $j$ 总是存在的。
  • 三轮换可以被写成两个对换的乘积:$(1\ k\ j) = (1\ j)(1\ k)$,所以它是一个偶置换
  • 这个置换 $\sigma$ 满足 $\sigma(1)=k$
  • 因此,利用 $A_n$ 中的元素,我们同样可以从1到达任何其他点。所以 $A_n$ 的作用也是传递的。
  • 但对于 $n=2$ 不成立:
  • $S_2 = \{e, (12)\}$$A_2 = \{e\}$ (因为 $(12)$ 是奇置换)。
  • $A_2$ 只包含单位元,它的作用是 $e \cdot 1=1, e \cdot 2=2$
  • 轨道是 $\{1\}$$\{2\}$。有两个轨道,所以作用不是传递的。
  • 但是,如果 $\sigma \in S_{n}$,那么子群 $\langle\sigma\rangle$ 传递地作用于 $\{1, \ldots, n\}$ ...:
  • 现在我们考虑由单个置换生成的循环子群 $\langle\sigma\rangle$ 的作用。
  • $\langle\sigma\rangle$ 传递地作用 ... $\Longleftrightarrow \sigma$ 只有一个轨道并且它有 $n$ 个元素:
  • $\langle\sigma\rangle$ 的作用是传递的 $\iff$$\langle\sigma\rangle$ 作用下只有一个轨道,即 $\langle\sigma\rangle \cdot i = \{1, ..., n\}$ for any $i$
  • $\langle\sigma\rangle \cdot i$ 正是我们在旧意义下所说的“置换 $\sigma$ 的轨道”。
  • 所以,这等价于说,置换 $\sigma$ 本身只有一个轨道,并且这个轨道的大小是 $n$
  • $\Longleftrightarrow \sigma$ 是一个 $n$-循环:
  • 一个置换只有一个长度为 $n$ 的轨道,这正是 $n$-循环 (n-cycle) 的定义。例如,在 $S_5$ 中,$(1\ 2\ 3\ 4\ 5)$ 是一个5-循环。
  • 它的轨道是 $\{1,2,3,4,5\}$。所以 $\langle(12345)\rangle$$\{1,2,3,4,5\}$ 上是传递作用。
  • 而对于 $\sigma = (123)(45)$,它有两个轨道 $\{1,2,3\}$$\{4,5\}$,所以 $\langle\sigma\rangle$ 的作用不是传递的。
📝 [总结]

本例深入分析了传递性:

  1. $S_n$$\{1,..,n\}$ 上的作用是传递的。
  2. $A_n$$\{1,..,n\}$ 上的作用在 $n \geq 3$ 时也是传递的。
  3. 由单个置换 $\sigma$ 生成的子群 $\langle\sigma\rangle$ 的作用是传递的,当且仅当 $\sigma$ 本身是一个 $n$-循环

📜 [原文46]

(2) $G L_{n}(\mathbb{R})$ 作用于 $\mathbb{R}^{n}$。有两个轨道$\{\mathbf{0}\}$$\mathbb{R}^{n}-\{\mathbf{0}\}$。这里,显然 $G L_{n}(\mathbb{R}) \cdot \mathbf{0}=\{\mathbf{0}\}$。要看到只有一个额外的轨道,我们证明 $G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1}=\mathbb{R}^{n}-\{\mathbf{0}\}$。设 $\mathbf{v}$$\mathbb{R}^{n}$ 中的非零向量,即 $\mathbb{R}^{n}-\{\mathbf{0}\}$ 中的一个元素。根据标准线性代数,$\mathbf{v}$ 可以完成为 $\mathbb{R}^{n}$ 的一个基 $\mathbf{v}=\mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{n}$。如果 $A$ 是其列为 $\mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{n}$ 的矩阵,那么 $A$ 是可逆的,即 $A \in G L_{n}(\mathbb{R})$,并且 $A \mathbf{e}_{i}=\mathbf{v}_{i}$ 对于每个 $i$。特别地,$A \mathbf{e}_{1}=\mathbf{v}_{1}=\mathbf{v}$。这表示 $\mathbb{R}^{n}-\{\mathbf{0}\} \subseteq G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1}$,但也有 $G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1} \subseteq \mathbb{R}^{n}-\{\mathbf{0}\}$,因为如果 $A$ 可逆,$A \mathbf{e}_{1}$ 不能是 $\mathbf{0}$,因为 $A$ 的零空间是 $\{\mathbf{0}\}$。因此 $G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1}=\mathbb{R}^{n}-\{\mathbf{0}\}$

📖 [逐步解释]

这个例子分析了一般线性群 $G L_n(\mathbb{R})$ 作用于向量空间 $\mathbb{R}^n$ 时的轨道结构。

  • $G L_{n}(\mathbb{R})$ 作用于 $\mathbb{R}^{n}$: 我们已知这是一个通过矩阵乘法 $A \cdot \mathbf{v} = A\mathbf{v}$ 定义的作用。
  • 有两个轨道:$\{\mathbf{0}\}$$\mathbb{R}^{n}-\{\mathbf{0}\}$:
  • 这是一个结论,下面将证明它。
  • 轨道1: $\{\mathbf{0}\}$ (只包含原点的集合)
  • 显然 $G L_{n}(\mathbb{R}) \cdot \mathbf{0}=\{\mathbf{0}\}$:
  • 计算原点的轨道:$G \cdot \mathbf{0} = \{A \cdot \mathbf{0} : A \in GL_n(\mathbb{R})\}$
  • 线性代数的基本性质:任何矩阵乘以零向量都得到零向量,即 $A\mathbf{0} = \mathbf{0}$
  • 所以轨道里只有一个元素,就是 $\mathbf{0}$
  • 轨道2: $\mathbb{R}^{n}-\{\mathbf{0}\}$ (所有非零向量的集合)
  • 要看到只有一个额外的轨道,我们证明 $G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1}=\mathbb{R}^{n}-\{\mathbf{0}\}$:
  • 我们任选一个非零向量作为起始点,最简单的就是标准基向量 $\mathbf{e}_1 = (1, 0, \ldots, 0)^T$
  • 我们要证明,从 $\mathbf{e}_1$ 出发,可以到达任何其他的非零向量。
  • 证明 $G \cdot \mathbf{e}_1 = \mathbb{R}^n - \{\mathbf{0}\}$:
  1. 证明 $\mathbb{R}^n - \{\mathbf{0}\} \subseteq G \cdot \mathbf{e}_1$:
    • $\mathbf{v}$$\mathbb{R}^{n}$ 中的任意一个非零向量
    • 根据标准线性代数,$\mathbf{v}$ 可以完成为 $\mathbb{R}^{n}$ 的一个基: 这是一个核心定理。只要一个向量非零,它就可以作为一组基的第一个向量。这组基是 $\mathcal{B} = \{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\}$,其中 $\mathbf{v}_1 = \mathbf{v}$
    • 如果 $A$ 是其列为 ... 的矩阵: 构造一个矩阵 $A$,其第 $i$ 列就是向量 $\mathbf{v}_i$
    • 那么 $A$ 是可逆的: 因为矩阵的列向量构成一组基(线性无关),所以该矩阵的行列式非零,因此矩阵是可逆的,即 $A \in GL_n(\mathbb{R})$
    • 并且 $A \mathbf{e}_{i}=\mathbf{v}_{i}$: 矩阵 $A$ 乘以标准基向量 $\mathbf{e}_i$ (第i个分量是1,其余是0),结果正好是 $A$ 的第 $i$ 列,即 $\mathbf{v}_i$
    • 特别地,$A \mathbf{e}_{1}=\mathbf{v}_{1}=\mathbf{v}$: 这意味着,我们找到了一个群元素 $A \in GL_n(\mathbb{R})$,它可以把起始点 $\mathbf{e}_1$ 变换到我们任意选择的非零向量 $\mathbf{v}$
    • 这就证明了任何非零向量 $\mathbf{v}$ 都在 $\mathbf{e}_1$ 的轨道里。
  2. 证明 $G \cdot \mathbf{e}_1 \subseteq \mathbb{R}^n - \{\mathbf{0}\}$:
    • 如果 $A$ 可逆,$A \mathbf{e}_{1}$ 不能是 $\mathbf{0}$:
    • 因为 $A$ 可逆,它的零空间(所有被 $A$ 映射到 $\mathbf{0}$ 的向量的集合)只包含零向量本身:$\mathrm{Ker}(A) = \{\mathbf{0}\}$
    • 由于 $\mathbf{e}_1$ 不是零向量,所以它不属于 $A$ 的零空间,因此 $A\mathbf{e}_1$ 不可能是 $\mathbf{0}$
    • 这证明了从 $\mathbf{e}_1$ 出发能到达的所有点,都必然是非零向量。
  3. 因此 $G L_{n}(\mathbb{R}) \cdot \mathbf{e}_{1}=\mathbb{R}^{n}-\{\mathbf{0}\}$: 结合上面两点(集合相互包含),我们证明了等式成立。
  • 最终结论: 整个空间 $\mathbb{R}^n$$GL_n(\mathbb{R})$ 的作用下,被完美地分成了两个轨道:一个是孤立的原点,另一个是所有非零向量构成的巨大集合。这个作用是非传递的
📝 [总结]

本例通过严谨的线性代数论证,揭示了 $GL_n(\mathbb{R})$$\mathbb{R}^n$ 上的作用结构。它将空间划分为两个泾渭分明的区域:静止不动的原点,以及一个所有非零向量都可以相互转换的传递的区域。


📜 [原文47]

同样,$O_{n}$$S O_{n}$ 作用于 $\mathbb{R}^{n}$。对于 $n \geq 2$轨道$\{\mathbf{0}\}$ 和以原点为中心的半径 $r>0$$(n-1)$-球面,对于 $O_{n}$$S O_{n}$ 都是如此。这源于格拉姆-施密特过程:如果 $\mathbf{u}$ 是一个单位向量( $\|\mathbf{u}\|=1$),那么 $\mathbf{u}$ 可以完成为 $\mathbb{R}^{n}$ 的一个正交基 $\mathbf{u}=\mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{n}$。如果 $A$ 是其列为 $\mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{n}$ 的矩阵,那么 $A$ 是一个正交矩阵,即 $A \in O_{n}$,并且 $A \mathbf{e}_{1}=\mathbf{u}_{1}=\mathbf{u}$。如果 $\operatorname{det} A=-1$,我们也可以用 $-\mathbf{u}_{n}$ 替换 $\mathbf{u}_{n}$,以使 $A \in S O_{n}$。这表明单位 $(n-1)$-球面 $S^{n-1}$$O_{n}$$S O_{n}$ 的一个单一轨道,并且稍作修改可以处理半径为 $r>0$$(n-1)$-球面情况。特别地,对于 $n \geq 2$$O_{n}$$S O_{n}$ 传递地作用于 $S^{n-1}$。由于这个作用是传递的,$S^{n-1}$ 的几何是齐次的,即它在每个点看起来都相同。

📖 [逐步解释]

这个例子分析了正交群 $O_n$特殊正交群 $S O_n$ 作用于 $\mathbb{R}^n$ 时的轨道结构,这比 $GL_n$ 的情况要精细得多。

  • $O_{n}$$S O_{n}$ 作用于 $\mathbb{R}^{n}$: 这是 $GL_n$ 作用的限制。
  • 对于 $n \geq 2$,轨道是 $\{\mathbf{0}\}$ 和以原点为中心的半径 $r>0$$(n-1)$-球面:
  • 轨道1: $\{\mathbf{0}\}$: 与 $GL_n$ 的情况完全相同,因为 $A\mathbf{0}=\mathbf{0}$ 对任何矩阵都成立。
  • 其他轨道: 与 $GL_n$ 不同,这里不再是所有非零向量都在一个轨道里。因为 $O_n$$S O_n$ 的变换保持向量长度
  • 如果 $y = A \cdot x$$A \in O_n$,那么 $\|y\| = \|x\|$
  • 这意味着,从一个长度为 $r$ 的向量出发,你永远只能到达长度同样为 $r$ 的向量。
  • 所以,所有长度为 $r$ 的向量构成的集合——即半径为 $r$ 的球面——必然是轨道的超集
  • 下面的证明将说明,它恰好就是一个完整的轨道。
  • 证明球面是一个轨道:
  • 这源于格拉姆-施密特过程: 这是一个构造性的证明。
  • 如果 $\mathbf{u}$ 是一个单位向量...可以完成为一个正交基: 这是线性代数中格拉姆-施密特过程的一个推论。任何一个单位向量都可以作为一组标准正交基(orthonormal basis)的第一个向量。这组基是 $\mathcal{B} = \{\mathbf{u}_1, \ldots, \mathbf{u}_n\}$,其中 $\mathbf{u}_1=\mathbf{u}$,且所有向量两两正交,长度为1。
  • 如果 $A$ 是其列为...的矩阵,那么 $A$ 是一个正交矩阵: 这是一个核心事实。当一个矩阵的列向量构成一组标准正交基时,这个矩阵就是正交矩阵,即 $A \in O_n$
  • 并且 $A \mathbf{e}_1 = \mathbf{u}_1 = \mathbf{u}$: 和 $GL_n$ 的证明类似,我们找到了一个群元素 $A \in O_n$,它可以把一个固定的单位向量 $\mathbf{e}_1$ 变换到任何我们想要的目标单位向量 $\mathbf{u}$
  • 这表明单位球面 $S^{n-1}$$O_n$ 的一个单一轨道: 因为从 $\mathbf{e}_1$ 可以到达 $S^{n-1}$ 上的任何点 $\mathbf{u}$,所以 $O_n \cdot \mathbf{e}_1 = S^{n-1}$
  • 对于 $S O_n$:
  • 如果 $\operatorname{det} A=-1$ ... 替换 ... 以使 $A \in S O_n$: 如果我们构造出的矩阵 $A$ 恰好是一个反射(行列式为-1),我们有一个简单的修正方法。只需将基向量中的最后一个 $\mathbf{u}_n$ 换成它的相反数 $-\mathbf{u}_n$。新的基 $\{\mathbf{u}_1, \ldots, \mathbf{u}_{n-1}, -\mathbf{u}_n\}$ 仍然是标准正交基,但由它构成的新矩阵 $A'$ 的行列式会变号,变为+1。重要的是,$A'$ 的第一列仍然是 $\mathbf{u}_1$,所以 $A'\mathbf{e}_1 = \mathbf{u}_1 = \mathbf{u}$ 仍然成立。
  • 这表明,对于任何目标单位向量 $\mathbf{u}$,我们总能找到一个旋转(属于 $SO_n$)将 $\mathbf{e}_1$ 变换到 $\mathbf{u}$
  • 因此,$S^{n-1}$ 也是 $S O_n$ 的一个单一轨道。(这里需要 $n \ge 2$ 的条件,因为在 $n=1$ 时, $SO(1)=\{1\}$,无法改变点的位置)。
  • 半径为 $r>0$ 的球面情况: 证明是类似的。任取两个长度为 $r$ 的向量 $\mathbf{v}_1, \mathbf{v}_2$。我们可以先找到一个 $A \in SO_n$ 把单位向量 $\mathbf{v}_1/r$ 变成 $\mathbf{v}_2/r$,即 $A(\mathbf{v}_1/r) = \mathbf{v}_2/r$。利用线性, $A\mathbf{v}_1 = \mathbf{v}_2$
  • 特别地...$O_{n}$$S O_{n}$ 传递地作用于 $S^{n-1}$:
  • 因为 $S^{n-1}$ 本身就是一个单一的轨道,所以根据传递作用的定义,这两个群在 $S^{n-1}$ 上的作用是传递的。
  • 由于这个作用是传递的,$S^{n-1}$ 的几何是齐次的,即它在每个点看起来都相同。
  • 齐次的 (Homogeneous): 这是一个深刻的几何结论。
  • "在每个点看起来都相同" 的精确数学含义就是:对于球面上的任意两点 $p$$q$,总存在一个属于该几何的对称变换(这里是旋转)能把 $p$ 完美地移动到 $q$ 的位置上。
  • 这正是传递作用的定义!群作用的传递性,为几何上的“齐次性”或“均质性”提供了精确的代数刻画。
📝 [总结]

本例精细地分解了 $O_n$$S O_n$$\mathbb{R}^n$ 上的轨道结构。与 $GL_n$ 不同,它们的轨道是由向量的长度决定的。

  1. 原点 $\{\mathbf{0}\}$ 是一个轨道。
  2. 每个以原点为中心、半径为 $r>0$ 的球面,都是一个完整的、单一的轨道。
  3. 因此,在每个球面上,$O_n$$S O_n$ 的作用都是传递的。这为“球面是均质的”这一几何直觉提供了严格的代数证明。

📜 [原文48]

(3) 二面体群 $D_{n}$ 传递地作用于 $P_{n}$ 的顶点集 $\left\{\mathbf{p}_{0}, \ldots, \mathbf{p}_{n-1}\right\}$

📖 [逐步解释]

这个例子分析了二面体群作用的传递性。

  • $G=D_n$: 正 $n$ 边形的对称群。
  • 集合 $X = \left\{\mathbf{p}_{0}, \ldots, \mathbf{p}_{n-1}\right\}$: 正 $n$ 边形的 $n$ 个顶点。
  • $D_n$ 传递地作用于 ... 顶点集:
  • 证明: 我们需要证明从任意一个顶点出发,可以到达所有其他顶点。
  • 使用旋转:
  • 设起始点为 $\mathbf{p}_0$
  • $D_n$ 中包含一个基本的旋转操作 $r$,它可以将 $\mathbf{p}_k$ 旋转到 $\mathbf{p}_{k+1}$ (模n) 的位置。
  • 应用 $r$ 一次:$r \cdot \mathbf{p}_0 = \mathbf{p}_1$
  • 应用 $r$ 两次:$r^2 \cdot \mathbf{p}_0 = \mathbf{p}_2$
  • ...
  • 应用 $r^k$ 次:$r^k \cdot \mathbf{p}_0 = \mathbf{p}_k$
  • 通过重复应用旋转操作 $r$,我们就可以从 $\mathbf{p}_0$ 到达任何一个顶点 $\mathbf{p}_k$
  • 结论: $\mathbf{p}_0$ 的轨道 $D_n \cdot \mathbf{p}_0$ 包含了所有顶点,即 $D_n \cdot \mathbf{p}_0 = X$
  • 因此,根据定义,这个作用是传递的
  • (我们甚至不需要使用翻转操作,仅靠旋转子群就足以保证传递性了)。
💡 [数值示例]
  • 示例: $D_4$ 作用于正方形顶点集 $\{ \mathbf{p}_0, \mathbf{p}_1, \mathbf{p}_2, \mathbf{p}_3 \}$
  • $r$ 是旋转90度的操作。
  • 起始点: $\mathbf{p}_0$
  • $e \cdot \mathbf{p}_0 = \mathbf{p}_0$
  • $r \cdot \mathbf{p}_0 = \mathbf{p}_1$
  • $r^2 \cdot \mathbf{p}_0 = \mathbf{p}_2$
  • $r^3 \cdot \mathbf{p}_0 = \mathbf{p}_3$
  • 轨道 $D_4 \cdot \mathbf{p}_0$ 包含了 $\{\mathbf{p}_0, \mathbf{p}_1, \mathbf{p}_2, \mathbf{p}_3\}$,等于整个顶点集。作用是传递的。
📝 [总结]

二面体群 $D_n$ 在其对应的正 $n$ 边形的顶点集上的作用是传递的。这是因为群中的旋转元素足以将任何一个顶点移动到任何其他顶点的位置。


📜 [原文49]

(4) 群 $G$ 通过左乘作用于自身。这个作用是传递的,因为例如轨道 $G \cdot 1$ 显然是 $G$。类似地,如果 $H \leq G$ 并且 $G$ 通过左乘作用于 $G / H$,那么恒等陪集 $H=1 H$轨道 $G \cdot H$ 显然是 $G / H$,因为根据 $G$$G / H$ 上的作用定义,$g \cdot H=g H$。因此,再次,作用是传递的。

📖 [逐步解释]

这个例子分析了两种纯代数作用的传递性。

  • 第一部分: 左乘作用于自身
  • $G$ 通过左乘作用于自身: 作用是 $g \cdot x = gx$
  • 这个作用是传递的:
  • 证明: 我们需要计算一个元素的轨道,看它是否等于全集 $G$。最简单的起始点是单位元 1
  • 轨道 $G \cdot 1$:
  • 根据定义,$G \cdot 1 = \{g \cdot 1 : g \in G\}$
  • 根据左乘作用的定义,$g \cdot 1 = g1 = g$
  • 所以,$G \cdot 1 = \{g : g \in G\} = G$
  • 结论: 因为单位元的轨道就是整个群 $G$,所以这个作用是传递的。
  • 直观意义: 在一个群里,从单位元出发,你可以通过左乘任何一个元素 $g$ 来得到 $g$ 本身。所以你能到达群里的任何地方。
  • 第二部分: 左乘作用于陪集空间
  • 如果 $H \leq G$ 并且 $G$ ... 作用于 $G / H$: 作用是 $g \cdot (xH) = (gx)H$
  • 这个作用也是传递的:
  • 证明: 我们需要计算一个元素的轨道。最简单的起始点是包含单位元的那个陪集,即 $H$ 本身(可以写作 $1H$)。
  • 轨道 $G \cdot H$:
  • 根据定义,$G \cdot H = \{g \cdot H : g \in G\}$
  • 根据在陪集上的作用定义,$g \cdot H = g \cdot (1H) = (g1)H = gH$
  • 所以,$G \cdot H = \{gH : g \in G\}$
  • 这个集合是什么? $\{gH : g \in G\}$ 正是所有 $G$ 的左陪集的集合,即 $G/H$ 的定义本身!
  • 结论: 因为陪集 $H$ 的轨道就是整个陪集空间 $G/H$,所以这个作用是传递的。
  • 直观意义: 在陪集空间里,从基础陪集 $H$ 出发,你可以通过左乘任何一个元素 $g$ 来得到陪集 $gH$。所以你能到达任何一个陪集。
📝 [总结]

两种核心的代数作用都是传递的

  1. $G$ 在其自身集合上的左乘作用是传递的。
  2. $G$ 在其任意子群 $H$左陪集空间 $G/H$ 上的作用也是传递的。

这两个传递作用是群论中许多重要构造和定理的基础。


📜 [原文50]

(5) 群 $G$ 通过共轭作用于自身。 $x \in G$轨道$x$共轭类,即 $G$ 的子集 $C(x)$,由所有与 $x$ 共轭的元素组成。因此根据定义

$$ C(x)=\left\{g x g^{-1}: g \in G\right\} $$

例如,$C(1)=\{1\}$,因此只要 $G$ 不是平凡群,共轭作用就永远不是传递的。

📖 [逐步解释]

这个例子分析了共轭作用的轨道,并引入了共轭类的概念。

  • $G$ 通过共轭作用于自身: 作用是 $g \cdot x = gxg^{-1}$ (为了清晰,我们暂时用 ·,虽然原文避免了)。
  • $x \in G$ 的轨道是 $x$ 的共轭类,即 $G$ 的子集 $C(x)$...:
  • 轨道定义: $x$ 的轨道是 $G \cdot x = \{g \cdot x : g \in G\} = \{gxg^{-1} : g \in G\}$
  • 新名词: 作者告诉我们,这个特定的轨道结构有一个专门的名字,叫做共轭类 (Conjugacy Class) of $x$
  • 记号: 共轭类通常记作 $C(x)$$\mathrm{Cl}(x)$
  • 所以,共轭作用下的轨道就是共轭类。这是一个定义上的等同。
  • 因此根据定义 $C(x)=\left\{g x g^{-1}: g \in G\right\}$:
  • 这只是把共轭类的定义用数学符号写出来。它包含了所有可以通过共轭从 $x$ 变换得到的元素。
  • 例如,$C(1)=\{1\}$:
  • 计算单位元 1 的共轭类。
  • $C(1) = \{g \cdot 1 \cdot g^{-1} : g \in G\}$
  • $g \cdot 1 \cdot g^{-1} = g g^{-1} = 1$
  • 所以,无论用哪个 $g$ 去共轭单位元,得到的结果永远是单位元。
  • 因此单位元的共轭类只包含它自己一个元素:$C(1)=\{1\}$
  • 因此只要 $G$ 不是平凡群,共轭作用就永远不是传递的。
  • 平凡群: 指只包含单位元一个元素的群 $G=\{1\}$
  • 如果 $G$ 不是平凡群: 意味着 $G$ 中至少还有一个不同于1的元素,比如 $y \neq 1$
  • 传递性要求: 如果作用是传递的,那么必须只有一个轨道,即 $G \cdot x = G$ for all $x$
  • 矛盾:
  • 我们已经知道,单位元1的轨道是 $C(1)=\{1\}$
  • 如果 $G$ 不是平凡群,那么 $G$ 至少包含两个元素,所以 $\{1\} \neq G$
  • 既然存在一个轨道(单位元的轨道)不等于全集 $G$,那么这个作用就不是传递的
  • 结论: 除非是那个只有一个元素的平凡群,否则共轭作用永远不可能是传递的。它总是把群分解成多个共轭类(轨道)。
📝 [总结]

本例的核心是:

  1. 共轭作用下,一个元素 $x$轨道被称为它的共轭类 $C(x)$
  2. 单位元的共轭类永远只包含它自身。
  3. 这个事实直接导致了一个重要结论:任何非平凡群的共轭作用都不是传递的。它总是将群分解为多个轨道(共轭类)。

62.6. 2.6. 定义 1.2.6

📜 [原文51]

如果 $X$ 是一个 $G$-集,$x \in X$,那么同构子群 $G_{x}$ 是集合 $\{g \in G: g \cdot x=x\}$。子群 $G_{x}$ 也称为 $x$稳定子,有时记作 $\operatorname{Stab} x$

📖 [逐步解释]

这个定义引入了群作用理论中与“轨道”同样重要的另一个核心概念——稳定子 (Stabilizer)同构子群 (Isotropy Subgroup)

  • 如果 $X$ 是一个 $G$-集,$x \in X$: 前提。我们有一个群作用,并且指定了集合 $X$ 中的一个元素 $x$
  • 那么同构子群 $G_x$ 是集合 $\{g \in G: g \cdot x=x\}$:
  • $G_x$: 这是稳定子的标准记号,下标 $x$ 表明它是与元素 $x$ 相关联的。
  • 是集合...: 稳定子是作用群 $G$ 的一个子集
  • 定义 $\{g \in G : g \cdot x = x\}$:
  1. 我们要从群 $G$ 中筛选出一些元素来组成 $G_x$
  2. 筛选的条件是:$g \cdot x = x$
    • 直观意义: $G_x$ 包含了所有那些作用在 $x$ 上时,能够使 $x$ 保持不动的群元素 $g$ 的集合。它们是 $x$ 的“稳定器”或“固定器”。
  • 轨道 vs 稳定子:
  • 轨道 $G \cdot x$: 是被作用集合 $X$ 的一个子集。它问的是:“$x$哪里?”
  • 稳定子 $G_x$: 是作用群 $G$ 的一个子集。它问的是:“哪些操作留住$x$?”
  • 子群 $G_x$ 也称为 $x$ 的稳定子,有时记作 $\operatorname{Stab} x$
  • 稳定子 (Stabilizer): 这是更常用、更直观的名称。
  • 同构子群 (Isotropy Subgroup): 这个名字在几何和物理中更常见。"Isotropy" 意为“各向同性”,指在某个点,从所有方向看性质都一样,这暗示了在这一点存在一些旋转对称性,这些对称操作就构成了同构子群。
  • $\operatorname{Stab} x$: 另一种常见的记号。
  • 预告: 定义中称之为“子群”,下一个引理将证明它确实是一个子群,而不仅仅是一个子集。
💡 [数值示例]
  • 示例1: $D_4$ 作用于正方形顶点集 $X=\{v_1, v_2, v_3, v_4\}$
  • $v_1$ 是右上角顶点 $(1,1)$
  • $v_1$ 的稳定子 $G_{v_1}$: 我们需要找出 $D_4$ 中哪些操作能让 $v_1$ 保持不动。
  • $D_4$ 有8个元素:
  • 恒等操作 $e$: $e \cdot v_1 = v_1$。所以 $e \in G_{v_1}$
  • 旋转90, 180, 270度: 都会移动 $v_1$
  • 水平翻转: 会把 $v_1$ 变成左上角顶点 $v_2$
  • 垂直翻转: 会把 $v_1$ 变成右下角顶点 $v_4$
  • 沿对角线 $y=x$ 翻转: 这条对角线穿过 $v_1$$v_3$。这个翻转操作会保持 $v_1$ 不动。我们称之为 $s_d$。所以 $s_d \in G_{v_1}$
  • 沿对角线 $y=-x$ 翻转: 会把 $v_1$ 变成 $v_3$
  • 结论: $G_{v_1} = \{e, s_d\}$。这是一个包含两个元素的集合。
  • 示例2: $SO(3)$ 作用于球面 $S^2$
  • $x$ 是北极点 $(0,0,1)$
  • 求北极点的稳定子 $G_x$: 我们需要找出所有能让北极点保持不动的空间旋转。
  • 显然,所有绕着z轴的旋转,都不会改变北极点的位置。
  • 这些绕z轴的旋转构成的群,同构于二维旋转群 $SO(2)$
  • 结论: 北极点的稳定子 $G_{(0,0,1)}$ 就是 $SO(3)$ 中所有绕z轴旋转的矩阵构成的子群,这个子群同构于 $SO(2)$
⚠️ [易错点]
  1. 稳定子是G的子集: 重复强调,稳定子是作用群 $G$ 的一部分,而轨道是被作用集合 $X$ 的一部分。
  2. 不同点的稳定子可能不同:
  3. $D_4$ 作用于正方形本身的例子中:
  4. 顶点 $(1,1)$ 的稳定子是 $\{e, s_d\}$
  5. 边中点 $(1,0)$ 的稳定子是 $\{e, s_h\}$ (水平翻转)。
  6. 中心点 $(0,0)$ 的稳定子是整个 $D_4$ 群,因为所有操作都保持中心点不动。
📝 [总结]

稳定子 $G_x$ 是与特定元素 $x$ 相关的、群 $G$ 中的一个子集。它由所有那些作用于 $x$ 而使其位置保持不变的群元素构成。它与“轨道”概念互补,共同构成了分析群作用的两个基本工具。

72.7. 2.7. 引理 1.2.7

📜 [原文52]

$G_{x}$$G$ 的一个子群。

证明。封闭性:如果 $g_{1}, g_{2} \in G_{x}$,那么

$$ \left(g_{1} g_{2}\right) \cdot x=g_{1} \cdot\left(g_{2} \cdot x\right)=g_{1} \cdot x=x $$

恒等元:由于 $1 \cdot x=x$,对于每个 $x$$1 \in G_{x}$。逆元:如果 $g \in G_{x}$,那么根据定义 $g \cdot x=x$。正如我们已经看到的,$g^{-1} \cdot x=x$,因此 $g^{-1} \in G_{x}$。因此 $G_{x} \leq G$

📖 [逐步解释]

这个引理正式证明了上一节定义的稳定子 $G_x$ 确实是一个子群,而不仅仅是一个子集。证明过程是标准的子群检验三部曲。

  • 目标: 证明 $G_x = \{g \in G : g \cdot x = x\}$$G$ 的一个子群。
  • 子群三条件:
  1. 封闭性 (Closure): 如果 $g_1, g_2 \in G_x$,那么它们的乘积 $g_1 g_2$ 也必须在 $G_x$ 中。
  2. 单位元 (Identity): 群 $G$ 的单位元 $1$ 必须在 $G_x$ 中。
  3. 逆元 (Inverse): 如果 $g \in G_x$,那么它的逆元 $g^{-1}$ 也必须在 $G_x$ 中。
  • 证明:
  • 1. 封闭性:
  • 如果 $g_1, g_2 \in G_x$: 这是前提。根据 $G_x$ 的定义,这意味着 $g_1 \cdot x = x$ 并且 $g_2 \cdot x = x$
  • 我们需要检验 $g_1 g_2$ 是否在 $G_x$: 即检验 $(g_1 g_2) \cdot x$ 是否等于 $x$
  • 推导:
  • $(g_1 g_2) \cdot x = g_1 \cdot (g_2 \cdot x)$ (根据群作用公理1)
  • $= g_1 \cdot x$ (因为 $g_2 \in G_x$,所以 $g_2 \cdot x = x$)
  • $= x$ (因为 $g_1 \in G_x$,所以 $g_1 \cdot x = x$)
  • 结论: $(g_1 g_2) \cdot x = x$,所以 $g_1 g_2 \in G_x$。封闭性得证。
  • 2. 恒等元:
  • 由于 $1 \cdot x = x$: 这是群作用公理2。
  • 对于每个 $x$: 这个性质对所有 $x$ 都成立。
  • $1 \in G_x$: 这句话的意思是,单位元 $1$ 满足“使 $x$ 保持不动”的条件 ($1 \cdot x=x$),因此根据 $G_x$ 的定义, $1$ 属于 $G_x$。单位元条件得证。
  • 3. 逆元:
  • 如果 $g \in G_x$,那么... $g \cdot x = x$: 这是前提。
  • 我们需要检验 $g^{-1}$ 是否在 $G_x$: 即检验 $g^{-1} \cdot x$ 是否等于 $x$
  • 正如我们已经看到的,$g^{-1} \cdot x = x$: 作者引用了之前(引理1.1.7(iii)的推论)已经得出的结论。我们再推导一遍:
  • $g \cdot x = x$ 出发。
  • 两边用 $g^{-1}$ 作用:$g^{-1} \cdot (g \cdot x) = g^{-1} \cdot x$
  • 左边根据公理1,是 $(g^{-1}g) \cdot x = 1 \cdot x$
  • 根据公理2, $1 \cdot x = x$
  • 所以,我们得到 $x = g^{-1} \cdot x$
  • 因此 $g^{-1} \in G_x$: 因为 $g^{-1}$ 满足了稳定子的条件,所以它属于 $G_x$。逆元条件得证。
  • 因此 $G_x \leq G$:
  • 因为稳定子 $G_x$ 满足了子群的所有三个条件,所以它确实是 $G$ 的一个子群。
📝 [总结]

引理1.2.7通过一个直接的、三步的验证过程,证明了稳定子 $G_x$ 的集合确实构成了作用群 $G$ 的一个子群。这个证明是群作用公理的直接应用,它揭示了稳定子这个概念内在的代数结构。

82.8. 2.8. 定义 1.2.8

📜 [原文53]

如果 $X$ 是一个 $G$-集,那么不动集 $X^{G}$ 是集合 $\{x \in X: g \cdot x= x \text{ 对于所有 } g \in G\}$。它是 $X$ 的最大 $G$-子集,对于该子集,$G$-作用是平凡的。显然 $x \in X^{G} \Longleftrightarrow G_{x}=G \Longleftrightarrow G \cdot x=\{x\} \Longleftrightarrow$ 轨道 $G \cdot x$ 恰好包含一个元素。

📖 [逐步解释]

这个定义引入了不动集 (Fixed Set) 的概念,它与稳定子密切相关,但视角不同。

  • 不动集 $X^G$ 是集合 $\{x \in X : g \cdot x = x \text{ 对于所有 } g \in G\}$:
  • $X^G$: 不动集的记号。上标 $G$ 表示是群 $G$ 作用下的不动集。
  • 是集合...: 不动集是被作用集合 $X$ 的一个子集。
  • 定义:
  1. 我们要从集合 $X$ 中筛选出一些元素来组成 $X^G$
  2. 筛选的条件是:这个元素 $x$ 必须在所有 $g \in G$ 的作用下都保持不动。
    • 直观意义: $X^G$ 是在群 $G$ 的所有操作下都“绝对静止”、“完全免疫”的那些点的集合。
  • 稳定子 vs 不动集:
  • 稳定子 $G_x$: 固定一个点 $x$,问哪些操作 $g$ 能留住它。结果是 $G$ 的一个子群。
  • 不动集 $X^G$: 固定所有操作 $g$,问哪些点 $x$ 能抵抗所有操作。结果是 $X$ 的一个子集。
  • 它是 $X$ 的最大 $G$-子集,对于该子集,$G$-作用是平凡的。
  • $G$-子集: 首先, $X^G$ 是一个 $G$-子集。因为如果 $x \in X^G$,那么对于任何 $h \in G$$h \cdot x = x$。而 $x$ 还在 $X^G$ 里,所以是封闭的。
  • 作用是平凡的: 在 $X^G$ 这个子集上,任何 $g$ 的作用都是 $g \cdot x = x$,这正是平凡作用的定义。
  • 最大: 任何一个作用是平凡的 $G$-子集 $Y$,根据定义,对其中所有 $y \in Y$,都有 $g \cdot y = y$ 对所有 $g$ 成立。这意味着 $Y$ 中的所有元素都满足进入 $X^G$ 的条件,所以 $Y \subseteq X^G$。因此 $X^G$ 是最大的那一个。
  • 显然 $x \in X^{G} \Longleftrightarrow G_{x}=G \Longleftrightarrow G \cdot x=\{x\} \Longleftrightarrow$ 轨道 $G \cdot x$ 恰好包含一个元素。
  • 这是一个非常重要的等价关系链,它将不动点、稳定子和轨道联系起来。
  • $x \in X^G \iff g \cdot x = x$ 对所有 $g \in G$ 成立: 这是不动点的定义。
  • $\iff G_x = G$:
  • $G_x$ 的定义是 $\{g \in G : g \cdot x = x\}$
  • 如果 $g \cdot x = x$ 对所有 $g \in G$ 都成立,那么 $G_x$ 就包含了 $G$ 的所有元素,即 $G_x = G$
  • 反之,如果 $G_x=G$,那么所有 $g \in G$ 都在 $G_x$ 里,所以它们都满足 $g \cdot x = x$
  • $\iff G \cdot x = \{x\}$:
  • $G \cdot x$ 的定义是 $\{g \cdot x : g \in G\}$
  • 如果 $g \cdot x = x$ 对所有 $g \in G$ 都成立,那么这个集合里所有的结果都是 $x$,所以 $G \cdot x = \{x\}$
  • 反之,如果轨道只包含 $x$ 一个元素,说明对于任何 $g \in G$$g \cdot x$ 的结果都必须是 $x$
  • $\iff$ 轨道 ... 恰好包含一个元素: 这是对 $G \cdot x = \{x\}$ 的文字表述。
  • 结论: 一个点是不动点,当且仅当它的稳定子是整个群,也当且仅当它的轨道是只包含它自身的单点集。

📜 [原文54]

注意:不要将不动集 $X^{G}$ 与从 $G$$X$ 的函数集合混淆。尽管我们使用相同的符号,但其含义应始终从上下文中清楚。

📖 [逐步解释]

这是一个标准的数学符号预警。

  • 在其他数学领域,特别是集合论或拓扑学中,$X^G$ 有时被用来表示所有从集合 $G$ 到集合 $X$ 的函数的集合,即 $\{f | f: G \rightarrow X\}$
  • 作者在此提醒读者,在本书的群作用上下文中,$X^G$ 特指不动集,而不是函数集。这是一个需要根据上下文来判断的符号重用情况。

92.9. 2.9. 命题 1.2.9

📜 [原文55]

以下是轨道同构子群之间的基本联系:

1命题 1.2.9

如果 $X$ 是一个 $G$-集,$x \in X$,那么存在一个从 $G \cdot x$$G / G_{x}$$G$-集同构,其中 $G$ 以通常的方式(通过左乘陪集)作用于 $G_{x}$ 的左陪集集合。特别是,如果 $G$ 传递地作用于 $X$,那么 $X$$G / G_{x}$$G$-同构的。

📖 [逐步解释]

这个命题是群作用理论的基石之一,通常被称为轨道-稳定子定理 (Orbit-Stabilizer Theorem)。它在轨道和稳定子之间建立了一个深刻而优美的定量关系。

  • 以下是轨道和同构子群之间的基本联系: 预告了这是一个核心结论。
  • 前提: $X$ 是一个 $G$-集,$x \in X$ 是一个指定的起始点。
  • 结论: ...存在一个从 $G \cdot x$$G / G_{x}$$G$-集同构...
  • $G \cdot x$: $x$ 的轨道。这是一个 $G$-集。
  • $G / G_x$: 由 $x$ 的稳定子 $G_x$(它是一个子群)所构成的左陪集空间。我们已经知道,这也是一个 $G$-集,作用方式是 $g \cdot (h G_x) = (gh) G_x$
  • $G$-集同构: 意味着这两个 $G$-集本质上是“一样”的。不仅它们的元素数量相同,而且群 $G$ 在它们上面的作用“模式”也完全相同。
  • 定理核心思想: 任何一个轨道,作为 $G$-集来看,都和某个陪集空间是同构的。这个陪集空间是由该轨道中任意一点的稳定子所定义的。这为我们研究抽象的轨道提供了一个具体的代数模型 ($G/G_x$)。
  • 特别是,如果 $G$ 传递地作用于 $X$ ...:
  • 传递作用: 意味着只有一个轨道,并且这个轨道就是整个集合 $X$,即 $G \cdot x = X$
  • ...那么 $X$$G / G_x$$G$-同构的:
  • $G \cdot x$ 替换为 $X$,就得到了这个特例。
  • 结论: 任何一个传递的 $G$-集,都同构于某个陪集空间 $G/G_x$
  • 这意味着,从代数结构的角度看,所有的传递 $G$-集本质上都是陪集空间。这是一个极其强大的分类结果。
📝 [总结]

轨道-稳定子定理指出,对于任意群作用中的任意一点 $x$,其轨道 $G \cdot x$ 作为 $G$-集,与由其稳定子 $G_x$ 构成的陪集空间 $G/G_x$$G$-同构的。这揭示了群作用最基本的结构单元——轨道——其代数本质就是一个陪集空间。


📜 [原文56]

证明。最简单的方法是定义一个函数 $F: G / G_{x} \rightarrow G \cdot x$,并首先证明它是双射,然后证明它是 $G$-集同构。给定一个陪集 $g G_{x}$,定义 $F\left(g G_{x}\right)=g \cdot x$(请注意,这确实是 $G \cdot x$ 的一个元素)。我们必须证明 $F$良定义的,即与陪集 $g G_{x}$ 的代表元 $g$ 无关。 $g G_{x}$ 的任何其他元素形式为 $g h$,其中 $h \in G_{x}$,因此

$$ (g h) \cdot x=g \cdot(h \cdot x)=g \cdot x $$

因为根据 $G_{x}$ 的定义 $h \cdot x=x$。因此 $F$良定义的,并且根据 $G \cdot x$ 的定义它是满射的。

📖 [逐步解释]

这是轨道-稳定子定理证明的第一部分:定义映射并证明其良定义性和满射性。

(注意:原文定义的映射是从 $G/G_x$$G \cdot x$。虽然命题陈述是从 $G \cdot x$$G/G_x$,但证明一个方向即可,因为逆也是同构)。

  • 定义一个函数 $F: G / G_{x} \rightarrow G \cdot x$:
  • 输入: 是一个陪集 $gG_x$
  • 输出: 是轨道中的一个元素。
  • 规则 $F(gG_x) = g \cdot x$: 将陪集 $gG_x$ 映射到由其代表元 $g$ 作用于 $x$ 所得的结果。
  • 我们必须证明 $F$ 是良定义的 (well-defined):
  • 问题: 陪集可以用不同的代表元表示。如果 $g_1 G_x = g_2 G_x$,我们必须保证 $F(g_1 G_x)$$F(g_2 G_x)$ 的结果是相同的,否则这个函数定义就是模糊的、无效的。
  • 证明:
  1. $g_1 G_x = g_2 G_x$。这意味着 $g_1$$g_2$ 在同一个陪集里。
  2. 根据陪集的性质,存在一个 $h \in G_x$ 使得 $g_2 = g_1 h$
  3. 我们需要比较 $F(g_1 G_x)$$F(g_2 G_x)$
    • $F(g_1 G_x) = g_1 \cdot x$
    • $F(g_2 G_x) = g_2 \cdot x = (g_1 h) \cdot x$
  4. 根据群作用公理(1),$(g_1 h) \cdot x = g_1 \cdot (h \cdot x)$
  5. 因为 $h \in G_x$ (稳定子),所以根据定义,$h \cdot x = x$
  6. 因此,$g_1 \cdot (h \cdot x) = g_1 \cdot x$
  7. 我们得到了 $F(g_2 G_x) = g_1 \cdot x = F(g_1 G_x)$
    • 结论: 映射的结果与代表元的选择无关,$F$ 是良定义的。
  • 并且根据 $G \cdot x$ 的定义它是满射的 (surjective):
  • 满射定义: 值域中的任何一个元素,都必须能被定义域中的某个元素映射到。
  • 证明:
  1. 任取值域 $G \cdot x$ 中的一个元素 $y$
  2. 根据轨道 $G \cdot x$ 的定义,$y$ 一定可以被写成 $y = g \cdot x$ 的形式,其中 $g$$G$ 中的某个元素。
  3. 现在我们需要在定义域 $G/G_x$ 中找到一个陪集,它能被 $F$ 映射到 $y$
  4. 考虑陪集 $gG_x$。根据 $F$ 的定义,$F(gG_x) = g \cdot x = y$
  5. 我们找到了这样的一个陪集。
    • 结论: $F$ 是满射。

📜 [原文57]

接下来,我们声称 $F$ 是内射的。假设 $F\left(g_{1} G_{x}\right)=F\left(g_{2} G_{x}\right)$。那么根据定义 $g_{1} \cdot x=g_{2} \cdot x$,因此

$$ x=g_{1}^{-1} \cdot\left(g_{1} \cdot x\right)=g_{1}^{-1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1}^{-1} g_{2}\right) \cdot x $$

因此 $g_{1}^{-1} g_{2} \in G_{x}$,所以 $g_{1} G_{x}=g_{2} G_{x}$。因此 $F$ 是内射的,从而是一个双射。

📖 [逐步解释]

这是证明的第二部分:证明 $F$ 是内射的。

  • 我们声称 $F$ 是内射的 (injective / one-to-one):
  • 内射定义: 如果两个不同的输入,它们对应的输出也一定不同。等价地,如果两个输入的输出相同,那么这两个输入必须是同一个。
  • 假设 $F(g_1 G_x) = F(g_2 G_x)$: 我们从输出相等出发。
  • 推导步骤:
  1. $g_1 \cdot x = g_2 \cdot x$: 这是将假设中的 $F$ 用其定义展开。
  2. $x = g_1^{-1} \cdot (g_1 \cdot x)$: 这是第一步。在等式 $g_1 \cdot x = g_2 \cdot x$ 的两边同时用 $g_1^{-1}$ 作用。我们只看左边, $g_1^{-1} \cdot (g_1 \cdot x) = (g_1^{-1}g_1)\cdot x = 1 \cdot x = x$
  3. $...=g_{1}^{-1} \cdot\left(g_{2} \cdot x\right)$: 将 $g_1 \cdot x$ 替换为与之相等的 $g_2 \cdot x$
  4. $...=\left(g_{1}^{-1} g_{2}\right) \cdot x$: 应用群作用公理(1)。
  5. 结论: 我们从 $g_1 \cdot x = g_2 \cdot x$ 推导出了 $(g_1^{-1}g_2) \cdot x = x$
  6. 因此 $g_1^{-1}g_2 \in G_x$:
    • 稳定子 $G_x$ 的定义是,所有使 $x$ 不动的元素的集合。
    • 既然元素 $g_1^{-1}g_2$ 作用于 $x$ 得到 $x$,那么 $g_1^{-1}g_2$ 必然属于 $G_x$
  7. 所以 $g_1 G_x = g_2 G_x$:
    • 这是左陪集的一个基本性质:$aH=bH \iff b^{-1}a \in H$
    • 这里对应的是 $g_1^{-1}g_2 \in G_x \iff g_1 G_x = g_2 G_x$
  8. 因此 $F$ 是内射的: 我们从 $F(g_1 G_x) = F(g_2 G_x)$ 出发,最终证明了输入 $g_1 G_x$$g_2 G_x$ 是同一个陪集。这正是内射的定义。
  • 从而是一个双射: 因为我们已经证明了 $F$ 既是满射又是内射,所以 $F$ 是一个双射 (bijection)

📜 [原文58]

最后,我们必须检查 $F$ 是否是 $G$-集同构。这从以下事实得出:对于所有 $g \in G$ 和陪集 $h G_{x} \in G / G_{x}$,根据 $G$$G / G_{x}$ 上的作用定义,

$$ F\left(g \cdot\left(h G_{x}\right)\right)=F\left((g h) G_{x}\right)=(g h) \cdot x=g \cdot(h \cdot x)=g \cdot F\left(h G_{x}\right) . $$

因此 $F$$G$-集同构。

📖 [逐步解释]

这是证明的最后一步:证明 $F$ 保持群作用的结构。

  • 我们必须检查 $F$ 是否是 $G$-集同构:
  • 目标: 验证 $F$ 满足 $G$-等变性条件,即 $F(g \cdot Y) = g \cdot F(Y)$,其中 $Y$ 是定义域中的一个元素。
  • 这里的定义域是 $G/G_x$,所以我们要验证的等式是 $F(g \cdot (hG_x)) = g \cdot F(hG_x)$,对于任意 $g \in G$ 和任意陪集 $hG_x \in G/G_x$
  • 推导步骤:
  1. $F(g \cdot (hG_x)) = F((gh)G_x)$
    • 这是对左边括号内部应用 $G$ 在陪集空间 $G/G_x$ 上的作用定义:$g \cdot (hG_x) = (gh)G_x$
  2. $... = (gh) \cdot x$
    • 这是应用映射 $F$ 的定义:$F$ 作用于一个陪集,等于该陪集的代表元作用于 $x$。这里代表元是 $gh$
  3. $... = g \cdot (h \cdot x)$
    • 这是应用群作用公理(1)
  4. $... = g \cdot F(hG_x)$
    • 这是将括号内的 $h \cdot x$$F$ 的定义反向写回去:$h \cdot x = F(hG_x)$
  5. 最终等式: 我们证明了 $F(g \cdot (hG_x)) = g \cdot F(hG_x)$
  • 因此 $F$$G$-集同构:
  • 因为 $F$ 是一个双射,并且满足 $G$-等变性条件,所以根据定义,它是一个 $G$-集同构。
  • 命题得证。

102.10. 2.10. 推论 1.2.10

📜 [原文59]

假设 $G$ 是有限的。设 $X$ 是一个 $G$-集,并设 $x \in X$。那么

$$ \left(G: G_{x}\right)=\#(G) / \#\left(G_{x}\right)=\#(G \cdot x) $$

等价地,

$$ \#(G)=\#\left(G_{x}\right) \cdot \#(G \cdot x) $$

因此 $G$$X$ 中的一个轨道的阶数整除 $G$ 的阶数。特别是,如果 $G$ 传递地作用于 $X$,那么 $\#(G)=\#\left(G_{x}\right) \cdot \#(X)$,或等价地 $\#(X)=\left(G: G_{x}\right)$

📖 [逐步解释]

这是轨道-稳定子定理在有限群情况下的一个直接推论,给出了一个非常实用的计数公式。

  • 假设 $G$ 是有限的: 这是应用拉格朗日定理的前提。
  • $\left(G: G_{x}\right)=\#(G) / \#\left(G_{x}\right)=\#(G \cdot x)$:
  • $\#(A)$: 表示集合 $A$ 的元素个数(阶数)。
  • $(G : G_x)$: 这是子群 $G_x$$G$ 中的指数 (index),定义为 $G$$G_x$ 的左(或右)陪集的数量。即 $(G : G_x) = \#(G/G_x)$
  • $(G : G_x) = \#(G) / \#(G_x)$: 这是拉格朗日定理 (Lagrange's Theorem) 的直接推论。它指出,对于有限群,子群的指数等于群的阶数除以子群的阶数。
  • ... $= \#(G \cdot x)$: 这一步是轨道-稳定子定理的核心。命题1.2.9证明了 $G/G_x$$G \cdot x$ 之间存在一个双射。双射的存在意味着这两个集合的元素个数必须相等。所以 $\#(G/G_x) = \#(G \cdot x)$
  • 综合起来: 我们得到了一个链式等式,将陪集数量、群与子群的阶数、轨道的阶数联系在一起。
  • 等价地,$\#(G)=\#\left(G_{x}\right) \cdot \#(G \cdot x)$:
  • 这是将上面的等式 $\#(G) / \#(G_x) = \#(G \cdot x)$ 变形得到的,通常被称为轨道-稳定子公式
  • 公式的意义: 整个群的阶数,等于任何一点 $x$ 的稳定子的阶数,乘以该点 $x$ 的轨道的阶数。
  • 因此 $G$$X$ 中的一个轨道的阶数整除 $G$ 的阶数:
  • 从公式 $\#(G) = \#(G_x) \cdot \#(G \cdot x)$ 可以看出,$\#(G \cdot x)$$\#(G)$ 的一个因子。这是一个非常强的约束。
  • 特别是,如果 $G$ 传递地作用于 $X$:
  • 传递性: 意味着轨道就是整个集合,即 $\#(G \cdot x) = \#(X)$
  • 那么 $\#(G)=\#\left(G_{x}\right) \cdot \#(X)$: 直接将 $\#(G \cdot x)$ 替换为 $\#(X)$
  • 或等价地 $\#(X)=\left(G: G_{x}\right)$: 直接从 $\#(G \cdot x) = (G:G_x)$ 替换得到。
  • 意义: 对于传递作用,被作用集合的大小,等于群的阶数除以任意一点稳定子的阶数。这个公式在组合计数和群论中有极其广泛的应用。

112.11. 2.11. 示例 1.2.11

📜 [原文60]

(1) $S_{n}$ 传递地作用于 $\{1, \ldots, n\}$,并且 $n$同构子群

$$ H_{n}=\left\{\sigma \in S_{n}: \sigma(n)=n\right\} \cong S_{n-1} $$

因此 $S_{n} / H_{n}$$\{1, \ldots, n\}$$S_{n}$-同构的。请注意 $\#\left(S_{n}\right)=n!, \#\left(H_{n}\right)=\#\left(S_{n-1}\right)=(n-1)!$,并且 $\#(\{1, \ldots, n\})=n=n!/(n-1)!=\#\left(S_{n}\right) / \#\left(H_{n}\right)$

📖 [逐步解释]

这个例子将轨道-稳定子定理应用于最经典的 $S_n$ 作用。

  • $S_n$ 传递地作用于 $\{1, \ldots, n\}$: 已知。
  • $n$ 的同构子群是... $H_n = \{\sigma \in S_n : \sigma(n)=n\}$:
  • 同构子群/稳定子: 这里计算的是元素 $n$ 的稳定子 $G_n$ (原文记作 $H_n$)。
  • 定义: 稳定子包含所有使 $n$ 保持不动的置换。
  • $\cong S_{n-1}$:
  • 如果一个置换 $\sigma$ 保持 $n$ 不动,那么它实际上只在集合 $\{1, \ldots, n-1\}$ 上进行排列。
  • 任何一个在 $\{1, \ldots, n-1\}$ 上的置换(即 $S_{n-1}$ 的一个元素),都可以被看作是 $S_n$ 中一个保持 $n$ 不动的置换。
  • 这个对应关系是一个同构。因此,固定 $n$ 的子群 $H_n$$S_{n-1}$ 是同构的。
  • 因此 $S_{n} / H_{n}$$\{1, \ldots, n\}$$S_{n}$-同构的:
  • 这是轨道-稳定子定理(命题1.2.9)的直接应用。
  • 作用是传递的,所以 $X = \{1, ..., n\}$
  • 轨道 $G \cdot n = X$。稳定子是 $G_n = H_n$
  • 定理说:$X \cong_G G/G_n$
  • 所以 $\{1, \ldots, n\} \cong_{S_n} S_n / H_n$
  • 请注意 $\#(S_n)=n!, \#(H_n)=(n-1)!, ...$:
  • 这是用推论1.2.10的计数公式进行验证。
  • $\#(S_n) = n!$ (n个元素的全排列数)。
  • $\#(H_n) = \#(S_{n-1}) = (n-1)!$
  • 传递作用的公式: $\#(X) = (G : H_n) = \#(G) / \#(H_n)$
  • 验证:
  • 左边: $\#(X) = \#(\{1,...,n\}) = n$
  • 右边: $\#(S_n) / \#(H_n) = n! / (n-1)! = n$
  • 等式成立,验证了计数公式。

📜 [原文61]

(2) $S O_{n}$ 传递地作用于 $S^{n-1}$,并且 $\mathbf{e}_{n}$同构子群很容易看出是 $S O_{n-1}$。因此 $S O_{n} / S O_{n-1}$$S^{n-1}$$S O_{n}$-同构的。在拓扑学中,这是 $(n-1)$-球面和群 $S O_{n}$ 之间的一个重要关系。

📖 [逐步解释]

这个例子应用于旋转群作用于球面。

  • $S O_n$ 传递地作用于 $S^{n-1}$: 已知。
  • $\mathbf{e}_n$ 的同构子群...是 $S O_{n-1}$:
  • $\mathbf{e}_n = (0, \ldots, 0, 1)^T$: 标准基向量(北极点)。
  • 稳定子 $G_{\mathbf{e}_n}$: 包含所有保持 $\mathbf{e}_n$ 不动的旋转矩阵 $A \in SO_n$
  • 几何直觉: 要让北极点不动,旋转轴必须就是穿过南北极的z轴。
  • 代数表示: 一个保持 $\mathbf{e}_n$ 不动的 $n \times n$ 旋转矩阵,其最后一列必须是 $\mathbf{e}_n$,最后一行必须是 $(0, \ldots, 0, 1)$。它的左上角 $(n-1) \times (n-1)$ 的子矩阵,必须是一个 $(n-1)$ 维的旋转矩阵,即属于 $SO_{n-1}$
  • 结论: $G_{\mathbf{e}_n}$ 同构于 $SO_{n-1}$
  • 因此 $S O_{n} / S O_{n-1}$$S^{n-1}$$S O_{n}$-同构的:
  • 再次直接应用轨道-稳定子定理。
  • $X = S^{n-1}$。稳定子是 $G_{\mathbf{e}_n} \cong SO_{n-1}$
  • $X \cong_G G / G_x \implies S^{n-1} \cong_{SO_n} SO_n / SO_{n-1}$
  • 在拓扑学中,这是...重要关系:
  • 这个同构关系不仅在代数上成立,在拓扑学中也有深刻含义。它表明 $S O_n$ 是一个“纤维丛 (fiber bundle)”,其底空间是 $S^{n-1}$,纤维是 $S O_{n-1}$。这为通过研究低维的群和球面来理解高维的旋转群提供了可能(例如,通过同伦群的长正合序列)。

📜 [原文62]

(3) $D_{n}$ 传递地作用于 $P_{n}$ 的顶点集 $\left\{\mathbf{p}_{0}, \ldots, \mathbf{p}_{n-1}\right\}$,并且 $\mathbf{p}_{0}$同构子群是关于 $\mathbf{p}_{0}$ 的反射。这提供了另一个证明 $\#\left(D_{n}\right)=2 n$ 的论据。

📖 [逐步解释]

这个例子应用到二面体群。

  • $D_n$ 传递地作用于...顶点集: 已知。
  • $\mathbf{p}_0$ 的同构子群是关于 $\mathbf{p}_0$ 的反射:
  • $\mathbf{p}_0$: 不妨设为点 $(1,0)$
  • 稳定子 $G_{\mathbf{p}_0}$: 寻找所有使 $(1,0)$ 不动的 $D_n$ 中的操作。
  • 旋转: 只有恒等旋转(转0度)能保持 $(1,0)$ 不动。
  • 翻转: 只有沿着穿过原点和 $(1,0)$ 的那条对称轴(即x轴)的翻转,才能保持 $(1,0)$ 不动。
  • 结论: 稳定子 $G_{\mathbf{p}_0}$ 包含两个元素:恒等操作 $e$ 和关于x轴的反射 $s$。这是一个二阶子群。
  • 这提供了另一个证明 $\#(D_n) = 2n$ 的论据:
  • 使用轨道-稳定子计数公式:$\#(G) = \#(G_x) \cdot \#(G \cdot x)$
  • $\#(G)$: 是我们想求的 $\#(D_n)$
  • $\#(G_x)$: 是稳定子 $G_{\mathbf{p}_0}$ 的阶数,我们刚算出是 2。
  • $\#(G \cdot x)$: 是轨道 $D_n \cdot \mathbf{p}_0$ 的阶数。因为作用是传递的,轨道就是整个顶点集,所以阶数是 $n$
  • 计算: $\#(D_n) = 2 \times n = 2n$
  • 这通过群作用理论,给出了计算 $D_n$ 阶数的一种新方法。

📜 [原文63]

(4) 设 $S$十二面体$G(S)$$S$ 的对称群。通过实验一个 $S$ 模型,可以合理地认为 $G(S)$ 传递地作用于 $S$ 的 12 个面,并且一个面的同构群的阶数为 5,对应于五边形的可能旋转。因此我们期望 $\#(G(S))=60$。通过观察 $G(S)$ 在 20 个顶点上的作用,其中同构群的阶数为 3,或者在 30 条边上的作用,其中同构群的阶数为 2,我们可以得出类似的结论。实际上,可以证明 $G(S) \cong A_{5}$。类似论证适用于其他正多面体:四面体的对称群的阶数为 12,并且同构于 $A_{4}$,而立方体八面体的对称群的阶数为 24,并且同构于 $S_{4}$

📖 [逐步解释]

这个例子展示了轨道-稳定子定理在计算正多面体对称群阶数方面的强大威力。

  • 十二面体:
  • $G(S)$ 传递地作用于 12 个面: 这是合理的假设。通过旋转,任何一个面都可以转到任何其他面的位置。
  • 一个面的同构群的阶数为 5:
  • 稳定子: 考虑顶面的稳定子。即所有能让顶面保持不变(可以自身旋转)的旋转操作。
  • 顶面是一个正五边形。能让它保持不变的旋转只有绕着穿过其中心的轴旋转 $k \times (360/5)$ 度,共5种(包括0度)。
  • 所以 $\#(G_{\text{面}}) = 5$
  • 因此我们期望 $\#(G(S))=60$:
  • $\#(G) = \#(G_x) \cdot \#(G \cdot x)$
  • $\#(G(S)) = \#(G_{\text{面}}) \times \#(\text{所有面}) = 5 \times 12 = 60$
  • 在顶点上的作用:
  • 十二面体有20个顶点。作用是传递的。
  • 稳定子: 一个顶角是三条边的汇集点。能让这个顶点不动的旋转,只有绕着穿过该顶点的轴旋转 $360/3=120$ 度和240度,加上恒等,共3个操作。所以 $\#(G_{\text{顶点}}) = 3$
  • 计算: $\#(G(S)) = \#(G_{\text{顶点}}) \times \#(\text{所有顶点}) = 3 \times 20 = 60$
  • 在边上的作用:
  • 十二面体有30条边。作用是传递的。
  • 稳定子: 一条边。能让这条边保持不变的旋转只有绕着穿过其中心的轴旋转180度,加上恒等,共2个操作。所以 $\#(G_{\text{边}}) = 2$
  • 计算: $\#(G(S)) = \#(G_{\text{边}}) \times \#(\text{所有边}) = 2 \times 30 = 60$
  • 结论: 从三个不同角度计算,都得到阶数是60。这大大增强了结论的可靠性。
  • 实际上... $G(S) \cong A_5$: 作者给出了更深的结果。60阶的单群只有交错群 $A_5$,可以证明十二面体的旋转群同构于 $A_5$
  • 类似论证适用于其他正多面体:
  • 四面体: 4个面,每个面稳定子阶数3 $\implies \#G = 4 \times 3 = 12$。($\cong A_4$)
  • 立方体: 6个面,每个面稳定子阶数4 $\implies \#G = 6 \times 4 = 24$。($\cong S_4$)
  • 八面体: 8个面,每个面稳定子阶数3 $\implies \#G = 8 \times 3 = 24$。($\cong S_4$)
  • 二十面体: 20个面,每个面稳定子阶数3 $\implies \#G = 20 \times 3 = 60$。($\cong A_5$)

📜 [原文64]

(5) 如果 $H$$G$ 的子群,那么 $G$ 传递地作用于 $G / H$,因为轨道 $G \cdot H=G / H$$H$同构子群根据定义是

$$ \{g \in G: g H=H\}=H $$

$x H$同构子群

$$ \{g \in G: g x H=x H\}=x H x^{-1} $$

因为 $g x H=x H \Longleftrightarrow x^{-1} g x \in H \Longleftrightarrow g \in x H x^{-1}$

📖 [逐步解释]

这个例子分析了陪集空间上的作用的稳定子。

  • $G$ 传递地作用于 $G/H$: 已知。
  • $H$ 的同构子群 ... 是 $H$:
  • 稳定子: 我们计算陪集 $H$ (即 $1H$) 的稳定子 $G_H$
  • 定义: $G_H = \{g \in G : g \cdot H = H\}$
  • $g \cdot H = gH$: 所以条件是 $gH=H$
  • 陪集性质: $gH=H$ 当且仅当 $g \in H$
  • 结论: $G_H = H$。基础陪集 $H$ 的稳定子就是 $H$ 本身。
  • 验证计数公式: $\#(G) = \#(G_H) \cdot \#(G \cdot H) = \#(H) \cdot \#(G/H)$。这正是拉格朗日定理。
  • $xH$ 的同构子群是 $xHx^{-1}$:
  • 稳定子: 计算任意陪集 $xH$ 的稳定子 $G_{xH}$
  • 定义: $G_{xH} = \{g \in G : g \cdot (xH) = xH\}$
  • $g \cdot (xH) = (gx)H$: 所以条件是 $(gx)H = xH$
  • 推导:
  • $(gx)H = xH$
  • $\iff (x^{-1})(gx)H = (x^{-1})xH = H$ (两边左乘陪集 $(x^{-1})$ 的代表元) (这里陪集不能乘,是两边左乘元素)
  • $\iff x^{-1}gx \in H$ (根据陪集性质 $aH=H \iff a \in H$)
  • $\iff g \in xHx^{-1}$ (两边左乘 $x$ 右乘 $x^{-1}$,即解出 $g$)
  • 结论: $G_{xH} = \{g \in G : g \in xHx^{-1}\} = xHx^{-1}$
  • $xHx^{-1}$: 这被称为子群 $H$ 的一个共轭子群。它是由 $H$ 的所有元素 $h$ 经过 $x$ 共轭 $xhx^{-1}$ 后得到的新集合,可以证明它也是一个子群。

📜 [原文65]

(6) 如果 $G$ 通过共轭作用于自身,那么不动集 $G^{G}$ 只是 $G$中心 $Z(G)$$x \in G$轨道正如我们已经看到的,是共轭类 $C(x)=\left\{g x g^{-1}: g \in G\right\}$,而 $x$同构群$x$中心化子,即子群

$$ Z(x)=\left\{g \in G: g x g^{-1}=x\right\}=\{g \in G: g x=x g\} $$

$x$ 可交换的 $G$ 的所有元素组成的子群。因此 $C(x)$$G / Z(x)$$G$-同构的,并且,如果 $G$ 是有限的,那么

$$ \#(Z(x)) \cdot \#(C(x))=\#(G) $$

📖 [逐步解释]

这个例子系统地总结了共轭作用下的所有核心概念。

  • 作用: $G$ 通过共轭作用于自身, $g \cdot x = gxg^{-1}$
  • 不动集 $G^G$$G$ 的中心 $Z(G)$:
  • 不动集定义: $G^G = \{x \in G : g \cdot x = x \text{ for all } g \in G\}$
  • 条件: $gxg^{-1} = x$ 对于所有 $g \in G$ 都成立。
  • 这等价于 $gx=xg$ 对于所有 $g \in G$ 都成立。
  • 中心 $Z(G)$ 的定义: 群的中心 $Z(G)$ 正是与群中所有元素都可交换的元素的集合。
  • 结论: $G^G=Z(G)$
  • 轨道是共轭类 $C(x)$:
  • 之前已经定义过,轨道 $G \cdot x = \{gxg^{-1} : g \in G\} = C(x)$
  • 同构群/稳定子是中心化子 $Z(x)$:
  • 稳定子定义: $G_x = \{g \in G : g \cdot x = x\}$
  • 条件: $gxg^{-1}=x$
  • 新名词: 这个特定的稳定子 $G_x$ 有一个专门的名字,叫元素 $x$中心化子 (Centralizer),记作 $Z(x)$$C_G(x)$
  • 等价条件: $gxg^{-1}=x \iff gx=xg$。所以中心化子就是所有与 $x$ 可交换的元素的集合。
  • 因此 $C(x)$$G / Z(x)$$G$-同构的:
  • 轨道-稳定子定理 (命题1.2.9) 的直接应用。
  • 轨道是 $C(x)$。稳定子是 $Z(x)$
  • 所以 $C(x) \cong_G G/Z(x)$
  • 如果 $G$ 是有限的,那么 $\#(Z(x)) \cdot \#(C(x))=\#(G)$:
  • 轨道-稳定子计数公式 (推论1.2.10) 的直接应用。
  • $\#(\text{稳定子}) \cdot \#(\text{轨道}) = \#(\text{群})$
  • 这就是著名的类方程 (Class Equation) 的基础。它指出,群的阶等于所有共轭类阶数之和。而每个共轭类的阶数 $\#(C(x))$ 都可以通过 $\#(G) / \#(Z(x))$ 来计算。

122.12. 2.12. 命题 1.2.12

📜 [原文66]

关于同构子群的另外两个有用的事实如下:

1命题 1.2.12

(i) 如果 $X$ 是一个 $G$-集,$x \in X$,并且 $y=g \cdot x \in G \cdot x$,那么 $G_{y}=g G_{x} g^{-1}$。换句话说,$x$$y$同构群通过 $g$ 共轭。

(ii) 推论 1.1.8 中由 $F(g)=\ell_{g}$ 定义的同态 $F: G \rightarrow S_{X}$ 的核是

$$ \left\{g \in G: g \in G_{x} \text{ 对于所有 } x \in X\right\}=\bigcap_{x \in X} G_{x} $$

📖 [逐步解释]

这个命题给出了关于稳定子的两个重要性质。

  • (i) ... $G_{y}=g G_{x} g^{-1}$:
  • 前提: $x$$y$同一个轨道中,并且 $g$ 是将 $x$ 变换到 $y$ 的那个群元素。
  • 结论: 它们的稳定子 $G_x$$G_y$共轭关系。
  • 意义: 在同一个轨道里的点的稳定子,虽然不一定相同,但它们在代数结构上是紧密相关的(共轭的子群必然是同构的)。这再次体现了轨道的“均质性”。
  • 证明: 见下一段。
  • (ii) ...同态 $F: G \rightarrow S_X$ 的核是... $\bigcap_{x \in X} G_x$:
  • 回顾: $F$ 是将群作用变成同态的那个映射,$F(g)=\ell_g$
  • 核的定义: $\ker(F) = \{g \in G : F(g) = \mathrm{Id}_X\}$
  • $F(g) = \mathrm{Id}_X \iff \ell_g = \mathrm{Id}_X \iff \ell_g(x)=x$ 对所有 $x \in X$ 成立。
  • $\iff g \cdot x = x$ 对所有 $x \in X$ 成立。
  • 与稳定子的关系:
  • "$g \cdot x = x$" 意味着 $g$$x$ 的稳定子 $G_x$ 中。
  • $g \cdot x = x$所有 $x \in X$ 成立” 意味着 $g$ 必须同时在所有点的稳定子中。
  • 结论: $g$ 必须在所有稳定子 $G_x$交集中。
  • 作用的核: 因此,群作用诱导的同态的核,等于该作用下所有点的稳定子的交集。这个核也被称为作用的忠实核

📜 [原文67]

证明。(i) 给定 $h \in G, h \cdot y=y \Longleftrightarrow h \cdot(g \cdot x)=g \cdot x \Longleftrightarrow(h g) \cdot x=g \cdot x \Longleftrightarrow g^{-1} \cdot((h g) \cdot x)=x \Longleftrightarrow\left(g^{-1} h g\right) \cdot x=x \Longleftrightarrow g^{-1} h g \in G_{x} \Longleftrightarrow h \in g G_{x} g^{-1}$。因此 $G_{y}=g G_{x} g^{-1}$

📖 [逐步解释]

这是对命题1.2.12(i) 的证明,一个非常漂亮的等价关系推导链。

  • 目标: 证明 $G_y = gG_x g^{-1}$。即证明 "$h \in G_y$" 与 "$h \in gG_x g^{-1}$" 这两个条件是等价的。
  • 推导链:
  1. $h \in G_y \iff h \cdot y = y$: 这是 $y$ 的稳定子 $G_y$ 的定义。
  2. $\iff h \cdot (g \cdot x) = g \cdot x$: 将前提 $y = g \cdot x$ 代入。
  3. $\iff (hg) \cdot x = g \cdot x$: 左边应用群作用公理(1)。
  4. $\iff g^{-1} \cdot ((hg) \cdot x) = x$: 在等式两边同时用 $g^{-1}$ 作用。右边 $g^{-1} \cdot (g \cdot x) = (g^{-1}g) \cdot x = 1 \cdot x = x$
  5. $\iff (g^{-1}hg) \cdot x = x$: 左边应用群作用公理(1)。
  6. $\iff g^{-1}hg \in G_x$: 这是 $x$ 的稳定子 $G_x$ 的定义。括号里的元素 $(g^{-1}hg)$ 使 $x$ 保持不动。
  7. $\iff h \in gG_x g^{-1}$: 解出 $h$。在 $g^{-1}hg \in G_x$ 两边左乘 $g$ 右乘 $g^{-1}$,得到 $h \in g G_x g^{-1}$
    • 结论: 我们从 $h \in G_y$ 出发,通过一系列等价变换,得到了 $h \in gG_x g^{-1}$。因此,这两个集合是相等的。

📜 [原文68]

(ii) 根据定义,$g \in \operatorname{Ker} F \Longleftrightarrow F(g)=\ell_{g}=\operatorname{Id}_{X} \Longleftrightarrow$ 对于所有 $x \in X, g \cdot x=x \Longleftrightarrow$ 对于所有 $x \in X, g \in G_{x}$

📖 [逐步解释]

这是对命题1.2.12(ii) 的简要证明,它将核的定义和稳定子的定义联系起来。

  • $g \in \ker(F)$: 从核中的一个任意元素 $g$ 出发。
  • $\iff F(g) = \ell_g = \mathrm{Id}_X$: 这是核的定义和 $F$ 的定义的直接展开。$g$ 在核里,意味着它被 $F$ 映射到单位元 $\mathrm{Id}_X$
  • $\iff$ 对于所有 $x \in X, g \cdot x = x$: 这是函数 $\ell_g$$\mathrm{Id}_X$ 相等的定义。两个函数相等,意味着对所有输入,输出都相等。
  • $\iff$ 对于所有 $x \in X, g \in G_x$: 这是稳定子 $G_x$ 定义的直接应用。 "$g \cdot x = x$" 正是 "$g \in G_x$" 的条件。既然这个条件对所有 $x$ 都成立,那么 $g$ 就必须属于每一个 $G_x$
  • 最终结论: 一个元素 $g$ 在作用的核里,当且仅当它在所有点的稳定子的交集里。

132.13. 2.13. 备注 1.2.13

📜 [原文69]

为了解释上面 (i) 中的假设,请注意,只有在同一轨道中的两个元素比较同构子群才有意义。

📖 [逐步解释]

这是对命题1.2.12(i) 的一个重要注解。

  • ...比较同构子群才有意义: "有意义"在这里指稳定子之间存在着必然的、简单的代数关系(即共轭关系)。
  • 只有在同一轨道中的两个元素: 命题的结论 $G_y = gG_x g^{-1}$ 依赖于前提 $y=g \cdot x$,这个前提本身就意味着 $x$$y$ 在同一个轨道。
  • 如果不在同一个轨道呢?: 如果 $x$$y$ 属于不同的轨道,那么它们的稳定子 $G_x$$G_y$ 之间没有必然的共轭关系。它们可能是同构的,也可能不是,可能是共轭的,也可能不是。群作用本身不提供任何保证。
  • 例子: 在 $D_4$ 作用于正方形的例子中,顶点 $(1,1)$ 和边中点 $(1,0)$ 在不同轨道。
  • $G_{(1,1)} = \{e, s_d\}$ (2阶群)。
  • $G_{(1,0)} = \{e, s_h\}$ (2阶群)。
  • 这两个稳定子虽然都是2阶群(因此同构),但它们在 $D_4$ 中并不是共轭的。
📝 [总结]

这个备注强调了命题1.2.12(i) 的适用范围和深刻含义:稳定子之间的共轭关系,是同一轨道内元素的一个标志性特征。轨道内的点共享着相似的“对称性”,这种对称性在代数上就表现为它们的稳定子是相互共轭的。

33. 行间公式索引

  1. 正n边形顶点的参数化公式

$$ \mathbf{p}_{k}=(\cos (2 \pi k / n), \sin (2 \pi k / n)), \quad k=0,1, \ldots, n-1 . $$

  1. 二面体群的集合论定义

$$ D_{n}=\left\{A \in O_{2}: A\left(P_{n}\right)=P_{n}\right\} . $$

  1. 欧拉公式

$$ v-e+f=2 $$

  1. 正多面体旋转对称群的定义

$$ G(S)=\left\{A \in S O_{3}: A(S)=S\right\} $$

  1. 共轭作用的结合律公理验证

$$ \begin{aligned} i_{g_{1}}\left(i_{g_{2}}(x)\right) & =i_{g_{1}}\left(g_{2} x g_{2}^{-1}\right)=g_{1}\left(g_{2} x g_{2}^{-1}\right) g_{1}^{-1}=\left(g_{1} g_{2}\right) x\left(g_{2}^{-1} g_{1}^{-1}\right) \\ & =\left(g_{1} g_{2}\right) x\left(g_{1} g_{2}\right)^{-1}=i_{g_{1} g_{2}}(x) \end{aligned} $$

  1. 共轭作用的单位元公理验证

$$ i_{1}(x)=1 x 1^{-1}=1 x 1=x $$

  1. 对称群对幂集的作用定义

$$ \sigma \cdot A=\sigma(A)=\{\sigma(a): a \in A\} . $$

  1. 左乘作用的函数表示 (群自身)

$$ \ell_{g}(x)=g x $$

  1. 群作用的函数表示 (一般情况)

$$ \ell_{g}(x)=g \cdot x $$

  1. 验证函数表示保持群结构 (引理1.1.7(i)证明)

$$ \begin{aligned} \ell_{g_{1}} \circ \ell_{g_{2}}(x) & =\ell_{g_{1}}\left(\ell_{g_{2}}(x)\right)=\ell_{g_{1}}\left(g_{2} \cdot x\right) \\ & =g_{1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1} g_{2}\right) \cdot x=\ell_{g_{1} g_{2}}(x) \end{aligned} $$

  1. 验证函数表示的逆 (引理1.1.7(iii)证明)

$$ \ell_{g} \circ \ell_{g^{-1}}=\ell_{g g^{-1}}=\ell_{1}=\operatorname{Id}_{X} $$

  1. 置换轨道的具体定义

$$ \left\{\sigma^{a}(i): a \in \mathbb{Z}\right\} $$

  1. 共轭类的定义

$$ C(x)=\left\{g x g^{-1}: g \in G\right\} $$

  1. 轨道-稳定子定理中映射良定义性的证明

$$ (g h) \cdot x=g \cdot(h \cdot x)=g \cdot x $$

  1. 轨道-稳定子定理中映射内射性的证明

$$ x=g_{1}^{-1} \cdot\left(g_{1} \cdot x\right)=g_{1}^{-1} \cdot\left(g_{2} \cdot x\right)=\left(g_{1}^{-1} g_{2}\right) \cdot x $$

  1. 轨道-稳定子定理中G-集同构的证明

$$ F\left(g \cdot\left(h G_{x}\right)\right)=F\left((g h) G_{x}\right)=(g h) \cdot x=g \cdot(h \cdot x)=g \cdot F\left(h G_{x}\right) . $$

  1. 轨道-稳定子计数公式

$$ \left(G: G_{x}\right)=\#(G) / \#\left(G_{x}\right)=\#(G \cdot x) $$

  1. 轨道-稳定子计数公式的等价形式

$$ \#(G)=\#\left(G_{x}\right) \cdot \#(G \cdot x) $$

  1. $S_n$中n的稳定子

$$ H_{n}=\left\{\sigma \in S_{n}: \sigma(n)=n\right\} \cong S_{n-1} $$

  1. 陪集H的稳定子

$$ \{g \in G: g H=H\}=H $$

  1. 陪集xH的稳定子

$$ \{g \in G: g x H=x H\}=x H x^{-1} $$

  1. 元素x的中心化子 (稳定子) 定义

$$ Z(x)=\left\{g \in G: g x g^{-1}=x\right\}=\{g \in G: g x=x g\} $$

  1. 类方程的计数形式

$$ \#(Z(x)) \cdot \#(C(x))=\#(G) $$

  1. 作用的核是所有稳定子的交集

$$ \left\{g \in G: g \in G_{x} \text{ 对于所有 } x \in X\right\}=\bigcap_{x \in X} G_{x} $$

[[END_OF_RESPONSE]]所有解释内容已全部输出完毕。