1.1_预备知识_集合与函数.ZH段落解释8.5

📜 原文

📖 逐步解释

∑ 公式拆解

💡 数值示例

⚠️ 易错点

📝 总结

🎯 存在目的

🧠 直觉心智模型

💭 直观想象

11. Ch1. 预备知识 Preliminaries P1

11.1. Ch1.1. 集合与函数 Sets and functions P1

1. 1.1. 1. 集合 Sets

📜 [原文1]

集合和函数的语言渗透于数学之中。粗略地说，每一个数学对象都是一个集合，而数学中大多数重要的运算最终都是函数，或者可以用函数来表达。我们不会定义什么是集合，而是将集合 $X$ 的概念和成员关系 $x \in X$ （ $x$ 是 $X$ 的一个元素）作为基本（未定义）术语。 $x \in X$ 的否定是 $x \notin X$ ： $x$ 不是 $X$ 的一个元素。通常，一个集合的元素本身就是集合，这强调了在数学中，一切皆是集合。集合通常有两种描述方式：(i) 作为列表 $\left\{x_{1}, \ldots, x_{n}\right\}$ ，例如 $\{1,2,4,5\}$ ，或者 (ii) 通过描述其元素来定义，例如上述集合也可以通过以下方式指定：

\{1,2,4,5\}=\{n \in \mathbb{Z}: 1 \leq n \leq 5, n \neq 3\}

其中 $\mathbb{Z}$ 表示所有整数的集合。有时（特别是在几何语境中），我们将“ $x$ 是 $X$ 的一个点”作为 $x \in X$ 的同义词。

📖 [逐步解释]

这段话是现代数学的基石，它引入了两个最核心、最基本的概念：集合 (Set) 和 函数 (Function)。

重要性：开篇第一句就点明了集合和函数的普遍性，它们是数学世界的“通用语言”。你可以把它们想象成物理世界中的“原子”和“力”。几乎所有更复杂的数学结构（比如群、环、空间）都是在集合的基础上，通过定义其上的函数（运算）来建立的。
- “每一个数学对象都是一个集合”：这是一个深刻的观点，源于集合论作为数学基础的地位。比如，数字“2”在严格的集合论构造中可以被定义为集合 $\{\emptyset, \{\emptyset\}\}$ 。虽然在日常使用中我们不必如此追根溯刨底，但这揭示了集合的底层性。
- “大多数重要的运算最终都是函数”：我们熟悉的加法、减法、乘法、除法，本质上都是函数。例如，加法可以看作一个接收两个数（一个数对），输出一个数（它们的和）的函数。
基本术语（公理化）：作者明确指出，我们不“定义”集合是什么。这是现代数学公理化方法的体现。我们不问“集合的本质是什么”，而是接受它作为一个“基本术语”或“无定义术语”。就像在几何学中，我们不定义“点”、“线”、“面”是什么，而是直接规定它们应遵循的规则（公理）。
- 集合 (Set) $X$ ：直观上理解为一个“东西”的汇集或收藏。
- 元素 (element) $x$ ：集合中的单个“东西”。
- 成员关系 (membership) $\in$ ：这是一个表示“属于”关系的基本符号。 $x \in X$ 读作 “ $x$ 属于 $X$ ” 或 “ $x$ 是 $X$ 的一个元素”。这是我们唯一需要接受的、关于集合和元素之间关系的基本事实。
- 否定成员关系 $\notin$ ： $x \notin X$ 读作 “ $x$ 不属于 $X$ ”。
“一切皆集合”：这句话非常关键。一个集合的元素也可以是集合。例如，集合 $A = \{1, \{2, 3\}\}$ 。这里的元素有两个：数字 $1$ 和集合 $\{2, 3\}$ 。这使得我们可以构建无限复杂的层次结构。
描述集合的两种方法：
- (i) 列举法 (Roster Method)：直接把所有元素列出来，用花括号 {} 括起来，元素之间用逗号 , 分隔。例如， $\{1, 2, 4, 5\}$ 这个集合包含了四个数字元素。这种方法简单直观，但只适用于元素数量有限且不多的情况。
- (ii) 描述法 (Set-Builder Notation)：通过描述元素需要满足的共同属性来定义集合。这种方法更强大，可以描述包含无限多元素的集合。它的通用格式是 { 变量 | 变量需要满足的条件 } 或 { 变量 : 变量需要满足的条件 }。
几何类比：在几何学（如拓扑学、微分几何）中，一个空间通常被看作一个点的集合，所以“点”和“元素”这两个词经常可以互换使用，这有助于建立代数与几何之间的直觉联系。

∑ [公式拆解]

\{1,2,4,5\}=\{n \in \mathbb{Z}: 1 \leq n \leq 5, n \neq 3\}

这个等式展示了描述集合的两种方法是等价的。我们来逐项拆解右边的描述法：

{ ... }：花括号，表示这是一个集合。
n：一个变量，代表集合中任意一个元素。
\in：成员关系符号，读作“属于”。
\mathbb{Z}：这是一个标准的数学符号，代表整数集 (Set of Integers)。整数包括所有的正整数、负整数和零，即 $\{\dots, -3, -2, -1, 0, 1, 2, 3, \dots\}$ 。所以 n \in \mathbb{Z} 意味着 “ $n$ 是一个整数”。
:：冒号，读作“使得 (such that)”。它后面的部分是对变量 n 的约束条件。
1 \leq n \leq 5：第一个条件，表示 “ $n$ 是一个大于等于1且小于等于5的数”。满足这个条件的整数有 $1, 2, 3, 4, 5$ 。
,：逗号，在这里表示“并且 (and)”。
n \neq 3：第二个条件，表示 “ $n$ 不等于3”。

推导过程：

我们从整数集 $\mathbb{Z}$ 中寻找满足条件的 n。
第一个条件 1 \leq n \leq 5 将我们的搜索范围缩小到整数 $\{1, 2, 3, 4, 5\}$ 。
第二个条件 n \neq 3 要求我们从这个范围中排除数字 $3$ 。
因此，剩下的元素就是 $\{1, 2, 4, 5\}$ 。
这就证明了右边的描述法定义的集合，与左边的列举法定义的集合是完全相同的。

💡 [数值示例]

示例1 (列举法转描述法)：
集合（列举法）： $A = \{a, e, i, o, u\}$
集合（描述法）： $A = \{x \mid x \text{ 是一个英文元音字母}\}$

示例2 (描述法转列举法)：
集合（描述法）： $B = \{k \in \mathbb{Z} : -2 < k \leq 2\}$
逐步分析：

k 必须是一个整数 (\in \mathbb{Z})。
k 必须大于 -2。
k 必须小于或等于 2。
同时满足这些条件的整数有：$-1, 0, 1, 2$。
- 集合（列举法）： $B = \{-1, 0, 1, 2\}$

示例3 (更复杂的描述法)：
集合（描述法）： $C = \{x^2 : x \in \{1, 2, 3\}\}$
逐步分析：这个描述的意思是“集合C的元素是集合 $\{1,2,3\}$ 中每个元素的平方”。

取 $x=1$ ，则 $x^2=1$ 。
取 $x=2$ ，则 $x^2=4$ 。
取 $x=3$，则 $x^2=9$。
- 集合（列举法）： $C = \{1, 4, 9\}$

⚠️ [易错点]

集合的无序性：列举法中元素的顺序无关紧要。集合 $\{1, 2, 4, 5\}$ 和集合 $\{5, 4, 2, 1\}$ 是同一个集合。
集合的互异性：集合中的元素不能重复。如果你写下 $\{1, 2, 2, 5\}$ ，它实际上就是集合 $\{1, 2, 5\}$ 。重复的元素只算一个。
元素与集合的混淆： $x$ 和 $\{x\}$ 是完全不同的。 $x$ 是一个元素，而 $\{x\}$ 是一个只包含 $x$ 这一个元素的集合。例如，对于集合 $A = \{1, 2\}$ ，我们有 $1 \in A$ ，但 $\{1\}$ 不是 $A$ 的元素（ $\{1\} \notin A$ ）。
描述法的冒号 vs. 竖线：在描述法中，: 和 | 是等价的，都表示“使得”。例如， $\{n \in \mathbb{Z} | 1 \leq n \leq 5, n \neq 3\}$ 和文中的写法完全一样。

📝 [总结]

本段引入了数学中最基本的概念——集合。它将集合和成员关系( $\in$ )作为不加定义的初始术语，并阐述了描述集合的两种标准方法：直接列出所有元素的列举法，以及通过定义元素属性的描述法。最后，通过一个例子展示了两种方法的等价性。

🎯 [存在目的]

本段的目的是为后续所有数学内容的学习搭建最底层的舞台。没有集合，就无法精确地定义数字、函数、几何形状、代数结构等任何数学对象。这部分内容确立了数学论述的共同语言和基本规则，确保了数学的严谨性和一致性。

🧠 [直觉心智模型]

袋子模型：想象一个袋子，这个袋子就是集合。袋子里装的东西就是元素。
$x \in X$ 就表示 “东西 $x$ 在袋子 $X$ 里面”。
无序性：袋子里的东西没有固定的位置，摇一摇顺序就变了，但还是那个袋子。
互异性：袋子里同样的东西只能放一个。如果你已经放了一个苹果，再放一个一模一样的苹果，袋子里的苹果数量还是一个。
元素可以是集合：你可以把一个小袋子（另一个集合）放进一个大袋子里。

💭 [直观想象]

维恩图 (Venn Diagram)：想象一张白纸，在上面画一个圈。这个圈圈出的区域就代表一个集合。圈里面所有的点就代表该集合的元素。
$x \in X$ 就是点 $x$ 在圈 $X$ 的内部。
$x \notin X$ 就是点 $x$ 在圈 $X$ 的外部。
描述法 $\{n \in \mathbb{Z}: 1 \leq n \leq 5, n \neq 3\}$ 可以想象成先有一个无限大的区域代表所有整数 $\mathbb{Z}$ ，然后你用一个框框出 $1$ 到 $5$ 的范围，再用橡皮擦把点 $3$ 擦掉。

1. 1.2. 定义 1.1.1.

📜 [原文2]

两个集合 $X$ 和 $Y$ 相等当且仅当它们拥有相同的元素： $X=Y$ 当且仅当，对于所有 $x, x \in X \Longleftrightarrow x \in Y$ 。我们可以不正式地这样说：一个集合由其元素唯一指定。

📖 [逐步解释]

这个定义是关于集合相等 (Set Equality) 的，它给出了判断两个集合是否是同一个集合的唯一标准。

核心思想：判断两个集合是否相等，唯一的依据就是看它们的元素是不是“一模一样”。跟集合的名字（我们叫它X还是Y）、元素的排列顺序、我们如何描述它都毫无关系。
“当且仅当” (if and only if, iff)：这是一个非常强的逻辑连接词，意味着左右两边的表述是完全等价的。
- “ $X$ 和 $Y$ 相等” 当且仅当 “它们拥有相同的元素”。
- 这意味着：
- 如果 $X$ 和 $Y$ 相等，那么它们必须拥有相同的元素。
- 并且，如果 $X$ 和 $Y$ 拥有相同的元素，那么它们就是相等的集合。
形式化语言：对于所有 $x, x \in X \Longleftrightarrow x \in Y$ 是对“拥有相同的元素”这句话的数学化翻译。
- 对于所有 $x$ (For all $x$ )：这句话是对宇宙中任何一个可能的对象 $x$ 而言的。
- x \in X \Longleftrightarrow x \in Y$：这里的 \Longleftrightarrow 是逻辑符号，代表“当且仅当”。
- x \in X \implies x \in Y：如果 $x$ 是 $X$ 的元素，那么它也必须是 $Y$ 的元素。
- x \in Y \implies x \in X：如果 $x$ 是 $Y$ 的元素，那么它也必须是 $X$ 的元素。
- 把这两条合起来，意思就是：任何在 $X$ 里的元素也必须在 $Y$ 里，同时任何在 $Y$ 里的元素也必须在 $X$ 里。一个不多，一个不少。
“外延公理” (Axiom of Extensionality)：这个定义实际上是集合论中最基本的一条公理，称为外延公理。它说明了一个集合的“外延”（即它的元素）完全决定了这个集合本身。

∑ [公式拆解]

X=Y \Longleftrightarrow (\forall x, (x \in X \Longleftrightarrow x \in Y))

这是一个更完整的形式化表达，我们来拆解：

X=Y：断言集合 $X$ 与集合 $Y$ 相等。
\Longleftrightarrow：逻辑上的“当且仅当”，连接两个等价的命题。
( ... )：括号，用于明确运算顺序。
\forall x：全称量词，读作“对于所有的 $x$ ”或“对于任意的 $x$ ”。它表示后面的陈述对所有可能的 $x$ 都成立。
, ：逗号，用于分隔量词和它作用的命题。
x \in X \Longleftrightarrow x \in Y：这部分是核心判断。
x \in X：命题“ $x$ 是 $X$ 的一个元素”。
x \in Y：命题“ $x$ 是 $Y$ 的一个元素”。
\Longleftrightarrow：表示这两个命题必须同真同假。也就是说，对于任何一个对象 $x$ ，它要么同时是 $X$ 和 $Y$ 的元素，要么同时不是 $X$ 和 $Y$ 的元素。绝不可能出现在一个集合里而不在另一个里。

推导：这个定义本身是一个公理，是集合世界的基本法则，所以它不是从其他定理“推导”出来的，而是我们进行一切推导的出发点。

💡 [数值示例]

示例1 (相等)：
令 $X = \{1, 2, 3\}$ 。
令 $Y = \{3, 1, 2\}$ 。
令 $Z = \{n \in \mathbb{N} : 1 \leq n \leq 3\}$ ，其中 $\mathbb{N}$ 是自然数集。
判断 $X$ 和 $Y$ 是否相等：
$X$ 的元素是 1, 2, 3。
$Y$ 的元素是 3, 1, 2。
它们拥有完全相同的元素。因此， $X=Y$ 。元素的顺序不影响集合的相等性。
判断 $X$ 和 $Z$ 是否相等：
$Z$ 描述的自然数是 $1, 2, 3$ 。
$X$ 和 $Z$ 拥有完全相同的元素。因此， $X=Z$ 。描述方式不影响集合的相等性。

示例2 (不相等)：
令 $A = \{1, 2\}$ 。
令 $B = \{1, 2, 3\}$ 。
判断 $A$ 和 $B$ 是否相等：
我们找到了一个元素 $3$ 。
$3 \in B$ (3是B的元素)，但是 $3 \notin A$ (3不是A的元素)。
这违反了 x \in A \Longleftrightarrow x \in B 的规则。
因此， $A \neq B$ 。

示例3 (元素与集合)：
令 $C = \{1\}$ 。
令 $D = 1$ 。
$C$ 是一个集合，它的唯一元素是数字1。 $D$ 是数字1本身，不是一个集合。它们根本不是同一种东西，所以无从谈起“集合相等”。
令 $E = \{\{1\}\}$ 。
判断 $C$ 和 $E$ 是否相等：
$C$ 的元素是 $1$ 。
$E$ 的元素是集合 $\{1\}$ 。
由于 $1 \neq \{1\}$ ，所以 $C$ 和 $E$ 的元素不同。
因此， $C \neq E$ 。

⚠️ [易错点]

忽略描述方式：初学者可能会因为两个集合看起来不一样（一个列举，一个描述）而认为它们不相等。必须回归到元素本身进行判断。
忽略元素顺序：如示例1所示，顺序是无关的。
判断不相等时，只需一个反例：要证明两个集合不相等，你只需要找到一个在其中一个集合里但不在另一个里的元素即可。而证明它们相等，则需要理论上检查所有可能的元素。

📝 [总结]

此定义确立了集合相等的黄金标准：两个集合相等，当且仅当它们的元素完全相同。这是集合论的“外延公理”，强调了集合的本质在于其包含的元素，而非其名称或描述形式。

🎯 [存在目的]

这个定义至关重要，因为它给了我们一个明确的、无歧义的方法来判断我们所处理的数学对象（集合）何时是“同一个”。没有这个定义，数学将充满混乱，例如，我们将无法确定 $\{1,2\}$ 和 $\{2,1\}$ 是否代表同一个数学实体。它是所有关于集合的证明和推理的基础。

🧠 [直觉心智模型]

成分鉴定模型：想象有两个药瓶，A和B。要判断这两瓶药是不是同一种药，你不会看瓶子的标签或形状，而是会把里面的药片都倒出来，送到实验室去分析成分。
如果化验报告显示，A瓶里的每一种成分，B瓶里都有，而且B瓶里的每一种成分，A瓶里也都有，那这两瓶就是同一种药，即 $A=B$ 。
如果发现A瓶里有一种成分B瓶里没有（或者反过来），那它们就不是同一种药，即 $A \neq B$ 。

💭 [直观想象]

维恩图重合：想象代表集合 $X$ 的圈和代表集合 $Y$ 的圈。
如果 $X=Y$ ，那么在纸上画出来时，这两个圈必须完美地重合在一起，它们的边界和内部区域完全一样。
如果 $X \neq Y$ ，那么这两个圈必然至少有一点点不重合。要么一个圈比另一个大，要么它们有部分交集但不完全重合，要么完全分离。

1. 1.3. 一个基本的集合例子是空集 $\emptyset$ ：

1. 1.4. 定义 1.1.2.

📜 [原文3]

一个集合 $X$ 是空的当且仅当，对于所有 $x, x \notin X$ 。因此 $X$ 没有元素。这在逻辑上意味着 $X$ 由条件“对于所有 $x, x \notin X$ ”唯一指定：空集只有一个，记作 $\emptyset$ 。

📖 [逐步解释]

这个定义引入了一个极其重要但又有些抽象的概念——空集 (Empty Set)。

定义核心：空集的定义非常直接：一个集合是空集，如果它里面不包含任何元素。
形式化语言：对于所有 $x, x \notin X。这句话是对“不包含任何元素”的严格数学翻译。
- 对于所有 $x$ ：对于宇宙中任何一个你能想到的对象 $x$ (无论它是数字1，字母'a'，还是月亮)。
- x \notin X：这个对象 $x$ 都不是集合 $X$ 的元素。
- 换句话说，你永远也找不到一个东西，然后能理直气壮地说：“瞧，这个东西在集合 $X$ 里面！”
唯一性 (Uniqueness)：这是空集的一个关键性质。为什么空集只有一个？
- 根据定义 1.1.1 (外延公理)，两个集合相等当且仅当它们有相同的元素。
- 假设有两个空集，叫 $E_1$ 和 $E_2$ 。
- 根据空集的定义， $E_1$ 没有任何元素， $E_2$ 也没有任何元素。
- 那么，“ $E_1$ 和 $E_2$ 有相同的元素吗？” 这个问题的答案是“是的”，因为它们都没有元素，所以它们的元素集合（都是空的）是一样的。
- 更严格地说，我们需要验证 `对于所有 $x, x \in E_1 \Longleftrightarrow x \in E_2`。因为对于任何$ x $，$ x \in E_1 $是假命题，$ x \in E_2 $也是假命题。在逻辑学中，“假$ \Longleftrightarrow$ 假”是一个真命题。所以，集合相等的条件满足了。
- 因此，任何两个空集都必然相等。所以，宇宙中只存在一个空集。
符号：这个唯一的空集有一个标准符号 $\emptyset$ 。这是一个带斜杠的圆圈，不是希腊字母 $\phi$ (phi)，虽然有时候会混用。也可以用 {} 来表示，即一对内部没有任何东西的花括号。

∑ [公式拆解]

本段的核心是定义，没有复杂的计算公式，但其逻辑推导值得关注。

定义： $X \text{ is empty} \Longleftrightarrow (\forall x, x \notin X)$ 。
唯一性推导：

假设 $E_1$ 和 $E_2$ 都是空集。
根据定义，我们有：
- $\forall x, x \notin E_1$ (即 $\forall x, (x \in E_1)$ 为假)
- $\forall x, x \notin E_2$ (即 $\forall x, (x \in E_2)$ 为假)
根据集合相等的定义，要证明 $E_1 = E_2$ ，我们需要证明 $\forall x, (x \in E_1 \Longleftrightarrow x \in E_2)$ 。
对于任何一个 $x$ ，命题 $x \in E_1$ 是假的，命题 $x \in E_2$ 也是假的。
逻辑命题 P \Longleftrightarrow Q 在 P 和 Q 同为假时，结果为真。
因此，对于任何 $x$ ，(x \in E_1) \Longleftrightarrow (x \in E_2) 这个复合命题是真的。
所以，\forall x, (x \in E_1 \Longleftrightarrow x \in E_2) 成立。
根据定义 1.1.1，我们得出结论 $E_1 = E_2$ 。
这证明了空集是唯一的。

💡 [数值示例]

空集本身就是最具体的例子。但我们可以通过描述法构造一些看起来不同，但实际上都是空集的集合，以体会其唯一性。

示例1： $A = \{x \in \mathbb{Z} : x > 1 \text{ and } x < 1\}$
我们要找一个整数，它既要大于1，又要小于1。这样的整数不存在。所以， $A = \emptyset$ 。

示例2： $B = \{y : y \text{是一个紫色的独角兽}\}$
在现实世界中，不存在紫色的独角兽。所以， $B = \emptyset$ 。
根据空集的唯一性，我们有 $A = B$ 。一个关于数字的集合和一个关于神话生物的集合，只要它们都是空的，它们就是同一个集合！

示例3： $C = \{n \in \mathbb{N} : n + 1 = n\}$
在自然数（或任何标准数集）中，不存在一个数加上1后还等于它自己。所以， $C = \emptyset$ 。

⚠️ [易错点]

$\emptyset$ vs. $\{\emptyset\}$ ：这是一个极其重要的区别，也是初学者最容易混淆的地方。
- $\emptyset$ 是空集，它里面没有任何元素。它的“元素个数”是 0。
- $\{\emptyset\}$ 是一个非空集合，它里面有一个元素，这个元素恰好是空集 $\emptyset$ 。它的“元素个数”是 1。
- 类比： $\emptyset$ 就像一个空钱包，里面一分钱都没有。 $\{\emptyset\}$ 就像一个钱包，里面装着另一个空钱包。这个钱包本身不是空的！
符号混淆：不要将 $\emptyset$ 和数字 $0$ 混为一谈。 $\emptyset$ 是一个集合，而 $0$ 是一个数（它可以是一个集合的元素）。

📝 [总结]

本段定义了空集 $\emptyset$ ，即不包含任何元素的集合。其关键特性是：根据外延公理，空集是唯一的。任何通过描述法定义的、实际上不可能有元素的集合，都是空集 $\emptyset$ 。

🎯 [存在目的]

空集在集合论和整个数学中扮演着类似数字“0”在算术中的角色。它是一个基础构建块，是许多定义和证明的起点或边界情况。例如，在集合运算中，一个集合与空集的交集是空集。在逻辑推理中，“对于空集中的所有元素……”开头的命题（例如“空集中所有的大象都是粉色的”）被认为是“真空真 (vacuously true)”，因为你找不到任何反例。

🧠 [直觉心智模型]

空袋子模型：空集就是那个你还没往里放任何东西的、完全空的袋子。注意，这个空袋子本身是存在的，它不是“无”。
空盒子模型：一个空的珠宝盒。盒子是存在的，但里面没有珠宝。 $\{\emptyset\}$ 则是一个大盒子里装着一个空的珠宝盒。

💭 [直观想象]

维恩图：在代表集合的圈内，没有任何一个点。这个圈圈出的就是一个空无一物的区域。

1. 1.5. 接下来我们定义子集：

1. 1.6. 定义 1.1.3.

📜 [原文4]

设 $X, Y$ 是两个集合。如果对于每一个 $x \in X, x \in Y$ ，则 $X$ 是 $Y$ 的子集或 $X$ 包含于 $Y$ ，记作 $X \subseteq Y$ 。

我们也将其记作 $Y \supseteq X$ （或 $Y$ 包含 $X$ ）。

符号 $X \varsubsetneqq Y$ 或 $X \subset Y$ 有时用来表示 $X \subseteq Y$ 但 $X \neq Y$ 。

（有些人用 $X \subset Y$ 来表示 $X \subseteq Y$ ，但我们将这些符号区分开来。）

📖 [逐步解释]

这个定义引入了集合之间的一种基本关系：子集 (Subset)。

核心思想：如果集合 $X$ 里的每一个元素都可以在集合 $Y$ 中找到，那么我们说 $X$ 是 $Y$ 的一个子集。换句话说， $X$ 的所有东西， $Y$ 都有， $Y$ 可能还有一些 $X$ 没有的东西。
形式化语言：对于每一个 $x \in X, x \in Y$ 。
- 对于每一个 $x \in X$ ：这句话的意思是“我们来检查 $X$ 里的所有元素，一个都不能漏”。
- `x \in Y $`：检查的结果必须是，这个**元素**也存在于$ Y$ 中。
- 这是一个单向的蕴含关系： $x \in X \implies x \in Y$ 。只要你是X的元素，你就必然是Y的元素。
符号与读法：
- X \subseteq Y：
- 读作 “ $X$ 是 $Y$ 的子集” (X is a subset of Y)。
- 或 “ $X$ 包含于 $Y$ ” (X is contained in Y)。
- 符号 \subseteq 像一个拉长的 C 下面加一横，这个横线可以理解为“可以相等”，类似于小于等于号 \leq 下面的横线。
- Y \supseteq X：
- 这是同一个意思的另一种写法，只是主语换了。
- 读作 “ $Y$ 包含 $X$ ” (Y contains X) 或 “ $Y$ 是 $X$ 的超集 (superset)”。
真子集 (Proper Subset)：
- 有时候，我们想强调 $X$ 是 $Y$ 的子集，并且 $X$ 和 $Y$ 不相等（即 $Y$ 至少有一个元素是 $X$ 没有的）。这时我们使用真子集的概念。
- 符号： $X \varsubsetneqq Y$ 或 $X \subset Y$ 。
- \varsubsetneqq 符号很明确，是在 \subseteq 上划掉等号，表示“真子集”。
- \subset 符号存在歧义。本书作者明确指出，在本书中，\subset 就代表真子集。但在其他一些教材或文章里，\subset 可能就是子集 \subseteq 的意思。这是学习数学时需要注意的符号约定问题。本书的约定（区分 \subseteq 和 \subset）是目前更主流的做法，因为它更清晰。

∑ [公式拆解]

子集定义： $X \subseteq Y \Longleftrightarrow (\forall x, (x \in X \implies x \in Y))$
\forall x：对于所有 $x$ 。
x \in X \implies x \in Y：逻辑蕴含。如果“ $x$ 在 $X$ 中”为真，那么“ $x$ 在 $Y$ 中”也必须为真。如果“ $x$ 在 $X$ 中”为假（即 $x \notin X$ ），那么这个蕴含式自动为真，我们无需关心 $x$ 是否在 $Y$ 中。

真子集定义： $X \subset Y \Longleftrightarrow (X \subseteq Y \land X \neq Y)$
\land：逻辑合取，表示“并且 (and)”。
这个定义是说， $X$ 是 $Y$ 的真子集，需要同时满足两个条件：(1) $X$ 是 $Y$ 的子集；(2) $X$ 不等于 $Y$ 。

💡 [数值示例]

示例1 (子集关系)：
令 $A = \{1, 2\}$ 。
令 $B = \{1, 2, 3\}$ 。
令 $C = \{1, 2\}$ 。
$A$ 与 $B$ 的关系： $A$ 的所有元素（1 和 2）都在 $B$ 中。所以 $A \subseteq B$ 。同时， $B$ 中有元素 3 而 $A$ 中没有，所以 $A \neq B$ 。因此， $A$ 也是 $B$ 的真子集， $A \subset B$ 。
$A$ 与 $C$ 的关系： $A$ 的所有元素都在 $C$ 中，并且 $C$ 的所有元素也都在 $A$ 中。所以 $A \subseteq C$ (并且 $C \subseteq A$ ）。因为 $A=C$ ，所以 $A$ 不是 $C$ 的真子集。

示例2 (非子集关系)：
令 $D = \{1, 4\}$ 。
令 $B = \{1, 2, 3\}$ 。
$D$ 与 $B$ 的关系：我们检查 $D$ 的元素。元素 4 在 $D$ 中，但不在 $B$ 中。因此， $D$ 不是 $B$ 的子集，我们记作 $D \not\subseteq B$ 。

示例3 (空集是任何集合的子集)：
令 $E = \emptyset$ 。
令 $B = \{1, 2, 3\}$ 。
$E$ 与 $B$ 的关系：要判断 $E \subseteq B$ 是否成立，我们需要检查“对于 $E$ 中的每一个元素，它是否也在 $B$ 中？”。因为 $E$ (空集) 中没有任何元素，所以这个条件不会被任何元素所违反。这种情况下，我们说这个论述是“真空为真”的。因此， $\emptyset \subseteq B$ 。这个结论对任何集合 $B$ 都成立。

⚠️ [易错点]

$\in$ vs. $\subseteq$ ：这是最常见的混淆。
- \in (属于) 是元素和集合之间的关系。
- \subseteq (包含于) 是两个集合之间的关系。
- 示例：令 $A = \{1, 2\}$ 。
- $1 \in A$ (正确，1是A的元素)。
- $\{1\} \subseteq A$ (正确，只包含1的集合是A的子集)。
- $1 \subseteq A$ (错误，1是一个数，不是集合，不能是另一个集合的子集)。
- $\{1\} \in A$ (错误，集合 $\{1\}$ 并不是 $A$ 的元素。除非 $A$ 被定义为像 $\{\{1\}, 2\}$ 这样)。
任何集合都是其自身的子集：根据定义，对于任何集合 $X$ ，它的每个元素都属于它自己，所以 $X \subseteq X$ 总是成立的。
空集是任何集合的子集：如示例3所示， $\emptyset \subseteq X$ 对于任何集合 $X$ 都成立。这包括 $X$ 本身是空集的情况，即 $\emptyset \subseteq \emptyset$ 。

📝 [总结]

本段定义了集合间的子集关系。 $X \subseteq Y$ 意味着 $X$ 的所有元素也都是 $Y$ 的元素。同时，它区分了允许相等的子集( $\subseteq$ )和不允许相等的真子集( $\subset$ )，并明确了本书中将要使用的符号约定。

🎯 [存在目的]

子集关系是组织和比较集合的基本工具。它建立了集合之间的层次结构，这在数学中无处不在。例如，自然数是整数的子集，整数是有理数的子集，等等。集合相等的定义（定义1.1.1）也可以通过子集关系来重新表述： $X=Y$ 当且仅当 $X \subseteq Y$ 并且 $Y \subseteq X$ 。这个“双向包含”的证明方法是证明两个集合相等的标准技巧。

🧠 [直觉心智模型]

套娃模型：如果集合 $X$ 是集合 $Y$ 的子集，你可以想象 $X$ 是一个小套娃，而 $Y$ 是一个能把它完整套住的大套娃。
子集 \subseteq：小套娃可以和外面的套娃一样大。
真子集 \subset：小套娃必须比外面的套娃小。

💭 [直观想象]

维恩图：如果 $X \subseteq Y$ ，那么代表 $X$ 的圈必须完全位于代表 $Y$ 的圈的内部或与它重合。
$X \subseteq Y$ ：
$X \subset Y$ (真子集)： $X$ 的圈必须在 $Y$ 圈的内部，且不能与 $Y$ 的边界重合，即 $Y$ 圈内必须有一部分区域在 $X$ 圈外。

1. 1.7. 备注 1.1.4.

📜 [原文5]

(i) $X \subseteq X$ 且 $\emptyset \subseteq X$ 。 $X$ 的子集 $A$ 称为真子集如果 $A \neq X$ 。

(ii) 根据集合相等的定义， $X=Y \Longleftrightarrow X \subseteq Y$ 且 $Y \subseteq X$ 。如果 $X \subseteq Y$ 且 $Y \subseteq Z$ ，则 $X \subseteq Z$ ；这称为传递性。

(iii) 如果 $x \in X$ （因此特别是 $X \neq \emptyset$ ），则 $\{x\} \subseteq X$ 。形式为 $\{x\}$ 的 $X$ 的子集称为单元素子集或单例子集。

📖 [逐步解释]

这段备注总结并强调了子集关系的一些基本且重要的性质。

(i) 两个特殊的子集

X \subseteq X：任何一个集合都是它自身的子集。这很容易理解，因为 $X$ 中的每个元素显然都在 $X$ 中。这被称为子集关系的自反性 (Reflexivity)。
\emptyset \subseteq X：空集是任何集合 $X$ 的子集。这个事实我们之前讨论过。因为空集中没有元素，所以“空集中的所有元素都在 $X$ 中”这个命题永远不会被证伪，因此它是真的。
真子集 (Proper Subset) 的再次强调：这里重申了真子集的定义，即 $A$ 是 $X$ 的一个子集，但 $A$ 不等于 $X$ 。这意味着 $X$ 中至少有一个元素不属于 $A$ 。

(ii) 子集与相等、传递性

X=Y \Longleftrightarrow X \subseteq Y \text{ 且 } Y \subseteq X：这是证明两个集合相等的标准策略，非常非常重要。要证明 $X$ 和 $Y$ 相等，你需要分两步：

第一步 (证明 $X \subseteq Y$ )：任取一个 $X$ 中的元素，证明它也一定在 $Y$ 中。
第二步 (证明 $Y \subseteq X$ )：任取一个 $Y$ 中的元素，证明它也一定在 $X$ 中。
- 完成这两步后，你就可以根据这个性质断定 $X=Y$ 。这个方法被称为“双向包含证明法”。

如果 X \subseteq Y 且 Y \subseteq Z，则 X \subseteq Z：这叫做传递性 (Transitivity)。
逻辑推导：

$X \subseteq Y$ 意味着：如果 $a \in X$ ，那么 $a \in Y$ 。
$Y \subseteq Z$ 意味着：如果 $a \in Y$ ，那么 $a \in Z$ 。
现在，我们把这两条链条接起来：任取一个元素 $a \in X$ 。根据(1)，我们知道 $a \in Y$ 。既然 $a \in Y$ ，再根据(2)，我们知道 $a \in Z$ 。
因此，我们证明了“如果 $a \in X$ ，那么 $a \in Z$ ”。这正是 $X \subseteq Z$ 的定义。

(iii) 单元素子集

如果 x \in X，则 \{x\} \subseteq X：这再次区分了元素和集合。
$x$ 是一个元素。
$\{x\}$ 是一个集合，它只有一个元素，就是 $x$ 。
因为 $\{x\}$ 的唯一元素 $x$ 本身就在 $X$ 里面，所以根据子集的定义，集合 $\{x\}$ 是集合 $X$ 的子集。
单元素子集 (Singleton Subset) / 单例子集：这是对形如 $\{x\}$ 的子集的专门命名。

💡 [数值示例]

示例1 (双向包含证明相等)：
令 $A = \{n \in \mathbb{Z} : n \text{ 是偶数且 } 0 < n < 6\}$ 。
令 $B = \{2, 4\}$ 。
证明 $A=B$ ：

证明 $A \subseteq B$ ： $A$ 中的元素是大于0小于6的偶数，只有 2 和 4。这两个元素都在 $B$ 中。所以 $A \subseteq B$ 。
证明 $B \subseteq A$ ： $B$ 中的元素是 2 和 4。2 是大于0小于6的偶数，所以 $2 \in A$ 。4 也是大于0小于6的偶数，所以 $4 \in A$ 。 $B$ 的所有元素都在 $A$ 中。所以 $B \subseteq A$ 。
因为 $A \subseteq B$ 且 $B \subseteq A$ ，所以 $A=B$ 。

示例2 (传递性)：
令 $X = \{ \text{猫} \}$ 。
令 $Y = \{ \text{猫}, \text{狗} \}$ (所有哺乳动物的子集)。
令 $Z = \{ \text{猫}, \text{狗}, \text{鸟} \}$ (所有动物的子集)。
我们有 $X \subseteq Y$ (猫是哺乳动物)。
我们有 $Y \subseteq Z$ (哺乳动物是动物)。
因此，根据传递性， $X \subseteq Z$ (猫是动物)。

示例3 (单元素子集)：
令 $X = \{a, b, c\}$ 。
$a$ 是 $X$ 的一个元素 ( $a \in X$ )。
$\{a\}$ 是 $X$ 的一个单元素子集 ( $\{a\} \subseteq X$ )。
同理， $\{b\} \subseteq X$ 和 $\{c\} \subseteq X$ 。
$X$ 的所有子集是： $\emptyset, \{a\}, \{b\}, \{c\}, \{a, b\}, \{a, c\}, \{b, c\}, \{a, b, c\}$ 。

⚠️ [易错点]

双向包含证明的必要性：在复杂的证明中，很容易只证明了单向的包含关系（比如 $A \subseteq B$ ）就误以为证明了相等。必须时刻提醒自己检查两个方向。
真子集的传递性：如果 $X \subset Y$ 且 $Y \subset Z$ ，那么一定有 $X \subset Z$ 。因为 $Y$ 比 $X$ “大”， $Z$ 比 $Y$ “大”，所以 $Z$ 一定比 $X$ “大”。
单元素子集与元素：再次强调， $x$ 和 $\{x\}$ 的区别。

📝 [总结]

该备注总结了子集关系的三个核心性质：

(i) 任何集合都是自身的子集，空集是任何集合的子集。

(ii) 集合相等等价于双向包含，且子集关系具有传递性。

(iii) 包含单个元素的集合被称为单元素子集。

🎯 [存在目的]

这些性质是使用子集关系进行数学推理的基本工具。特别是“双向包含证明相等”和“传递性”，它们是集合相关证明中不可或缺的逻辑步骤。明确这些性质可以使论证过程更加清晰和严谨。

🧠 [直觉心智模型]

(ii) 证明相等：想象天平。要证明物体A和物体B重量相等，一个标准方法是：先把A放左边B放右边，天平平衡；再把B放左边A放右边，天平还平衡。这就证明它们相等了。“双向包含”就像这样，从两个方向进行比较，确保完全对等。
(ii) 传递性：这就像家庭辈分。如果“你是你父亲的儿子”（子集），“你父亲是他爷爷的孙子”（子集），那么结论就是“你是你爷爷的曾孙”（子集）。这是一个自然的逻辑链条。

💭 [直观想象]

(ii) 传递性：用维恩图想象。 $X$ 的圈在 $Y$ 的圈里面，而 $Y$ 的圈又在 $Z$ 的圈里面。那么显而易见， $X$ 的圈一定在 $Z$ 的圈里面。

1. 1.8. 我们将处理的许多集合都是有限集：

1. 1.9. 定义 1.1.5.

📜 [原文6]

形式为 $X=\left\{x_{1}, \ldots, x_{n}\right\}$ 的集合是有限集。如果对于所有 $i, j$ 且 $1 \leq i, j \leq n$ ，我们有 $x_{i} \neq x_{j}$ ，则我们记作 $\#(X)=n$ 。根据逻辑或约定， $\emptyset$ 是有限的，且 $\#(\emptyset)=0$ 。反之，如果 $X$ 是一个（有限）集合且 $\#(X)=0$ ，则 $X=\emptyset$ 。形式为 $\{x\}$ 的集合恰好有一个元素。特别是， $\{\emptyset\}$ 有一个单元素，即 $\emptyset$ ，因此 $\{\emptyset\} \neq \emptyset$ 。同样地， $\#(\{\emptyset,\{\emptyset\}\})=2$ 。

如果一个集合不是有限的，则它是无限的。（有些人使用 $\#(X)=\infty$ 来表示 $X$ 是无限的，但我宁愿避免使用这个符号，因为符号 $\infty$ 并不是衡量无限集大小的明确方法。）

📖 [逐步解释]

这个定义引入了有限集 (Finite Set) 和无限集 (Infinite Set) 的概念，并定义了衡量有限集大小的基数 (Cardinality) 符号。

有限集的直观定义：一个集合是有限的，如果我们可以（至少在理论上）把它所有的元素一个一个地数完。定义中 X = {x_1, ..., x_n} 的形式就表达了这个“可以数完”的意思，数到第 n 个就结束了。
基数 (Cardinality)：
- 符号：#(X) 或 |X| 都是常用符号，表示集合 X 的基数，即其中元素的个数。
- 前提条件：在计算个数时，必须保证元素都是互不相同的。如果对于所有 i, j 且 1 <= i, j <= n，我们有 x_i != x_j 这句话，其实是在强调集合的互异性。如果列表里有重复，我们得先去掉重复的再数。例如，集合 {1, 2, 2, 3} 的基数是 3，而不是 4。
- 如果元素互不相同，那么一个包含 n 个元素的有限集的基数就是 n。
空集的基数：
- 根据约定，空集 $\emptyset$ 是一个有限集。
- 因为它没有任何元素，所以它的基数是 0，即 $\#(\emptyset) = 0$ 。
- 反过来也成立：如果一个有限集的基数是0，那它必然是空集。
重要示例的澄清：
- \{x\}：单元素子集，里面只有一个元素 $x$ ，所以它的基数是1，#(\{x\}) = 1。
- \{\emptyset\}：这个集合不是空的！它包含一个元素，这个元素就是空集 $\emptyset$ 。所以，\#(\{\emptyset\}) = 1。这再次强调了 \emptyset 和 \{\emptyset\} 的天壤之别。
- \#(\{\emptyset,\{\emptyset\}\}) = 2：这个集合里有两个元素。第一个元素是 \emptyset，第二个元素是 \{\emptyset\}。这两个元素本身是不同的，所以基数是2。
无限集 (Infinite Set)：
- 定义很简单：不是有限集的集合就是无限集。这意味着你永远也数不完它的元素。
- 关于无穷符号 $\infty$ 的警告：作者不建议用 \#(X) = \infty 来表示无限集。这是一个很重要的观点。因为无限集和无限集的大小（或“浓度”）是可以不同的。例如，整数集是无限的，实数集也是无限的，但实数要比整数“多得多”。用同一个符号 $\infty$ 会掩盖这种区别。更高级的集合论会引入像 \aleph_0 (阿列夫零) 和 \mathfrak{c} (连续统) 这样的超穷基数来区分不同大小的无穷。

💡 [数值示例]

示例1 (有限集基数)：
$A = \{a, b, c, d\}$ 。这是一个有限集，元素互不相同。所以 $\#(A) = 4$ 。
$B = \{1, 3, 5, 7, 9\}$ 。这是一个有限集。 $\#(B) = 5$ 。
$C = \{1, 1, 2, 2, 3\}$ 。列表里有重复元素。这个集合实际上是 $\{1, 2, 3\}$ 。所以 $\#(C) = 3$ 。

示例2 (空集和包含空集的集合)：
$X = \emptyset$ 。 $\#(X) = 0$ 。
$Y = \{\emptyset\}$ 。 $\#(Y) = 1$ 。
$Z = \{\emptyset, \{\emptyset\}\}$ 。 $\#(Z) = 2$ 。
$W = \{\emptyset, \{\emptyset\}, \{\emptyset, \{\emptyset\}\}\}$ 。这是一个包含三个元素的集合。 $\#(W) = 3$ 。

示例3 (无限集)：
$\mathbb{N} = \{1, 2, 3, \dots\}$ (自然数集) 是一个无限集。
$\mathbb{Z} = \{\dots, -1, 0, 1, \dots\}$ (整数集) 是一个无限集。
$P = \{p : p \text{ 是一个质数}\}$ (质数集) 是一个无限集。

⚠️ [易错点]

计算基数时忘记互异性：这是最常见的计算错误。一定要先确认集合里没有重复元素再计数。
混淆 $\emptyset$ 和 $\{\emptyset\}$ ：再次强调，前者是空的，基数为0；后者非空，基数为1。
对无限的误解：认为所有“无穷”都一样大。作者的提醒非常关键，这是通往更深层次数学的第一个路口。

📝 [总结]

本段定义了有限集和无限集，并引入了表示有限集元素个数的基数符号 #(X)。通过一系列关于空集的例子，澄清了集合、元素和基数之间的关系，并对使用无穷符号 \infty 表达无限集基数的局限性提出了告诫。

🎯 [存在目的]

区分有限与无限是数学中的一个根本性分界。许多在有限集上显而易见的定理，在无限集上可能不成立，或者需要更复杂的证明。定义基数为后续的组合数学、概率论以及更高级的集合论提供了基础。没有“多少”这个概念，很多数学分支都无法开展。

🧠 [直觉心智模型]

数豆子模型：
有限集：给你一碗豆子，你可以一颗一颗地数，最终能得到一个确定的总数。这个总数就是基数。
无限集：给你一个神奇的豆子碗，你每拿走一颗，碗里又会变出一颗，你永远也数不完。
基数就是“集合有多大”的官方量度。

💭 [直观想象]

想象一条数轴。
有限集 {1, 5, 10} 就是数轴上孤立的三个点。
无限集 $\mathbb{N}$ (自然数集) 就是从1开始，向右延伸的、无穷无尽的一系列离散的点。
无限集 $[0, 1]$ (闭区间) 则是数轴上从0到1的一整段实线，包含了无限多的点，而且这些点是“连续”的，比自然数的点要“密集”得多。这直观地展示了为什么不是所有无穷都一样。

1. 1.10. 最后，我们收集一些将在本书中使用的标准数集符号：

📜 [原文7]

(i) $\mathbb{N}$ 是自然数集：

\mathbb{N}=\{1,2,3, \ldots\}

（有些人允许 0 是自然数，但这不是本文的约定。）

(ii) $\mathbb{Z}$ 是整数集：

\mathbb{Z}=\{\ldots,-3,-2,-1,0,1,2,3, \ldots\}

(iii) $\mathbb{Q}$ 是有理数集。一个有理数 $a / b$ 写成整数 $a, b$ 的商，其中 $b \neq 0$ ，且两个商 $a / b$ 和 $c / d$ 定义相同的有理数 $\Longleftrightarrow a d=b c$ 。一个有理数有一个“最佳描述”形式 $a / b$ ，其中 $b>0$ 且 $a, b$ 没有公因子（我们说 $a / b$ 是最简形式）。我们稍后会回到这一点。

(iv) $\mathbb{R}$ 是实数集。集合 $\mathbb{R}$ 不是代数定义的，所以我们在此不讨论它的构造。

(v) $\mathbb{C}$ 是复数集。我们稍后会回到 $\mathbb{C}$ 的性质。

📖 [逐步解释]

这段话的作用相当于一个“符号速查表”，列举了在数学中广泛使用的几个基本数集，并对它们做了简要说明。这些符号（ $\mathbb{N}, \mathbb{Z}, \mathbb{Q}, \mathbb{R}, \mathbb{C}$ ）是数学家之间的“黑话”，必须熟记。它们通常用一种特殊的“黑板粗体 (blackboard bold)”字体书写。

(i) 自然数集 $\mathbb{N}$ (Natural Numbers)

定义： $\mathbb{N}$ 就是我们从小学习数数时用的数：1, 2, 3, 4, ... 一直延续下去。它们是正整数。
关于0的约定：作者特别指出，本书不认为 0 是自然数。这是一个非常重要的约定！在不同的数学领域或国家，这个约定是不同的。
在数论中，通常 $\mathbb{N} = \{1, 2, 3, \dots\}$ 。
在集合论、逻辑学和计算机科学中，通常 $\mathbb{N} = \{0, 1, 2, \dots\}$ 。
为了避免歧义，有时人们会用 $\mathbb{Z}^+$ 或 $\mathbb{N}^*$ 表示 $\{1, 2, 3, \dots\}$ ，用 $\mathbb{N}_0$ 或 $\mathbb{W}$ (whole numbers) 表示 $\{0, 1, 2, \dots\}$ 。
关键：在阅读任何一本数学书时，都要先搞清楚作者对 $\mathbb{N}$ 的定义。

(ii) 整数集 $\mathbb{Z}$ (Integers)

定义： $\mathbb{Z}$ 在自然数的基础上，增加了 0 和所有的负整数。字母 Z 来自德语的“Zahlen”，意为“数”。
它包含了自然数集： $\mathbb{N} \subset \mathbb{Z}$ 。

(iii) 有理数集 $\mathbb{Q}$ (Rational Numbers)

定义： $\mathbb{Q}$ 是所有可以表示成两个整数之商（分数）的数。字母 Q 来自英语的“Quotient”，意为“商”。
形式化定义： $\mathbb{Q} = \{ \frac{a}{b} \mid a \in \mathbb{Z}, b \in \mathbb{Z}, b \neq 0 \}$ 。分母不能为0是铁律。
相等性问题：一个有理数可以有多种分数表示形式。例如， $\frac{1}{2}$ , $\frac{2}{4}$ , $\frac{-5}{-10}$ 都代表同一个有理数。定义 a/b = c/d \Longleftrightarrow ad = bc 给出了判断两个分数是否相等的精确方法（交叉相乘法）。这实际上是在定义一个“等价关系”，有理数是所有等价分数所组成的“等价类”。
最简形式 (Simplest Form)：在众多表示中，通常我们偏爱“最简形式”，即分母为正数，且分子分母没有除1以外的公因子（即它们互质）。例如， $\frac{1}{2}$ 就是有理数 $0.5$ 的最简形式。

(iv) 实数集 $\mathbb{R}$ (Real Numbers)

定义： $\mathbb{R}$ 包括了所有有理数和无理数（如 $\sqrt{2}, \pi, e$ 等）。直观上，它填满了整条数轴，没有任何“空隙”。
构造的复杂性：作者提到 $\mathbb{R}$ 的定义不是代数的。这是因为它无法像有理数那样简单地通过整数的加减乘除得到。 $\mathbb{R}$ 的严格构造需要用到更高等的分析工具，比如“戴德金分割 (Dedekind cuts)”或“柯西序列 (Cauchy sequences)”，这些内容属于数学分析的范畴。

(v) 复数集 $\mathbb{C}$ (Complex Numbers)

定义： $\mathbb{C}$ 在实数的基础上，引入了虚数单位 $i$ ，其中 $i^2 = -1$ 。任何一个复数都可以写成 $a+bi$ 的形式，其中 $a, b$ 都是实数。 $a$ 称为实部， $b$ 称为虚部。
几何表示：复数可以被看作二维平面（复平面）上的点，这使得代数和几何有了深刻的联系。

∑ [公式拆解]

\mathbb{N}=\{1,2,3, \ldots\}

\mathbb{N}: 自然数集的符号。
{...}: 集合的列举法表示。
1, 2, 3: 列举出的元素。
\ldots (省略号): 表示按照已经建立的模式（每次加1）无限延续下去。

\mathbb{Z}=\{\ldots,-3,-2,-1,0,1,2,3, \ldots\}

\mathbb{Z}: 整数集的符号。
\ldots (两边的省略号): 表示向正负两个方向无限延伸。

💡 [数值示例]

自然数 $\mathbb{N}$ : $5, 100, 2024$ 都是自然数。根据本书约定, $0, -3, 1.5$ 都不是自然数。
整数 $\mathbb{Z}$ : $-50, 0, 42$ 都是整数。 $1/2, \sqrt{2}$ 都不是整数。
有理数 $\mathbb{Q}$ :
$0.5 = \frac{1}{2}$ 是有理数。
$-3 = \frac{-3}{1}$ 是有理数 (所有整数都是有理数)。
$0.333\dots = \frac{1}{3}$ 是有理数 (所有有限小数和无限循环小数都是有理数)。
$\sqrt{2} \approx 1.41421356\dots$ (无限不循环小数) 不是有理数，它是无理数。
实数 $\mathbb{R}$ : $7, -2.5, \frac{1}{3}, \pi$ 都是实数。
复数 $\mathbb{C}$ : $2+3i, 5 (=5+0i), -i (=0-1i)$ 都是复数。

⚠️ [易错点]

$\mathbb{N}$ 的定义：始终注意 0 是否被包含。
有理数的相等性：不要仅仅因为两个分数长得不一样就认为它们是不同的有理数。必须通过交叉相乘来检验。 $\frac{2}{4}$ 和 $\frac{1}{2}$ 是同一个有理数。
集合的包含关系：这些数集形成了一个清晰的子集链：

$\mathbb{N} \subset \mathbb{Z} \subset \mathbb{Q} \subset \mathbb{R} \subset \mathbb{C}$

📝 [总结]

本段定义了五个基本的标准数集符号： $\mathbb{N}$ (自然数), $\mathbb{Z}$ (整数), $\mathbb{Q}$ (有理数), $\mathbb{R}$ (实数), 和 $\mathbb{C}$ (复数)。它简要说明了每个集合的构成和关键性质，并特别强调了不同教材对自然数定义可能存在的差异。

🎯 [存在目的]

这部分内容是为了“统一语言”。在后续的讨论中，作者会频繁地使用这些符号，而不再每次都解释它们的含义。提前定义好这些符号，可以使行文更简洁，也确保读者和作者在同一个频道上交流。

🧠 [直觉心智模型]

俄罗斯套娃模型：想象一套代表数集的俄罗斯套娃。
最小的娃娃是 $\mathbb{N}$ (自然数)。
能套住 $\mathbb{N}$ 的是 $\mathbb{Z}$ (整数)，它比 $\mathbb{N}$ 多了0和负数。
能套住 $\mathbb{Z}$ 的是 $\mathbb{Q}$ (有理数)，它在整数之间填充了所有的分数。
能套住 $\mathbb{Q}$ 的是 $\mathbb{R}$ (实数)，它把分数之间的“缝隙”也用无理数填满了。
最大的娃娃是 $\mathbb{C}$ (复数)，它在实数轴的基础上增加了一个虚数轴，构成了一个平面。

💭 [直观想象]

数轴的演化：

$\mathbb{N}$ : 在一条射线上，从1开始，每隔一段距离标一个点 (1, 2, 3, ...)。
$\mathbb{Z}$ : 把上面的射线变成一条直线，向左边也标上点 (-1, -2, ...) 和原点 (0)。此时数轴上还是一堆离散的点。
$\mathbb{Q}$ : 在这些整数点之间，疯狂地加入分数点，比如 1/2, -3/4 等。你会发现这些点变得非常密集，任何两个点之间都能再找到一个点。但即使如此，数轴上仍然有无数的“针孔”，这些就是无理数的位置。
$\mathbb{R}$ : 把这些“针孔”全部补上，形成一条连续不断的、完美的直线。
$\mathbb{C}$ : 在这条直线的基础上，增加一条与之垂直穿过原点的虚数轴，构成一个二维平面。

21.2. 2. 从旧集合构造新集合 New sets from old

1. 2.1. 回忆集合的标准运算：

1. 2.2. 定义 1.2.1.

📜 [原文8]

如果 $X_{1}$ 和 $X_{2}$ 是两个集合，则：

(i) $X_{1}$ 和 $X_{2}$ 的并集是集合

X_{1} \cup X_{2}=\left\{x: x \in X_{1} \text { 或 } x \in X_{2}\right\} .

因此 $X_{1} \subseteq\left(X_{1} \cup X_{2}\right)$ 且 $X_{2} \subseteq\left(X_{1} \cup X_{2}\right)$ 。有限多个集合的并集也类似定义：如果 $X_{1}, \ldots, X_{n}$ 是集合，则

\bigcup_{i=1}^{n} X_{i}=\left\{x: \text { 对于某个 } i, x \in X_{i}\right\}

根据这些定义，我们有：对于所有集合 $X_{1}, X_{2}, X_{3}$ ，

\begin{gathered} X_{1} \cup X_{2}=X_{2} \cup X_{1} \\ \left(X_{1} \cup X_{2}\right) \cup X_{3}=X_{1} \cup X_{2} \cup X_{3}=X_{1} \cup\left(X_{2} \cup X_{3}\right) . \end{gathered}

📖 [逐步解释]

本节开始介绍如何通过已有的集合来创建新的集合。第一种方法是并集 (Union)。

并集的核心思想：把两个（或多个）集合的所有元素“合并同类项”，汇集到一个新的大集合中。一个东西只要在任何一个原始集合里出现过，它就会被包含在新集合里。
定义与符号：
- X_1 \cup X_2：读作 “ $X_1$ 并 $X_2$ ” (X1 union X2)。符号 \cup 像一个杯子，把所有东西都装起来。
- 形式化定义：\{x : x \in X_1 或 x \in X_2\}。
- x \in X_1 或 x \in X_2：“或 (or)” 在数学和逻辑中是包含性或 (inclusive or)，意思是 “只要满足其中一个条件就行，两个都满足当然也行”。所以，如果一个元素 $x$ 同时在 $X_1$ 和 $X_2$ 中，它当然也属于并集。
并集的基本性质：
- X_1 \subseteq (X_1 \cup X_2) 和 X_2 \subseteq (X_1 \cup X_2)：这是显然的。因为并集包含了 $X_1$ 的所有元素，所以 $X_1$ 是并集的子集。同理 $X_2$ 也是。并集是包含所有原始集合的“最小”集合。
推广到多个集合：
- \bigcup_{i=1}^{n} X_i：这是对多个集合求并集的紧凑写法。读作 “从 $i=1$ 到 $n$ 的 $X_i$ 的并集”。
- \{x : 对于某个 i, x \in X_i\}： इसका意思是，只要 $x$ 至少是 $X_1, X_2, \dots, X_n$ 中某一个集合的元素，它就属于这个大的并集。
并集的运算定律：
- X_1 \cup X_2 = X_2 \cup X_1：交换律 (Commutative Law)。求并集的顺序不重要，就像 $2+3=3+2$ 一样。
- (X_1 \cup X_2) \cup X_3 = X_1 \cup (X_2 \cup X_3)：结合律 (Associative Law)。当有多个集合求并集时，先算哪两个无所谓，就像 $(2+3)+4 = 2+(3+4)$ 一样。正因为有结合律，我们才能放心地写 X_1 \cup X_2 \cup X_3 而不用加括号。

∑ [公式拆解]

X_{1} \cup X_{2}=\left\{x: x \in X_{1} \text { 或 } x \in X_{2}\right\}

X_1 \cup X_2: 正在定义的新集合，即并集。
{...}: 集合的描述法。
x: 代表新集合中任意一个元素。
:: 使得。
x \in X_1 \text{ 或 } x \in X_2: 元素 $x$ 必须满足的条件。这里的“或”是逻辑或，用符号 \lor 表示，即 (x \in X_1) \lor (x \in X_2)。

\bigcup_{i=1}^{n} X_{i}=\left\{x: \text { 对于某个 } i, x \in X_{i}\right\}

\bigcup_{i=1}^{n}: 并集的大符号。下标 i=1 表示索引从1开始，上标 n 表示索引到n结束。
X_i: 代表第 $i$ 个集合 ( $X_1, X_2, \dots$ )。
对于某个 i, x \in X_i: 这等价于 \exists i \in \{1, \dots, n\}, x \in X_i，其中 \exists 是存在量词，读作“存在一个”。整个条件的意思是 “存在至少一个 $i$ (在1到n之间)，使得 $x$ 是集合 $X_i$ 的元素”。

\begin{gathered} X_{1} \cup X_{2}=X_{2} \cup X_{1} \\ \left(X_{1} \cup X_{2}\right) \cup X_{3}=X_{1} \cup X_{2} \cup X_{3}=X_{1} \cup\left(X_{2} \cup X_{3}\right) . \end{gathered}

这两行是并集运算的交换律和结合律，它们是集合代数的基本法则，可以从定义直接推出。例如，因为逻辑上的“或”满足交换律（P \lor Q 等价于 Q \lor P），所以集合并集也满足交换律。

💡 [数值示例]

示例1 (两个集合的并集)：
令 $A = \{1, 2, 3\}$ 。
令 $B = \{3, 4, 5\}$ 。
$A \cup B = \{x : x \in A \text{ 或 } x \in B\}$
我们把 $A$ 的元素都放进来： $\{1, 2, 3\}$ 。
再把 $B$ 的元素都放进来： $\{3, 4, 5\}$ 。
合并起来是 $\{1, 2, 3, 3, 4, 5\}$ 。
根据集合的互异性，去掉重复的元素 3。
最终结果： $A \cup B = \{1, 2, 3, 4, 5\}$ 。

示例2 (多个集合的并集)：
令 $X_1 = \{a, b\}$ 。
令 $X_2 = \{b, c\}$ 。
令 $X_3 = \{c, d\}$ 。
$\bigcup_{i=1}^{3} X_i = X_1 \cup X_2 \cup X_3$ 。
合并所有元素，得到 $\{a, b, b, c, c, d\}$ 。
去重后得到 $\{a, b, c, d\}$ 。

示例3 (一个集合是另一个的子集)：
令 $C = \{1, 2\}$ 。
令 $D = \{1, 2, 3, 4\}$ 。
显然 $C \subseteq D$ 。
$C \cup D = \{1, 2, 1, 2, 3, 4\} = \{1, 2, 3, 4\} = D$ 。
结论：如果 $C \subseteq D$ ，那么 $C \cup D = D$ 。

⚠️ [易错点]

忘记去重：合并后必须去掉重复的元素，这是集合互异性的要求。
与交集混淆：“并集”是“或”的关系，取所有出现过的元素；“交集”是“且”的关系，只取共同拥有的元素。
与空集求并集：任何集合 $X$ 与空集 $\emptyset$ 的并集都是它自身。 $X \cup \emptyset = X$ 。因为空集没有提供任何新的元素。
与自身求并集： $X \cup X = X$ 。

📝 [总结]

本段定义了集合的并集运算 ( $\cup$ )，即创建一个包含所有原始集合中出现过的元素的新集合。并集运算满足交换律和结合律。

🎯 [存在目的]

并集是构造更复杂的集合的基本操作之一。它在数学的许多领域都有应用，例如：

在概率论中，两个事件的并集代表“事件A发生或事件B发生”，计算其概率是基本问题。
在拓扑学中，开集的并集仍然是开集，这是拓扑空间的核心性质之一。
在数据库查询中，UNION 操作就是集合并集的直接应用。

🧠 [直觉心智模型]

派对合并模型：想象有两个派对，A派对的宾客名单是 $X_1$ ，B派对的宾客名单是 $X_2$ 。现在要举办一个联合大派对，新的宾客名单 $X_1 \cup X_2$ 就是把两份名单上的人都请来。如果有人同时在两份名单上（比如张三），他只需要一张请柬，在新名单里只出现一次。

💭 [直观想象]

维恩图：如果用两个圈分别代表集合 $X_1$ 和 $X_2$ 。
它们的并集 $X_1 \cup X_2$ 就是两个圈所覆盖的全部区域，包括它们重叠的部分。

1. 2.3. 定义 1.2.1. (续)

📜 [原文9]

(ii) $X_{1}$ 和 $X_{2}$ 的交集是：

X_{1} \cap X_{2}=\left\{x: x \in X_{1} \text { 且 } x \in X_{2}\right\}

因此 $\left(X_{1} \cap X_{2}\right) \subseteq X_{1}$ 且 $\left(X_{1} \cap X_{2}\right) \subseteq X_{2}$ 。同样地

\bigcap_{i=1}^{n} X_{i}=\left\{x: \text { 对于所有 } i, x \in X_{i}\right\}

如 (i) 所示，对于所有集合 $X_{1}, X_{2}, X_{3}$ ，

\begin{gathered} X_{1} \cap X_{2}=X_{2} \cap X_{1} \\ \left(X_{1} \cap X_{2}\right) \cap X_{3}=X_{1} \cap X_{2} \cap X_{3}=X_{1} \cap\left(X_{2} \cap X_{3}\right) . \end{gathered}

📖 [逐步解释]

本节介绍第二种集合基本运算：交集 (Intersection)。

交集的核心思想：只保留那些在所有原始集合中都出现过的公共元素，形成一个新的集合。
定义与符号：
- X_1 \cap X_2：读作 “ $X_1$ 交 $X_2$ ” (X1 intersect X2)。符号 \cap 像一个倒过来的杯子或一座桥，连接着两个集合的公共部分。
- 形式化定义：\{x : x \in X_1 且 x \in X_2\}。
- x \in X_1 且 x \in X_2：“且 (and)” 在这里是关键。一个元素要被选入交集，它必须同时满足是 $X_1$ 的元素和是 $X_2$ 的元素这两个条件，缺一不可。
交集的基本性质：
- (X_1 \cap X_2) \subseteq X_1 和 (X_1 \cap X_2) \subseteq X_2：这是显然的。因为交集中的每个元素都属于 $X_1$ ，所以交集是 $X_1$ 的子集。同理，它也是 $X_2$ 的子集。交集是“包含于”所有原始集合的“最大”集合。
推广到多个集合：
- \bigcap_{i=1}^{n} X_i：对多个集合求交集的紧凑写法。读作 “从 $i=1$ 到 $n$ 的 $X_i$ 的交集”。
- \{x : 对于所有 i, x \in X_i\}：它的意思是，一个元素 $x$ 要想属于这个大交集，它必须是 $X_1, X_2, \dots, X_n$ 每一个集合的元素，一个都不能少。
交集的运算定律：
- X_1 \cap X_2 = X_2 \cap X_1：交换律 (Commutative Law)。求交集的顺序不重要。
- (X_1 \cap X_2) \cap X_3 = X_1 \cap (X_2 \cap X_3)：结合律 (Associative Law)。求多个集合的交集时，先后顺序无所谓。因此我们可以简写为 X_1 \cap X_2 \cap X_3。

∑ [公式拆解]

X_{1} \cap X_{2}=\left\{x: x \in X_{1} \text { 且 } x \in X_{2}\right\}

X_1 \cap X_2: 正在定义的新集合，即交集。
x: 代表新集合中任意一个元素。
:: 使得。
x \in X_1 \text{ 且 } x \in X_2: 元素 $x$ 必须满足的条件。这里的“且”是逻辑与，用符号 \land 表示，即 (x \in X_1) \land (x \in X_2)。

\bigcap_{i=1}^{n} X_{i}=\left\{x: \text { 对于所有 } i, x \in X_{i}\right\}

\bigcap_{i=1}^{n}: 交集的大符号。
对于所有 i, x \in X_i: 这等价于 \forall i \in \{1, \dots, n\}, x \in X_i，其中 \forall 是全称量词，读作“对于所有”。整个条件的意思是 “对于从1到n的每一个 $i$ ， $x$ 都必须是集合 $X_i$ 的元素”。

\begin{gathered} X_{1} \cap X_{2}=X_{2} \cap X_{1} \\ \left(X_{1} \cap X_{2}\right) \cap X_{3}=X_{1} \cap X_{2} \cap X_{3}=X_{1} \cap\left(X_{2} \cap X_{3}\right) . \end{gathered}

这两行是交集运算的交换律和结合律。它们源于逻辑“与”运算同样满足这些定律。

💡 [数值示例]

示例1 (两个集合的交集)：
令 $A = \{1, 2, 3\}$ 。
令 $B = \{3, 4, 5\}$ 。
$A \cap B = \{x : x \in A \text{ 且 } x \in B\}$
我们来检查 $A$ 的元素：
1 在 $A$ 中，但不在 $B$ 中。不选。
2 在 $A$ 中，但不在 $B$ 中。不选。
3 在 $A$ 中，也在 $B$ 中。选中！
我们再检查 $B$ 的元素（其实检查完一个就行了）：
4 在 $B$ 中，但不在 $A$ 中。不选。
5 在 $B$ 中，但不在 $A$ 中。不选。
最终结果： $A \cap B = \{3\}$ 。

示例2 (不相交的集合)：
令 $C = \{1, 2\}$ 。
令 $D = \{a, b\}$ 。
$C$ 和 $D$ 没有任何共同元素。
$C \cap D = \emptyset$ 。
当两个集合的交集为空集时，我们称这两个集合\\不相交 (disjoint)\\。

示例3 (多个集合的交集)：
$X_1 = \{1, 2, 3, 4\}$ , $X_2 = \{2, 3, 4, 5\}$ , $X_3 = \{3, 4, 5, 6\}$ 。
$\bigcap_{i=1}^{3} X_i = X_1 \cap X_2 \cap X_3$ 。
我们寻找同时存在于所有三个集合中的元素。
只有 3 和 4 满足条件。
所以结果是 $\{3, 4\}$ 。

⚠️ [易错点]

和并集混淆：务必分清 \cup (或) 和 \cap (且)。
与空集求交集：任何集合 $X$ 与空集 $\emptyset$ 的交集都是空集。 $X \cap \emptyset = \emptyset$ 。因为它们没有任何共同元素（空集连元素都没有）。
与自身求交集： $X \cap X = X$ 。
子集关系与交集：如果 $C \subseteq D$ ，那么 $C \cap D = C$ 。因为 $C$ 的所有元素都在 $D$ 中，所以它们的公共元素就是 $C$ 的全部元素。

📝 [总结]

本段定义了集合的交集运算 ( $\cap$ )，即创建一个只包含所有原始集合共有的元素的新集合。交集运算同样满足交换律和结合律。

🎯 [存在目的]

交集是另一个基本的集合构造工具，用于筛选和提取共同特征。

在数据库查询中，INTERSECT 操作或带 AND 的 WHERE 子句就是交集思想的体现。
在逻辑中，寻找满足多个条件的解，就是在寻找多个条件集合的交集。
在解决问题时，将问题分解为多个约束条件，每个条件对应一个解集，最终的解就是这些解集的交集。

🧠 [直觉心智模型]

共同好友模型：你的微信好友列表是集合 $X_1$ ，你朋友的微信好友列表是集合 $X_2$ 。你们的“共同好友”集合就是 $X_1 \cap X_2$ 。

💭 [直观想象]

维恩图：如果用两个圈分别代表集合 $X_1$ 和 $X_2$ 。
它们的交集 $X_1 \cap X_2$ 就是两个圈重叠的那一小块区域。

1. 2.4. 定义 1.2.1. (续)

📜 [原文10]

(iii) 给定两个集合 $X_{1}$ 和 $X_{2}$ ， $X_{2}$ 在 $X_{1}$ 中的补集，记作 $X_{1}-X_{2}$ ，是集合

\left\{x \in X_{1}: x \notin X_{2}\right\} .

因此 $X_{2} \cap\left(X_{1}-X_{2}\right)=\emptyset$ 。如果 $X_{2} \subseteq X_{1}$ ，则 $X_{2} \cup\left(X_{1}-X_{2}\right)=X_{1}$ 。例如， $X-X=\emptyset$ 且 $X-\emptyset=X$ 。

📖 [逐步解释]

本节介绍第三种集合基本运算：差集 (Set Difference) 或称为相对补集 (Relative Complement)。

差集的核心思想：从一个集合（基准集合 $X_1$ ）中，"挖掉" 所有也同时属于另一个集合 ( $X_2$ ) 的元素。
定义与符号：
- X_1 - X_2 或 X_1 \setminus X_2：都读作 “ $X_1$ 减 $X_2$ ” (X1 minus X2) 或 “ $X_2$ 在 $X_1$ 中的补集”。符号 \ 有时更受欢迎，因为它不会与数字的减法混淆。
- 形式化定义：\{x \in X_1 : x \notin X_2\}。
- 这个定义非常清晰：我们要找的元素 $x$ 必须满足两个条件：(1) 它必须是 $X_1$ 的元素；(2) 它不能是 $X_2$ 的元素。
差集的重要性质：
- X_2 \cap (X_1 - X_2) = \emptyset：这个性质说明，被减去的集合 $X_2$ 与减完后剩下的结果 X_1 - X_2 是不相交的。这是当然的，因为 X_1 - X_2 的定义就是把所有属于 $X_2$ 的元素都去掉了。
- 如果 X_2 \subseteq X_1，则 X_2 \cup (X_1 - X_2) = X_1：这个性质描述了一种“复原”。如果 $X_2$ 本身就是 $X_1$ 的一部分（子集），那么把 $X_1$ 中挖掉 $X_2$ 的部分 (X_1 - X_2) 和被挖掉的 $X_2$ 本身再“并”起来，就恰好还原了完整的 $X_1$ 。
基本示例：
- X - X = \emptyset：一个集合减去它自己，当然什么都不剩了。
- X - \emptyset = X：一个集合减去空集，等于什么都没减，还是它自己。

∑ [公式拆解]

\left\{x \in X_{1}: x \notin X_{2}\right\}

这是一个描述法定义的集合。
x \in X_1: 第一个条件，限定了我们的搜索范围只在 $X_1$ 内部。
x \notin X_2: 第二个条件，排除了所有属于 $X_2$ 的元素。
合起来就是：属于 $X_1$ 但不属于 $X_2$ 的元素的集合。

💡 [数值示例]

示例1 (一般情况)：
令 $A = \{1, 2, 3, 4\}$ 。
令 $B = \{3, 4, 5, 6\}$ 。
计算 $A - B$ ：从 $A$ 中去掉也存在于 $B$ 中的元素。 $A$ 中的 3 和 4 也在 $B$ 中，所以要去掉。剩下 $\{1, 2\}$ 。所以 $A - B = \{1, 2\}$ 。
计算 $B - A$ ：从 $B$ 中去掉也存在于 $A$ 中的元素。 $B$ 中的 3 和 4 也在 $A$ 中，所以要去掉。剩下 $\{5, 6\}$ 。所以 $B - A = \{5, 6\}$ 。
重要观察： $A - B \neq B - A$ 。差集运算不满足交换律！

示例2 (子集情况)：
令 $C = \{1, 2\}$ 。
令 $D = \{1, 2, 3, 4\}$ 。
计算 $D - C$ ：从 $D$ 中去掉 $C$ 的所有元素（1 和 2）。剩下 $\{3, 4\}$ 。所以 $D - C = \{3, 4\}$ 。
计算 $C - D$ ：从 $C$ 中去掉也属于 $D$ 的元素。 $C$ 的所有元素（1 和 2）都属于 $D$ ，所以全被去掉了。剩下空集。所以 $C - D = \emptyset$ 。
结论：如果 $C \subseteq D$ ，那么 $C - D = \emptyset$ 。

示例3 (补集)：在很多情况下，我们会讨论一个“全集” $U$ (Universal set)。此时，一个集合 $A$ 的补集 $A^c$ 或 $A'$ ，实际上就是 $U - A$ 。
令全集 $U = \{1, 2, 3, 4, 5, 6, 7, 8, 9, 10\}$ 。
令 $A = \{2, 3, 5, 7\}$ (小于10的质数)。
$A$ 的补集 $A^c = U - A = \{1, 4, 6, 8, 9, 10\}$ 。

⚠️ [易错点]

不满足交换律：这是差集和并集、交集最大的不同。 $X_1 - X_2$ 和 $X_2 - X_1$ 通常是完全不同的集合。
运算范围： $X_1 - X_2$ 的结果中，所有元素都必须来自 $X_1$ 。它绝不会包含 $X_1$ 之外的任何元素。
和算术减法的区别：集合的减法是“移除”操作，不是数值上的相减。

📝 [总结]

本段定义了集合的差集运算 ( $X_1-X_2$ )，即从 $X_1$ 中移除所有也属于 $X_2$ 的元素后得到的新集合。此运算不满足交换律，其结果是第一个集合 $X_1$ 的一个子集。

🎯 [存在目的]

差集运算提供了“排除”或“细化”的功能，在构建集合和逻辑推理中非常有用。

它可以用来表达“属于A但不属于B”这样的精确条件。
补集的概念是概率论（“非A事件”）和逻辑（“非P”命题）的基础。
通过差集和并集、交集的组合，可以表达非常复杂的集合关系。

🧠 [直觉心智模型]

筛子模型：想象集合 $X_1$ 是一碗混了沙子和石头的混合物。集合 $X_2$ 是“所有石头”的集合。那么 X_1 - X_2 这个操作，就像用一个只能让沙子通过的筛子去筛这碗混合物，最后得到的只有沙子。你从 $X_1$ 里把 $X_2$ 的成分（石头）给筛出去了。

💭 [直观想象]

维恩图：用两个圈代表集合 $X_1$ 和 $X_2$ 。
差集 $X_1 - X_2$ 是指属于 $X_1$ 圈，但不属于 $X_2$ 圈重叠部分的那块“月牙”区域。

1. 2.5. 备注 1.2.2.

📜 [原文11]

(i) 注意，对于每个 $j$ 且 $1 \leq j \leq n, X_{j} \subseteq \bigcup_{i=1}^{n} X_{i}$ 。此外，如果 $Y$ 是一个集合，使得对于每个 $j$ 且 $1 \leq j \leq n, X_{j} \subseteq Y$ ，则 $\bigcup_{i=1}^{n} X_{i} \subseteq Y$ 。这大致说明 $\bigcup_{i=1}^{n} X_{i}$ 是包含所有 $X_{j}$ 的最小集合。

(ii) 同样地，对于每个 $j$ 且 $1 \leq j \leq n, \bigcap_{i=1}^{n} X_{i} \subseteq X_{j}$ 。此外，如果 $Y$ 是一个集合，使得对于每个 $j$ 且 $1 \leq j \leq n, Y \subseteq X_{j}$ ，则 $Y \subseteq \bigcap_{i=1}^{n} X_{i}$ 。这大致说明 $\bigcap_{i=1}^{n} X_{i}$ 是包含于所有 $X_{j}$ 的最大集合。

(iii) 检查以下公式是定义的练习：

\begin{aligned} & \left(X_{1} \cup X_{2}\right) \cap Y=\left(X_{1} \cap Y\right) \cup\left(X_{2} \cap Y\right) \\ & \left(X_{1} \cap X_{2}\right) \cup Y=\left(X_{1} \cup Y\right) \cap\left(X_{2} \cup Y\right) \end{aligned}

(iv) 根据逻辑（德摩根定律）， $Y-\left(X_{1} \cap X_{2}\right)=\left(Y-X_{1}\right) \cup\left(Y-X_{2}\right)$ 且 $Y-\left(X_{1} \cup X_{2}\right)= \left(Y-X_{1}\right) \cap\left(Y-X_{2}\right)$ 。（例如，如果 $x \in Y, x \notin X_{1} \cap X_{2}$ ，那么 $x \notin X_{1}$ 或 $x \notin X_{2}$ ，反之亦然。）

📖 [逐步解释]

这个备注总结了并集和交集的“最小/最大”性质，并引入了分配律和德摩根定律。

(i) 并集是最小的“超集”

第一部分 X_j \subseteq \bigcup X_i 是说，任何一个参与并集运算的集合，都是结果并集的子集。这很显然。
第二部分是关键：如果有一个集合 $Y$ ，它能把所有的 $X_j$ 都“装下”（即所有的 $X_j$ 都是 $Y$ 的子集），那么这个 $Y$ 也一定能把它们的并集 \bigcup X_i“装下”。
“最小集合”的含义：结合这两点，并集是这样一个集合：它包含了所有 $X_j$ 的元素（一个都不少），但又没有多余任何不必要的元素。任何其他同样能包含所有 $X_j$ 的集合 $Y$ ，都至少和并集一样“大”，或者更大。

(ii) 交集是最大的“子集”

第一部分 \bigcap X_i \subseteq X_j 是说，交集的结果，是任何一个参与运算的集合 $X_j$ 的子集。这也很好理解，因为交集只保留公共元素。
第二部分是关键：如果有一个集合 $Y$ ，它能被所有的 $X_j$ 都“装下”（即 $Y$ 是所有 $X_j$ 的子集），那么这个 $Y$ 也一定能被它们的交集 \bigcap X_i“装下”。
“最大集合”的含义：交集是这样一个集合：它包含了所有 $X_j$ 的公共元素，且包含了所有可能的公共元素。任何其他同样是所有 $X_j$ 子集的集合 $Y$ ，都至多和交集一样“大”，或者更小。

(iii) 分配律 (Distributive Laws)

这两条定律描述了并集和交集混合运算时的规则，类似于算术中的乘法对加法的分配律 a (b + c) = (a b) + (a * c)。
第一条：(X_1 \cup X_2) \cap Y = (X_1 \cap Y) \cup (X_2 \cap Y)
交集对并集的分配律。可以理解为：先把 $X_1$ 和 $X_2$ 合并，再和 $Y$ 找共同部分；等价于，分别找出 $X_1$ 与 $Y$ 的共同部分、 $X_2$ 与 $Y$ 的共同部分，然后再把这两部分合并。
第二条：(X_1 \cap X_2) \cup Y = (X_1 \cup Y) \cap (X_2 \cup Y)
并集对交集的分配律。这在普通算术中没有对应（加法对乘法没有分配律 a + (bc) != (a+b)(a+c)），但在集合代数和逻辑中成立。可以理解为：先把 $X_1$ 和 $X_2$ 的共同部分找出来，再和 $Y$ 合并；等价于，分别将 $X_1$ 与 $Y$ 合并、 $X_2$ 与 $Y$ 合并，然后再找这两大坨的共同部分。

(iv) 德摩根定律 (De Morgan's Laws)

这两条定律是关于补集（差集）与并集、交集的转换规则，极其重要。
第一条：Y - (X_1 \cap X_2) = (Y - X_1) \cup (Y - X_2)
从 $Y$ 中减去“ $X_1$ 和 $X_2$ 的公共部分”，等价于，“从Y中减去 $X_1$ 的部分” 与 “从Y中减去 $X_2$ 的部分” 的并集。
逻辑解释：一个元素 $x$ 在左边，意味着 $x \in Y$ 且 $x \notin (X_1 \cap X_2)$ 。 $x \notin (X_1 \cap X_2)$ 意味着 $x \notin X_1$ 或 $x \notin X_2$ 。所以整体是 $x \in Y$ 且 ( $x \notin X_1$ 或 $x \notin X_2$ )。这等价于 ( $x \in Y$ 且 $x \notin X_1$ ) 或 ( $x \in Y$ 且 $x \notin X_2$ )。这恰好就是右边集合的定义。
第二条：Y - (X_1 \cup X_2) = (Y - X_1) \cap (Y - X_2)
从 $Y$ 中减去“ $X_1$ 和 $X_2$ 的所有部分”，等价于，“从Y中减去 $X_1$ 的部分” 与 “从Y中减去 $X_2$ 的部分” 的交集。
逻辑解释：一个元素 $x$ 在左边，意味着 $x \in Y$ 且 $x \notin (X_1 \cup X_2)$ 。 $x \notin (X_1 \cup X_2)$ 意味着 $x \notin X_1$ 且 $x \notin X_2$ 。所以整体是 $x \in Y$ 且 $x \notin X_1$ 且 $x \notin X_2$ 。这等价于 ( $x \in Y$ 且 $x \notin X_1$ ) 且 ( $x \in Y$ 且 $x \notin X_2$ )。这恰好是右边集合的定义。

∑ [公式拆解]

\begin{aligned} & \left(X_{1} \cup X_{2}\right) \cap Y=\left(X_{1} \cap Y\right) \cup\left(X_{2} \cap Y\right) \\ & \left(X_{1} \cap X_{2}\right) \cup Y=\left(X_{1} \cup Y\right) \cap\left(X_{2} \cup Y\right) \end{aligned}

这些是分配律的公式。证明它们通常使用“双向包含”法，并依赖于逻辑命题的分配律。例如，证明第一条 A = B：

证明 $A \subseteq B$ : 取 $x \in (X_1 \cup X_2) \cap Y$ 。则 $x \in (X_1 \cup X_2)$ 且 $x \in Y$ 。所以 $(x \in X_1 \text{ 或 } x \in X_2)$ 且 $x \in Y$ 。根据逻辑分配律，这等价于 $(x \in X_1 \text{ 且 } x \in Y) \text{ 或 } (x \in X_2 \text{ 且 } x \in Y)$ 。这意味着 $x \in (X_1 \cap Y)$ 或 $x \in (X_2 \cap Y)$ 。因此 $x \in (X_1 \cap Y) \cup (X_2 \cap Y)$ 。
证明 $B \subseteq A$ : 取 $x \in (X_1 \cap Y) \cup (X_2 \cap Y)$ 。反向推导上述步骤即可。

💡 [数值示例]

示例1 (分配律)：
$X_1=\{1,2\}, X_2=\{2,3\}, Y=\{1,3\}$
左边: $(X_1 \cup X_2) \cap Y = \{1,2,3\} \cap \{1,3\} = \{1,3\}$ 。
右边: $(X_1 \cap Y) \cup (X_2 \cap Y) = \{1\} \cup \{3\} = \{1,3\}$ 。
左右相等，验证了第一条分配律。

示例2 (德摩根定律)：
$Y=\{1,2,3,4,5\}, X_1=\{1,2\}, X_2=\{2,3\}$
第一条定律：
左边: $Y - (X_1 \cap X_2) = Y - \{2\} = \{1,3,4,5\}$ 。
右边: $(Y - X_1) \cup (Y - X_2) = \{3,4,5\} \cup \{1,4,5\} = \{1,3,4,5\}$ 。
左右相等。
第二条定律：
左边: $Y - (X_1 \cup X_2) = Y - \{1,2,3\} = \{4,5\}$ 。
右边: $(Y - X_1) \cap (Y - X_2) = \{3,4,5\} \cap \{1,4,5\} = \{4,5\}$ 。
左右相等。

⚠️ [易错点]

德摩根定律的符号：记住“括号外的补集/差集”作用到括号内时，“并变交，交变并”。
分配律的第二条：并集对交集的分配律在直觉上不如第一条明显，容易记错或忽略，需要特别记忆。

📝 [总结]

本备注阐述了集合运算的一些高级定律。并集和交集分别是包含所有成员的“最小”超集和被所有成员包含的“最大”子集。分配律揭示了并集与交集混合运算的规则，而德摩根定律则给出了补集如何与并集、交集相互作用的深刻关系。

🎯 [存在目的]

这些定律是进行集合运算和逻辑推演的“代数法则”。它们使得我们可以像处理代数表达式一样，对复杂的集合表达式进行化简、变形和证明，是集合代数和布尔代数的核心内容。

🧠 [直觉心智模型]

分配律：想象你在招募俱乐部成员。条件是：“（必须是新生或 二年级生）并且必须 会编程”。这等价于：“（新生的程序员）或者（二年级生的程序员）”。
德摩根定律：老板说：“我不要 又便宜又好的东西”（拒绝 便宜 \cap 好）。这等价于：“要么就 不便宜，要么就不好”（非便宜 \cup 非好）。老板又说：“我不要 便宜的或者不好的东西”（拒绝 便宜 \cup 非好）。这等价于：“必须 又不便宜，又好”（非便宜 \cap 好）。

💭 [直观想象]

分配律 (交对并)： (X1 U X2) ∩ Y

左边是 (X1 U X2) 的区域，右边是 Y 的区域，交集是它们重叠的部分（深灰色）。这等于 X1 ∩ Y (左月牙+中间) 和 X2 ∩ Y (右月牙+中间) 的并集。

德摩根定律： Y - (X1 ∩ X2)

从大框 Y 中挖掉 X1 和 X2 的交集（中间部分），剩下的区域等于 Y-X1（Y中 X1以外的部分）和 Y-X2（Y中 X2以外的部分）的并集。

1. 2.6. 定义 1.2.3.

📜 [原文12]

给定 $X$ 和 $Y$ ，我们定义 $X \times Y$ ，即 $X$ 和 $Y$ 的笛卡尔积，为有序对 $(x, y)$ 的集合，其中 $x \in X$ 且 $y \in Y$ 。此处 $x$ 是有序对 $(x, y)$ 的第一分量或第一坐标，而 $y$ 是第二分量（或坐标）。

如果 $X=Y$ ，我们用 $X^{2}$ 缩写 $X \times X$ 。同样地，如果我们有 $n$ 个集合 $X_{1}, \ldots, X_{n}$ ，那么 $X_{1} \times \cdots \times X_{n}$ 是有序 $n$ 元组 $\left(x_{1}, \ldots, x_{n}\right)$ 的集合，其中每个 $i$ 都有 $x_{i} \in X_{i}$ ， $\left(x_{1}, \ldots, x_{n}\right)$ 的第 $i$ 个分量（或坐标）是 $x_{i}$ ，我们再次用 $X^{n}$ 缩写 $X \times \cdots \times X$ （ $n$ 次）。

📖 [逐步解释]

这个定义引入了一种全新的、非常强大的构造新集合的方法：笛卡尔积 (Cartesian Product)。它构造出的元素类型——有序对——与我们之前见过的都不同。

核心思想：笛卡尔积 $X \times Y$ 是一个由所有可能的“配对”组成的集合。每个“配对”都是一个有序对 $(x, y)$ ，其中第一个元素 $x$ 来自集合 $X$ ，第二个元素 $y$ 来自集合 $Y$ 。
“有序”是关键：
- “有序对 (Ordered Pair)” 这个名字强调了顺序的重要性。 $(x, y)$ 和 $(y, x)$ 是不同的有序对（除非 $x=y$ ）。
- 这与集合 {x, y} 完全不同。在集合中，{x, y} 和 {y, x} 是完全相同的，因为集合是无序的。
- 类比：你在电影院的座位票是 (10排, 8座)，这和 (8排, 10座) 显然是不同的座位。这里的 (排, 座) 就是一个有序对。
分量/坐标：
- 在有序对 $(x, y)$ 中， $x$ 被称为第一分量 (first component) 或第一坐标 (first coordinate)。
- $y$ 被称为第二分量 (second component) 或第二坐标 (second coordinate)。
- “坐标”这个词暗示了它与几何的深刻联系。平面直角坐标系中的任意一个点，其坐标 $(x, y)$ 就是实数集 $\mathbb{R}$ 与自身的笛卡尔积 $\mathbb{R} \times \mathbb{R}$ 中的一个元素。
符号与推广：
- X \times Y：读作 “X 叉乘 Y” (X cross Y) 或 “X 和 Y 的笛卡尔积”。
- X^2：是 X \times X 的简写。例如， $\mathbb{R}^2$ 就是我们熟悉的二维笛卡尔平面。
- 有序n-元组 (Ordered n-tuple)：这个概念将有序对推广到多个集合。X_1 \times ... \times X_n 的元素是形如 (x_1, ..., x_n) 的有序n-元组，其中 x_1 来自 X_1，x_2 来自 X_2，以此类推。
- X^n：是 X 与自身进行 n 次笛卡尔积的简写。例如， $\mathbb{R}^3$ 就是三维空间。

💡 [数值示例]

示例1 (简单的笛卡尔积)：
令 $X = \{1, 2\}$ 。
令 $Y = \{a, b, c\}$ 。
要构造 $X \times Y$ ，我们需要从 $X$ 中取一个元素作为第一分量，从 $Y$ 中取一个元素作为第二分量，然后把所有可能的组合都列出来。
以 1 开头： $(1, a), (1, b), (1, c)$
以 2 开头： $(2, a), (2, b), (2, c)$
所以， $X \times Y = \{ (1, a), (1, b), (1, c), (2, a), (2, b), (2, c) \}$ 。
这个新集合里有 $2 \times 3 = 6$ 个元素，每个元素都是一个有序对。

示例2 (顺序的重要性)：
使用上面的 $X$ 和 $Y$ 。
$Y \times X$ 的元素是形如 $(y, x)$ 的有序对，其中 $y \in Y, x \in X$ 。
$Y \times X = \{ (a, 1), (a, 2), (b, 1), (b, 2), (c, 1), (c, 2) \}$ 。
显然， $X \times Y$ 和 $Y \times X$ 是两个完全不同的集合，因为例如 $(1, a) \in X \times Y$ 但 $(1, a) \notin Y \times X$ 。

示例3 (集合的平方)：
令 $A = \{H, T\}$ (H代表硬币正面, T代表反面)。
$A^2 = A \times A$ 代表了掷两次硬币可能出现的所有有序结果。
$A^2 = \{ (H, H), (H, T), (T, H), (T, T) \}$ 。
(H, T) 表示第一次正面，第二次反面。(T, H) 表示第一次反面，第二次正面。它们是不同的结果。

⚠️ [易错点]

将有序对与集合混淆： $(x, y)$ 不是 {x, y}。前者有序，后者无序。
不满足交换律：一般情况下 $X \times Y \neq Y \times X$ 。它们相等的唯一可能是 $X=Y$ ，或者其中一个（或两个）是空集。
与空集的笛卡尔积：如果 $X$ 或 $Y$ 中任何一个是空集 $\emptyset$ ，那么就不可能构造出任何有序对（因为缺少一个分量）。所以，对于任何集合 $A$ ，都有 $A \times \emptyset = \emptyset$ 和 $\emptyset \times A = \emptyset$ 。

📝 [总结]

本段定义了笛卡尔积，这是一个通过组合来自不同集合的元素来创建有序对（或有序n-元组）集合的操作。其最关键的特性是“有序”，即元素的顺序至关重要。

🎯 [存在目的]

笛卡尔积是数学中一座极其重要的桥梁，它连接了集合论与几何、代数等多个分支。

几何基础：如上所述，二维、三维乃至n维欧几里得空间（ $\mathbb{R}^2, \mathbb{R}^3, \mathbb{R}^n$ ）都是通过笛卡尔积定义的。
关系与函数的定义：在下一节我们将看到，函数可以被严格地定义为笛卡尔积的一个子集。更一般地，“关系”（比如“大于”，“是...的朋友”）也可以被定义为笛卡尔积的子集。
多变量函数的定义域：一个接受两个变量的函数 $f(x, y)$ ，其定义域就是一个笛卡尔积。

🧠 [直觉心智模型]

餐厅菜单模型：假设一家餐厅的菜单，前菜 (Appetizers) 集合是 $X = \{\text{沙拉}, \text{汤}\}$ ，主菜 (Main Courses) 集合是 $Y = \{\text{牛排}, \text{鱼}, \text{意面}\}$ 。
那么笛卡尔积 $X \times Y$ 就代表了所有可能的“前菜+主菜”搭配套餐的集合。
$X \times Y = \{ (\text{沙拉}, \text{牛排}), (\text{沙拉}, \text{鱼}), (\text{沙拉}, \text{意面}), (\text{汤}, \text{牛排}), (\text{汤}, \text{鱼}), (\text{汤}, \text{意面}) \}$ 。
每一对都是一个有序对，代表一个具体的套餐选择。

💭 [直观想象]

表格/网格：想象一个表格。
表格的行标签来自集合 $X$ 。
表格的列标签来自集合 $Y$ 。
笛卡尔积 $X \times Y$ 就是这个表格中所有的单元格。每个单元格都可以用它的“行-列”坐标 $(x, y)$ 来唯一标识。

例如，对于

X=\{1,2\}, Y=\{a,b,c\}

：

	a	b	c
1	(1,a)	(1,b)	(1,c)
2	(2,a)	(2,b)	(2,c)

1. 2.7. 备注 1.2.4.

📜 [原文13]

有序对 $(x, y)$ 的操作性质是：1) 对于所有 $x \in X$ 和 $y \in Y$ ，存在一个有序对 $(x, y) \in X \times Y$ ，以及 2) 两个有序对 $(x_{1}, y_{1})$ 和 $(x_{2}, y_{2})$ 相等 $\Longleftrightarrow$ 它们具有相同的第一分量和相同的第二分量，即 $\Longleftrightarrow x_{1}=x_{2}$ 且 $y_{1}=y_{2}$ ；仅仅要求集合 $\left\{x_{1}, y_{1}\right\}$ 和 $\left\{x_{2}, y_{2}\right\}$ 相等是不够的。可以仅使用集合论给出有序对的正式定义。事实上，可以定义 $(x, y)=\{\{x\},\{x, y\}\}$ 。（换句话说，有序对不必是未定义的术语。）然而，我们并不会真正关心精确的定义是什么，而只关心有序对具有上述性质 1) 和 2)。不过，使用函数，我们可以给出有序 $n$ 元组的仔细定义；我们稍后会描述这一点。

📖 [逐步解释]

这段备注深入探讨了有序对的本质。它告诉我们，我们真正关心的是有序对“如何工作”（它的性质），而不是它“是什么”（它的构造）。

操作性质 (Operational Properties)：这指的是有序对在使用时必须遵守的两条核心规则。
- 1) 存在性 (Existence)：只要你分别从集合 $X$ 和 $Y$ 中取出元素 $x$ 和 $y$ ，你就一定能构造出一个对应的有序对 $(x, y)$ 。
- 2) 相等性 (Equality)：这是有序对的灵魂。判断两个有序对 (x_1, y_1) 和 (x_2, y_2) 是否相等，唯一的标准是：它们的第一分量必须相等 (x_1 = x_2) 并且它们的第二分量也必须相等 (y_1 = y_2)。两个条件必须同时满足。
与集合相等的对比：
- 作者强调，仅仅要求构成有序对的元素所组成的集合相等是不够的。
- 例如，对于有序对 $(1, 2)$ 和 $(2, 1)$ ：
- 它们的第一分量 $1 \neq 2$ ，所以这两个有序对不相等。
- 但是，它们对应的集合 $\{1, 2\}$ 和 $\{2, 1\}$ 是相等的。
- 这再次凸显了“有序”的重要性。
有序对的集合论定义 (Kuratowski's definition)：
- 前面说有序对的概念似乎是凭空出现的，但数学家们不喜欢“无定义的术语”。他们希望用最少的公理（比如集合论）来构建整个数学大厦。
- 波兰数学家库拉托夫斯基 (Kazimierz Kuratowski) 在1921年提出了一个巧妙的定义，只使用集合的概念来定义有序对：
- 这个定义看起来很奇怪，但它完美地满足了我们需要的两条操作性质。
- 如何体现顺序？ 在这个由两个集合组成的集合里，{x} 是一个单元素子集，{x, y} 是一个可能包含两个元素的集合。
- 我们可以通过观察这两个内部集合，明确地“解码”出谁是第一分量：那个同时出现在两个内部集合里的元素（即 x）就是第一分量。剩下的那个元素（如果存在且不同的话，即 y）就是第二分量。
- 正是这种不对称的结构，巧妙地把“顺序”信息编码到了无序的集合中。
作者的态度：
- “我们并不会真正关心精确的定义是什么”。作者的意思是，在实际应用中，我们几乎永远不会用到 \{\{x\}, \{x, y\}\} 这个复杂的构造。我们只需要记住并使用那两条操作性质（特别是相等性那条）就足够了。
- 这个底层构造的存在，只是为了保证我们的理论是建立在坚实的集合论基础之上的，而不是空中楼阁。
有序n-元组的定义：作者预告，后面会用函数的概念来更清晰地定义有序n-元组，这比嵌套使用库拉托夫斯基的定义（例如 (x, y, z) = (x, (y, z))）要更优雅。

∑ [公式拆解]

(x, y)=\{\{x\},\{x, y\}\}

这是一个定义式，而非计算式。我们来验证它为何能保证有序对的相等性 (x_1, y_1) = (x_2, y_2) \iff x_1=x_2 \land y_1=y_2。

证明 \implies 方向：
假设 $(x_1, y_1) = (x_2, y_2)$ 。
根据库拉托夫斯基定义，这意味着 \{\{x_1\}, \{x_1, y_1\}\} = \{\{x_2\}, \{x_2, y_2\}\}。
根据集合相等的定义，这两个集合的元素必须完全相同。
情况一： {x_1} = \{x_2\} 并且 {x_1, y_1} = \{x_2, y_2\}。
从 {x_1} = \{x_2\}，我们得到 $x_1 = x_2$ 。
代入第二个等式，得到 {x_1, y_1} = \{x_1, y_2\}。这意味着 $y_1 = y_2$ 。（如果 $y_1 \neq x_1$ , 那么 $y_1$ 必须等于 $y_2$ 。如果 $y_1 = x_1$ , 那么 `{x_1} = \{x_1, y_2\} $，这意味着要么$ y_2=x_1 $，此时$ y_1=y_2 $；要么这个集合只有一个元素，也要求$ y_2=x_1 $, 同样$ y_1=y_2$）。
情况二： {x_1} = \{x_2, y_2\} 并且 {x_1, y_1} = \{x_2\}。
从 {x_1} = \{x_2, y_2\}，我们知道这个集合只有一个元素，所以 $x_1=x_2=y_2$ 。
从 {x_1, y_1} = \{x_2\}，我们知道这个集合也只有一个元素，所以 $x_1=y_1=x_2$ 。
综合起来，我们有 $x_1=x_2$ 并且 $y_1=y_2$ (因为它们都等于 $x_1$ )。
在所有情况下，我们都得出了 $x_1=x_2$ 且 $y_1=y_2$ 。

证明 \Longleftarrow 方向：
假设 $x_1=x_2$ 且 $y_1=y_2$ 。
那么 \{\{x_1\}, \{x_1, y_1\}\} 和 \{\{x_2\}, \{x_2, y_2\}\} 显然是同一个集合。
所以 $(x_1, y_1) = (x_2, y_2)$ 。

💡 [数值示例]

示例1 (构造)：
有序对: $(1, 2)$
集合论定义: $\{\{1\}, \{1, 2\}\}$

示例2 (构造)：
有序对: $(2, 1)$
集合论定义: $\{\{2\}, \{2, 1\}\}$ 。因为 $\{1,2\}=\{2,1\}$ ，所以这也可以写成 $\{\{2\}, \{1, 2\}\}$ 。
比较 $(1,2)$ 和 $(2,1)$ 的集合定义： $\{\{1\}, \{1, 2\}\}$ 和 $\{\{2\}, \{1, 2\}\}$ 。这两个集合的元素不同（一个包含 {1}，另一个包含 {2}），所以它们是不相等的集合，因此 $(1,2) \neq (2,1)$ 。

示例3 (对角线元素)：
有序对: $(3, 3)$
集合论定义: $\{\{3\}, \{3, 3\}\} = \{\{3\}, \{3\}\} = \{\{3\}\}$ 。它是一个只包含一个元素（即集合 {3}）的集合。

⚠️ [易错点]

不要在实践中使用这个定义：这个定义的意义在于理论上的完备性，而不是用于日常计算或推导。在做题或思考时，始终使用“分量分别相等”这一操作性质。
理解其目的：学习这个定义的关键是理解为什么需要它（为了数学的根基牢固），以及它如何通过不对称的结构来编码“顺序”信息。

📝 [总结]

本备注阐明了有序对的两个核心操作性质：存在性和基于分量相等的相等性判据。它进一步揭示，尽管有序对可以被严格地用集合论（如库拉托夫斯基定义）来构造，但在实际应用中，我们只关心其操作性质，而非其底层实现。

🎯 [存在目的]

本段的目的是加深对“有序”这一概念的理解，并展示现代数学的构造主义思想。它告诉我们，像“顺序”这样看似基本直观的概念，也可以从更底层的“无序”的集合概念中构建出来。这增强了我们对数学体系严谨性和一致性的信心。

🧠 [直觉心智模型]

黑箱模型：你可以把有序对 (x, y) 想象成一个黑箱。
这个黑箱有两个插槽，一个标记为“1”，一个标记为“2”。你可以把 $x$ 插入插槽1，把 $y$ 插入插槽2。
你有一个“比较器”，可以判断两个黑箱是否相等。这个比较器的工作原理是：分别检查两个黑箱的插槽1里的东西是否一样，以及插槽2里的东西是否一样。只有两对都一样，它才亮绿灯。
至于黑箱内部是用 \{\{x\}, \{x, y\}\} 还是用别的什么电路实现的，作为用户，你不需要关心。

💭 [直观想象]

DNA编码：想象一下，集合是组成DNA的碱基（A, T, C, G），它们可以无序地存在于细胞液中。而有序对就像是DNA链上的一个片段，例如 ...-A-T-...。这里的顺序 A-T 带有特定的遗传信息，与 T-A 是不同的。库拉托夫斯基的定义 \{\{A\}, \{A, T\}\} 就像是一种化学机制，它能把无序的碱基分子稳定地组合成有特定顺序的结构。

1. 2.8. 备注 1.2.5.

📜 [原文14]

(i) 如果 $A \subseteq X$ 且 $B \subseteq Y$ ，则 $A \times B \subseteq X \times Y$ 。但是，通常情况下，并不是 $X \times Y$ 的每个子集都具有这种形式（练习 1.1）。

(ii) 根据逻辑，对于每个集合 $X$ ， $\emptyset \times X=X \times \emptyset=\emptyset$ 。

(iii) 如果 $X$ 和 $Y$ 是有限集，则 $X \times Y$ 也是有限的，并且

\#(X \times Y)=\#(X) \#(Y)

对于 $n$ 个有限集 $X_{1} \times \cdots \times X_{n}$ 的乘积也类似：

\#\left(X_{1} \times \cdots \times X_{n}\right)=\#\left(X_{1}\right) \times \cdots \times \#\left(X_{n}\right)

特别是，这个公式说明 $\#(\emptyset \times X)=\#(X) \times 0=0$ ，与 (ii) 一致。

📖 [逐步解释]

这个备注讨论了笛卡尔积的一些重要性质，包括它的子集、与空集的运算，以及其基数。

(i) 笛卡尔积的子集

如果 A \subseteq X 且 B \subseteq Y，则 A \times B \subseteq X \times Y：这个性质非常直观。如果 $A$ 是 $X$ 的一部分， $B$ 是 $Y$ 的一部分，那么由 $A$ 和 $B$ 的元素组成的有序对的集合，自然也应该是 $X$ 和 $Y$ 组成的有序对的集合的一部分。
证明：任取一个元素 $(a, b) \in A \times B$ 。根据笛卡尔积的定义，有 $a \in A$ 且 $b \in B$ 。又因为 $A \subseteq X$ 和 $B \subseteq Y$ ，所以 $a \in X$ 且 $b \in Y$ 。因此，根据笛卡尔积的定义， $(a, b) \in X \times Y$ 。这就证明了 $A \times B$ 是 $X \times Y$ 的子集。
并非所有子集都是笛卡尔积：这是更深刻的一点。 $X \times Y$ 的一个子集，我们称之为“关系 (Relation)”。只有形态非常“规整”的子集（像一个矩形区域）才能被写成另一个笛卡尔积 $A \times B$ 的形式。
例子：令 $X=\{1,2\}, Y=\{a,b\}$ 。则 $X \times Y = \{(1,a), (1,b), (2,a), (2,b)\}$ 。
子集 $S = \{(1,a), (2,b)\}$ 是 $X \times Y$ 的一个子集。但是我们无法找到 $A \subseteq X$ 和 $B \subseteq Y$ 使得 $A \times B = S$ 。
因为 $(1,a) \in S$ ，所以必须有 $1 \in A, a \in B$ 。
因为 $(2,b) \in S$ ，所以必须有 $2 \in A, b \in B$ 。
那么 $A$ 至少是 $\{1,2\}$ ， $B$ 至少是 $\{a,b\}$ 。
但此时 $A \times B = \{1,2\} \times \{a,b\} = \{(1,a), (1,b), (2,a), (2,b)\}$ ，这并不等于 $S$ 。
所以，形如 $A \times B$ 的子集只是 $X \times Y$ 所有子集中的一小部分。

(ii) 与空集的乘积

\emptyset \times X = X \times \emptyset = \emptyset：只要参与笛卡尔积的任何一个集合是空集，结果就是空集。
原因：要构造一个有序对 $(x,y)$ ，我们需要一个来自第一个集合的元素和来自第二个集合的元素。如果其中一个集合是空的，我们就无法凑齐一个完整的有序对。因此，最终的集合里一个元素都没有，即为空集。

(iii) 笛卡尔积的基数

\#(X \times Y) = \#(X) \#(Y)：笛卡尔积的基数等于各集合\\基数\\*的乘积。
这个规律被称为乘法原理 (Multiplication Principle)。
直观理解：要构造一个有序对 $(x,y)$ ，分两步走。第一步，为 $x$ 选择一个值，有 $\#(X)$ 种选择。第二步，对于 $x$ 的每一种选择，我们都可以为 $y$ 选择一个值，有 $\#(Y)$ 种选择。所以总的组合数就是 $\#(X) \times \#(Y)$ 。
推广到n个集合：\#(X_1 \times ... \times X_n) = \#(X_1) ... \#(X_n)。这个原理可以一直推广下去。
与(ii)的验证：这个公式也很好地解释了为什么与空集的乘积是空集。因为 $\#(\emptyset) = 0$ ，所以 $\#(\emptyset \times X) = \#(\emptyset) \times \#(X) = 0 \times \#(X) = 0$ 。一个基数为0的集合就是空集。

∑ [公式拆解]

\#(X \times Y)=\#(X) \#(Y)

\#\left(X_{1} \times \cdots \times X_{n}\right)=\#\left(X_{1}\right) \times \cdots \times \#\left(X_{n}\right)

这些是组合数学中的基本乘法原理。它们不是从更基本的定理推导出来的，而是基于“分步计数”这个基本思想。

💡 [数值示例]

示例1 (基数计算)：
令 $X = \{1, 2\}$ ，则 $\#(X) = 2$ 。
令 $Y = \{a, b, c\}$ ，则 $\#(Y) = 3$ 。
$X \times Y = \{ (1,a), (1,b), (1,c), (2,a), (2,b), (2,c) \}$ 。
$\#(X \times Y) = 6$ 。
验证： $\#(X) \times \#(Y) = 2 \times 3 = 6$ 。公式成立。

示例2 (掷骰子)：
掷一个六面的骰子，可能的结果集合是 $D = \{1, 2, 3, 4, 5, 6\}$ ， $\#(D)=6$ 。
掷两个骰子，所有可能的结果集合是 $D \times D = D^2$ 。
总共有多少种可能的结果？ $\#(D^2) = \#(D) \times \#(D) = 6 \times 6 = 36$ 种。
掷三个骰子，结果总数是 $\#(D^3) = 6 \times 6 \times 6 = 216$ 种。

示例3 (子集的形式)：
令 $X = \{1,2,3\}, Y=\{a,b,c\}$ 。 $X \times Y$ 包含 $3 \times 3 = 9$ 个元素。
令 $A = \{1\}, B = \{a,b\}$ 。则 $A \subseteq X, B \subseteq Y$ 。
$A \times B = \{(1,a), (1,b)\}$ 。这是一个包含2个元素的集合。
显然 $A \times B \subseteq X \times Y$ 。
$S = \{(1,a), (2,b), (3,c)\}$ 是 $X \times Y$ 的一个子集，但它不能被写成 $A \times B$ 的形式。

⚠️ [易错点]

子集的误解：不要以为笛卡尔积的子集一定也是一个笛卡尔积。这只在特殊情况下成立。
空集的作用：只要有空集参与“叉乘”，结果就是“一无所有”。
基数公式只对有限集明确有效：对于无限集，这个乘法法则需要用超穷基数的理论来解释，不能简单地用 \infty * \infty = \infty 来理解。

📝 [总结]

本备注阐明了笛卡尔积的三个核心性质：

(i) “矩形”子集 $A \times B$ 是其父集 $X \times Y$ 的子集，但父集的大多数子集都不是这种“矩形”形式。

(ii) 与空集的笛卡尔积恒为空集。

(iii) 有限集的笛卡尔积的基数等于各集合\\基数\\的乘积。

🎯 [存在目的]

这些性质是使用笛卡尔积的基础。特别是基数的乘法法则是组合数学的基石，用于计算排列组合的总可能性。而对子集形式的探讨，则为后续引入“关系”和“函数”这些更精细的结构（它们都是笛卡尔积的子集）埋下了伏笔。

🧠 [直觉心智模型]

基数：服装搭配。你有2件上衣（集合X， $\#(X)=2$ ）和3条裤子（集合Y， $\#(Y)=3$ ）。总共有多少种不同的搭配方法（集合 $X \times Y$ ）？答案是 $2 \times 3 = 6$ 种。
子集：在所有6种搭配中，\{(上衣1, 裤子1), (上衣2, 裤子2)\} 是一个“特定搭配方案”的集合，它是所有搭配方案集合的一个子集。但这个方案本身无法分解成“某几件上衣”和“某几条裤子”的笛卡尔积。

💭 [直观想象]

子集：在坐标平面 $\mathbb{R}^2 = \mathbb{R} \times \mathbb{R}$ 中：
一个形如 $A \times B$ 的子集，其中 $A=[1,2], B=[3,4]$ 是区间，它对应坐标系中的一个实心矩形。
而直线 $y=x$ 对应的子集是 \{(x,x) | x \in R\}，它是一条斜线。
圆盘 $x^2+y^2 \leq 1$ 对应的子集是 \{(x,y) | x^2+y^2 \leq 1\}，它是一个圆形区域。
斜线和圆形区域都不能被表示为两个实数集子集的笛卡尔积。这直观地显示了笛卡尔积的子集远比“矩形”要丰富得多。

1. 2.9. 最后，一个非常重要的构造是集合的幂集：

1. 2.10. 定义 1.2.6.

📜 [原文15]

$X$ 的所有子集的集合也是一个集合，称为 $X$ 的幂集，通常记作 $\mathcal{P}(X)$ ：

\mathcal{P}(X)=\{A: A \subseteq X\}

📖 [逐步解释]

这个定义引入了又一个重要的集合构造方法：幂集 (Power Set)。

核心思想：给定一个集合 $X$ ，幂集 $\mathcal{P}(X)$ 是一个“集合的集合”。它的每一个元素，本身就是 $X$ 的一个子集。换句话说，你把 $X$ 的所有可能子集（包括空集和 $X$ 自身）都找出来，然后把这些子集作为元素装进一个更大的新集合里，这个新集合就是幂集。
定义与符号：
- $\mathcal{P}(X)$ 或 $2^X$ ：都读作 “ $X$ 的幂集” (Power set of X)。 $\mathcal{P}$ 是花体字母P。 $2^X$ 这个符号我们稍后会看到其合理性。
- 形式化定义：\{A : A \subseteq X\}。
- A 在这里是一个变量，但它代表的不是单个的对象，而是一个集合。
- : A \subseteq X 是条件，意味着只有当集合 $A$ 是 $X$ 的子集时，它才有资格成为幂集的一个元素。
构造幂集的过程：
从一个集合 $X$ 开始。
写下 $X$ 的所有可能的子集。
用一对花括号 {} 把所有这些子集括起来。

∑ [公式拆解]

\mathcal{P}(X)=\{A: A \subseteq X\}

这是一个描述法定义。

\mathcal{P}(X): 正在定义的幂集。
{...}: 表示这是一个集合。
A: 变量，代表幂集中的一个元素。这个 $A$ 本身是一个集合。
: A \subseteq X: 对变量 $A$ 的约束条件，即 $A$ 必须是 $X$ 的一个子集。

💡 [数值示例]

示例1 (简单集合)：
令 $X = \{1, 2\}$ 。
第一步：找出 X 的所有子集。
0个元素的子集： $\emptyset$
1个元素的子集： $\{1\}, \{2\}$
2个元素的子集： $\{1, 2\}$ (即 $X$ 自身)
第二步：把这些子集作为元素放入一个新集合。
$\mathcal{P}(X) = \{ \emptyset, \{1\}, \{2\}, \{1, 2\} \}$ 。
注意： $\mathcal{P}(X)$ 的元素是 $\emptyset, \{1\}, \{2\}, \{1, 2\}$ 。1 不是幂集的元素，\{1\} 才是。

示例2 (单元素集合)：
令 $Y = \{a\}$ 。
$Y$ 的子集只有两个： $\emptyset$ 和 $\{a\}$ 。
$\mathcal{P}(Y) = \{ \emptyset, \{a\} \}$ 。

示例3 (空集)：
令 $Z = \emptyset$ 。
$Z$ 的子集只有一个： $\emptyset$ 。
$\mathcal{P}(Z) = \{ \emptyset \}$ 。
这是一个非常重要的例子！空集的幂集不是空的，它是一个包含一个元素（即空集）的集合。

⚠️ [易错点]

元素与子集的混淆：这是幂集概念中最容易出错的地方。 $\mathcal{P}(X)$ 的元素是 $X$ 的子集，而不是 $X$ 的元素。如果 $x \in X$ ，那么一般来说 $x \notin \mathcal{P}(X)$ ，但是 $\{x\} \in \mathcal{P}(X)$ 。
空集和集合本身：构造幂集时，最容易遗漏的两个子集就是空集 $\emptyset$ 和集合 $X$ 自身。它们永远是幂集的成员。
幂集的基数：如果一个有限集 $X$ 有 $n$ 个元素（$\#(X)=n$），那么它的幂集 $\mathcal{P}(X)$ 有 $2^n$ 个元素（$\#(\mathcal{P}(X))=2^n$）。
- 验证示例1: $X=\{1,2\}$ , $\#(X)=2$ 。 $\mathcal{P}(X)$ 有4个元素。 $2^2=4$ ，成立。
- 验证示例2: $Y=\{a\}$ , $\#(Y)=1$ 。 $\mathcal{P}(Y)$ 有2个元素。 $2^1=2$ ，成立。
- 验证示例3: $Z=\emptyset$ , $\#(Z)=0$ 。 $\mathcal{P}(Z)$ 有1个元素。 $2^0=1$ ，成立。
- 原因：对于 $X$ 中的每个元素，在构造一个子集时，我们都有两种选择：“选”或“不选”。如果有 $n$ 个元素，根据乘法原理，总共就有 $2 \times 2 \times \dots \times 2$ (n次) $= 2^n$ 种不同的选择，即 $2^n$ 个不同的子集。

📝 [总结]

本段定义了幂集 $\mathcal{P}(X)$ ，它是一个其元素为原集合 $X$ 所有子集的新集合。

🎯 [存在目的]

幂集是一个在集合论、逻辑学、计算机科学和拓扑学中都极为重要的构造。

集合论：幂集公理是标准集合论（ZFC）的公理之一，它保证了幂集的存在性。康托的对角线论证证明了任何集合的幂集都比原集合“更大”（基数更高），这揭示了无穷有不同的大小。
计算机科学：幂集与二进制表示有直接关系。一个 $n$ 元素\\集合的任何子集都可以用一个 $n$ 位的二进制数来表示，每一位对应一个元素\\，1代表“选”，0代表“不选”。
拓扑学：一个空间上的拓扑结构，就是其幂集的一个子集（满足特定条件的开集族）。

🧠 [直觉心智模型]

自助餐模型：想象一个集合 $X$ 是一张自助餐台，上面摆着各种菜品 $X = \{\text{菜A}, \text{菜B}, \text{菜C}\}$ 。
幂集 $\mathcal{P}(X)$ 就是所有可能的“取餐方案”的集合。
一个方案（幂集的一个元素）就是你盘子里装的菜（ $X$ 的一个子集）。
$\emptyset$ ：什么都不拿。
$\{\text{菜A}\}$ ：只拿菜A。
$\{\text{菜A}, \text{菜B}\}$ ：拿菜A和菜B。
...
$\{\text{菜A}, \text{菜B}, \text{菜C}\}$ ：每样都拿。
幂集就是包含所有这些“盘子”的集合。

💭 [直观想象]

开关面板：如果一个集合 $X$ 有 $n$ 个元素，想象一排有 $n$ 个开关，每个开关对应一个元素。
任何一种开关的“开/关”组合，都唯一对应 $X$ 的一个子集（“开”表示选中该元素）。
所有可能的开关组合状态有 $2^n$ 种。
幂集就是这 $2^n$ 种状态的集合。

1. 2.11. 例 1.2.7.

📜 [原文16]

(i) 根据备注 1.1.4 中的传递性，如果 $Y$ 是 $X$ 的子集，则 $\mathcal{P}(Y)$ 是 $\mathcal{P}(X)$ 的子集。

(ii) 注意 $X \in \mathcal{P}(X)$ 且 $\emptyset \in \mathcal{P}(X)$ 。

(iii) 如果 $X \neq \emptyset$ 且 $x \in X$ ，则 $\{x\} \in \mathcal{P}(X)$ 。

(iv) $\mathcal{P}(\emptyset)=\{\emptyset\}$ 。特别是， $\mathcal{P}(\emptyset) \neq \emptyset$ ；事实上， $\mathcal{P}(\emptyset)$ 包含唯一的元素 $\emptyset$ ，因此 $\#(\mathcal{P}(\emptyset))=1$ 。同样地， $\mathcal{P}(\mathcal{P}(\emptyset))=\mathcal{P}(\{\emptyset\})=\{\emptyset,\{\emptyset\}\}$ 。特别是， $\#(\mathcal{P}(\mathcal{P}(\emptyset)))=2$ 。同样地，

\mathcal{P}(\{\emptyset,\{\emptyset\}\})=\{\emptyset,\{\emptyset\},\{\{\emptyset\}\},\{\emptyset,\{\emptyset\}\}\}

因此 $\#(\mathcal{P}(\{\emptyset,\{\emptyset\}\}))=4$ 。更一般地，我们将看到，如果 $X$ 是一个有限集且 $\#(X)=n$ ，则 $\#(\mathcal{P}(X))=2^{n}$ 。

📖 [逐步解释]

这个例子通过一系列具体情况，帮助我们巩固对幂集的理解，特别是处理空集和嵌套集合时的情况。

(i) 幂集的子集关系

命题：如果 $Y \subseteq X$ ，那么 $\mathcal{P}(Y) \subseteq \mathcal{P}(X)$ 。
解释：这句话是说，小集合的幂集，也是大集合\\幂集的子集\\。
证明思路：

要证明 $\mathcal{P}(Y) \subseteq \mathcal{P}(X)$ ，我们需要证明 $\mathcal{P}(Y)$ 中的任意一个元素也属于 $\mathcal{P}(X)$ 。
设 $A$ 是 $\mathcal{P}(Y)$ 的一个任意元素，即 $A \in \mathcal{P}(Y)$ 。
根据幂集定义，这意味着 $A$ 是 $Y$ 的一个子集，即 $A \subseteq Y$ 。
我们已知条件是 $Y \subseteq X$ 。
根据子集关系的传递性（备注 1.1.4），由 $A \subseteq Y$ 和 $Y \subseteq X$ 可以得出 $A \subseteq X$ 。
既然 $A \subseteq X$ ，那么根据幂集定义， $A$ 就是 $\mathcal{P}(X)$ 的一个元素，即 $A \in \mathcal{P}(X)$ 。
证毕。

(ii) 两个特殊的元素

X \in \mathcal{P}(X)： $X$ 自身是它自己的一个子集，所以 $X$ 是其幂集的一个元素。
\emptyset \in \mathcal{P}(X)：空集是任何集合的子集，所以空集是任何集合\\幂集的一个元素\\。
这两个是构造幂集时必须包含、也最容易忘记的两个元素。

(iii) 单元素子集是幂集的元素

如果 X \neq \emptyset 且 x \in X，则 \{x\} \in \mathcal{P}(X)。
如果 $X$ 不是空的，我们就可以从中取出一个元素 $x$ 。
由这个 $x$ 构成的单元素子集 $\{x\}$ 是 $X$ 的一个子集。
因此， $\{x\}$ 是 $X$ 的幂集的一个元素。

(iv) 迭代构造幂集

这是本例最核心、最能考验理解深度的部分。它展示了对幂集进行迭代操作的结果。
第一层： $\mathcal{P}(\emptyset) = \{\emptyset\}$ 。
空集 $\emptyset$ 的子集只有一个，就是 $\emptyset$ 本身。
所以 $\mathcal{P}(\emptyset)$ 就是把这个唯一的子集 $\emptyset$ 装进去，得到 $\{\emptyset\}$ 。
\#(\mathcal{P}(\emptyset)) = 1。这与 $2^0=1$ 的公式一致。

第二层： $\mathcal{P}(\mathcal{P}(\emptyset)) = \mathcal{P}(\{\emptyset\})$ 。
我们现在要求集合 A = \{\emptyset\} 的幂集。
$A$ 是一个单元素子集，它的唯一元素是 $\emptyset$ 。
$A$ 的子集有哪些？
空集： $\emptyset$
$A$ 自身： $\{\emptyset\}$
所以， $\mathcal{P}(A) = \{\emptyset, \{\emptyset\}\}$ 。
\#(\mathcal{P}(\mathcal{P}(\emptyset))) = 2。这与 $2^1=2$ 的公式一致。

第三层： $\mathcal{P}(\{\emptyset, \{\emptyset\}\})$
我们现在要求集合 B = \{\emptyset, \{\emptyset\}\} 的幂集。
$B$ 有两个元素：e1 = \emptyset 和 e2 = \{\emptyset\}。
$B$ 的子集有哪些？( $\#(B)=2$ ，所以应该有 $2^2=4$ 个)
0个元素的子集： $\emptyset$
1个元素的子集： $\{e1\} = \{\emptyset\}$ 和 $\{e2\} = \{\{\emptyset\}\}$
2个元素的子集： $\{e1, e2\} = \{\emptyset, \{\emptyset\}\}$ (即 $B$ 自身)
把这4个子集装起来，得到 \{\emptyset, \{\emptyset\}, \{\{\emptyset\}\}, \{\emptyset, \{\emptyset\}\}\}。
\#(\mathcal{P}(\{\emptyset, \{\emptyset\}\})) = 4。这与 $2^2=4$ 的公式一致。

基数公式的预告：最后一句明确指出了我们通过例子发现的规律：如果 \#(X)=n，那么 \#(\mathcal{P}(X)) = 2^n。

∑ [公式拆解]

\mathcal{P}(\{\emptyset,\{\emptyset\}\})=\{\emptyset,\{\emptyset\},\{\{\emptyset\}\},\{\emptyset,\{\emptyset\}\}\}

这个公式是本段的核心示例，展示了对一个包含两个元素的集合求幂集的结果。

令 $B = \{\emptyset, \{\emptyset\}\}$ 。
$B$ 的子集包括：

空集： $\emptyset$
只包含第一个元素的单元素子集： $\{\emptyset\}$
只包含第二个元素的单元素子集： $\{\{\emptyset\}\}$
包含所有两个元素的子集（即 $B$ 自身）：$\{\emptyset, \{\emptyset\}\}$
- 将这四个子集作为元素放入一个新集合，就得到了右边的结果。

💡 [数值示例]

本段原文已经给出了非常详尽和典型的关于空集的嵌套示例。我们再举一个普通数值的例子来对比。

示例 (i)
$Y = \{1\}, X = \{1, 2\}$ 。 $Y \subseteq X$ 。
$\mathcal{P}(Y) = \{\emptyset, \{1\}\}$ 。
$\mathcal{P}(X) = \{\emptyset, \{1\}, \{2\}, \{1,2\}\}$ 。
显然， $\mathcal{P}(Y)$ 的每个元素（ $\emptyset$ 和 $\{1\}$ ）都在 $\mathcal{P}(X)$ 中，所以 $\mathcal{P}(Y) \subseteq \mathcal{P}(X)$ 。

示例 (iv) 对比
我们来求 $\mathcal{P}(\{1,2\})$ 。
子集有： $\emptyset, \{1\}, \{2\}, \{1,2\}$ 。
$\mathcal{P}(\{1,2\}) = \{\emptyset, \{1\}, \{2\}, \{1,2\}\}$ 。
\#(\mathcal{P}(\{1,2\})) = 4。
这与原文中求 $\mathcal{P}(\{\emptyset, \{\emptyset\}\})$ 的结构是完全一样的，只是把 1 换成了 \emptyset，把 2 换成了 \{\emptyset\}。

⚠️ [易错点]

括号层级：处理幂集的幂集时，花括号的层级非常容易搞混。务必小心翼翼地辨认，哪个括号界定了一个集合，哪个集合是另一个集合的元素。
元素身份：在 $\mathcal{P}(\{\emptyset, \{\emptyset\}\})$ 的例子中，要始终记着，我们操作的集合 B 的元素是 \emptyset 和 \{\emptyset\} 这两个东西，要把它们当作不可分割的整体 e1 和 e2 来思考，这样就不容易混淆。

📝 [总结]

此例通过具体情况展示了幂集的性质。它阐明了子集关系如何在幂集层面上传递，强调了 X 和 \emptyset 始终是幂集的元素，并通过对空集进行迭代取幂集操作，深刻揭示了幂集的构造方式及其基数为 $2^n$ 的规律。

🎯 [存在目的]

这些例子，特别是关于空集的嵌套例子，是检验是否真正理解了集合、子集、元素、幂集这些抽象概念的“试金石”。它们强迫我们摆脱对数字和字母的直观依赖，纯粹依靠定义来进行逻辑推理。这对于培养严谨的数学思维至关重要。

🧠 [直觉心智模型]

文件系统模型：
一个集合就像一个文件夹。
\emptyset 是一个空文件夹。
\{\emptyset\} 是一个文件夹，里面只包含一个“空文件夹”的快捷方式。
$\mathcal{P}(X)$ 就像一个“快照”文件夹，它里面包含了指向 $X$ 文件夹所有可能“子文件夹组合”的快捷方式。
$\mathcal{P}(\emptyset) = \{\emptyset\}$ ：对一个空文件夹做快照，只有一个“空文件夹”的状态。
$\mathcal{P}(\{\emptyset\}) = \{\emptyset, \{\emptyset\}\}$ ：对一个“内含一个空文件夹”的文件夹做快照，有两种状态：“什么都不包含”（即空文件夹状态）和“包含那个空文件夹”（即它自身的状态）。

💭 [直观想象]

俄罗斯套娃的幂集：
$X = \emptyset$ (没有娃娃)。 $\mathcal{P}(X) = \{\emptyset\}$ (一个场景：桌上没有娃娃)。
$X = \{娃_1\}$ (一个娃娃)。 $\mathcal{P}(X) = \{\emptyset, \{娃_1\}\}$ (两个场景：桌上没娃娃，桌上有娃1)。
$X = \{娃_1, 娃_2\}$ (两个娃娃)。 $\mathcal{P}(X) = \{\emptyset, \{娃_1\}, \{娃_2\}, \{娃_1, 娃_2\}\}$ (四个场景：没娃，只有娃1，只有娃2，两个娃都在)。
原文的例子就是把“娃1”换成“空集”，把“娃2”换成“包含空集的集合”。

31.3. 3. 函数 Functions

1. 3.1.

接下来我们定义函数 $f: X \rightarrow Y$ 。虽然我们可以把函数看作一个“规则”，它将 $X$ 中的每个 $x$ 映射到 $Y$ 中的唯一 $y$ ，但通过将函数 $f$ 与其在 $X \times Y$ 中的图像（如我们在微积分中被教导不要做的那样）联系起来，可以更容易地精确化这个概念。给定函数 $f: X \rightarrow Y$ ，我们有其图像 $G_{f} \subseteq X \times Y$ ，定义为

G_{f}=\{(x, y) \in X \times Y: y=f(x)\}

它具有以下性质：对于所有 $x \in X$ ，存在唯一一个 $y \in Y$ 使得 $(x, y) \in G_{f}$ ，即 $y=f(x)$ 。说存在唯一的 $y \in Y$ 意味着 $f(x)$ 由 $x$ 唯一确定，而说对于每个 $x \in X$ 都存在一个 $(x, y) \in G_{f}$ 则意味着 $f(x)$ 实际上对所有 $x \in X$ 都有定义。这就是所谓的垂直线测试：对于每个 $x \in X$ ，我们有 $X \times Y$ 的子集 $\{x\} \times Y$ 。（如果 $X=Y=\mathbb{R}$ ，这样的子集正是垂直线。）然后我们可以将其反过来作为函数的定义：

📖 [逐步解释]

这部分开始定义数学中另一个核心概念——函数 (Function)。作者采用了一种非常严谨的、基于集合论的方法来定义函数。

从直观到严格：
- 直观定义：我们通常把函数理解为一个“规则”、“机器”或“映射”。你给它一个输入 $x$ ，它就按照某个规则吐出一个唯一的输出 $y$ 。例如， $f(x) = x^2$ 就是一个规则，你输入2，它输出4。
- 严格定义的必要性： “规则”这个词在数学上不够精确。为了把函数也纳入集合论的框架，我们需要一个完全由集合和元素构成的定义。
- 作者的思路：借用函数的图像 (Graph) 来定义函数。我们通常认为图像是函数的附属品，但作者反其道而行之，把图像作为函数的本体。
函数的图像 (Graph of a function)：
- 给定一个我们直观理解的函数 $f: X \rightarrow Y$ ，它的图像 $G_f$ 是一个由有序对 $(x, y)$ 组成的集合。
- 这些有序对都属于笛卡尔积 $X \times Y$ ，所以图像是笛卡尔积的一个子集 ( $G_f \subseteq X \times Y$ )。
- 什么样的有序对 $(x, y)$ 才有资格进入图像集合？条件是： $y$ 必须是 $x$ 在函数 $f$ 下的输出，即 $y=f(x)$ 。
图像的关键性质 (垂直线测试)：
- 一个普通的笛卡尔积子集不能随便就叫函数图像，它必须满足一个极其重要的性质：“对于所有 $x \in X$ ，存在唯一一个 $y \in Y$ 使得 $(x, y) \in G_f$ ”。
- 我们来拆解这个性质：
- 对于所有 x \in X (For all $x \in X$ ): 这意味着定义域 $X$ 中的每一个元素都必须被“照顾到”，都必须有一个对应的输出。函数不能对定义域里的某些输入“装死”说“我不知道输出啥”。
- 存在 ... y \in Y (There exists a $y \in Y$ ): 保证了输出值是存在的。
- 唯一一个 (unique): 这是函数的本质！一个输入 $x$ 绝对不能对应多个不同的输出 $y$ 。一个 $x$ 只能对应一个 $y$ 。
- 垂直线测试 (Vertical Line Test)：这个性质在二维坐标系 ( $X=Y=\mathbb{R}$ ) 中有非常直观的几何解释。
- 集合 $\{x\} \times Y$ 在坐标系中代表什么？它代表所有第一坐标为 $x$ 的点，即一条垂直于x轴、经过点 $(x,0)$ 的垂直线。
- 性质“对于每个 $x$ ，存在唯一的 $y$ 使得 $(x, y) \in G_f$ ”，翻译成几何语言就是：“对于定义域中的每个 $x$ ，穿过它的那条垂直线，必须与函数图像 $G_f$ 有且只有一个交点。”
- 如果交点没有，说明这个 $x$ 没有定义输出。如果交点超过一个，说明这个 $x$ 对应多个输出。这两种情况都不是函数。
“反客为主”的定义：既然我们知道了什么样的子集才配叫函数图像，那我们就直接用这个性质来定义函数。下一段（定义1.3.1）就会正式这么做。

∑ [公式拆解]

G_{f}=\{(x, y) \in X \times Y: y=f(x)\}

G_f: 函数 f 的图像 (Graph)。它是一个集合。
{...}: 描述法。
(x, y) \in X \times Y: 图像的元素是来自笛卡尔积 $X \times Y$ 的有序对。
: y=f(x): 约束条件，只有满足“输出-输入”关系的有序对才能被选中。

💡 [数值示例]

示例1 (是函数)：
令 $X=\{1,2,3\}, Y=\{a,b,c,d\}$ 。
函数规则: $f(1)=a, f(2)=a, f(3)=c$ 。
图像: $G_f = \{(1,a), (2,a), (3,c)\}$ 。
验证垂直线测试:
$x=1$ : 只有一个有序对以1开头，即 $(1,a)$ 。通过。
$x=2$ : 只有一个有序对以2开头，即 $(2,a)$ 。通过。
$x=3$ : 只有一个有序对以3开头，即 $(3,c)$ 。通过。
并且 $X$ 中所有元素 1,2,3 都被用作第一分量了。
所以， $G_f$ 确实是一个从 $X$ 到 $Y$ 的函数图像。

示例2 (不是函数 - 违反“唯一”性)：
令 $X=\mathbb{R}, Y=\mathbb{R}$ 。
考虑一个圆的方程 $x^2 + y^2 = 1$ 。它对应的笛卡尔积子集是 $S = \{(x,y) \in \mathbb{R}^2 : x^2+y^2=1\}$ 。
这个 $S$ 是不是一个从 $[-1,1]$ 到 $\mathbb{R}$ 的函数图像？
垂直线测试: 取 $x=0$ 。满足 $0^2+y^2=1$ 的 $y$ 有两个： $y=1$ 和 $y=-1$ 。
所以，有序对 $(0,1)$ 和 $(0,-1)$ 都属于 $S$ 。
垂直线 $x=0$ 与图像有两个交点。违反了“唯一性”。
因此，圆不是一个函数的图像。

示例3 (不是函数 - 违反“所有x”性)：
令 $X=\mathbb{R}, Y=\mathbb{R}$ 。
考虑规则 $g(x) = 1/x$ 。
图像: $G_g = \{(x, 1/x) : x \in \mathbb{R}, x \neq 0\}$ 。
这个 $G_g$ 是不是一个从 $X=\mathbb{R}$ 到 $Y=\mathbb{R}$ 的函数图像？
垂直线测试: 取 $x=0$ 。在 $G_g$ 中不存在任何以0为第一分量的有序对。
垂直线 $x=0$ 与图像没有交点。
违反了“对于所有 $x \in X$ ”的要求。
因此，这个规则不能定义一个从 $\mathbb{R}$ 到 $\mathbb{R}$ 的函数。它可以定义一个从 $\mathbb{R} \setminus \{0\}$ 到 $\mathbb{R}$ 的函数。

⚠️ [易错点]

定义域的重要性：一个规则是否构成一个函数，与指定的定义域 $X$ 息息相关。如示例3所示， $g(x)=1/x$ 在定义域为 $\mathbb{R}$ 时不是函数，但在定义域为 $\mathbb{R} \setminus \{0\}$ 时是函数。
“多对一”是允许的：函数只要求一个输入不能有多个输出。但多个不同的输入可以有相同的输出。如示例1中， $f(1)=a$ 和 $f(2)=a$ ，这是完全允许的。几何上，这意味着“水平线测试”可以不通过。

📝 [总结]

本段为定义函数铺平了道路，其核心策略是：将函数等同于其图像。一个函数的图像是一个特殊的笛卡尔积子集，它必须满足“垂直线测试”：定义域中的每个 $x$ 值，都必须对应图像中有且仅有的一个点。

🎯 [存在目的]

这种看似绕弯的定义方法，其根本目的是为了严谨性。它将函数这个动态的“过程”或“规则”概念，转化为了一个静态的、良定义的集合对象（即图像），从而将函数完全纳入了集合论的体系中。这使得我们可以用集合论的工具来精确地研究和证明关于函数的各种性质。

🧠 [直觉心智模型]

通讯录模型：
集合 $X$ 是你所有朋友的名字。
集合 $Y$ 是所有可能的电话号码。
函数 $f: X \rightarrow Y$ 就是一本通讯录。
图像 $G_f$ 就是通讯录里的每一条记录，形如 (朋友名, 电话号码)。
垂直线测试的要求：

对于所有x: 通讯录里必须包含你每一位朋友的名字，不能漏掉。
存在唯一的y: 每一位朋友的名字后面，必须有且只有一个电话号码。不能一个号码都没有，也不能一个人对应好几个号码（只考虑主号码）。
- 满足这两个条件的“记录集合”，本身就是这本通讯录（函数）。

💭 [直观想象]

投影仪模型：
想象在地面（ $X$ 轴）上有一个定义域集合 $X$ 。
在空中有一个图像曲线 $G_f$ 。
有一台从正上方垂直向下照射的投影仪。
$G_f$ 是一个函数图像的条件是：

它在地面的投影必须恰好覆盖整个定义域 $X$ 。（不能有地方没照到）
$G_f$ 这条曲线本身不能有任何“垂直重叠”的部分，否则投影下来一个点就会对应天上的多个点。

1. 3.2. 定义 1.3.1.

📜 [原文17]

函数 $f: X \rightarrow Y$ 是 $X \times Y$ 的一个子集 $G$ ，使得对于每个 $x \in X$ ， $(\{x\} \times Y) \cap G$ 恰好包含一个点，必然是 $(x, y)$ 形式的，其中 $y \in Y$ 。这个唯一的 $y$ 然后记作 $f(x)$ 。

在上述符号中，我们称 $X$ 为 $f$ 的定义域，称 $Y$ 为 $f$ 的值域。因此，定义域和值域是函数信息的一部分。

我们也将“映射”或“映照”作为函数的同义词；通常映射是某种几何环境中的函数。

📖 [逐步解释]

这是对函数的正式、严格的定义，完全基于集合论。

函数是什么？ 定义开宗明义：函数 $f: X \rightarrow Y$ 是 $X \times Y$ 的一个子集 $G$ 。这句话直接将函数的本体定义为其图像。
什么样的子集？ 不是任何子集都行，它必须满足一个条件：对于每个 $x \in X$ ， $(\{x\} \times Y) \cap G$ 恰好包含一个点。
- \{x\} \times Y：我们之前解释过，这就是代表通过 $x$ 的那条“垂直线”。
- G：就是我们正在考察的那个子集（即图像）。
- (...) \cap G：取“垂直线”和“图像”的交集。
- 恰好包含一个点：这是对“垂直线测试”最精确的描述。
- “包含点”确保了存在性（至少一个交点）。
- “恰好一个”确保了唯一性（不能多于一个交点）。
- 这个点必然是 (x, y) 的形式，因为它是从垂直线 $\{x\} \times Y$ 上取出来的。
$f(x)$ 的由来：
- 既然对于每个 $x$ ，都存在唯一的一个 $y$ 使得 $(x, y)$ 在这个图像集合 $G$ 中，我们就可以给这个唯一的 $y$ 一个名字。
- 我们就把它记作 $f(x)$ 。
- f(x) 这个我们熟悉的写法，在这里被重新定义为：在函数（即图像集合 $G$ ）中，与 $x$ 配对的那个唯一的第二分量。
- 这样，y = f(x) 就与 (x, y) \in G 成了同义词。
定义域 (Domain) 和值域 (Codomain/Range)：
- $X$ ：输入的来源集合，称为定义域。
- $Y$ ：输出的“目标”集合或“候选”集合，称为值域。
- 重要：定义域 $X$ 和值域 $Y$ 是函数定义的一部分。f: X -> Y 和 g: A -> B 如果 $X \neq A$ 或 $Y \neq B$ ，那么即使它们的对应规则相同，它们也是不同的函数。这在现代数学中非常重要。
- 注意：这里的值域 (Codomain) 和后面会讲的像 (Image) 是不同的概念。值域是事先指定的输出范围，而像是实际输出值的集合。像必然是值域的一个子集。
同义词：
- 映射 (Map) 或 映照 (Mapping) 通常可以和函数互换使用。
- 在几何或者拓扑的语境中，用“映射”这个词更能体现出一种“变换”或“投影”的动态感觉。

💡 [数值示例]

示例1：
$X=\{1,2\}, Y=\{a,b\}$ 。
$X \times Y = \{(1,a), (1,b), (2,a), (2,b)\}$ 。
考虑 $X \times Y$ 的一个子集 $G = \{(1,a), (2,b)\}$ 。我们来判断 $G$ 是否是一个函数 $f: X \rightarrow Y$ 。
检查 $x=1$ :
垂直线是 $\{1\} \times Y = \{(1,a), (1,b)\}$ 。
交集是 $(\{1\} \times Y) \cap G = \{(1,a)\}$ 。
恰好包含一个点。通过。这个点是 $(1,a)$ ，所以我们定义 $f(1)=a$ 。
检查 $x=2$ :
垂直线是 $\{2\} \times Y = \{(2,a), (2,b)\}$ 。
交集是 $(\{2\} \times Y) \cap G = \{(2,b)\}$ 。
恰好包含一个点。通过。这个点是 $(2,b)$ ，所以我们定义 $f(2)=b$ 。
结论： $G$ 满足函数的定义。它就是函数 $f(x)$ ，其中 $f(1)=a, f(2)=b$ 。

示例2：
$X=\{1,2\}, Y=\{a,b\}$ 。
考虑另一个子集 $H = \{(1,a)\}$ 。判断 $H$ 是否是函数 $f:X \rightarrow Y$ 。
检查 $x=1$ : 交集是 $\{(1,a)\}$ ，恰好一个点。通过。
检查 $x=2$ : 垂直线是 $\{(2,a), (2,b)\}$ 。交集是 $(\{2\} \times Y) \cap H = \emptyset$ 。
交集是空集，不包含任何点，违反了“恰好包含一个点”的要求。
结论： $H$ 不是一个从 $X$ 到 $Y$ 的函数，因为它没有对定义域中所有的元素（即2）给出定义。

⚠️ [易错点]

函数本身就是集合：这个定义最核心的转变在于，函数不再是一个抽象的“规则”，它就是一个特定类型的集合。f 和 G 在这里是同一个东西。
Codomain vs. Image (值域 vs. 像): 这是一个非常重要的区别。
- 值域 (Codomain) $Y$ 是我们事先声明的“靶子”范围。
- 像 (Image) 是实际射中的点的集合。
- 示例：在示例1中，函数 $f$ 的值域是 $Y=\{a,b\}$ 。实际的输出值是 $\{a,b\}$ ，所以像是 $\{a,b\}$ 。在这里，像恰好等于值域。
- 另一个示例：令 $g: \{1,2\} \rightarrow \{a,b,c\}$ ，其图像为 $G_g = \{(1,a), (2,a)\}$ 。
- 值域是 $\{a,b,c\}$ 。
- 实际输出值只有 $a$ 。所以像是 $\{a\}$ 。
- 在这里，像是值域的真子集。

📝 [总结]

本段给出了函数的严格集合论定义：一个函数 $f: X \rightarrow Y$ 就是其图像，即笛卡尔积 $X \times Y$ 的一个满足“垂直线测试”的特殊子集 $G$ 。同时明确了定义域和值域是函数定义中不可或缺的部分。

🎯 [存在目的]

这个定义的目的是提供一个无歧义的、坚实的基础，以便在此之上构建整个函数理论。通过将函数对象化为一个集合，所有关于函数的性质（如相等性、复合、反函数等）都可以转化为集合的操作和性质进行证明，从而保证了数学的严谨性。

🧠 [直觉心智模型]

法律条文模型：
定义函数就像是在立一部《函数法》。
法律条文（定义 1.3.1）规定：“任何一个被称为‘从X到Y的函数’的实体，必须是 $X \times Y$ 的一个子集，并且该子集必须通过‘垂直线测试’的检验。检验通过后，我们才授予它‘函数’的合法地位，并允许使用 $f(x)$ 这样的简便记号。”
这个定义就像法官判案的唯一依据，任何声称自己是函数的东西，都要拿这个条文来衡量。

💭 [直观想象]

一夫一妻制模型（在特定文化背景下）：
集合 $X$ 是一村的全部男性。
集合 $Y$ 是一村的全部女性。
一个函数 $f: X \rightarrow Y$ 是一种婚姻关系。
图像 $G_f$ 就是民政局的婚姻登记记录集合，每条记录是 (男方, 女方)。
函数定义的条件是：

对于每个 x \in X: 村里每个男的都必须出现在登记记录的“男方”一栏里（全村男性都必须结婚）。
恰好包含一个点: 每个男的在“男方”栏里只能出现一次（禁止一夫多妻）。
- 注意：这个模型允许“一妻多夫”的反向情况不成立（一个女方可以出现在多条记录里），这对应函数可以是“多对一”的。也允许村里有未婚女性（值域大于像）。

1. 3.3. 备注 1.3.2.

📜 [原文18]

(i) 注意函数必须在其定义域的所有元素上都有定义；因此，例如，函数 $f(x)=1 / x$ 不能在定义域 $\mathbb{R}$ 上而不对 $f(0)$ 赋值。（这与某些微积分课程中的做法相反，在这些课程中 $f$ 可以不必处处有定义。）

(ii) 两个函数 $f_{1}$ 和 $f_{2}$ 相等当且仅当它们的图像相等，当且仅当，对于所有 $x \in X, f_{1}(x)=f_{2}(x)$ 。因此，就像集合由其元素指定一样，函数由其值唯一指定。但是我们强调，要使两个函数 $f_{1}$ 和 $f_{2}$ 相等，它们必须具有相同的定义域和值域。

(iii) 如果 $X=\left\{x_{1}, \ldots, x_{n}\right\}$ 是一个有限集，则函数 $f: X \rightarrow Y$ 可以通过一个表格来描述：

$x_{1}$	$x_{2}$	$x_{3}$	$\ldots$	$x_{n}$
$f\left(x_{1}\right)$	$f\left(x_{2}\right)$	$f\left(x_{3}\right)$	$\ldots$	$f\left(x_{n}\right)$

📖 [逐步解释]

这个备注对函数的定义做了一些重要的澄清和补充。

(i) 全域定义 (Total function)

核心要求：根据我们严格的定义，一个函数 $f: X \rightarrow Y$ 必须对定义域 $X$ 中的每一个元素都有定义。不能有“漏网之鱼”。
例子 $f(x)=1/x$ ：
如果我们声明一个函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ ，并给出规则 $f(x)=1/x$ ，这是不合法的。因为当 $x=0$ 时，这个规则无法给出一个在 $\mathbb{R}$ 中的输出值。这违反了“垂直线测试”中“对于所有 $x \in X$ ”的要求。
正确的做法是，明确指出定义域不包含0。例如，定义一个新函数 $g: \mathbb{R}\setminus\{0\} \rightarrow \mathbb{R}$ ，规则是 $g(x)=1/x$ 。这个函数 $g$ 是合法的。
与微积分课程的对比：作者指出，在一些不那么严格的微积分教学中，可能会直接说“函数 $f(x)=1/x$ ”，并默认其定义域是“所有能让表达式有意义的x的集合”。但在更严谨的代数或分析中，定义域必须事先明确指定，并且函数必须在该定义域上完全有定义。我们这里的定义属于后者，即所谓的全函数(Total function)。那些允许部分有定义的被称为部分函数(Partial function)。

(ii) 函数的相等性 (Equality of Functions)

根本判据：两个函数相等，当且仅当它们的图像（作为集合）相等。这是最根本的定义，因为它直接源于“函数就是其图像”这个定义。
操作性判据：从图像相等可以推导出更实用的判据：对于定义域中所有的 $x$ ，两个函数的输出值都必须相等，即 $f_1(x) = f_2(x)$ 。
一个重要的附加条件：作者特别强调，要判断两个函数相等，光有相同的对应规则和定义域还不够，它们的值域 (Codomain) 也必须相同！
例子：
令 $f: \mathbb{R} \rightarrow \mathbb{R}$ ，规则为 $f(x)=x^2$ 。
令 $g: \mathbb{R} \rightarrow [0, \infty)$ ，规则为 $g(x)=x^2$ 。
虽然对于任何实数 $x$ ， $f(x)=g(x)$ ，且它们的定义域都是 $\mathbb{R}$ ，但它们的值域不同（一个是 $\mathbb{R}$ ，一个是 $[0, \infty)$ ）。
根据严格定义，函数 $f$ 和 $g$ 是不同的函数。因为 $f$ 的图像是 $\mathbb{R} \times \mathbb{R}$ 的子集，而 $g$ 的图像是 $\mathbb{R} \times [0, \infty)$ 的子集。它们属于不同的笛卡尔积空间。
这个区别在讨论满射性质时会变得至关重要。

(iii) 有限集上的函数表示

如果定义域 $X$ 是一个有限集，那么我们可以用一个简单的两行表格来完整地描述一个函数。
表格的第一行是定义域的所有元素。
表格的第二行是每个元素对应的输出值。
这个表格实际上就是函数图像 \{(x_1, f(x_1)), ..., (x_n, f(x_n))\} 的另一种表现形式。

💡 [数值示例]

示例 (ii) - 函数相等：
$X=\{1,2\}, Y=\{a,b\}$
$f_1: X \rightarrow Y$ 定义为 $f_1(1)=a, f_1(2)=b$ 。其图像是 $G_1 = \{(1,a), (2,b)\}$ 。
$f_2: X \rightarrow Y$ 定义为 $f_2(x) =$ "如果x=1则输出a，否则输出b"。其图像是 $G_2 = \{(1,a), (2,b)\}$ 。
$f_3: X \rightarrow Y$ 定义为 $f_3(1)=b, f_3(2)=a$ 。其图像是 $G_3 = \{(1,b), (2,a)\}$ 。
判断：
因为 $G_1 = G_2$ ，所以 $f_1=f_2$ 。函数的定义规则可以不同，只要最终的值对应关系完全一样。
因为 $G_1 \neq G_3$ ，所以 $f_1 \neq f_3$ 。

示例 (iii) - 表格表示：
令 $X = \{A, B, C\}$ ， $Y = \{0, 1\}$ 。
| 一个函数 $f: X \rightarrow Y$ 可以是： | x | A | B | C |

:-----------------------------------------	:--	:--	:--	---

这个表格唯一地定义了一个函数，其图像是 $\{(A,1), (B,0), (C,1)\}$ 。

⚠️ [易错点]

忘记检查值域：在判断函数是否相等时，除了检查定义域和对应法则，严格来说还必须检查值域是否相同。在很多初等场景下这个区别被模糊了，但在高等数学中至关重要。
全函数 vs. 部分函数：要根据上下文确定讨论的是哪种函数。在本书中，未特别说明时，"函数"就是指全函数。

📝 [总结]

此备注强调了函数定义的三个关键方面：

(i) 函数必须在定义域的所有点上有定义（全函数）。

(ii) 两个函数相等的充要条件是它们有相同的定义域、相同的值域，并且对定义域内所有元素给出相同的输出值。

(iii) 有限集上的函数可以用表格方便地表示。

🎯 [存在目的]

本段旨在消除对函数概念可能存在的模糊认识，为后续的理论建立清晰、无歧义的操作规范。特别是对函数相等性的严格定义，是所有涉及函数的证明和代数运算的基础。例如，当我们说“两个函数的和”时，我们必须先确保它们是“可相加”的（定义域和值域兼容），而相等性则是判断运算结果是否一致的依据。

🧠 [直觉心智模型]

函数相等性：这就像判断两份合同是否是“同一份合同”。
定义域相同：合同的甲方（或适用范围）必须一致。
值域相同：合同的目标（比如支付货币的币种）必须一致。
对应法则相同：合同的每一条具体条款（权利和义务）必须完全一样。
只有这三者都满足，才能说这两份是内容完全等价的合同。

💭 [直观想象]

函数表格：这个表格就像一个“查表”的过程。你输入第一行的任意一个值，就能在第二行查到唯一的对应值。这提供了一种非常具体、离散的方式来思考函数。

1. 3.4. 例 1.3.3.

📜 [原文19]

以下是一些基本的函数示例：

(i) 对于任何集合 $X$ ，恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$ 满足：对于每个 $x \in X$ ， $\operatorname{Id}_{X}(x)=x$ 。因此它在 $X^{2}$ 中的图像是集合

\Delta_{X}=\{(x, x): x \in X\}

我们可以将其视为 $X^{2}$ 的子集中的“对角线”。(对角线是否满足作为函数图像的测试？) 当 $X$ 在上下文中明确时，我们通常将 $\mathrm{Id}_{X}$ 缩写为 $\mathrm{Id}$ 。

📖 [逐步解释]

本节开始列举一些基础但极为重要的函数类型，第一个是恒等函数 (Identity Function)。

核心思想：恒等函数是最简单的函数，它什么也不做。你给它什么输入，它就原封不动地把输入作为输出。它是一个“透明”或“直通”的函数。
定义与符号：
- Id_X : X -> X：
- Id 是 "Identity" 的缩写。
- 下标 X 表明这是作用在集合 X 上的恒等函数。
- 它的定义域和值域必须是同一个集合 X。
- 规则：Id_X(x) = x 对于所有 $x \in X$ 都成立。
图像 (Graph)：
- 恒等函数的图像被称为对角线 (Diagonal)，记作 \Delta_X。
- 根据定义，图像是所有形如 (x, f(x)) 的有序对的集合。因为 f(x) = x，所以这里的有序对都是形如 (x, x)。
- \Delta_X = \{(x, x) : x \in X\}。即所有第一分量和第二分量相等的有序对的集合。
几何直观：
- 如果 $X = \mathbb{R}$ ，那么 $\mathrm{Id}_{\mathbb{R}}: \mathbb{R} \rightarrow \mathbb{R}$ 就是我们熟悉的函数 $y=x$ 。
- 它的图像 $\Delta_{\mathbb{R}} = \{(x, x) : x \in \mathbb{R}\}$ 正是穿过原点、与x轴成45度角的那条直线，即坐标系的对角线。
作者的提问：(对角线是否满足作为函数图像的测试？)
- 这是一个启发式问题，让我们自己验证。
- 验证：我们要测试 \Delta_X 是否满足“垂直线测试”。
对于所有 x \in X: 我们需要为 X 中每个元素都检查。
存在唯一的 y: 对于一个给定的 $x_0 \in X$ ，我们需要在 \Delta_X 中寻找形如 (x_0, y) 的有序对。
根据 \Delta_X 的定义，只有当 y = x_0 时，(x_0, y) 才可能在里面。
所以，(x_0, x_0) 是唯一一个以 $x_0$ 为第一分量的有序对。
测试通过。“垂直线” \{x_0\} \times X 与 \Delta_X 的交集是单元素集合 \{(x_0, x_0)\}。
- 所以，对角线确实是一个合法的函数图像。
简写：如果上下文很清楚我们正在讨论哪个集合 X，可以省略下标，直接写 Id。

∑ [公式拆解]

\Delta_{X}=\{(x, x): x \in X\}

\Delta_X: 符号，代表集合 $X$ 的对角线，也就是恒等函数 Id_X 的图像。\Delta 是大写的希腊字母 Delta。
{(x, x) : x \in X}: 描述法。
(x,x): 元素的形式，是一个第一和第二分量相等的有序对。
: x \in X: 表明 $x$ 可以取遍集合 $X$ 中的所有元素。

💡 [数值示例]

示例1 (有限集)：
令 $X = \{a, b, c\}$ 。
恒等函数 Id_X 的规则是 Id_X(a)=a, Id_X(b)=b, Id_X(c)=c。
它的图像（对角线）是 \Delta_X = \{(a, a), (b, b), (c, c)\}。

示例2 (数值集)：
令 $X = \{1, 2, 3\}$ 。
| Id_X 可以用表格表示： | x | 1 | 2 | 3 |

:----------------------	:--	:--	:--	---

图像是 \Delta_X = \{(1, 1), (2, 2), (3, 3)\}。

⚠️ [易错点]

定义域和值域必须相同：一个恒等函数 Id_X 必须是从 X 到 X 的函数。不存在从 X 到 Y (当 $X \neq Y$ ) 的恒等函数。
空集上的恒等函数：如果 $X=\emptyset$，那么 Id_\emptyset 是什么？
- 它的定义域和值域都是 $\emptyset$ 。
- 它的图像 \Delta_\emptyset = \{(x,x) : x \in \emptyset\}。因为空集中没有任何元素 $x$ ，所以这个图像集合也是空的，\Delta_\emptyset = \emptyset。
- 所以 Id_\emptyset 是一个图像为空集的函数。

📝 [总结]

本段定义了恒等函数 Id_X，它将每个元素映射到其自身。它的图像被称为对角线 \Delta_X，由所有形如 (x,x) 的有序对构成。

🎯 [存在目的]

恒等函数在函数的世界里，扮演着类似于数字“1”在乘法中、数字“0”在加法中的角色。它是一个“单位元 (identity element)”。

在函数复合（将两个函数串联起来）这个运算中，任何函数与恒等函数复合，结果都等于它自身（ $f \circ \mathrm{Id} = \mathrm{Id} \circ f = f$ ）。
它是定义“反函数”概念的基石。一个函数 $g$ 是另一个函数 $f$ 的反函数，如果它们的复合结果是恒等函数 ( $g \circ f = \mathrm{Id}$ )。

🧠 [直觉心智模型]

镜子模型：恒等函数就像一面完美的镜子。你（输入 $x$ ）照镜子，镜子里的人（输出 $f(x)$ ）就是你自己。
回声模型：你冲山谷喊一声“喂”（输入 $x$ ），山谷传回来的回声（输出 $f(x)$ ）还是“喂”。

💭 [直观想象]

在任何集合 $X$ 的笛卡尔积 $X \times X$ 构成的“网格”或“表格”中，对角线就是所有“行-列”坐标相同的那些单元格。
| 如果 $X=\{a,b,c\}$ : | | a | b | c |

:------------------	:--------	:--------	:--------	---
b		(b,b)
c			(c,c)

对角线 \Delta_X 就是表格中被加粗的那些单元格的集合。

1. 3.5. 例 1.3.3. (续)

📜 [原文20]

(ii) 一个相关例子是包含：如果 $X \subseteq Y$ ，则 $\Delta_{X}=\{(x, x): x \in X\}$ 是 $X \times Y$ 的子集，它是从 $X$ 到 $Y$ 的函数图像，我们通常将其表示为包含函数 $i_{X}$ 。

📖 [逐步解释]

这里介绍了一个与恒等函数密切相关但又有细微区别的函数：包含函数 (Inclusion map) 或包含映射。

前提条件：讨论包含函数的前提是，我们有两个集合 $X$ 和 $Y$ ，并且 $X$ 是 $Y$ 的一个子集 ( $X \subseteq Y$ )。
核心思想：包含函数的作用是，把子集 $X$ 中的元素，看作是“更大的”集合 $Y$ 中的元素。它本质上也是一个“什么都不做”的函数，只是它改变了我们看待元素的“上下文”（从在 $X$ 里看，变成在 $Y$ 里看）。
定义与符号：
- i_X : X -> Y：
- i 是 "Inclusion" 的首字母。
- 下标 X 表明这是将集合 X 包含进去的函数。
- 注意它的定义域是小集合 X，值域是大集合 Y。这与定义域和值域相同的恒等函数不同。
- 规则：虽然没有明确写出，但其规则就是 i_X(x) = x。
图像：
- 包含函数的图像，和恒等函数 Id_X 的图像 \Delta_X，是完全相同的集合！都是 \{(x, x) : x \in X\}。
- 关键区别：我们看待这个图像集合的“参考系”不同了。
- 对于 Id_X，我们认为 \Delta_X 是 X \times X 的一个子集。
- 对于 i_X，我们认为 \Delta_X 是 X \times Y 的一个子集。（因为 $X \subseteq Y$ ，所以 $X \times X \subseteq X \times Y$ ，所以这个看法是合理的）。
- 根据我们严格的定义，函数就是其图像，并且定义域和值域是函数信息的一部分。由于 Id_X : X -> X 和 i_X : X -> Y 的值域不同（当 $X \neq Y$ 时），所以它们是两个不同的函数，尽管它们的对应规则和图像集合本身是一样的。

💡 [数值示例]

示例1：
令 $X = \{1, 2\}$ ， $Y = \{1, 2, 3\}$ 。显然 $X \subseteq Y$ 。
恒等函数 Id_X：
Id_X: \{1,2\} -> \{1,2\}。
规则: Id_X(1)=1, Id_X(2)=2。
图像: \Delta_X = \{(1,1), (2,2)\}，被看作是 \{1,2\} \times \{1,2\} 的子集。
包含函数 i_X：
i_X: \{1,2\} -> \{1,2,3\}。
规则: i_X(1)=1, i_X(2)=2。
图像: G_{i_X} = \{(1,1), (2,2)\}，被看作是 \{1,2\} \times \{1,2,3\} 的子集。
Id_X 和 i_X 是不同的函数，因为它们的值域不同。

示例2 (数集)：
我们知道 $\mathbb{N} \subseteq \mathbb{Z}$ 。
存在一个包含函数 $i_{\mathbb{N}}: \mathbb{N} \rightarrow \mathbb{Z}$ 。
它的作用就是把一个自然数（比如 3）看作一个整数（3）。这看起来是废话，但在抽象代数中，区分一个结构中的元素和它在更大结构中的“化身”是非常重要的。

⚠️ [易错点]

与恒等函数的混淆：这是最主要的易错点。关键区别在于值域。只有当 $X=Y$ 时，包含函数 i_X 才等同于恒等函数 Id_X。
理解这种区分的必要性：初学者可能会觉得这种区分是“小题大做”。但在处理函数的性质，如满射时，这个区别是决定性的。Id_X 永远是满射的，而 i_X 只有在 $X=Y$ 时才是满射的。

📝 [总结]

本段定义了包含函数 i_X : X -> Y，它存在于当 $X$ 是 $Y$ 的子集时。它将 $X$ 中的每个元素映射到它自身，但将其视为 $Y$ 中的元素。尽管其图像集合与恒等函数 Id_X 相同，但由于值域不同，它们是不同的函数。

🎯 [存在目的]

包含函数在数学中是一个非常重要的“粘合剂”和“转换器”。它使得我们可以在不同的集合（或更复杂的代数结构，如群、环、空间）之间建立最自然、最直接的联系。

它可以形式化地描述“将小范围问题看作大范围问题的一部分”这个过程。
在范畴论等更抽象的领域，包含（以及其他类似的“自然”映射）是研究结构之间关系的核心。

[直觉心- 心灵模型\\：

身份变更模型：
集合 X 是“清华大学学生”的集合。
集合 Y 是“中国公民”的集合。显然 $X \subseteq Y$ 。
一个清华学生张三（ $x \in X$ ）。
恒等函数 Id_X 是在清华校园内部看张三，他的身份是“学生”。
包含函数 i_X 是在全国范围看张三，他的身份是“公民”。
i_X(张三) = 张三，人还是那个人，但我们看待他的“身份背景”（值域）变了。

💭 [直观想象]

图层模型：
想象在Photoshop或类似软件里有两个图层。
大图层 Y 是背景层。
小图层 X 是一个只在中间画了个小圈的前景层。
包含函数 i_X 就好比把 X 图层上的小圈内容，“合并”到背景层 Y 中去。小圈本身的内容没变，但它现在成了大背景的一部分。

1. 3.6. 例 1.3.3. (续)

📜 [原文21]

(iii) 另一个例子，如果 $X, Y \neq \emptyset$ ，是常数函数：选择 $c \in Y$ 并定义 $f(x)=c$ 对于所有 $x \in X$ 。（这个函数的图像是什么，为什么它是一个函数？）

📖 [逐步解释]

这里介绍了第三种基本函数类型：常数函数 (Constant Function)。

前提条件：定义域 $X$ 和值域 $Y$ 都不是空集。如果 $X$ 是空的，函数的图像也是空的。如果 $Y$ 是空的（但 $X$ 非空），则无法定义任何函数，因为找不到输出值。
核心思想：常数函数是最“固执”的函数。无论你给它什么输入，它永远只给你一个固定不变的输出。
定义：
首先，从值域 Y 中选择并固定一个元素，我们叫它 c。
然后，定义函数 f 的规则为：对于定义域 X 中的所有 x，输出都是这个固定的 c，即 f(x) = c。
图像 (Graph)：
- 图像是什么？ 根据定义，图像是所有 (x, f(x)) 有序对的集合。因为这里 f(x) 永远等于 c，所以图像就是所有形如 (x, c) 的有序对的集合，其中 x 可以取遍 X 中的所有元素。
- 形式化地写，图像是 $G_f = \{ (x, c) : x \in X \}$ 。
- 这个集合可以被看作是笛卡尔积 $X \times \{c\}$ 。
作者的提问：(为什么它是一个函数？)
- 我们需要用“垂直线测试”来检验它的图像 $G_f = \{ (x, c) : x \in X \}$ 。
- 验证：
对于所有 x \in X: 我们要对定义域中每个 $x_0 \in X$ 进行检查。
存在唯一的 y: 对于一个给定的 $x_0 \in X$ ，我们需要在 $G_f$ 中寻找形如 $(x_0, y)$ 的有序对。
根据 $G_f$ 的定义，只有一个有序对的第一分量是 $x_0$ ，它就是 $(x_0, c)$ 。
因此，对于每个 $x_0$ ，都存在唯一一个对应的有序对。
测试通过。所以常数函数确实是一个合法的函数。
几何直观：
- 如果 $X = \mathbb{R}, Y = \mathbb{R}$ ，并选择 $c=2$ ，那么常数函数就是 $f(x)=2$ 。
- 它的图像是 \{(x, 2) : x \in \mathbb{R}\}，这正是一条穿过点 (0,2) 的、平行于x轴的水平线。

💡 [数值示例]

示例1：
令 $X=\{ \text{苹果}, \text{香蕉}, \text{橙子} \}$ 。
令 $Y=\{ \text{红色}, \text{黄色}, \text{绿色} \}$ 。
我们从 $Y$ 中选择一个常数 $c = \text{红色}$ 。
定义常数函数 $f: X \rightarrow Y$ 为 $f(x) = \text{红色}$ 。
这意味着：
$f(\text{苹果}) = \text{红色}$
$f(\text{香蕉}) = \text{红色}$
$f(\text{橙子}) = \text{红色}$
图像是 $G_f = \{ (\text{苹果}, \text{红色}), (\text{香蕉}, \text{红色}), (\text{橙子}, \text{红色}) \}$ 。

示例2：
令 $X = \mathbb{Z}$ (整数集)， $Y = \mathbb{R}$ (实数集)。
选择常数 $c = \pi \in Y$ 。
定义常数函数 $g: \mathbb{Z} \rightarrow \mathbb{R}$ 为 $g(n) = \pi$ 。
这意味着 $g(0)=\pi, g(1)=\pi, g(-100)=\pi$ ，等等。所有整数的输出都是 $\pi$ 。

⚠️ [易错点]

常数c的选择：常数 $c$ 必须是值域 $Y$ 中的一个元素。你不能从别的地方选一个数来当常数。
定义域为空：如果定义域 $X = \emptyset$ ，那么任何一个 $c \in Y$ 定义的常数函数 $f: \emptyset \rightarrow Y$ 的图像都是空集 $\emptyset$ 。有趣的是，对于一个给定的值域 $Y$ ，从 $\emptyset$ 到 $Y$ 的函数只有一个，就是那个图像为空集的函数。
值域为空：如果值域 $Y = \emptyset$ 但定义域 $X \neq \emptyset$ ，那么我们无法从中选择任何常数 $c$ ，因此无法定义任何常数函数。事实上，此时无法定义任何函数。

📝 [总结]

本段定义了常数函数，它将定义域中的所有元素都映射到值域中的同一个固定元素 $c$ 。其图像是一条“水平线”，即 $X \times \{c\}$ 。

🎯 [存在目的]

常数函数是函数世界中最简单的非平凡例子（最平凡的是空集上的函数）。它在许多理论构建中作为基础案例或反例出现。

微积分：常数函数的导数是0。
线性代数：它通常不是一个线性变换（除非常数是0）。
它可以用来表示一种“状态无关”或“输入不敏感”的系统。

🧠 [直觉心智模型]

坏掉的自动售货机：想象一台自动售货机（函数）。
你按“可乐”按钮（输入 $x_1$ ），它掉出来一包薯片（输出 $c$ ）。
你按“雪碧”按钮（输入 $x_2$ ），它还掉出来一包薯片（输出 $c$ ）。
无论你按哪个按钮（任何输入 $x$ ），它永远只掉出来薯片（固定的输出 $c$ ）。
这台售货机就是一个常数函数。

💭 [直观想象]

投影到一个点：想象定义域 $X$ 是x轴上的一段区间，值域 $Y$ 是y轴。
常数函数 $f(x)=c$ 的作用就像把 $X$ 上的所有点，全部“压扁”或“投影”到y轴上的一个点 (0, c) 上。
它的图像就是连接 $X$ 上的点和那个目标点 $c$ 的“路径”，形成一条平行于x轴的水平线段。

1. 3.7. 例 1.3.3. (续)

📜 [原文22]

(iv) 当然，所有标准的微积分函数都提供了从 $\mathbb{R}$ 到 $\mathbb{R}$ 的函数示例（或者从开区间的并集到 $\mathbb{R}$ ，如果不是处处有定义的话）。

📖 [逐步解释]

这一小段的作用是连接抽象定义与我们已有的知识，告诉我们之前在微积分里学过的那些熟悉的函数，都符合我们现在这个严格的集合论定义。

熟悉的例子：
- $f(x) = x^2$
- $f(x) = \sin(x)$
- $f(x) = e^x$
- 多项式函数，如 $f(x) = 3x^3 - 2x + 5$
- 这些都是从实数集 $\mathbb{R}$ 到实数集 $\mathbb{R}$ 的函数，即 $f: \mathbb{R} \rightarrow \mathbb{R}$ 。
定义域的考量：
- 作者补充说，“或者从开区间的并集到 $\mathbb{R}$ ”。这指的是那些不是在所有实数上都有定义的微积分函数。
- 例子：
- $f(x) = \log(x)$ (自然对数)。它的定义域是所有正实数集合 $(0, \infty)$ 。所以严格来说，它是 $f: (0, \infty) \rightarrow \mathbb{R}$ 。
- $g(x) = \tan(x)$ 。它的定义域是所有实数除去 $\frac{\pi}{2} + k\pi$ ( $k$ 为整数) 的点。这个定义域可以被写成无穷多个开区间的并集，例如 $\dots \cup (-\frac{\pi}{2}, \frac{\pi}{2}) \cup (\frac{\pi}{2}, \frac{3\pi}{2}) \cup \dots$ 。
- 这再次呼应了备注 1.3.2(i) 的观点：在严谨的讨论中，函数的定义域必须明确，并且函数要在其定义域的每一点上都有定义。

💡 [数值示例]

示例1 ( $f(x)=x^2$ )：
函数: $f: \mathbb{R} \rightarrow \mathbb{R}$ 。
图像: $G_f = \{(x, x^2) : x \in \mathbb{R}\}$ 。这是一条抛物线。
验证: 任何一条垂直线 $x=x_0$ 都与这条抛物线有且只有一个交点 $(x_0, x_0^2)$ 。所以它是一个合法的函数。

示例2 ( $g(x)=\sqrt{x}$ )：
如果考虑 $g: \mathbb{R} \rightarrow \mathbb{R}$ ，则它不是一个合法的函数，因为对于任何 $x<0$ ，都没有实数输出。
正确的定义应该是 $g: [0, \infty) \rightarrow \mathbb{R}$ 。对于这个定义域里的任何 $x_0$ ，都有唯一的输出 $\sqrt{x_0}$ 。所以这是一个合法的函数。
有时也定义为 $g: [0, \infty) \rightarrow [0, \infty)$ ，这样值域更精确。

⚠️ [易错点]

默认定义域：在解决微积分问题时，我们常常依赖“自然定义域”（使表达式有意义的最大集合）的默契。但在此处更抽象的代数背景下，这种默契不再可靠，必须明确写出定义域。
多值函数：在一些领域（如复变函数），会讨论“多值函数”，例如复对数或n次方根。严格来说，它们不是我们这里定义的函数，而是更广义的“关系”。为了把它们变成函数，需要通过“分支切割”等手段限制其输出范围，使其变为单值。

📝 [总结]

本段是一个承上启下的例子，它将前面抽象的函数定义与读者在微积分等课程中已经熟悉的具体函数联系起来，确认了那些我们熟知的函数都符合这个更严格的集合论框架。

🎯 [存在目的]

本段的目的是为了让读者感到安心，确认我们现在学习的这个抽象定义不是什么全新的、奇怪的东西，而是对我们已有知识的提炼和升华。它告诉我们，这个定义是有足够表达力的，能够涵盖数学分析中几乎所有的研究对象。

🧠 [直觉心智模型]

法律溯及既往：新的《函数法》颁布了（定义1.3.1）。现在我们回头审查历史上已经存在的各种“函数”（微积分函数）。本段的作用就是宣布：“经过审查，确认 $y=x^2, y=\sin(x)$ 等实体符合新法规定，其‘函数’地位予以承认。对于 $y=\log(x)$ 等实体，需在附加条款中明确其适用范围（定义域）后，其‘函数’地位也予以承认。”

💭 [直观想象]

直接想象你在微积分课本里看到的所有函数图像：抛物线、正弦波、指数曲线、对数曲线等等。所有这些光滑的、没有“掉头”的曲线，都是合法的函数图像。而像圆、垂直线、或字母S的形状，则不是。

1. 3.8. 例 1.3.3. (续)

📜 [原文23]

(v) 另一个例子是笛卡尔积 $X \times X$ ：给定有序对 $(x_{1}, x_{2})$ ，我们可以将 $x_{i}$ 视为一个函数，它将值 $x_{1}$ 赋给 1，将 $x_{2}$ 赋给 2。通过这种方式，我们可以将 $X^{2}=X \times X$ 与所有函数 $f:\{1,2\} \rightarrow X$ 的集合等同起来。如果我们要以这种方式定义两个可能不同的集合的笛卡尔积，我们可以将 $X \times Y$ 定义为所有函数 $f:\{1,2\} \rightarrow X \cup Y$ 的集合，使得 $f(1) \in X$ 且 $f(2) \in Y$ 。同样地， $X^{n}$ 与函数 $f:\{1,2, \ldots, n\} \rightarrow X$ 的集合等同起来，而 $X_{1} \times \cdots \times X_{n}$ 定义为所有函数 $f:\{1,2, \ldots, n\} \rightarrow \bigcup_{i=1}^{n} X_{i}$ 的集合，使得对于每个 $i$ 都有 $f(i) \in X_{i}$ 。

📖 [逐步解释]

这是一个非常深刻和抽象的例子。它揭示了笛卡尔积和函数这两个概念之间令人惊讶的内在联系。它提供了一种用函数来重新定义笛卡尔积的视角。

核心思想的转换：
- 我们之前理解的有序对 (x_1, x_2) 是一个带有两个“槽位”的结构，第一个槽位放 x_1，第二个槽位放 x_2。
- 现在的思想是，把“槽位”本身看作输入，把槽位里的东西看作输出。
- “第一个槽位”就是数字 1，“第二个槽位”就是数字 2。
- 因此，一个有序对 (x_1, x_2) 可以被重新诠释为一个函数 f。这个函数的定义域是集合 {1, 2}。
- 当你给这个函数输入 1 时，它输出 x_1，即 f(1) = x_1。
- 当你给这个函数输入 2 时，它输出 x_2，即 f(2) = x_2。
- 这个函数 f 完整地包含了有序对 (x_1, x_2) 的所有信息。
等同关系 (Equivalence)：
- X^2 是所有形如 (x_1, x_2)（其中 $x_1, x_2 \in X$ ）的有序对的集合。
- 所有函数 f:{1,2} -> X 的集合。
- 这两者之间存在一个完美的“一一对应”关系。
- 每一个有序对 (x_1, x_2) 都对应一个唯一的函数 f（定义为 f(1)=x_1, f(2)=x_2）。
- 每一个这样的函数 f，也都对应一个唯一的有序对 (f(1), f(2))。
- 因此，我们可以说这两个集合是“等同的”或“同构的”。这意味着在更高的抽象层次上，我们可以把它们看作是同一个东西。
推广到不同集合的笛卡尔积：
- 如何用函数定义 X \times Y？
- 一个有序对 (x, y)，其中 $x \in X, y \in Y$ 。
- 我们可以将其看作一个函数 f，定义域还是 {1, 2}。
- f(1) = x, f(2) = y。
- 这里有一个小问题：f 的值域是什么？因为 x 和 y 来自不同的集合，所以输出值可能在 X 中，也可能在 Y 中。一个安全的值域选择是它们的并集 X \cup Y。
- 所以 X \times Y 可以被定义为：所有满足特定条件的函数 f: {1,2} -> X \cup Y 的集合。
- 条件是：f(1) 的值必须来自 X，并且 f(2) 的值必须来自 Y。
推广到n元组：
- 这个思想可以自然地推广。
- 一个有序n-元组 (x_1, x_2, ..., x_n) 可以被看作是一个函数 f，其定义域是集合 \{1, 2, ..., n\}。
- f(i) = x_i。
- 因此， $X^n$ 等同于所有函数 f: {1, ..., n} -> X 的集合。
- $X_1 \times \dots \times X_n$ 等同于所有满足 f(i) \in X_i 条件的函数 f: {1, ..., n} -> \bigcup X_i 的集合。
- 这正是备注 1.2.4 中预告的，用函数来给出有序n-元组的仔细定义。这个定义比嵌套有序对要清晰得多。

💡 [数值示例]

示例1 (有序对转函数)：
令 $X = \{a, b\}$ 。
$X^2 = \{(a,a), (a,b), (b,a), (b,b)\}$ 。
考虑有序对 $(a, b) \in X^2$ 。
它对应的函数是 $f: \{1,2\} \rightarrow \{a,b\}$ ，其中 $f(1)=a, f(2)=b$ 。
| 可以用表格表示这个函数： | x | 1 | 2 |

:---------------------------	:--	:--	---

示例2 (函数转有序对)：
考虑一个函数 $g: \{1,2\} \rightarrow \{a,b\}$ ，定义为 $g(1)=b, g(2)=b$ 。
这个函数对应的有序对是 $(g(1), g(2)) = (b,b)$ 。

示例3 (n-元组)：
考虑一个三维空间中的点 $(3, -1, 4) \in \mathbb{R}^3$ 。
它可以被看作一个函数 $f: \{1,2,3\} \rightarrow \mathbb{R}$ ，其中 $f(1)=3, f(2)=-1, f(3)=4$ 。

⚠️ [易错点]

这是一种重新诠释：不要把这种观点和有序对的原始定义混淆。这是一种更抽象、更统一的视角，揭示了不同数学概念间的深层联系。在大多数情况下，你仍然可以把有序对就看作是 (x, y)。
索引集 (Index Set)：这里的集合 {1, 2, ..., n} 起到了“索引”或“标签”的作用，所以被称为索引集。我们可以用任何方便的集合作为索引集，不一定非得是 {1, 2, ..., n}。例如，我们可以用 {'姓名', '年龄'} 作为索引集来定义一个记录。

📝 [总结]

本段提供了一个看待笛卡尔积的全新视角：一个有序n-元组可以被等同地看作一个定义在索引集 \{1, ..., n\} 上的函数。这个函数将每个索引（位置编号）映射到该位置上的元素。这揭示了笛卡尔积和函数这两个概念本质上的相通性。

🎯 [存在目的]

这种用函数来定义笛卡尔积的观点，在现代数学中非常重要，因为它具有强大的推广能力。

统一性：它将笛卡尔积这个看似特殊的操作，也归结为函数这一更普适的概念。
推广到无穷：如果索引集是无限集（比如自然数集 $\mathbb{N}$ ），我们就可以自然地定义出“无穷元组”，也就是“序列”。这正是下一段要讲的内容。
推广到任意索引集：我们可以定义由任意索引集 I 索引的笛卡尔积 $\prod_{i \in I} X_i$ ，它被定义为所有满足特定条件的函数 f: I -> \bigcup X_i 的集合。这在拓扑学和泛函分析等领域是基本工具。

🧠 [直觉心智模型]

查字典模型：
一个有序n-元组 (x_1, ..., x_n) 就像一本特殊的字典。
字典的“词条”（输入）是位置编号 1, 2, ..., n。
每个词条对应的“释义”（输出）是该位置的元素 $x_i$ 。
有序对 (a,b) 就是一本只有两个词条 "1" 和 "2" 的迷你字典，1 的释义是 a，2 的释义是 b。

💭 [直观想象]

电子表格的行：想象电子表格中的一行数据。
A B C D ... 这些列标签，就是索引集 {1, 2, 3, 4, ...}。
这一行本身，就可以看作一个函数。当你指定一个列标签（比如 C，即索引3），函数就会返回该单元格中的值。
整个电子表格就是所有这些“行函数”的集合。

1. 3.9. 例 1.3.3. (续)

📜 [原文24]

实数序列 $x_{1}, x_{2}, \ldots$ 与函数 $\mathbb{N} \rightarrow \mathbb{R}$ 是相同的，其中 $\mathbb{N}$ 仍然是自然数集 $\{1,2, \ldots\}$ 。这里，给定一个函数 $f: \mathbb{N} \rightarrow \mathbb{R}$ ，我们通过 $x_{i}=f(i)$ 定义一个序列 $x_{1}, x_{2}, \ldots$ ，反之亦然。更一般地，如果 $X$ 是任何集合，可能是有限的，那么一个值在 $X$ 中的序列 $x_{1}, x_{2}, \ldots$ 与一个函数 $f: \mathbb{N} \rightarrow X$ 是同一回事。

📖 [逐步解释]

这是上一个例子的直接应用和推广，它明确定义了数学中另一个基本概念——序列 (Sequence)。

序列的本质：
- 我们通常理解的序列，就是一长串按顺序排列的数（或其他对象），比如 $1, 4, 9, 16, \dots$ 。
- 这个例子的核心观点是：一个无穷序列，其本质就是一个定义域为自然数集 $\mathbb{N}$ 的函数。
序列与函数的对应关系：
- 函数 -> 序列：给定一个函数 $f: \mathbb{N} \rightarrow \mathbb{R}$ 。
- 我们可以生成一个序列，这个序列的第1项是 $f(1)$ ，第2项是 $f(2)$ ，第 $i$ 项是 $f(i)$ 。
- 我们通常用下标来表示序列的项，所以记 $x_i = f(i)$ 。这样我们就得到了序列 $x_1, x_2, x_3, \dots$ 。
- 序列 -> 函数：给定一个序列 $x_1, x_2, x_3, \dots$ 。
- 我们可以定义一个函数 $f: \mathbb{N} \rightarrow \mathbb{R}$ 。
- 其规则是：对于任何自然数 $i \in \mathbb{N}$ ，定义 $f(i) = x_i$ 。
“是同一回事”：
- 因为这种函数和序列之间的转换是完美的一一对应，所以作者说它们“是相同的”或“是同一回事”。
- 序列 $x_1, x_2, \dots$ 是函数的一种直观、传统的记法。
- 函数 $f: \mathbb{N} \rightarrow X$ 是序列的严格、现代的定义。
推广：
- 这个定义不仅限于实数序列。
- 输出值可以是任何集合 $X$ 中的元素。
- 一个在 $X$ 中取值的序列，就是一个函数 $f: \mathbb{N} \rightarrow X$ 。
- 这里的 $X$ 甚至可以是有限集。例如，一个不断掷硬币产生的正反面序列 H, T, T, H, ... 就是一个定义域为 $\mathbb{N}$ ，值域为 $\{H, T\}$ 的函数。

💡 [数值示例]

示例1 (等差数列)：
序列: $2, 5, 8, 11, \dots$ (首项为2，公差为3)
这个序列的通项公式是 $x_n = 2 + (n-1)3 = 3n-1$ 。
对应的函数: $f: \mathbb{N} \rightarrow \mathbb{Z}$ ，其规则是 $f(n) = 3n-1$ 。
$f(1) = 3(1)-1 = 2$ (序列第一项)
$f(2) = 3(2)-1 = 5$ (序列第二项)
...

示例2 (几何序列)：
函数: $g: \mathbb{N} \rightarrow \mathbb{Q}$ ，规则为 $g(n) = (1/2)^n$ 。
对应的序列:
$x_1 = g(1) = 1/2$
$x_2 = g(2) = 1/4$
$x_3 = g(3) = 1/8$
...
序列是 $1/2, 1/4, 1/8, \dots$ 。

示例3 (非数值序列)：
令 $X = \{red, green, blue\}$ 。
函数 $h: \mathbb{N} \rightarrow X$ 定义为：
$h(n) = red$ 如果 $n$ 除以3余1
$h(n) = green$ 如果 $n$ 除以3余2
$h(n) = blue$ 如果 $n$ 除以3余0
对应的序列是： $red, green, blue, red, green, blue, \dots$ (一个循环序列)。

⚠️ [易错点]

索引的起始点：本书约定 $\mathbb{N}=\{1,2,3,\dots\}$ ，所以序列是从第1项 $x_1$ 开始的。在计算机科学和某些数学分支中，序列和数组常常从第0项开始，此时定义域应为 $\{0,1,2,\dots\}$ 。这是一个需要注意的约定差异。
有限序列：我们这里定义的是无穷序列。一个有限序列（或n-元组） $x_1, \dots, x_n$ 对应的函数定义域是有限集 $\{1, \dots, n\}$ 。

📝 [总结]

本段明确地将无穷序列定义为一个定义域为自然数集 $\mathbb{N}$ 的函数。序列的第 $i$ 项 $x_i$ 就是函数在输入 $i$ 时的输出值 $f(i)$ 。

🎯 [存在目的]

这个定义至关重要，因为它用函数这一统一的、严格的工具，定义了序列这个在数学分析、微积分、离散数学等领域无处不在的概念。

序列的极限：在微积分中研究序列的收敛性，实际上就是在研究当输入 $n$ 趋向无穷大时，函数 $f(n)$ 的行为。
级数：研究级数的和，就是研究由序列部分和构成的新序列的极限。
这个定义将我们对序列的直观理解，置于坚实的集合论和函数论基础之上。

🧠 [直觉心智模型]

自动打点机：
想象一台机器，它有一个屏幕。
你给这台机器输入一个自然数 $n$ (比如按下按钮 'n')。
机器就会在屏幕上显示出第 $n$ 个点或数字 $x_n$ 。
这台机器就是函数 $f$ 。
你按顺序依次按下 1, 2, 3, ...，屏幕上依次显示 $x_1, x_2, x_3, \dots$ ，这就是序列。

💭 [直观想象]

函数图像上的离散点：
画一个函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ 的图像，比如一条曲线。
一个实数序列，就是只看这条曲线上横坐标为自然数 1, 2, 3, ... 的那些点。
序列 (f(1), f(2), f(3), ...) 就是这些离散点的纵坐标的集合。

1. 3.10. 例 1.3.3. (续)

📜 [原文25]

(vi) 两个变量的函数与单变量函数 $f: X \times Y \rightarrow Z$ 是同一回事，换句话说，我们对 $X \times Y$ 的元素（即有序对）求 $f$ 的值。传统上，我们写 $f(x, y)$ 而不是 $f((x, y))$ 来表示 $f$ 在 $(x, y)$ 上的值。对于 $n$ 个变量的函数也有类似的约定。

📖 [逐步解释]

这个例子将我们熟悉的多变量函数纳入了我们当前的单变量函数框架，再次体现了数学追求统一的强大思想。

核心思想：一个接受两个变量（比如 $x$ 和 $y$ ）的函数，可以被看作是一个只接受一个变量的函数，只不过这个单一的变量是一个有序对 (x, y)。
定义域的转换：
- 对于一个二元函数 $f(x,y)$ ，我们直观上认为它有两个输入。
- 现在我们把这两个输入“打包”成一个有序对 (x, y)。
- 这个有序对 (x, y) 来自哪里？它来自笛卡尔积 $X \times Y$ （假设 $x \in X, y \in Y$ ）。
- 因此，这个二元函数的定义域，可以被看作是单个集合 $X \times Y$ 。
- 这样，一个“二元函数”就被重新解释为一个定义域为笛卡尔积的“单变量函数” $f: X \times Y \rightarrow Z$ 。
记法约定：
- 从逻辑上讲，既然输入是一个有序对 (x, y)，我们应该写成 $f((x, y))$ 。
- 但是，这太多括号了，看起来很笨拙。
- 所以，按照传统习惯，我们省略掉外层的括号，直接写成 $f(x, y)$ 。
- $f(x, y)$ 只是 $f((x, y))$ 的一个方便的简写。
推广到n个变量：
- 这个思想同样适用于任意多个变量。
- 一个 $n$ 变量函数 $f(x_1, x_2, \dots, x_n)$ ，其输入可以被看作是一个有序n-元组 (x_1, \dots, x_n)。
- 这个有序n-元组是笛卡尔积 $X_1 \times \dots \times X_n$ 的一个元素。
- 因此，这个 $n$ 元函数就是一个单变量函数 $f: X_1 \times \dots \times X_n \rightarrow Z$ 。

💡 [数值示例]

示例1 (加法)：
我们熟悉的整数加法，可以看作一个二元函数 add(x, y) = x + y。
用本节的观点，它是一个单变量函数 add: \mathbb{Z} \times \mathbb{Z} \rightarrow \mathbb{Z}。
它的输入是一个有序对，比如 (3, 5)。
add((3, 5)) = 3 + 5 = 8。
我们习惯简写为 add(3, 5) = 8。

示例2 (几何距离)：
平面上两点 $P_1=(x_1, y_1)$ 和 $P_2=(x_2, y_2)$ 之间的距离函数 $d(P_1, P_2)$ 。
这是一个接受两个“点”变量的函数。每个点本身又是一个有序对。
所以，它的定义域是 $(\mathbb{R} \times \mathbb{R}) \times (\mathbb{R} \times \mathbb{R})$ ，即 $\mathbb{R}^2 \times \mathbb{R}^2$ 。
d: \mathbb{R}^2 \times \mathbb{R}^2 \rightarrow \mathbb{R}。
d((x_1, y_1), (x_2, y_2)) = \sqrt{(x_1-x_2)^2 + (y_1-y_2)^2}。
这实际上是一个四元函数 $f(x_1, y_1, x_2, y_2)$ ，其定义域是 $\mathbb{R}^4$ 。

⚠️ [易错点]

不要忘记打包：在进行理论推导时，要时刻记着，多变量函数的输入在形式上是一个单一的元组 (tuple)。
区分元组和分量：输入是元组，而 $x, y$ 只是元组的分量。

📝 [总结]

本段通过将多个输入“打包”成一个有序元组，成功地将多变量函数的概念统一到了单变量函数的框架下。一个 $n$ 元函数被严格地看作是一个定义域为笛卡尔积的单变量函数。

🎯 [存在目的]

这个例子极大地简化了函数理论。有了这个统一的观点，我们为单变量函数建立的所有理论（如函数相等、复合、反函数等），都可以（或经过适当修改后）应用到多变量函数上，而无需为每一种元数的函数都重新建立一套理论。这体现了数学追求普适性和简洁性的美学原则。

🧠 [直觉心智模型]

打包发货模型：
一个单变量函数就像一个只接受一个包裹的快递站。
如果你有多个物品（变量 $x, y, z$ ）要寄，你不能零散地递给快递员。
你必须先把这些物品打包成一个箱子（有序元组 (x, y, z)）。
然后你把这一个箱子递给快递站，快递站处理这一个包裹。
多变量函数 $f(x, y, z)$ 的本质，就是处理这个打包好的箱子的单变量函数 $f((x,y,z))$ 。

💭 [直观想象]

三维图像：
一个二元函数 $f: \mathbb{R} \times \mathbb{R} \rightarrow \mathbb{R}$ ，比如 $f(x,y) = x^2 + y^2$ 。
它的定义域是整个x-y平面（一个笛卡尔积）。
它的图像存在于三维空间中，是一个形如 (x, y, z) 的点的集合，其中 $z = f(x,y)$ 。
这个图像 G_f = \{( (x,y), x^2+y^2 ) : (x,y) \in \mathbb{R}^2 \}，其元素是 (输入元组, 输出) 形式的有序对。
这个三维的曲面（一个旋转抛物面），就是这个“单变量函数”（变量是有序对 (x,y)）的图像。

1. 3.11. 例 1.3.3. (续)

📜 [原文26]

(vii) 给定笛卡尔积 $X \times Y$ ，我们有第一和第二投影函数： $\pi_{1}: X \times Y \rightarrow X$ 由 $\pi_{1}(x, y)=x$ 定义，同样地 $\pi_{2}: X \times Y \rightarrow Y$ 由 $\pi_{2}(x, y)=y$ 定义。类似地，对于笛卡尔积 $X_{1} \times \cdots \times X_{n}$ ，我们可以定义到第 $i$ 个因子的投影 $\pi_{i}: X_{1} \times \cdots \times X_{n} \rightarrow X_{i}$ 为： $\pi_{i}\left(x_{1}, \ldots, x_{n}\right)=x_{i}$ 。还有更复杂的“部分”投影。例如，给定 $i \neq j$ ，我们可以定义 $\pi_{i, j}: X_{1} \times \cdots \times X_{n} \rightarrow X_{i} \times X_{j}$ 为： $\pi_{i, j}\left(x_{1}, \ldots, x_{n}\right)=\left(x_{i}, x_{j}\right)$ 。

📖 [逐步解释]

这里介绍了另一类非常基本且有用的函数——投影函数 (Projection Function)。

核心思想：投影函数的作用是从一个有序元组（笛卡尔积的元素）中“提取”出某个特定位置的分量。
二元投影：
- 给定一个笛卡尔积 $X \times Y$ ，其元素是有序对 (x, y)。
- 第一投影函数 \pi_1:
- \pi_1: X \times Y -> X。它的输入是一个有序对，输出是这个有序对的第一分量。
- 规则：\pi_1(x, y) = x。
- 第二投影函数 \pi_2:
- \pi_2: X \times Y -> Y。它的输入是一个有序对，输出是第二分量。
- 规则：\pi_2(x, y) = y。
- 符号 \pi 是希腊字母 Pi，常用于表示投影。
推广到n元投影：
- 给定笛卡尔积 $X_1 \times \dots \times X_n$ ，其元素是 (x_1, ..., x_n)。
- 第 i 投影 \pi_i：
- \pi_i: X_1 \times ... \times X_n -> X_i。它的输入是一个n-元组，输出是这个元组的第 i 个分量。
- 规则：\pi_i(x_1, ..., x_n) = x_i。
部分投影：
- 我们还可以定义更复杂的投影，不是投到单个集合，而是投到某几个集合的笛卡尔积上。
- 例子 \pi_{i,j}：
- \pi_{i,j}: X_1 \times ... \times X_n -> X_i \times X_j。它的输入是一个n-元组，输出是一个由原来的第 $i$ 和第 $j$ 分量构成的有序对。
- 规则：\pi_{i,j}(x_1, ..., x_n) = (x_i, x_j)。

💡 [数值示例]

示例1 (二元投影)：
令 $P = \{(1,a), (1,b), (2,a), (2,b)\}$ (即 $\{1,2\} \times \{a,b\}$ )。
$\pi_1: P \rightarrow \{1,2\}$
$\pi_1(1,a) = 1$
$\pi_1(1,b) = 1$
$\pi_1(2,a) = 2$
$\pi_1(2,b) = 2$
$\pi_2: P \rightarrow \{a,b\}$
$\pi_2(1,a) = a$
$\pi_2(1,b) = b$
$\pi_2(2,a) = a$
$\pi_2(2,b) = b$

示例2 (n-元投影)：
考虑一个集合 Students，其元素是 (ID, Name, Age) 形式的元组。这是一个笛卡尔积 $\mathbb{N} \times \text{Strings} \times \mathbb{N}$ 的子集。
一个学生记录是 s = (101, "Alice", 20)。
$\pi_1(s) = 101$ (获取ID)
$\pi_2(s) = \text{"Alice"}$ (获取姓名)
$\pi_3(s) = 20$ (获取年龄)

示例3 (部分投影)：
还是上面的学生记录 s = (101, "Alice", 20)。
定义一个投影 \pi_{2,3} 到 \text{Strings} \times \mathbb{N}。
$\pi_{2,3}(s) = (\text{"Alice"}, 20)$ (获取姓名和年龄组成的有序对)。

⚠️ [易错点]

定义域和值域：要特别注意每个投影函数的定义域（一个笛卡尔积）和值域（某一个因子集合或其笛卡尔积）。
投影是满射：只要因子集合非空，标准的投影函数 \pi_i 通常都是满射的（后面会讲到），即值域中的每个元素都至少是一个元组的投影结果。

📝 [总结]

本段定义了投影函数 \pi_i，其作用是从一个有序元组中“提取”出第 $i$ 个分量。这是一个从笛卡尔积空间映射到其某个因子空间的基本函数。

🎯 [存在目的]

投影函数是连接笛卡尔积与其构成部分（因子集合）的桥梁。

分解：它们允许我们将一个在笛卡尔积空间上的复杂问题，“投影”到更简单的因子空间上进行分析。
数据库理论：在关系数据库中，“投影”是一个基本操作，它从一个表中选择某些列来创建一个新表，这和我们这里的定义完全对应。
范畴论：笛卡尔积和其对应的投影函数一起，构成了“乘积”という普遍构造，是范畴论的基本概念之一。

🧠 [直觉心智模型]

表格列选择器：
一个笛卡尔积就像一个大表格，每一行是一个元组。
投影函数 \pi_i 就像一个指令：“只看第 $i$ 列”。
当你应用这个指令到某一行（一个元组）时，你得到的就是那一列的单元格里的值（第 $i$ 个分量）。
影子模型：
想象一个三维空间中的物体（笛卡尔积的一个子集）。
\pi_1 就像用一束平行于x轴的光照射，物体在y-z平面上留下的影子。
\pi_{1,2} 就像用一束平行于z轴的光照射，物体在x-y平面上留下的影子。

💭 [直观想象]

想象一个电影院的座位 (10排, 8座)。
\pi_1 函数的作用是告诉你“排号”，\pi_1(10排, 8座) = 10排。
\pi_2 函数的作用是告诉你“座号”，\pi_2(10排, 8座) = 8座。

1. 3.12. 例 1.3.3. (续)

📜 [原文27]

(viii) 如果 $X$ 和 $Y$ 是两个集合，那么从 $X$ 到 $Y$ 的所有函数的集合是一个新集合，有时记作 $Y^{X}$ ：

Y^{X}=\{f: f \text { 是从 } X \text { 到 } Y \text { 的函数 }\} .

如果 $X$ 和 $Y$ 是有限的，例如 $\#(X)=n$ 且 $\#(Y)=m$ ，那么 $Y^{X}$ 也是有限的，且 $\#\left(Y^{X}\right)=m^{n}$ 。这遵循备注 1.3.2(iii) 中对函数 $f: X \rightarrow Y$ 的表格描述，注意到在这种情况下，对于 $f\left(x_{1}\right)$ 有 $m$ 种选择，对于 $f\left(x_{2}\right)$ 有 $m$ 种选择，...，对于 $f\left(x_{n}\right)$ 有 $m$ 种选择，总共有 $m^{n}$ 种选择。

📖 [逐步解释]

这个例子引入了一个更高层次的构造：构造一个以函数本身为元素的集合。

核心思想：
- 我们已经定义了什么是“从 $X$ 到 $Y$ 的函数”。
- 现在，我们把所有可能的、符合这个定义的函数都收集起来，把它们作为元素，放进一个更大的“超级集合”里。
- 这个“超级集合”就叫做函数集 (Set of functions) 或函数空间 (Function space)。
定义与符号：
- $Y^X$ ：这是表示从 $X$ 到 $Y$ 的所有函数的集合的标准记号。
- 为什么用指数形式？ 这个记号源于有限集的情况，马上就会解释。它暗示了一种与幂运算的深刻联系。
- 形式化定义： $Y^X = \{f \mid f \text{ is a function from } X \text{ to } Y\}$ 。
有限集情况下的基数：
- 假设定义域 $X$ 是有限的，有 $n$ 个元素： $X=\{x_1, \dots, x_n\}$ 。
- 假设值域 $Y$ 也是有限的，有 $m$ 个元素： $Y=\{y_1, \dots, y_m\}$ 。
- 我们要构造一个函数 $f: X \rightarrow Y$ 。根据备注 1.3.2(iii) 的表格法，我们需要为 $X$ 中的每个元素都指定一个输出来确定一个函数。
- 分步计数：
- 为 $x_1$ 选择一个输出值 $f(x_1)$ ：我们可以在 $Y$ 中任选一个，有 $m$ 种选择。
- 为 $x_2$ 选择一个输出值 $f(x_2)$ ：我们也可以在 $Y$ 中任选一个，还是有 $m$ 种选择（这个选择与上一步独立）。
- ...
- 为 $x_n$ 选择一个输出值 $f(x_n)$ ：同样有 $m$ 种选择。
- 根据乘法原理，总共可以构造出的不同函数的数量是 $m \times m \times \dots \times m$ (n次)。
- 这个总数就是 $m^n$ 。
- 结论： $\#(Y^X) = (\#(Y))^{\#(X)}$ 。
- 这就解释了为什么记号 $Y^X$ 非常贴切。

∑ [公式拆解]

Y^{X}=\{f: f \text { 是从 } X \text { 到 } Y \text { 的函数 }\} .

Y^X: 正在定义的函数集。
{...}: 描述法。
f: 变量，代表该集合中的一个元素。注意，这里的 $f$ 本身就是一个函数。
: ...: 约束条件，即 $f$ 必须是一个从 $X$ 到 $Y$ 的函数。

💡 [数值示例]

示例1：
令 $X = \{1, 2\}$ ， $\#(X)=2$ 。
令 $Y = \{a, b\}$ ， $\#(Y)=2$ 。
函数集 $Y^X$ 应该有多少个元素？答案是 $2^2 = 4$ 个。
我们来把这4个函数都列出来（用表格表示）：

| f1: | x | 1 | 2 |

:------	:--	:--	---

| f2: | x | 1 | 2 |

:------	:--	:--	---

| f3: | x | 1 | 2 |

:------	:--	:--	---

| f4: | x | 1 | 2 |

:------	:--	:--	---

函数集 $Y^X = \{f_1, f_2, f_3, f_4\}$ 。

示例2：
示例2:
令 $X = \{ a, b, c \}$ , $\#(X)=3$ 。
令 $Y = \{ 0, 1 \}$ , $\#(Y)=2$ 。
从 $X$ 到 $Y$ 的函数有多少个？答案是 $\#(Y^X) = (\#(Y))^{\#(X)} = 2^3 = 8$ 个。
这8个函数中的每一个，都对应着给 $f(a), f(b), f(c)$ 分配 0 或 1 的一种方式。这与一个3位的二进制数一一对应。例如，函数 $f(a)=1, f(b)=0, f(c)=1$ 可以对应二进制数 101。

⚠️ [易错点]

$Y^X$ vs $X^Y$ : 这两个是完全不同的集合。 $Y^X$ 是从 $X$ 到 $Y$ 的函数集，其基数是 $(\#(Y))^{\#(X)}$ 。 $X^Y$ 是从 $Y$ 到 $X$ 的函数集，其基数是 $(\#(X))^{\#(Y)}$ 。这两个值通常不相等。
元素是函数: 再次强调， $Y^X$ 的元素是一个个的函数，而不是普通的数或对象。当你从 $Y^X$ 中取出一个元素时，你得到的是一个完整的函数（一个对应规则）。
空集情况:
- 如果 $X = \emptyset$ (且 $Y$ 非空)，那么从 $\emptyset$ 到 $Y$ 的函数只有一个（即图像为空集的那个函数）。所以 $\#(Y^\emptyset) = 1$ 。这与 $m^0=1$ 的公式一致。
- 如果 $Y = \emptyset$ (且 $X$ 非空)，那么无法构造任何从 $X$ 到 $Y$ 的函数（因为找不到输出值）。所以 $\emptyset^X = \emptyset$ (空集)。 $\#(\emptyset^X)=0$ 。这与 $0^n=0$ (当n>0)一致。
- 如果 $X, Y$ 都是空集， $\emptyset^\emptyset$ 有一个元素，即空函数。 $\#(\emptyset^\emptyset) = 1$ ，对应 $0^0=1$ 这个约定。

📝 [总结]

本段定义了函数集 $Y^X$ ，即所有从集合 $X$ 到集合 $Y$ 的函数所构成的集合。对于有限集，其基数遵循指数关系 $\#(Y^X) = (\#(Y))^{\#(X)}$ ，这也是其记号的由来。

🎯 [存在目的]

函数集（或称函数空间）是现代数学，特别是泛函分析的核心研究对象。通过将函数本身视为一个集合中的“点”，我们可以在这个函数的集合上定义结构，比如距离（度量）、范数、内积等。这使得我们可以用几何和分析的工具来研究函数，例如讨论“函数的收敛”、“函数的连续性”等。这个概念极大地扩展了数学分析的范围。

🧠 [直觉心智模型]

菜谱大全模型：
集合 $X$ 是所有可能的“食材”的集合。
集合 $Y$ 是所有可能的“菜品”的集合。
一个函数 $f: X \rightarrow Y$ 就像一本“菜谱”，它告诉你用某种食材能做出什么菜。但这个类比不完美，因为函数必须对所有食材都有定义。
更好的类比是：一个函数 $f$ 是一个“当日菜单生成器”，你输入一个食材，它告诉你今天用这个食材做的是哪道菜。
函数集 $Y^X$ 就是一本《天下菜单生成器大全》，里面收集了所有可能的“当日菜单生成器”。

💭 [直观想象]

电路配置：
集合 $X$ 是一组输入引脚，共 $n$ 个。
集合 $Y$ 是一组可能的输出电压，共 $m$ 种。
一个函数 $f: X \rightarrow Y$ 是指对这块电路板的一种完整“接线”配置，它决定了每个输入引脚进来后，对应的输出电压是什么。
函数集 $Y^X$ 就是所有 $m^n$ 种可能的“接线配置”的总和。

1. 3.13. 例 1.3.3. (viii) (续) - 求值函数

📜 [原文28]

给定 $x \in X$ ，我们通过在 $x$ 处求值得到一个从 $Y^{X}$ 到 $Y$ 的函数 $\mathrm{ev}_{x}$ ：

\mathrm{ev}_{x}(f)=f(x)

因此，当我们上面写 $f(x)$ 时，符号 $f$ 变成了“变量”。还有一个类似的两变量函数 $e: X \times Y^{X} \rightarrow Y$ ，定义为

e(x, f)=f(x)

注意投影 $\pi_{i}: X^{n} \rightarrow X$ 是求值的一个特例，通过将 $X^{n}$ 视为 $X^{\{1, \ldots, n\}}$ 并在 $i$ 处求值。换句话说， $\pi_{i}$ 与 $\operatorname{ev}_{i}: X^{\{1, \ldots, n\}} \rightarrow X$ 等同。

📖 [逐步解释]

这一段内容非常抽象，它引入了一个作用于函数集上的函数——求值函数 (Evaluation map)。

求值函数 ev_x：
- 上下文：我们有一个函数集 $Y^X$ ，里面的元素都是函数。
- 构造：我们先从定义域 $X$ 中固定一个元素 $x$ 。
- 定义一个新的函数，名为 ev_x。ev 是 "evaluation" 的缩写，下标 $x$ 表示这个求值函数是和我们固定的 $x$ 相关的。
- ev_x 的定义域和值域：ev_x 是一个从函数集 $Y^X$ 映射到值域 $Y$ 的函数，即 ev_x: Y^X -> Y。
- ev_x 的规则：它的输入是一个函数 f (来自 $Y^X$ )。它的输出是这个函数 f 在我们固定的那个点 x 上的值，即 f(x)。
- 所以，ev_x(f) = f(x)。
f 变成“变量”：
- 我们通常写 f(x) 时，会把 f 看作是固定的规则，而 x 是变量。
- 但在 ev_x(f) 的表达式中，x 是固定的，而 f 成为了 ev_x 这个函数的输入变量。
- 这是一种“角色互换”，体现了数学的灵活性：函数本身也可以被当作其他函数的“数据”或“输入”。
通用的求值函数 e：
- ev_x 是为每个固定的 x 单独定义的。我们可以把它们统一成一个两变量函数 e。
- 定义：e: X \times Y^X -> Y。
- 输入：它的输入是一个有序对 (x, f)，其中 $x$ 是 $X$ 的一个元素，f 是 $Y^X$ 的一个元素（即一个函数）。
- 规则：e(x, f) = f(x)。它的作用就是，根据有序对中给出的元素 x 和函数 f，计算出 f 在 x 点的值。
- e 有时被称为通用求值映射 (universal evaluation map)。
投影是求值的特例：
- 这一段将我们刚学的求值函数和之前学的投影函数联系了起来。
- 回忆例(v)，我们把有序n-元组的集合 $X^n$ 等同于函数集 $X^{\{1, ..., n\}}$ 。
- 一个n-元组 (x_1, ..., x_n) 对应一个函数 f: \{1, ..., n\} -> X，其中 f(i) = x_i。
- 投影函数 \pi_i 的作用是：\pi_i((x_1, ..., x_n)) = x_i。
- 求值函数 ev_i (这里下标 $i$ 是从索引集 {1,...,n} 中固定的一个元素) 的作用是：输入一个函数 f，输出 f(i)。
- 如果我们把 (x_1, ..., x_n) 这个元组看作它对应的函数 f，那么 \pi_i 对元组的操作，得到的结果 x_i，和 ev_i 对函数 f 的操作，得到的结果 f(i)，是完全一样的。
- 因此，第i投影 \pi_i 本质上就是在点i处的求值 ev_i。

∑ [公式拆解]

\mathrm{ev}_{x}(f)=f(x)

ev_x: 一个函数，它的名字叫 ev_x。
(f): 它的输入（变量）是 f，而 f 本身也是一个函数。
f(x): 它的输出，是函数 f 在预先固定的点 x 上的值。

e(x, f)=f(x)

e: 一个函数，它的名字叫 e。
(x, f): 它的输入是一个有序对，包含一个点 x 和一个函数 f。
f(x): 它的输出，是用有序对中的函数 f 对有序对中的点 x 进行求值。

💡 [数值示例]

示例1 (ev_x)：
令 $X=\{1,2\}, Y=\{a,b\}$ 。
$Y^X = \{f_1, f_2, f_3, f_4\}$ (如上一个例子所列)。
我们固定 $x=1 \in X$ 。来定义求值函数 ev_1: Y^X -> Y。
ev_1 的输入是 $Y^X$ 中的一个函数，我们来计算它对每个输入的输出：
ev_1(f_1): $f_1$ 是 f(1)=a, f(2)=a。所以输出是 $f_1(1) = a$ 。
ev_1(f_2): $f_2$ 是 f(1)=a, f(2)=b。所以输出是 $f_2(1) = a$ 。
ev_1(f_3): $f_3$ 是 f(1)=b, f(2)=a。所以输出是 $f_3(1) = b$ 。
ev_1(f_4): $f_4$ 是 f(1)=b, f(2)=b。所以输出是 $f_4(1) = b$ 。
ev_1 本身是一个函数，它的图像是 $\{(f_1, a), (f_2, a), (f_3, b), (f_4, b)\}$ 。

示例2 (e)：
继续使用上面的集合。
e: X \times Y^X -> Y。
e 的输入是一些有序对 (x, f)。
e(1, f_3) = f_3(1) = b。
e(2, f_3) = f_3(2) = a。
e(2, f_1) = f_1(2) = a。

⚠️ [易错点]

函数的函数：理解求值函数的关键是接受“函数可以作为另一个函数的输入”这个事实。这在编程中很常见（高阶函数），在数学中也是一个核心思想。
分清角色：在 ev_x(f)=f(x) 中，要分清哪个是函数名 (ev_x)，哪个是变量 (f)，哪个是参数/常量 (x)。

📝 [总结]

本段定义了求值函数 ev_x 和 e。ev_x 是一个从函数集 $Y^X$ 到集合 $Y$ 的函数，其作用是“提取”出输入函数在特定点 $x$ 的值。e 是其更通用的两变量形式。这个概念也揭示了投影函数 \pi_i 本质上就是一种求值函数 ev_i。

🎯 [存在目的]

求值函数是一个在理论中非常有用的工具。

对偶性：它建立了一种在“点空间” $X$ 和“函数空间” $Y^X$ 之间的深刻联系（对偶关系）。
泛函分析：在泛函分析中，线性函数空间上的求值函数是一种最基本的“线性泛函”。
范畴论：函数集 $Y^X$ 和求值映射一起构成了所谓的“指数对象”，它满足一个重要的泛性质，使得它在理论推导中非常强大。
λ-演算与计算机科学：“求值”或“应用”(Apply)是函数式编程和计算理论的两个基本操作之一（另一个是“抽象”Lambda Abstraction）。

🧠 [直觉心智模型]

通用遥控器模型：
函数集 $Y^X$ 是你家里所有电器的遥控器集合 {电视遥控器, 空调遥控器, ...}。每个遥控器本身都是一个函数（你按一个按钮，它发出一个特定信号）。
你现在想知道“所有这些遥控器的‘开机’按钮按下去会发生什么？”
你构造了一个求值函数 ev_开机按钮。
它的输入是一个遥控器，比如“电视遥控器”。
ev_开机按钮(电视遥控器) = (电视遥控器上的开机按钮按下去的效果) = '电视打开'。
ev_开机按钮(空调遥控器) = (空调遥控器上的开机按钮按下去的效果) = '空调打开'。
这里的“开机按钮”就是固定的 x，遥控器就是变量 f。

💭 [直观想象]

函数图像的切片：
想象一个二元函数 F(x,y) 的三维图像，它是一个曲面。
我们可以把这个二元函数看作是一个从 $X$ 到函数集 $Y^Z$ 的函数 f: X -> Z^Y，即 $f(x)$ 是一个关于 $y$ 的一元函数。
求值函数 ev_y0 就像是用一把刀在 $y=y_0$ 的位置垂直于y轴切下去。
它作用在 f(x) 这个曲线上，得到的是曲线在 $y=y_0$ 这一点的高度值。

41.4. 4. 像和原像 Images and preimages

1. 4.1. 定义 1.4.1.

📜 [原文29]

设 $f: X \rightarrow Y$ 是一个函数。集合

\{y \in Y: \text { 存在 } x \in X \text { 使得 } f(x)=y\}

称为 $f$ 的像或 $\operatorname{Im} f$ ，我们也将其写为 $f(X)$ 。有时人们将值域称为共域和/或将值域定义为像。在本文中，我们始终区分像和值域。更一般地，如果 $A$ 是 $X$ 的子集，则我们设置

f(A)=\{y \in Y: \text { 存在 } x \in A \text { 使得 } f(x)=y\}

因此 $f(A) \subseteq Y$ 。通常，函数 $f: X \rightarrow Y$ 的像将是值域的子集，但不一定等于值域。

📖 [逐步解释]

这一部分定义了与函数输出相关的两个重要概念：像 (Image) 和原像 (Preimage)。本段先聚焦于像。

函数的像 (Image of a function)：
- 核心思想：函数的像是所有实际输出值的集合。它是值域 $Y$ (所有可能的输出值) 的一个子集。
- 定义：
- \operatorname{Im} f 或 f(X)。
- \{y \in Y : ...\}：我们要在值域 $Y$ 中寻找满足条件的元素。
- 存在 x \in X 使得 f(x)=y：条件是，这个 $y$ 必须是定义域 $X$ 中至少一个 $x$ 的函数值。换句话说，这个 $y$ 必须被“射中”过。
- 像就是靶子上所有中靶的点的集合。
像 (Image) vs. 值域 (Codomain)：
- 作者特别强调，本书严格区分这两个概念。这是一个非常重要的现代数学约定。
- 值域 (Codomain) $Y$ ：是函数定义时声明的“目标靶子”，是输出值的“候选范围”。
- 像 (Image) f(X)：是实际射中的点的集合，是实际输出值的集合。
- 关系：f(X) \subseteq Y。像永远是值域的子集。
- 它们可能相等，也可能不相等。当它们相等时，我们称这个函数是“满射”的，后面会讲。
子集的像 (Image of a subset)：
- 这个概念更加通用。我们不仅可以求整个定义域 $X$ 的像，还可以求定义域中某个子集 $A \subseteq X$ 的像。
- 定义 f(A)：
- \{y \in Y : 存在 x \in A 使得 f(x)=y\}。
- 和 f(X) 的定义几乎一样，只是把输入值的来源从整个 $X$ 缩小到了子集 $A$ 。
- f(A) 是子集 $A$ 中所有元素的函数值所构成的集合。

∑ [公式拆解]

\{y \in Y: \text { 存在 } x \in X \text { 使得 } f(x)=y\}

{...}: 描述法。
y \in Y: 我们要收集的元素是来自值域 $Y$ 的。
: \exists x \in X, f(x)=y: \exists 是存在量词，读作“存在”。条件是：存在至少一个来自定义域 $X$ 的 $x$ ，它的函数值恰好是 $y$ 。

f(A)=\{y \in Y: \text { 存在 } x \in A \text { 使得 } f(x)=y\}

f(A): 这是一个记号，表示子集 $A$ 的像。注意，这里的 $f$ 作用在集合 $A$ 上，得到的是另一个集合。这与 $f$ 作用在元素 $x$ 上得到元素 $f(x)$ 是不同的操作，是一种“符号重载”。
定义与上面类似，只是把 x \in X 换成了 x \in A。

💡 [数值示例]

示例1：
令函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ ，规则为 $f(x) = x^2$ 。
定义域: $X = \mathbb{R}$ 。
值域 (Codomain): $Y = \mathbb{R}$ 。
求整个函数的像 f(X)：
$f(X) = \{y \in \mathbb{R} : \exists x \in \mathbb{R}, x^2=y\}$ 。
任何数的平方都是非负的。所以实际的输出值集合是所有非负实数。
\operatorname{Im} f = f(\mathbb{R}) = [0, \infty)。
在这里，像 [0, \infty) 是值域 \mathbb{R} 的一个真子集。
求子集的像:
令 $A = \{-1, 0, 1, 2\}$ 。求 $f(A)$ 。
$f(A) = \{ f(-1), f(0), f(1), f(2) \} = \{(-1)^2, 0^2, 1^2, 2^2\} = \{1, 0, 1, 4\}$ 。
根据集合的互异性， $f(A) = \{0, 1, 4\}$ 。
令 $B = [-2, 2]$ (一个闭区间)。求 $f(B)$ 。
当 $x$ 在 $[-2, 2]$ 之间变化时， $x^2$ 的值域是 $[0, 4]$ 。
所以 $f(B) = [0, 4]$ 。

⚠️ [易错点]

像 vs. 值域：这是最核心的易错点。务必区分声明的目标范围 (Codomain) 和实际到达的范围 (Image)。
$f(A)$ 是一个集合： $f(A)$ 的元素是 $Y$ 中的元素，而不是 $X$ 中的。它是 $A$ 中元素的“输出结果”的集合。
$f(\emptyset)$ : 空集的像是什么？ $f(\emptyset)=\{y \in Y : \exists x \in \emptyset, f(x)=y\}$ 。因为不存在 $x \in \emptyset$ ，所以这个条件永远无法满足。因此， $f(\emptyset) = \emptyset$ 。

📝 [总结]

本段定义了函数的像 f(X)，即所有实际输出值的集合。它还推广到定义域子集的像 f(A)。关键是要将其与值域 (Codomain) 区分开，像是值域的一个子集。

🎯 [存在目的]

像的概念是描述函数行为的核心工具。一个函数的“威力”或“覆盖范围”就是由它的像来衡量的。

它直接引出函数的一个关键分类：满射（当像等于值域时）。
在线性代数中，一个线性变换的“像”或“列空间”是其最重要的子空间之一，描述了该变换所有可能的输出向量。
在研究问题时，确定一个函数的像，就是确定该问题解的取值范围。

[直觉心- 心灵模型\\：

弓箭手模型：
定义域 $X$ 是弓箭手拥有的所有箭。
值域 $Y$ 是整个靶场区域。
函数 $f$ 是弓箭手的射箭动作。
像 f(X) 是所有射出的箭最终落点（插在靶上的位置）的集合。
弓箭手可能只会射中靶心附近的一小块区域（像），而整个靶场（值域）要大得多。
子集的像：如果只用一部分特定的箭（子集 $A$ ）来射，这些箭的落点集合就是 f(A)。

💭 [直观想象]

投影模型：
想象一个在三维空间中的物体（比如一个土豆），它的函数是将其垂直投影到x-y平面上。
定义域是土豆这个三维物体。
值域是整个x-y平面。
像是土豆在x-y平面上留下的那个“影子”。这个影子是x-y平面的一个子集。

1. 4.2. 定义 1.4.1. (续)

📜 [原文30]

我们还为 $Y$ 的子集 $B$ 定义子集

f^{-1}(B)=\{x \in X: f(x) \in B\}

它是 $X$ 的子集，称为 $B$ 的原像。因此 $f^{-1}(B) \subseteq X$ 。如果 $B=\{y\}$ 只有一个元素，我们写 $f^{-1}(y)$ 而不是 $f^{-1}(\{y\})$ 。然而，根据这个定义， $f^{-1}(y)$ 是 $X$ 的子集。例如， $f^{-1}(Y)=X$ 且 $f^{-1}(y) \neq \emptyset$ 当且仅当 $y \in f(X)$ ，即 $y \in \operatorname{Im} f$ 。注意：原像 $f^{-1}(B)$ 可以为每个函数 $f: X \rightarrow Y$ 和 $Y$ 的每个子集 $B$ 定义，特别是当 $B=\{y\}$ 时。因此这个符号与我们稍后将定义的逆函数的存在性无关，而是旨在在逆函数存在时造成最大的混淆。因此（与许多数学符号的情况一样），上下文将至关重要。

📖 [逐步解释]

这部分定义了与像相对偶的概念——原像 (Preimage) 或 逆像 (Inverse Image)。

核心思想：给定值域 $Y$ 中的一个子集 $B$ ，原像就是定义域 $X$ 中所有那些“能射中” $B$ 内部的元素的集合。
定义与符号：
- f^{-1}(B)：读作 “ $B$ 在 $f$ 下的原像”。
- 警告！ 这个 f^{-1} 不是反函数！它只是一个符号，用来表示“找原像”这个操作。反函数可能不存在，但原像对于任何函数都可以定义。作者在这里用了一种幽默的说法，说这个符号的设计“旨在造成最大的混淆”，这其实是在强烈提醒读者注意这个区别。
- 形式化定义：\{x \in X : f(x) \in B\}。
- \{x \in X : ...\}：我们要收集的元素是来自定义域 $X$ 的。
- f(x) \in B：条件是，这个元素 $x$ 的函数值，必须落在我们指定的目标区域 $B$ 里面。
单元素的子集的原像：
- 如果目标区域 $B$ 只有一个点 $y$ ，即 $B=\{y\}$ 。
- 我们简写 f^{-1}(\{y\}) 为 f^{-1}(y)。
- f^{-1}(y) = \{x \in X : f(x)=y\}。
- f^{-1}(y) 是定义域中所有那些函数值恰好等于 $y$ 的元素的集合。
- 重要：即使简写了，f^{-1}(y) 仍然是一个集合，它可能包含一个元素、多个元素，甚至是空集。
基本示例：
- f^{-1}(Y) = X：能射中整个值域 $Y$ 的元素有哪些？根据函数定义，定义域 $X$ 中的所有元素的输出值都在 $Y$ 中，所以是整个定义域 $X$ 。
- f^{-1}(y) \neq \emptyset \iff y \in f(X)：一个点 $y$ 的原像不是空集，当且仅当这个点 $y$ 至少被一个 $x$ 射中过。这正是说“ $y$ 属于函数的像”的另一种方式。

∑ [公式拆解]

f^{-1}(B)=\{x \in X: f(x) \in B\}

f^{-1}(B): 记号，表示子集 $B$ 的原像。这是一个 $X$ 的子集。
{...}: 描述法。
x \in X: 我们要收集的元素来自定义域。
: f(x) \in B: 筛选条件，x 的像必须落在 B 内部。

💡 [数值示例]

示例1：
令函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ ，规则为 $f(x) = x^2$ 。
求子集的原像:
令 $B = [1, 9]$ (闭区间)。求 $f^{-1}(B)$ 。
$f^{-1}([1,9]) = \{x \in \mathbb{R} : f(x) \in [1,9]\} = \{x \in \mathbb{R} : 1 \leq x^2 \leq 9\}$ 。
解这个不等式，得到 $1 \leq |x| \leq 3$ 。
所以 $x$ 的范围是 [-3, -1] 或 [1, 3]。
$f^{-1}([1,9]) = [-3, -1] \cup [1, 3]$ 。
求单元素的原像:
令 $y=4$ 。求 $f^{-1}(4)$ 。
$f^{-1}(4) = \{x \in \mathbb{R} : x^2 = 4\}$ 。
解方程得到 $x=2$ 或 $x=-2$ 。
所以 $f^{-1}(4) = \{-2, 2\}$ 。这是一个包含两个元素的集合。
令 $y=-1$ 。求 $f^{-1}(-1)$ 。
$f^{-1}(-1) = \{x \in \mathbb{R} : x^2 = -1\}$ 。
在实数范围内无解。
所以 $f^{-1}(-1) = \emptyset$ 。

⚠️ [易错点]

f^{-1}不是反函数：这是最重要、最需要警惕的一点。f^{-1}(y) 是一个集合，而反函数（如果存在）作用于 $y$ 的结果是一个元素。只有当函数是双射时，原像集合 f^{-1}(y) 才总是恰好包含一个元素，这时它才与反函数的值有紧密联系。
f^{-1}(y) 是一个集合：即使简写了，也要记住它代表一个集合，不是一个元素。
原像可能为空：如果目标区域没有被任何元素射中，其原像就是空集。

📝 [总结]

本段定义了值域子集 $B$ 的原像 f^{-1}(B)，即所有能映射到 $B$ 内的定义域元素的集合。它特别强调，原像符号 f^{-1} 并不意味着反函数的存在，且对单点 $y$ 的原像 f^{-1}(y) 也是一个集合。

🎯 [存在目的]

原像是分析函数的另一个核心工具，它允许我们从“结果”反推“原因”。

解方程：解方程 f(x) = y，本质上就是在求单点集 \{y\} 的原像 f^{-1}(y)。
拓扑学：连续性的一个等价定义是“开集的原像是开集”。这个定义比微积分中的 ε-δ 定义更简洁、更普适。
测度论：可测函数的定义依赖于“可测集的原像是可测集”。
它直接引出函数的另一个关键分类：单射（当任何单点原像最多只有一个元素时）。

🧠 [直觉心智模型]

弓箭手模型（反向）：
值域子集 $B$ 是靶场上画的一个圈（比如“9环区域”）。
原像 f^{-1}(B) 就是弓箭手箭袋里，所有那些最终射中了“9环区域”的箭的集合。
f^{-1}(y)：靶心 y 的原像，就是所有射中靶心的那些箭的集合。可能有多支箭射中了靶心。

💭 [直观想象]

电影院座位查询：
函数 $f$ : (座位) -> (票价)。
值域子集 $B = \{100元, 120元\}$ 。
原像 f^{-1}(B) 是所有票价为100元或120元的座位的集合。
f^{-1}(80元) 是所有票价为80元的座位的集合。

1. 4.3. 定义 1.4.1. (续)

📜 [原文31]

从定义可知

\begin{aligned} & f\left(f^{-1}(B)\right) \subseteq B \\ & A \subseteq f^{-1}(f(A)) \end{aligned}

就我们的基本函数示例而言，我们有：

(i) 对于 $f=\operatorname{Id}_{X}: X \rightarrow X$ ，子集 $A \subseteq X$ 的像和原像都是 $A$ 。

(ii) 如果 $X \subseteq Y$ 且 $i_{X}: X \rightarrow Y$ 是包含，那么 $X$ 的子集 $A$ 的像 $i_{X}(A)$ 就是 $A$ ，视为 $Y$ 的子集，而 $B \subseteq Y$ 的原像 $i_{X}^{-1}(B)$ 是 $B \cap X$ 。

(iii) 如果 $f: X \rightarrow Y$ 是常数函数 $f(x)=c$ 对于所有 $x \in X$ ，那么 $Y$ 的子集 $B$ 的原像 $f^{-1}(B)$ 在 $c \notin B$ 时是 $\emptyset$ ，在 $c \in B$ 时是 $X$ 。 $X$ 的子集 $A$ 的像 $f(A)$ 在 $A=\emptyset$ 时是 $\emptyset$ ，在 $A \neq \emptyset$ 时是 $\{c\}$ 。

📖 [逐步解释]

这部分探讨了像和原像这两个操作复合起来的性质，并用之前介绍过的基本函数作为例子。

像与原像的复合关系：
- f(f^{-1}(B)) \subseteq B：
- 过程：先找到所有能射到 $B$ 里的输入（f^{-1}(B)），然后再看这些输入实际射到了哪里（对它取像）。
- 结果：结果集合 f(f^{-1}(B)) 必然是 $B$ 的一个子集。
- 为什么不是等于？ 因为 $B$ 里面可能有一些“幽灵点”，它们没有任何 $X$ 中的元素能射中它们。取原像时这些点就被忽略了，再取像时自然就回不来了。只有当 $B$ 中的每个点都能被射中时（即 $B \subseteq f(X)$ ），等号才成立。
- A \subseteq f^{-1}(f(A))：
- 过程：先看 $A$ 里的元素射到了哪里（f(A)），然后再找所有能射到这个目标区域的输入（对它取原像）。
- 结果：结果集合 f^{-1}(f(A)) 必然包含了一开始的 $A$ 。
- 为什么不是等于？ 因为可能存在 $A$ 之外的元素，它们也“恰好”射中了 f(A) 这个目标区域。取原像时会把这些“局外人”也一并包含进来。只有当没有“局外人”能射中 f(A) 时，等号才成立（这种情况对应函数是单射）。
基本函数示例：
- (i) 恒等函数 Id_X:
- Id_X(A) = A: 子集 $A$ 的像，就是 $A$ 自身。
- Id_X^{-1}(A) = A: 能射到 $A$ 里的元素，就是 $A$ 自身。
- 对于恒等函数，像和原像操作都不会改变原来的集合。
- (ii) 包含函数 i_X: X -> Y (其中 $X \subseteq Y$ ):
- i_X(A) = A (其中 $A \subseteq X$ ): $A$ 的像就是 $A$ 自身。
- i_X^{-1}(B) = B \cap X (其中 $B \subseteq Y$ ): 想要找 $X$ 中哪些元素的输出值落在 $Y$ 的子集 $B$ 中。因为 i_X(x)=x，所以就是找 $X$ 中哪些元素 $x$ 本身就属于 $B$ 。这正是 $X$ 和 $B$ 的交集。
- (iii) 常数函数 f(x)=c:
- 原像 f^{-1}(B)：
- 如果固定的输出值 $c$ 不在目标区域 $B$ 里 (c \notin B)，那么没有任何 $x$ 的输出能落在 $B$ 里。原像是空集 $\emptyset$ 。
- 如果 $c$ 在 $B$ 里 (c \in B)，那么定义域中所有 $x$ 的输出（都是c）都落在 $B$ 里。原像是整个定义域 $X$ 。
- 像 f(A)：
- 如果 $A$ 是空集，`f(\emptyset)=\emptyset$。
- 如果 $A$ 不是空集，那么 $A$ 中所有元素的输出都是同一个值 $c$ 。所以像就是只包含这个值的单元素子集 {c}。

∑ [公式拆解]

\begin{aligned} & f\left(f^{-1}(B)\right) \subseteq B \\ & A \subseteq f^{-1}(f(A)) \end{aligned}

证明第一条 f(f^{-1}(B)) \subseteq B：

设 $y \in f(f^{-1}(B))$ 。
根据像的定义，存在一个 $x \in f^{-1}(B)$ ，使得 $f(x)=y$ 。
根据原像的定义， $x \in f^{-1}(B)$ 意味着 $f(x) \in B$ 。
结合第2步和第3步，我们有 $y = f(x)$ 并且 $f(x) \in B$ 。
因此， $y \in B$ 。
这就证明了左边集合的任意元素都在右边集合里。
- 证明第二条 A \subseteq f^{-1}(f(A))：
设 $x \in A$ 。
我们想证明 $x \in f^{-1}(f(A))$ 。
根据原像的定义，这需要我们证明 $f(x) \in f(A)$ 。
根据像的定义， $f(A)$ 是所有形如 $f(a)$ (其中 $a \in A$ ) 的值的集合。
因为我们假设了 $x \in A$ ，所以 $f(x)$ 天然就是 $f(A)$ 的一个元素。
第3步的条件成立，因此 $x \in f^{-1}(f(A))$ 。

💡 [数值示例]

示例 (复合关系)：
令 $f: \{1,2,3,4\} \rightarrow \{a,b,c\}$ ，定义为 $f(1)=a, f(2)=a, f(3)=b, f(4)=c$ 。
验证 f(f^{-1}(B)) \subseteq B：
令 $B = \{a, c, d\}$ 。d 是一个“幽灵点”。
`f^{-1}(B) = \{x : f(x) \in \{a,c,d\}\} = \{1, 2, 4\}$。
`f(f^{-1}(B)) = f(\{1,2,4\}) = \{f(1), f(2), f(4)\} = \{a, a, c\} = \{a, c\}$。
我们看到 \{a, c\} \subseteq \{a, c, d\}，并且是不等号，因为“幽灵点”d 没了。
验证 A \subseteq f^{-1}(f(A))：
令 $A = \{1, 3\}$ 。
`f(A) = \{f(1), f(3)\} = \{a, b\}$。
`f^{-1}(f(A)) = f^{-1}(\{a,b\}) = \{x : f(x) \in \{a,b\}\} = \{1, 2, 3\}$。
我们看到 \{1,3\} \subseteq \{1,2,3\}，并且是不等号，因为“局外人”2（它的值 $f(2)=a$ 也在目标区域里）被包含了进来。

⚠️ [易错点]

等号不一定成立：这是核心。初学者很容易想当然地认为先取原像再取像（或反之）会“抵消”，回到原始集合。但示例表明，通常只会得到子集关系。等号成立的条件与函数的满射和单射性质有关。

📝 [总结]

本段阐述了像和原像复合操作的两个基本包含关系：f(f^{-1}(B)) \subseteq B 和 A \subseteq f^{-1}(f(A))，并解释了等号通常不成立的原因。随后，它将像和原像的概念应用到恒等函数、包含函数和常数函数上，给出了它们具体的计算结果。

🎯 [存在目的]

这些关系和例子是理解像和原像操作如何工作的关键。它们是更高级集合论证的基础。理解为什么等号不成立，能帮助我们更深刻地理解满射和单射的本质。对基本函数的分析，也为我们提供了在更复杂情况下进行推理的“心理模型”。

🧠 [直觉心智模型]

信息丢失与增加模型：
f(f^{-1}(B)) \subseteq B：想象 $B$ 是一些人的“国籍”信息。f^{-1}(B) 是找到所有这些国籍的人。f(...) 是再次查询这些人的国籍。如果一开始 $B$ 中包含了像“火星国籍”这样现实中不存在的国籍（幽灵点），这个往返操作后，“火星国籍”就丢失了。
A \subseteq f^{-1}(f(A))：想象 $A$ 是一些特定的犯罪嫌疑人。f(A) 是他们留下的所有作案指纹的集合。f^{-1}(f(A)) 是在数据库里搜索所有拥有这些指纹的人。结果不仅包括了原来的嫌疑人 $A$ ，还可能包括了跟他们指纹一样的其他“同伙”（局外人）。信息被增加了。

1. 4.4. 备注 1.4.2.

📜 [原文32]

如果 $Y$ 是另一个集合 $Y^{\prime}$ 的子集，那么函数 $f: X \rightarrow Y$ 定义（以明显的方式）一个从 $X$ 到 $Y^{\prime}$ 的函数。就图像而言，我们把图像 $G_{f} \subseteq X \times Y$ 视为 $X \times Y^{\prime}$ 的子集。从技术上讲，这是两个不同的函数，尽管我们偶尔会（不正确地）模糊这种区别。此外，给定一个函数 $f: X \rightarrow Y$ ，我们总是可以将其替换为一个从 $X$ 到 $f(X) \subseteq Y$ 的函数。更一般地，如果 $f(X) \subseteq B \subseteq Y$ ，那么 $G_{f} \subseteq X \times B$ 并定义一个新函数 $X \rightarrow B$ 。

📖 [逐步解释]

这个备注讨论了如何通过改变函数的值域 (Codomain) 来“改造”一个函数。

扩大值域：
- 情况：我们有一个函数 f: X -> Y。现在有一个更大的集合 Y'，Y 是 Y' 的子集。
- 改造：我们可以定义一个新函数 g: X -> Y'，它的对应规则和 f 完全一样。
- 图像视角：f 的图像 $G_f$ 是 X x Y 的子集。因为 Y 是 Y' 的子集，所以 X x Y 也是 X x Y' 的子集。因此， $G_f$ 同样可以被看作是 X x Y' 的一个子集。这个子集满足“垂直线测试”，所以它也定义了一个从 $X$ 到 $Y'$ 的函数。
- 技术上的区别：因为新函数 g 的值域 Y' 与旧函数 f 的值域 Y 不同，所以根据我们严格的定义，f 和 g 是两个不同的函数。
- 实践中的模糊：在实际应用中，如果不会引起混淆，我们常常会不严格地把这两个函数看作是同一个。例如，我们通常不区分函数 $f(x)=x^2$ 作为 $f: \mathbb{R} \rightarrow [0, \infty)$ 还是作为 $f: \mathbb{R} \rightarrow \mathbb{R}$ 。
缩小值域：
- 情况：给定一个函数 f: X -> Y。
- 改造：我们可以把值域 $Y$ “缩小”到恰好等于函数的像 f(X)。
- 我们可以定义一个新函数 h: X -> f(X)，它的对应规则和 f 一样。
- 好处：这个新函数 h 必定是满射的（后面会讲），因为它的值域被设定为恰好等于它的像。
- 更一般地：只要我们选择的新值域 $B$ 能够包含原来的像（即 f(X) \subseteq B），我们就可以定义一个新函数 k: X -> B。

💡 [数值示例]

示例1：
原始函数: $f: \mathbb{R} \rightarrow [0, \infty)$ ，规则为 $f(x)=x^2$ 。
定义域: $\mathbb{R}$
值域: $[0, \infty)$
像: $[0, \infty)$
扩大值域: 我们可以定义一个新函数 $g: \mathbb{R} \rightarrow \mathbb{R}$ ，规则也是 $g(x)=x^2$ 。
$f$ 和 $g$ 在技术上是不同的函数。
缩小值域:
因为像是 $[0, \infty)$ ，所以 $f$ 已经是“最小”值域了。
考虑另一个函数 $p: \mathbb{R} \rightarrow \mathbb{R}$ ，规则为 $p(x) = \sin(x)$ 。
p 的像是 [-1, 1]。
我们可以将其替换为一个新函数 $q: \mathbb{R} \rightarrow [-1, 1]$ ，规则为 $q(x) = \sin(x)$ 。
这个新函数 q 是满射的。

⚠️ [易错点]

不能随意缩小值域：缩小的新值域 $B$ 必须至少要包含原来的像 f(X)。否则，原来的一些输出值就没有地方可去了，这就无法构成一个合法的函数。

📝 [总结]

本备注的核心思想是：一个函数的对应规则（由其图像决定）和它的值域在技术上是分离的。我们可以通过扩大或缩小值域（只要新值域仍包含像）来“改造”一个函数，得到一个技术上不同但行为相似的新函数。特别地，任何函数都可以通过将其值域缩小到其像，而变成一个满射函数。

🎯 [存在目的]

这个看似学究气的区分，是理解函数性质（特别是满射）的关键。它给予了我们灵活性。当我们需要一个满射函数时，我们可以通过这种“缩小值域”的操作来方便地获得一个。这种思想在抽象代数的同构定理等高级理论中非常重要，它允许我们在不同的目标空间中“重塑”函数，以揭示更深刻的结构。

🧠 [直觉心智模型]

更改收件地址模型：
一个函数 f: X -> Y 就像一个邮寄服务，它把来自 $X$ 的信件寄到 $Y$ 市。
像 f(X) 是 $Y$ 市里实际收到信的那些街道。
扩大值域：现在你把邮寄服务的地址范围改成 $Y'$ 省（ $Y$ 市在 $Y'$ 省内）。信件的投递路径和最终收信人没变，但你在表格上填写的“目的地”范围变大了。
缩小值域：你发现信件只会寄到 f(X) 这几条街道。于是你把服务范围精确地改为只服务这几条街道。服务本身没变，但声明的目标更准确了。

1. 4.5. 我们经常需要限制给定函数的值，这导致了以下内容：

1. 4.6. 定义 1.4.3.

📜 [原文33]

如果 $f: X \rightarrow Y$ 是一个函数且 $A \subseteq X$ ，那么我们定义 $f$ 到 $A$ 的限制 $f \mid A$ 为函数 $f \mid A: A \rightarrow Y$ ，由 $(A \times Y) \cap G_{f}$ 定义，其中 $G_{f}$ 是 $f$ 的图像。换句话说，对于所有 $a \in A$ ， $(f \mid A)(a)=f(a)$ ，且 $f \mid A$ 的定义域恰好是 $A$ 。如果 $f(A) \subseteq B$ ，则存在诱导函数 $g: A \rightarrow B$ ，通过将备注 1.4.2 的过程应用于 $f \mid A$ 获得，如果 $B \neq Y$ ，则在技术上与 $f \mid A$ 不同。

📖 [逐步解释]

这个定义介绍了与“改造值域”相对的操作：“改造定义域”，即限制 (Restriction)。

核心思想：给定一个函数 f，限制操作就是只关注这个函数在某个子集 A 上的行为，忽略它在其他地方的表现，从而得到一个定义域更小的新函数。
定义与符号：
- f | A 或 f|_A：读作 “ $f$ 限制在 $A$ 上” (f restricted to A)。
- 新函数的定义域和值域：f|A 是一个从子集 A 到原值域 Y 的函数，即 f|A: A -> Y。
- 规则：它的规则和 f 完全一样，只是只对 A 中的元素生效。即 (f|A)(a) = f(a) 对于所有 $a \in A$ 。
图像视角：
- f 的图像是 $G_f \subseteq X \times Y$ 。
- f|A 的图像是什么？我们只关心输入来自 A 的部分。所以我们用 A \times Y（代表所有输入来自 A的“垂直线”的集合）去和原始图像 $G_f$ 取交集。
- G_{f|A} = (A \times Y) \cap G_f。这个交集就是 $G_f$ 中所有第一分量属于 $A$ 的有序对。
诱导函数 (Induced function)：
- 这是一个组合操作。我们先对定义域做限制，再对值域做缩小。
- 情况：我们有一个函数 f: X -> Y。我们关注它在一个子集 A \subseteq X 上的行为，并且我们发现，A 中元素的输出值都落在一个特定的子集 B \subseteq Y 里，即 f(A) \subseteq B。
- 构造：
先得到限制函数 f|A: A -> Y。
然后，根据备注 1.4.2，我们可以把这个函数的值域从 Y 缩小到 B。
这样就得到了一个诱导函数 g: A -> B。
- 如果 B 不等于 Y，这个诱导函数 g 和限制函数 f|A 在技术上是不同的函数。

💡 [数值示例]

示例1 (限制)：
令 $f: \mathbb{R} \rightarrow \mathbb{R}$ ，规则为 $f(x)=x^2$ 。
令 $A = [0, \infty)$ ，这是 $\mathbb{R}$ 的一个子集。
限制函数 f|A 是一个新函数 g: [0, \infty) -> \mathbb{R}，规则是 $g(x)=x^2$ 。
这个限制函数 g 与原来的 f 是不同的，因为它的定义域更小。一个重要的区别是，f 不是单射的（比如 $f(-1)=f(1)$ ），但 g 是单射的。

示例2 (诱导函数)：
继续上面的例子。 $f(x)=x^2$ 。
令 $A = [-2, 2]$ 。f|A 是一个函数 h: [-2, 2] -> \mathbb{R}。
我们计算 A 的像：f(A) = f([-2,2]) = [0,4]。
我们发现像 [0,4] 是包含于 B = [-1, 5] 这个集合的。
所以，我们可以定义一个诱导函数 k: [-2, 2] -> [-1, 5]，规则是 $k(x)=x^2$ 。
我们也可以直接把值域缩小到像，定义一个诱导函数 m: [-2, 2] -> [0, 4]，规则是 $m(x)=x^2$ 。这个函数 m 是满射的。

⚠️ [易错点]

区分限制和诱导：限制只改变定义域，诱导通常同时改变定义域和值域。
新函数的性质：通过限制操作，原函数不具备的良好性质（如单射）可能会在新函数上出现。这是解决问题时的一个常用技巧（比如求反三角函数时，就是将三角函数限制在某个单调区间上）。

📝 [总结]

本段定义了函数的限制操作 f|A，即通过缩小定义域来创建一个新函数。它还结合之前缩小值域的操作，定义了更复杂的诱导函数，这允许我们同时“裁剪”定义域和值域。

🎯 [存在目的]

限制操作是数学中进行“局部研究”的核心工具。很多时候，一个函数在整个定义域上行为很复杂，但在某个局部（一个子集）上可能具有非常好的性质。通过限制，我们可以把注意力集中在这个“表现良好”的局部，进行分析或求解，这在微积分（局部极值）、微分几何（局部坐标卡）等领域中无处不在。

🧠 [直觉心智模型]

放大镜模型：
一个函数 f 像是一幅巨大的画。
限制 f|A 就像拿一个放大镜（或者一个裁剪框 A）只看画中的一小部分。
在这一小部分里，你可能会发现一些在整幅画中不明显的细节或规律。
诱导函数：不仅用放大镜看，还换了一副“滤镜”（改变值域），使得你看到的颜色范围也发生了变化。

51.5. 5. 单射、满射、双射 Injections, Surjections, Bijections

1. 5.1. 定义 1.5.1.

📜 [原文34]

函数 $f: X \rightarrow Y$ 是满射或映上的，如果 $f(X)=Y$ ，换句话说，如果 $f$ 的像是 $Y$ 。

函数 $f: X \rightarrow Y$ 是单射或一对一的，如果对于所有 $x_{1}, x_{2} \in X, f\left(x_{1}\right)=f\left(x_{2}\right)$ 当且仅当 $x_{1}=x_{2}$ 。等价地，对于所有 $y \in Y$ ，集合 $f^{-1}(y)$ 最多只有一个元素。因此，如果对于所有 $y \in Y$ ，方程 $f(x)=y$ 最多只有一个解，或者换句话说，如果存在解，则它是唯一的，那么 $f$ 是单射的。

相比之下，如果对于所有 $y \in Y$ ，方程 $f(x)=y$ 有解（不一定是唯一的），那么 $f$ 是满射的。

函数 $f: X \rightarrow Y$ 既是一对一又是映上的，则称为双射或一一对应。等价地， $f$ 是双射 $\Longleftrightarrow$ 对于所有 $y \in Y$ ，存在唯一的 $x \in X$ 使得 $f(x)=y$ 。

📖 [逐步解释]

这一定义引入了对函数进行分类的三个最基本的属性：满射 (Surjection), 单射 (Injection), 和 双射 (Bijection)。这些属性描述了函数的输入和输出之间“连接”方式的特征。

满射 (Surjection / onto)：
- 核心思想：值域中的每一个点都被射中了。靶子上没有“空地”。
- 定义：f(X) = Y。函数的像 (Image) 恰好等于它的值域 (Codomain)。
- 等价描述：对于值域 $Y$ 中的任意一个元素 $y$ ，你总能（至少能找到一个）在定义域 $X$ 中的元素 $x$ ，使得 $f(x) = y$ 。
- 方程视角：方程 f(x) = y 对于任何 y \in Y 至少有一个解。
单射 (Injection / one-to-one)：
- 核心思想：不同的输入，必定得到不同的输出。不会出现两个不同的输入射到同一个点的情况。
- 定义：f(x_1) = f(x_2) 能推出 x_1 = x_2。换句话说，如果两个输出值相同，那它们必然来自同一个输入值。
- 等价定义 (原像视角)：对于值域 $Y$ 中的任何一个元素 $y$ ，它的原像集合 f^{-1}(y) 最多只包含一个元素（可以是0个或1个）。
- 方程视角：方程 f(x) = y 对于任何 y \in Y 最多只有一个解。
双射 (Bijection / one-to-one correspondence)：
- 核心思想：双射是完美的“一一对应”。定义域中的每个元素与值域中的每个元素都配成了一对，不多不少，不重不漏。
- 定义：一个函数既是单射，又是满射。
- 等价定义 (原像视角)：对于值域 $Y$ 中的任意一个元素 $y$ ，它的原像集合 f^{-1}(y) 有且仅有一个元素。
- 方程视角：方程 f(x) = y 对于任何 y \in Y 有且仅有一个解。

💡 [数值示例]

令 $X=\{1,2,3\}, Y=\{a,b\}$ 。

示例1 (满射但非单射)：
$f_1: X \rightarrow Y$ 定义为 $f_1(1)=a, f_1(2)=b, f_1(3)=a$ 。
满射?: 像 $f_1(X)=\{a,b\}$ 。值域 $Y=\{a,b\}$ 。像=值域。是满射。
单射?: $f_1(1)=f_1(3)=a$ ，但 $1 \neq 3$ 。不同的输入得到相同的输出。不是单射。

示例2 (单射但非满射)：
令 $Y'=\{a,b,c\}$ 。
$f_2: X \rightarrow Y'$ 定义为 $f_2(1)=a, f_2(2)=b, f_2(3)=c$ 。
单射?: 不同的输入对应不同的输出。是单射。
满射?: 像 $f_2(X)=\{a,b,c\}$ 。值域 $Y'=\{a,b,c\}$ 。像=值域。是满射。
修改一下：令 $Y''=\{a,b,c,d\}$ 。
$f_3: X \rightarrow Y''$ 定义为 $f_3(1)=a, f_3(2)=b, f_3(3)=c$ 。
单射?: 是单射。
满射?: 像 $f_3(X)=\{a,b,c\}$ 。值域 $Y''=\{a,b,c,d\}$ 。像 $\neq$ 值域 (d没被射中)。不是满射。

示例3 (双射)：
令 $X'=\{1,2,3\}, Y'=\{a,b,c\}$ 。
$f_2: X' \rightarrow Y'$ (即上例中的f2) 是双射。

示例4 (既非单射也非满射)：
$f_4: X \rightarrow Y''$ 定义为 $f_4(1)=a, f_4(2)=a, f_4(3)=b$ 。
单射?: 不是 ( $f_4(1)=f_4(2)$ )。
满射?: 不是 (c和d都没被射中)。

⚠️ [易错点]

性质与定义域/值域有关：一个函数是否是单射/满射，严重依赖于其定义域和值域的设定。同一个规则，换了定义域或值域，性质可能完全改变（见备注1.5.2）。
“一对一”的口语歧义：口语中的“一对一”有时可能被误解为双射。在数学中，one-to-one 严格地就是指单射 (injection)。双射是 "one-to-one and onto"。
有限集上的关系：对于从有限集 $X$ 到有限集 $Y$ 的函数：
- 如果存在单射，则 $\#(X) \leq \#(Y)$ 。
- 如果存在满射，则 $\#(X) \geq \#(Y)$ 。
- 如果存在双射，则 $\#(X) = \#(Y)$ 。

📝 [总结]

本段定义了函数的三个核心分类属性：

满射 (Surjective): 值域中的每个元素都被作为输出值至少出现一次。
单射 (Injective): 不同的输入产生不同的输出。
双射 (Bijective): 既是单射又是满射，建立了一一对应关系。

🎯 [存在目的]

这些分类是函数理论的基石，几乎所有关于函数的高级理论都建立在这些概念之上。

可逆性：一个函数存在反函数的充要条件是它是双射。
集合大小的比较：双射是用来定义两个集合（即使是无限集）“大小相等”（基数相同）的工具。如果能在两个集合间建立一个双射，就说它们等势。
同构：在抽象代数中，两个代数结构（如群、环）之间的“同构”是一种保持运算结构的双射，表明这两个结构本质上是同一个东西。

🧠 [直觉心智模型]

相亲大会模型： $X$ 是男嘉宾集合， $Y$ 是女嘉宾集合， $f$ 是配对规则， $f(x)=y$ 表示男x配对女y。
单射：不出现“两个男嘉宾抢一个女嘉宾”的情况。每个配对成功的女嘉宾只对应一个男嘉宾。
满射：所有女嘉宾都被配对成功了，没有“剩下”的。
双射：完美配对！每个男嘉宾都唯一地配对了一位女嘉宾，且所有女嘉宾都被配对了。男女嘉宾人数必须相等。

💭 [直观想象]

箭头图：用点表示集合元素，用箭头表示函数映射。
单射：没有两个箭头指向同一个目标点。
满射：右边集合中的每个点都至少有一个箭头指向它。
双射：右边集合中的每个点都有且仅有一个箭头指向它。

1. 5.2. 例 1.5.2.

📜 [原文35]

(i) 取 $X=\mathbb{R}$ ，函数 $f(x)=x^{2}$ 既不是单射也不是满射。（什么时候 $x_{1}^{2}=x_{2}^{2}$ ？ $f$ 的像是什么？）然而，相应的函数定义了一个单射 $[0, \infty) \rightarrow \mathbb{R}$ ，一个满射 $\mathbb{R} \rightarrow[0, \infty)$ ，以及一个双射 $[0, \infty) \rightarrow[0, \infty)$ 。

(ii) 函数 $f(x)=e^{x}$ 是单射但不是满射。（ $f$ 的像是什么？）函数 $f(x)=x^{3}+1$ 是一个双射。

(iii) 对于每个集合 $X$ ，恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$ 始终是一个双射。

(iv) 给定函数 $f: X \rightarrow Y$ ，备注 1.4.2 中描述的相应函数 $X \rightarrow f(X)$ 自动是满射的。换句话说，我们可以通过缩小值域将每个函数转换为一个（可能不同的）满射函数。

📖 [逐步解释]

这个例子通过我们熟悉的微积分函数来具体展示单射、满射和双射的性质，并强调了这些性质是如何依赖于定义域和值域的。

(i) $f(x)=x^2$ 的变身

原始函数: $f: \mathbb{R} \rightarrow \mathbb{R}$ , $f(x)=x^2$ 。
单射? 不是。因为 $f(-2)=4$ 且 $f(2)=4$ ，不同的输入（-2和2）得到了相同的输出（4）。作者提问：“什么时候 $x_1^2 = x_2^2$ ？” 答案是当 $x_1 = \pm x_2$ 时。
满射? 不是。值域是 $\mathbb{R}$ ，但像是 $[0, \infty)$ ，即所有非负实数。负数（比如-1）永远不会被射中。作者提问：“ $f$ 的像是什么？” 答案是 $[0, \infty)$ 。因为像不等于值域，所以不是满射。
改造1 (变单射)：通过限制定义域。
新函数: $g: [0, \infty) \rightarrow \mathbb{R}$ , $g(x)=x^2$ 。
现在输入只取非负数。如果 $x_1^2=x_2^2$ 且 $x_1, x_2 \geq 0$ ，那么必然 $x_1=x_2$ 。所以 $g$ 是单射。
改造2 (变满射)：通过缩小值域。
新函数: $h: \mathbb{R} \rightarrow [0, \infty)$ , $h(x)=x^2$ 。
现在值域被设定为恰好等于像 [0, \infty)。所以 $h$ 是满射。
改造3 (变双射)：同时限制定义域和缩小值域。
新函数: $k: [0, \infty) \rightarrow [0, \infty)$ , $k(x)=x^2$ 。
这个函数 k 既是单射（因为定义域受限）又是满射（因为值域被缩小），因此它是一个双射。这个函数就是我们熟悉的“开平方根”函数 $\sqrt{x}$ 的反函数。

(ii) 其他例子

$f(x)=e^x$ (作为 $f: \mathbb{R} \rightarrow \mathbb{R}$ )
单射? 是。如果 $e^{x_1} = e^{x_2}$ ，两边取自然对数，得到 $x_1 = x_2$ 。
满射? 不是。作者提问：“ $f$ 的像是什么？” 答案是 $(0, \infty)$ ，即所有正实数。输出值永远不会是0或负数。因为像不等于值域 $\mathbb{R}$ ，所以不是满射。
$f(x)=x^3+1$ (作为 $f: \mathbb{R} \rightarrow \mathbb{R}$ )
单射? 是。如果 $x_1^3+1 = x_2^3+1$ ，则 $x_1^3 = x_2^3$ ，两边开立方根，得到 $x_1 = x_2$ 。
满射? 是。对于任何一个实数 $y \in \mathbb{R}$ ，我们总能解出 $x = \sqrt[3]{y-1}$ 。这意味着值域中每个点都被射中了。
因为它既是单射又是满射，所以它是双射。

(iii) 恒等函数

$\mathrm{Id}_X: X \rightarrow X$ 。
单射? 是。如果 $\mathrm{Id}(x_1)=\mathrm{Id}(x_2)$ ，那么 $x_1=x_2$ 。
满射? 是。像是 $X$ 中所有元素的集合，即 $X$ 。值域也是 $X$ 。像=值域。
因此，恒等函数总是双射。

(iv) 将任意函数变为满射

这是一个普遍结论，重申了备注 1.4.2 的思想。
给定任何函数 f: X -> Y，它的像是 f(X)。
我们可以定义一个新函数 g: X -> f(X)，其规则与 f 完全相同。
这个新函数 g 的值域被设定为 f(X)，恰好等于它的像。
因此，g 自动成为一个满射函数。

📝 [总结]

这个例子通过一系列具体函数，生动地展示了如何判断单射、满射和双射，并揭示了通过“裁剪”定义域或值域来改变函数性质的强大技术。任何函数都可以通过缩小其值域到其像而被“转化”为一个满射函数。

🎯 [存在目的]

本例旨在将抽象的定义与读者的既有经验联系起来，加深对概念的理解。它强调了函数性质的“相对性”——一个函数的属性不是孤立的，而是由其规则、定义域、值域三者共同决定的。这种“改造函数”的思想是解决问题的重要策略，例如，在需要反函数时，我们常常需要先通过限制操作，从一个非双射的函数中“雕刻”出一个双射的部分。

💭 [直观想象]

水平线测试 (Horizontal Line Test)：这是判断单射和满射的几何方法。
画出函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ 的图像。
画一条任意的水平线 $y=c$ 。
单射测试：如果任何水平线与图像最多只有一个交点，则函数是单射的。
$f(x)=x^2$ 的图像是抛物线，水平线 $y=4$ 与它有两个交点，所以不是单射。
$f(x)=x^3+1$ 的图像是单调递增曲线，任何水平线都只有一个交点，所以是单射。
满射测试：如果对于值域中的任何一个 c，对应的水平线 $y=c$ 与图像至少有一个交点，则函数是满射的。
$f(x)=x^2$ 作为到 $\mathbb{R}$ 的函数，水平线 $y=-1$ 与图像没有交点，所以不是满射。
$f(x)=x^3+1$ 作为到 $\mathbb{R}$ 的函数，任何水平线都有交点，所以是满射。
双射测试：任何（在值域内的）水平线与图像都有且仅有一个交点。

1. 5.3. 函数 $f: X \rightarrow Y$ 是单射 $\Longleftrightarrow$ ... (续)

📜 [原文36]

单射或满射的性质也可以通过“水平线”来描述，换句话说，通过形式为 $X \times\{y\}$ 的 $X \times Y$ 的子集（当 $X=Y=\mathbb{R}$ 时，它们恰好是水平线）。函数 $f: X \rightarrow Y$ 是单射 $\Longleftrightarrow$ 对于每个 $y \in Y$ ，图像 $G_{f}$ 与 $X \times\{y\}$ 的交集，即 $G_{f} \cap(X \times\{y\})$ ，最多有一个点。函数 $f$ 是满射 $\Longleftrightarrow$ 对于每个 $y \in Y$ ，图像 $G_{f}$ 与 $X \times\{y\}$ 的交集，即 $G_{f} \cap(X \times\{y\})$ ，至少有一个点。因此， $f$ 是双射 $\Longrightarrow$ 对于每个 $y \in Y$ ，图像 $G_{f}$ 与 $X \times\{y\}$ 的交集，即 $G_{f} \cap(X \times\{y\})$ ，恰好有一个点。这可以解释如下：对于 $X \times Y$ 的每个子集 $A$ ，我们通过以下方式得到 $Y \times X$ 的一个新子集 ${ }^{t} A$ ：

{ }^{t} A=\{(y, x):(x, y) \in A\}

这是“关于对角线反射”的抽象类比。上述说法是 $f$ 是双射 $\Longleftrightarrow$ 当 ${ }^{t} G_{f}$ 被视为 $Y \times X$ 的子集时，它满足“垂直线测试”。因此：

📖 [逐步解释]

这部分将上一节例子中提到的“水平线测试”从几何直观提升到了严格的集合论描述，并由此引出了反函数存在的根本条件。

水平线测试的集合论描述：
- 水平线：在笛卡尔积 $X \times Y$ 中，一条“水平线”对应的是所有第二分量为某个固定值 $y$ 的点的集合，即 $X \times \{y\}$ 。
- 交点：函数图像 $G_f$ 与这条“水平线”的交集，就是 $G_f \cap (X \times \{y\})$ 。
- 重新描述性质：
- 单射 (最多一个解): 对于每个 $y \in Y$ ，上述交集的基数（包含的点的数量）\#(G_f \cap (X \times \{y\})) \leq 1。
- 满射 (至少一个解): 对于每个 $y \in Y$ ，\#(G_f \cap (X \times \{y\})) \geq 1。
- 双射 (有且仅有一个解): 对于每个 $y \in Y$ ，\#(G_f \cap (X \times \{y\})) = 1。
图像的“转置”：
- 作者引入了一个操作 ` ${}^t A`，作用于$ X \times Y $的一个**子集**$ A$ 上。
- ${}^t A = \{(y, x) : (x, y) \in A\}$ 。
- 这个操作就是把 $A$ 中所有有序对的两个分量交换位置。
- 几何意义：如果 $A$ 是 $\mathbb{R}^2$ 中的一个子集（一个图形），那么 ${}^t A` 就是将图形$ A$ 关于对角线 y=x 进行对称反射后得到的图形。这就像矩阵的转置，所以用 t` 作为符号。
双射与反函数的联系：
- 我们知道，一个函数 $g: Y \rightarrow X$ 的图像 $G_g$ 必须满足“垂直线测试”（在 $Y \times X$ 空间中）。
- 现在考虑一个函数 $f: X \rightarrow Y$ 。它的图像是 $G_f$ 。
- 我们将 $G_f$ 进行“转置”操作，得到 ` ${}^t G_f`，这是$ Y \times X$ 的一个子集。
- 现在问：` ${}^t G_f` 是否是一个从$ Y $到$ X$ 的函数图像？
- ${}^t G_f` 要成为**函数图像**，它必须满足在$ Y \times X $中的“垂直线测试”。即，对于每个$ y \in Y $，`$ {}^t G_f 与“垂直线” $\{y\} \times X$ 的交集必须恰好只有一个点。
- ${}^t G_f \cap (\{y\} \times X)$ 恰好有一个点。我们来看看这个交集里的元素是什么形式。它是 (y, x)，其中 (x, y) \in G_f`。
- 所以这个条件等价于：对于每个 $y \in Y$ ，存在唯一的 $x$ 使得 (x,y) \in G_f。
- 这正是 $f$ 是双射的集合论描述！
结论：
- 一个函数 $f: X \rightarrow Y$ 是双射，当且仅当，它的图像 $G_f$ 经过“翻转”（转置）后得到的新集合 ` ${}^t G_f`，恰好满足了从$ Y $到$ X$ 的函数的定义。
- 这个由 ` ${}^t G_f` 所定义的**新函数**，就是$ f$ 的反函数。

∑ [公式拆解]

{ }^{t} A=\{(y, x):(x, y) \in A\}

这是一个定义式。它定义了“转置”操作，将一个由 (x,y) 组成的集合 A 变换成一个由 (y,x) 组成的集合 ${}^t A。

💡 [数值示例]

示例1 (双射函数)：
$f: \{1,2,3\} \rightarrow \{a,b,c\}$ 是双射， $f(1)=a, f(2)=b, f(3)=c$ 。
$G_f = \{(1,a), (2,b), (3,c)\}$ 。
转置图像: ` ${}^t G_f = \{(a,1), (b,2), (c,3)\}$ 。
我们来检查 ` ${}^t G_f` 是否是$ g: \{a,b,c\} \rightarrow \{1,2,3\}$ 的函数图像。
对于 $y=a$ ，有唯一交点 $(a,1)$ 。
对于 $y=b$ ，有唯一交点 $(b,2)$ 。
对于 $y=c$ ，有唯一交点 $(c,3)$ 。
它通过了“垂直线测试”。所以 ` ${}^t G_f` 是一个**函数图像**，这个**函数**就是$ f $的**反函数**$ f^{-1}$。

示例2 (非双射函数)：
$f: \{1,2\} \rightarrow \{a,b,c\}$ ， $f(1)=a, f(2)=b$ (单射但非满射)。
$G_f = \{(1,a), (2,b)\}$ 。
${}^t G_f = \{(a,1), (b,2)\}$ 。
检查它是否是 $g: \{a,b,c\} \rightarrow \{1,2\}$ 的函数图像。
对于 $y=c$ ，它与 ${}^t G_f 没有交点。违反了“对于每个y”的要求。所以不是函数。
$f: \{1,2,3\} \rightarrow \{a,b\}$ ， $f(1)=a, f(2)=b, f(3)=a$ (满射但非单射)。
$G_f = \{(1,a), (2,b), (3,a)\}$ 。
${}^t G_f = \{(a,1), (b,2), (a,3)\}$ 。
检查它是否是 $g: \{a,b\} \rightarrow \{1,2,3\}$ 的函数图像。
对于 $y=a$ ，它与 ` ${}^t G_f` 有两个交点$ (a,1) $和$ (a,3)$。违反了“唯一性”。所以不是函数。

📝 [总结]

本段将单射、满射、双射的性质与“水平线测试”的集合论版本联系起来。更重要的是，它通过引入图像的“转置”操作，从根本上揭示了双射与反函数存在性之间的深刻联系：一个函数是双射，等价于其“翻转后的图像”满足函数的定义。

🎯 [存在目的]

本段的目的是为下一节的命题 1.5.3（即双射等价于反函数存在）提供一个坚实的、基于图像和集合论的证明思路。它将反函数这个概念从一个纯粹的代数操作（寻找一个能“抵消”原函数的函数），转化为一个几何/集合论的操作（对图像进行“关于对角线反射”）。这种几何化的观点非常强大和直观。

1. 5.4. 命题 1.5.3.

📜 [原文37]

函数 $f: X \rightarrow Y$ 是双射 $\Longleftrightarrow$ 子集 ${ }^{t} G_{f} \subseteq Y \times X$ 是从 $Y$ 到 $X$ 的函数图像。这个函数记作 $f^{-1}$ 。

$f^{-1}$ 的定义性质如下：

y=f(x) \Longleftrightarrow x=f^{-1}(y)

📖 [逐步解释]

这个命题是上一段讨论的正式总结，是函数理论中的一个基石定理。

核心论断：
- \Longleftrightarrow (当且仅当) 表明这是一个双向的、完全等价的陈述。
- 左边: “函数 $f$ 是一个双射”。
- 右边: “ $f$ 的图像 $G_f$ 在翻转之后得到的集合 ${}^t G_f$ ，本身是一个从 $Y$ 到 $X$ 的函数的图像”。
- 这个命题正式确立了：双射的性质，和“翻转图像能得到一个新函数”这件事，是完全等价的。
反函数 $f^{-1}$ 的定义：
- 如果 $f$ 是双射，那么右边的条件成立，${}^t G_f 就定义了一个新的函数。
- 我们就把这个新的函数命名为 $f$ 的反函数 (Inverse function)，并记作 $f^{-1}$ 。
- 警告：这里的 $f^{-1}$ 是一个真正的函数！它与我们之前定义的原像操作 f^{-1}(B) 只是共享了同一个符号，但概念完全不同。
- 反函数 $f^{-1}$ 的输入是一个元素 $y \in Y$ ，输出是一个元素 $x \in X$ 。
- 原像 f^{-1}(B) 的输入是一个子集 $B \subseteq Y$ ，输出是一个子集 \subseteq X。
- 只有当 $f$ 是双射时，对单点集的原像 f^{-1}(\{y\}) 恰好是单元素子集 \{f^{-1}(y)\}，这时两者才通过花括号联系起来。
反函数的定义性质：
- y=f(x) \Longleftrightarrow x=f^{-1}(y)。这个性质完美地描述了函数和其反函数之间的“互逆”关系。
- 从图像上看：
- y=f(x) 意味着有序对 (x, y) 在 f 的图像 $G_f$ 中。
- x=f^{-1}(y) 意味着有序对 (y, x) 在 $f^{-1}$ 的图像 ${}^t G_f 中。
- 根据 ${}^t G_f 的定义 \{(y, x) : (x, y) \in G_f\}，这两句话显然是等价的。

∑ [公式拆解]

y=f(x) \Longleftrightarrow x=f^{-1}(y)

这个公式是使用反函数时最核心的操作法则。它允许我们在一个等式两边同时“作用”一个函数或其反函数（类似于对方程两边同时加减乘除）。

用法示例：求解方程 $e^x = 5$ 。

我们知道指数函数 exp(x) = e^x 和对数函数 ln(y) 互为反函数。
设 $y=5, f(x)=e^x$ 。我们有 y = f(x)。
根据该性质，这等价于 x = f^{-1}(y)。
即 $x = \ln(5)$ 。

💡 [数值示例]

示例1：
令 $f: \mathbb{R} \rightarrow \mathbb{R}, f(x)=x+2$ 。这是一个双射。
$y = x+2$ 。
根据性质，这等价于 $x = f^{-1}(y)$ 。
从 $y = x+2$ 中解出 $x$ ，得到 $x = y-2$ 。
所以， $f^{-1}(y) = y-2$ 。这就是反函数的规则。
图像： $y=x+2$ 是一条斜率为1，y轴截距为2的直线。 $y=x-2$ (或写成 $x=y+2$ ) 是一条斜率为1，x轴截距为2的直线。这两条直线确实关于对角线 $y=x$ 对称。

示例2：
令 $f: [0, \infty) \rightarrow [0, \infty), f(x)=x^2$ 。我们在例1.5.2中知道这是个双射。
$y = x^2$ 。
根据性质，等价于 $x = f^{-1}(y)$ 。
从 $y = x^2$ 中解出 $x$ 。因为我们限定了定义域 $x \geq 0$ ，所以解是唯一的 $x = \sqrt{y}$ 。
所以， $f^{-1}(y) = \sqrt{y}$ 。平方根函数是平方函数在非负数域上的反函数。

📝 [总结]

该命题给出了函数可逆的充要条件：一个函数是双射。它将反函数 $f^{-1}$ 严格地定义为由“翻转后”的图像 ${}^t G_f 所代表的函数，并给出了反函数最核心的运算性质 y=f(x) \iff x=f^{-1}(y)。

🎯 [存在目的]

这个命题是连接函数属性和函数运算的关键桥梁。它为我们提供了一个明确的判据来判断一个函数是否有反函数，并为我们找到了计算和使用反函数的理论依据。反函数的概念在数学中极为重要，它代表了“逆运算”或“解方程”的过程。没有反函数，我们就无法从结果反推原因。

1. 5.5. 备注 1.5.4.

📜 [原文38]

如果 $X$ 和 $Y$ 是有限集，并且 $f: X \rightarrow Y$ 是一个双射，那么 $\#(X)=\#(Y)$ 。事实上，我们可以通过以下方式定义一个有限集 $X$ ： $X$ 是有限的 $\Longleftrightarrow$ 对于某个自然数 $n$ ，存在一个从集合 $\{1, \ldots, n\}$ 到 $X$ 的双射，在这种情况下 $\#(X)=n$ 。（因此，根据定义，一个无限集 $X$ 是指对于每个自然数 $n$ ，都不存在从 $\{1, \ldots, n\}$ 到 $X$ 的双射。）

更一般地，如果 $X$ 和 $Y$ 是有限集，则

(i) 存在双射 $f: X \rightarrow Y \Longleftrightarrow \#(X)=\#(Y)$ 。

(ii) 存在单射 $f: X \rightarrow Y \Longleftrightarrow \#(X) \leq \#(Y)$ 。

(iii) 存在满射 $g: X \rightarrow Y \Longleftrightarrow \#(X) \geq \#(Y)$ 。

(iv) 如果 $\#(X)=\#(Y)$ 且 $g: X \rightarrow Y$ 是一个函数，那么 $g$ 是单射 $\Longleftrightarrow g$ 是满射 $\Longleftrightarrow g$ 是双射。

上述三条事实中的任何一条都称为鸽巢原理。

📖 [逐步解释]

这个备注探讨了单射、满射、双射在有限集上的表现，这与我们的直觉高度吻合，并引出了著名的鸽巢原理 (Pigeonhole Principle)。

双射与基数相等：
- 如果能在两个有限集之间建立一个双射（一一对应），那么它们的元素个数必然相等。这是显而易见的，因为双射就是完美配对。
- 反过来，这个备注提供了一种更深刻的、用双射来定义“有限集”和“基数”的方法。
- 一个集合 $X$ 是有限的，且基数为 $n$ ，这句话的严格定义是：存在一个从标准有限集 $\{1, 2, ..., n\}$ 到 $X$ 的双射。
- 这个双射的作用就像“数数”：你将 1 配对给 $X$ 的第一个元素，2 配对给第二个，...，n 配对给最后一个，正好数完。
有限集上的三种映射与基数关系：
- (i) 双射 (Bijection): 两个有限集之间能建立双射，等价于它们的基数相等。
- (ii) 单射 (Injection): 从 $X$ 到 $Y$ 能建立单射，等价于 $X$ 的基数小于或等于 $Y$ 的基数。
- 直观理解：要把 $X$ 里的每个元素都映射到 $Y$ 中不同的元素，那么 $Y$ 至少要提供和 $X$ 一样多的“位置”才行。
- (iii) 满射 (Surjection): 从 $X$ 到 $Y$ 能建立满射，等价于 $X$ 的基数大于或等于 $Y$ 的基数。
- 直观理解：要想把 $Y$ 里的每个元素都“射中”，那么 $X$ 至少要提供和 $Y$ 一样多的“箭”才行。
- 鸽巢原理：这三条（特别是(ii)和(iii)）是鸽巢原理的不同表述。最通俗的版本是：如果你有 $n+1$ 只鸽子要飞进 $n$ 个鸽巢，那么至少有一个鸽巢里有两只或更多的鸽子。这对应于：不存在从一个 $n+1$ 元素\\集合到一个 $n$ 元素\\集合的单射。
基数相等时的特殊性质：
- (iv) 这是一个非常重要的结论，只在有限集且基数相等时成立。
- 如果两个有限集 $X, Y$ 大小相同，那么对于一个从 $X$ 到 $Y$ 的函数，单射、满射、双射这三个性质是“捆绑”在一起的。只要满足其中一个，就自动满足另外两个。
- 单射 $\implies$ 双射: 如果 $g$ 是单射，它把 $n$ 个不同的元素映射到 $Y$ 中 $n$ 个不同的元素。因为 $Y$ 总共也只有 $n$ 个元素，所以这 $n$ 个元素必然就是 $Y$ 的全部。因此 $g$ 也是满射，故为双射。
- 满射 $\implies$ 双射: 如果 $g$ 是满射，那么 $Y$ 中 $n$ 个元素都被射中了。因为 $X$ 总共只有 $n$ 个元素（ $n$ 支箭），为了射中 $n$ 个不同的目标，必须每支箭射一个，不能有两支箭射同一个目标。因此 $g$ 也是单射，故为双射。
- 警告：这个性质对于无限集完全不成立！例如， $f: \mathbb{N} \rightarrow \mathbb{N}, f(n)=n+1$ 是单射但不是满射（1没被射中）。

💡 [数值示例]

示例 (鸽巢原理)：
$X=\{1,2,3\}, Y=\{a,b\}$ 。 $\#(X)=3, \#(Y)=2$ 。
$\#(X) > \#(Y)$ 。所以不可能存在从 $X$ 到 $Y$ 的单射。你一定会发现至少有两个输入（鸽子）映射到同一个输出（鸽巢），比如 $f(1)=a, f(2)=b, f(3)=a$ 。
$\#(X) \geq \#(Y)$ 。所以可能存在从 $X$ 到 $Y$ 的满射，比如上面那个例子就是。

示例 (iv)：
$X=\{1,2,3\}, Y=\{a,b,c\}$ 。 $\#(X)=\#(Y)=3$ 。
定义 $g: X \rightarrow Y$ 为 $g(1)=a, g(2)=b, g(3)=c$ 。
我们只检查它是单射：不同输入确实得到不同输出。
根据性质(iv)，我们无需再检查，就可以直接断定它也一定是满射和双射。
定义 $h: X \rightarrow Y$ 为 $h(1)=a, h(2)=b, h(3)=a$ 。
我们发现它不是单射。根据性质(iv)，我们可以立即断定它也一定不是满射（事实也如此，c没被射中）。

📝 [总结]

本备注建立了在有限集背景下，函数的单射/满射/双射性质与集合基数之间的紧密联系。核心结论是鸽巢原理的各种形式，以及在两个等大有限集之间，单射、满射和双射是等价的。

1. 5.6. 备注 1.5.5.

📜 [原文39]

很容易得出，如果 $X$ 是有限的且 $A$ 是 $X$ 的真子集，那么 $\#(A)< \#(X)$ 且不存在从 $A$ 到 $X$ 的双射。结果表明，无限集可以通过相反的性质来表征： $X$ 是无限的 $\Longleftrightarrow$ 存在 $X$ 的真子集 $A$ 和一个从 $A$ 到 $X$ 的双射。

尽管我们不会使用无限基数的语言，但如果存在从 $\mathbb{N}$ 到 $X$ 的双射，则集合 $X$ 是可数的。例如， $\mathbb{N}, \mathbb{Z}$ 和 $\mathbb{Q}$ 都是可数的。如果不存在从 $\mathbb{N}$ 到 $X$ 的双射，则无限集 $X$ 是不可数的。例如，康托的一个著名结果是 $\mathbb{R}$ 是不可数的。此外，幂集 $\mathcal{P}(\mathbb{N})$ 是不可数的（事实上，存在从 $\mathcal{P}(\mathbb{N})$ 到 $\mathbb{R}$ 的双射）。

📖 [逐步解释]

这个备注进一步深入探讨了有限集和无限集的本质区别，并引入了“可数”与“不可数”这一对描述无穷的重要概念。

有限集的特征：
- “部分小于整体”。如果一个集合是有限的，那么它的任何一个真子集（即不是它本身的子集）的元素个数都严格小于它本身。
- 因此，在有限集 $X$ 和其真子集 $A$ 之间，不可能建立双射（因为它们的基数不同）。这是我们日常经验的一部分。
无限集的反直觉特征 (戴德金无限)：
- 德国数学家戴德金 (Richard Dedekind) 提出了一个惊人的、用于定义无限集的性质：一个集合是无限的，当且仅当，它可以和它的一个真子集建立双射。
- 换句话说，无限集可以做到“部分等于整体”！
- 经典例子 (希尔伯特旅馆)：
- $X = \mathbb{N} = \{1, 2, 3, \dots\}$ (自然数集)。
- $A = \{2, 3, 4, \dots\}$ (所有大于1的自然数集)。显然 $A$ 是 $X$ 的一个真子集，因为它少了元素1。
- 我们能建立一个从 $X$ 到 $A$ 的双射吗？可以！
- 定义函数 $f: X \rightarrow A$ 为 $f(n) = n+1$ 。
- 这个函数是单射（如果 $n_1+1 = n_2+1$ ，则 $n_1=n_2$ ）。
- 这个函数是满射（对于 $A$ 中任何一个元素 $a \geq 2$ ，我们总能找到一个 $X$ 中的元素 $n=a-1$ ，使得 $f(n)=a$ ）。
- 所以 $f$ 是一个双射。我们成功地在无限集 $\mathbb{N}$ 和它的真子集 $\{2,3,4,\dots\}$ 之间建立了一一对应！
可数集 (Countable Set)：
- 这是最“小”的一种无限集。
- 定义：一个集合 $X$ 是可数的，如果能建立一个从自然数集 $\mathbb{N}$ 到 $X$ 的双射。
- 直观意义：可数集的元素可以像自然数一样，被一个一个地“数”出来（尽管永远数不完），可以给它们排成一列 $x_1, x_2, x_3, \dots$ 。
- 例子：
- $\mathbb{N}$ (自然数集) 自身显然是可数的 ( $\mathrm{Id}_{\mathbb{N}}$ 就是一个双射)。
- $\mathbb{Z}$ (整数集) 也是可数的。我们可以这样数： $0, 1, -1, 2, -2, 3, -3, \dots$ 。这表明可以建立一个从 $\mathbb{N}$ 到 $\mathbb{Z}$ 的双射。
- $\mathbb{Q}$ (有理数集) 也是可数的。这更反直觉，因为有理数在数轴上非常密集。但康托证明了，可以通过一个巧妙的对角线方法将所有分数排列成一个序列。
不可数集 (Uncountable Set)：
- 比可数集“更大”的无限集。
- 定义：一个无限集，如果不能与自然数集 $\mathbb{N}$ 建立双射，则称之为不可数的。
- 直观意义：不可数集的元素“太多了”，根本无法将它们排成一个无穷序列。你无论如何排列，总会漏掉无穷多个。
- 例子：
- $\mathbb{R}$ (实数集)：康托的对角线论证证明了实数集是不可数的。在数轴上任意一个很小的区间内，所包含的实数都比全部的自然数要“多”。
- $\mathcal{P}(\mathbb{N})$ (自然数集的幂集)：康托也证明了任何集合的幂集都比自身“大”。因此 $\mathcal{P}(\mathbb{N})$ 比 $\mathbb{N}$ 更“大”，所以它是不可数的。
- 事实上，可以证明 $\mathcal{P}(\mathbb{N})$ 和 $\mathbb{R}$ 之间存在双射，所以它们是同样“大”的无穷。

📝 [总结]

本备注通过“部分与整体”的关系，深刻地揭示了有限与无限的本质区别。它引入了戴德金无限的定义，并进一步将无限集划分为可数和不可数两类，列举了各自的典型例子，如 $\mathbb{N}, \mathbb{Z}, \mathbb{Q}$ 是可数的，而 $\mathbb{R}$ 是不可数的。

61.6. 6. 函数复合 Function composition

1. 6.1. 定义 1.6.1.

📜 [原文40]

给定函数 $f: X \rightarrow Y$ 和 $g: Y \rightarrow Z$ ，定义复合函数 $g \circ f: X \rightarrow Z$ 为

g \circ f(x)=g(f(x))

对于所有 $x \in X$ 。当然，我们也可以通过稍微复杂的规则将 $g \circ f$ 定义为一个图像

G_{g \circ f}=\pi_{1,3}\left(\left(G_{f} \times Z\right) \cap\left(X \times G_{g}\right)\right),

其中 $\pi_{1,3}$ 是例 1.3.3 (vii) 中定义的到 $X \times Z$ 的投影。

📖 [逐步解释]

这个定义引入了组合函数的一种基本方式：函数复合 (Function Composition)。

前提条件：要对两个函数 $f$ 和 $g$ 进行复合，形成 $g \circ f$ ，一个关键的条件是：第一个函数 $f$ 的值域 $Y$ 必须是第二个函数 $g$ 的定义域。这确保了 $f$ 的输出可以作为 $g$ 的输入。
核心思想：函数复合就像一个“流水线”操作。一个输入 $x$ 先经过第一台机器 $f$ 的加工，得到一个中间产品 $f(x)$ 。然后，这个中间产品 $f(x)$ 立即被送入第二台机器 $g$ 进行再加工，得到最终产品 $g(f(x))$ 。
定义与符号：
- g \circ f：读作 “g 复合 f” (g composed with f) 或 “g 圈 f” (g circle f)。
- 注意顺序！ 写在左边的函数 $g$ 是后执行的，写在右边的函数 $f$ 是先执行的。运算顺序与书写顺序相反。
- 复合函数的定义域是第一个函数的定义域 $X$ 。
- 复合函数的值域是第二个函数的值域 $Z$ 。
- 所以，g \circ f 是一个从 $X$ 到 $Z$ 的新函数。
- 规则：(g \circ f)(x) = g(f(x))。
图像视角的定义：
- 作者还给出了一个纯粹基于图像和集合运算的、更底层的定义，这展示了复合操作是如何在集合论框架下实现的。
- $G_f \subseteq X \times Y$ , $G_g \subseteq Y \times Z$ 。
- $G_f \times Z = \{((x,y),z) : (x,y) \in G_f, z \in Z\} \subseteq (X \times Y) \times Z$
- $X \times G_g = \{(x,(y,z)) : x \in X, (y,z) \in G_g\} \subseteq X \times (Y \times Z)$
- (G_f \times Z) \cap (X \times G_g)：我们把这两个集合看作 $X \times Y \times Z$ 的子集来取交集。这个交集中的元素是形如 (x, y, z) 的三元组，它必须满足 (x, y) \in G_f (即 $y=f(x)$ ) 并且 (y, z) \in G_g (即 $z=g(y)$ )。所以这个交集就是 \{(x, f(x), g(f(x))) : x \in X\}。
- \pi_{1,3}(...)：对这个三元组的集合做投影，只保留第一和第三个分量。
- 最终结果就是 \{(x, g(f(x))) : x \in X\}，这恰好就是复合函数 $g \circ f$ 的图像。
- 这个复杂的定义我们不必在日常使用中记忆，但它证明了函数复合这个操作可以在集合论内部被完美定义。

∑ [公式拆解]

g \circ f(x)=g(f(x))

这是复合函数的操作性定义。g \circ f 是新函数的名字，它作用于 $x$ 的结果，是通过先计算 $f(x)$ ，再将结果作为输入计算 $g$ 的值得到的。

💡 [数值示例]

示例1：
令 $f: \mathbb{R} \rightarrow \mathbb{R}, f(x) = x+1$ 。
令 $g: \mathbb{R} \rightarrow \mathbb{R}, g(x) = x^2$ 。
计算 $g \circ f$ :
`(g \circ f)(x) = g(f(x)) = g(x+1) = (x+1)^2 = x^2+2x+1$。
计算 $f \circ g$ :
`(f \circ g)(x) = f(g(x)) = f(x^2) = x^2+1$。
重要观察： $(g \circ f)(x) \neq (f \circ g)(x)$ 。函数复合不满足交换律！

示例2：
$f: \{1,2,3\} \rightarrow \{a,b\}, f(1)=a, f(2)=b, f(3)=a$ 。
$g: \{a,b\} \rightarrow \{T, F\}, g(a)=T, g(b)=F$ 。
$g \circ f$ 是一个从 $\{1,2,3\}$ 到 $\{T,F\}$ 的函数。
(g \circ f)(1) = g(f(1)) = g(a) = T。
(g \circ f)(2) = g(f(2)) = g(b) = F。
(g \circ f)(3) = g(f(3)) = g(a) = T。

📝 [总结]

本段定义了函数复合 g \circ f，它代表了将函数 $f$ 和 $g$ 按顺序串联起来形成的一个新函数。其核心规则是 (g \circ f)(x) = g(f(x))，运算顺序与书写顺序相反。函数复合通常不满足交换律。

1. 6.2. 例 1.6.2.

📜 [原文41]

(i) 给定 $f: X \rightarrow Y, \operatorname{Id}_{Y} \circ f=f \circ \operatorname{Id}_{X}=f$ 。因此，恒等函数在复合下表现得非常像恒等元，只要我们小心相关恒等函数的定义域。

(ii) 如果 $f: X \rightarrow Y$ 是一个函数且 $A \subseteq X$ ，则 $f \circ i_{A}=f \mid A$ ，其中 $i_{A}: A \rightarrow X$ 是例 1.3.3(ii) 中定义的包含函数。同样地，如果 $Y \subseteq Y^{\prime}$ 且 $i_{Y}: Y \rightarrow Y^{\prime}$ 是包含，那么 $i_{Y} \circ f$ 就是我们在备注 1.4.2 中描述的函数。

📖 [逐步解释]

这个例子展示了恒等函数和包含函数在复合运算中的作用。

(i) 恒等函数是复合运算的单位元

\mathrm{Id}_Y \circ f = f：
\mathrm{Id}_Y \circ f 是一个从 $X$ 到 $Y$ 的函数。
(\mathrm{Id}_Y \circ f)(x) = \mathrm{Id}_Y(f(x))。
恒等函数 \mathrm{Id}_Y 的作用是“输入什么，输出什么”。它的输入是 f(x)，所以输出也是 f(x)。
因此，(\mathrm{Id}_Y \circ f)(x) = f(x) 对于所有 $x$ 都成立。
所以 \mathrm{Id}_Y \circ f 和 f 是同一个函数。
f \circ \mathrm{Id}_X = f：
f \circ \mathrm{Id}_X 是一个从 $X$ 到 $Y$ 的函数。
(f \circ \mathrm{Id}_X)(x) = f(\mathrm{Id}_X(x))。
\mathrm{Id}_X(x) 的结果是 x。
所以 (f \circ \mathrm{Id}_X)(x) = f(x) 对于所有 $x$ 都成立。
所以 f \circ \mathrm{Id}_X 和 f 是同一个函数。
结论：恒等函数在函数复合这个运算中的角色，就像数字1在乘法中的角色（a 1 = 1 a = a），或数字0在加法中的角色。它是一个单位元 (Identity Element)。
小心定义域：作者提醒，在使用恒等元时要小心。与 $f$ 在右边复合的必须是其定义域上的恒等函数 \mathrm{Id}_X，在左边复合的必须是其值域上的恒等函数 \mathrm{Id}_Y。

(ii) 包含函数与限制/扩展的关系

f \circ i_A = f|A：
i_A 是从子集 $A$ 到 $X$ 的包含函数 i_A: A -> X。
f 是从 $X$ 到 $Y$ 的函数 f: X -> Y。
复合函数 f \circ i_A 的定义域是 $A$ ，值域是 $Y$ 。
(f \circ i_A)(a) = f(i_A(a)) = f(a) 对于所有 $a \in A$ 。
而限制函数 f|A 的定义也恰好是：一个从 $A$ 到 $Y$ 的函数，其规则是 (f|A)(a) = f(a)。
因此，f \circ i_A 和 f|A 是同一个函数。
意义：“对函数进行限制”这个操作，可以被看作是“与包含函数进行复合”。
i_Y \circ f：
f 是 f: X -> Y。
i_Y 是从 $Y$ 到一个更大集合 $Y'$ 的包含函数 i_Y: Y -> Y'。
复合函数 i_Y \circ f 是一个从 $X$ 到 $Y'$ 的函数。
(i_Y \circ f)(x) = i_Y(f(x)) = f(x)。
它的规则和 $f$ 一样，只是值域从 $Y$ 扩大到了 $Y'$ 。这正是备注 1.4.2 中描述的“扩大值域”得到的那个新函数。

📝 [总结]

本例揭示了复合运算如何与其他基本函数（恒等、包含）和基本操作（限制、扩展值域）联系起来：

(i) 恒等函数是复合运算的单位元。

(ii) 与定义域的包含函数复合，等价于对函数进行限制。与值域的包含函数复合，等价于扩大函数的值域。

1. 6.3. 函数复合运算有点像代数运算 ... (续)

📜 [原文42]

函数复合有一个重要的性质，即它在有定义时是结合的：

命题 1.6.3. 假设给定函数 $f: X \rightarrow Y, g: Y \rightarrow Z$ 和 $h: Z \rightarrow W$ 。那么

h \circ(g \circ f)=(h \circ g) \circ f

证明。对于所有 $x \in X$ ，

\begin{aligned} & (h \circ(g \circ f))(x)=h((g \circ f)(x))=h(g(f(x))) \\ & ((h \circ g) \circ f)(x)=(h \circ g)(f(x))=h(g(f(x))) \end{aligned}

因此对于所有 $x \in X$ ， $(h \circ(g \circ f))(x)=((h \circ g) \circ f)(x)$ ，所以 $h \circ(g \circ f)=(h \circ g) \circ f$ 。

📖 [逐步解释]

这个命题指出了函数复合最重要的代数性质之一：结合律 (Associativity)。

前提条件：要讨论三个函数 $f, g, h$ 的复合，它们的定义域和值域必须能像链条一样连起来： $f$ 的输出是 $g$ 的输入， $g$ 的输出是 $h$ 的输入。
结合律的含义：
- 当你有三个或更多函数连环复合时，先算哪两个的复合是无所谓的。
- h \circ (g \circ f)：表示先计算 $f$ 和 $g$ 的复合，得到一个新函数 g \circ f，然后再将它与 $h$ 复合。
- (h \circ g) \circ f：表示先计算 $g$ 和 $h$ 的复合，得到一个新函数 h \circ g，然后再将 $f$ 与它复合。
- 结合律说，这两种计算顺序得到的结果是完全相同的函数。
证明：
- 证明两个函数相等，最直接的方法是证明它们对于定义域中任何一个输入 $x$ ，给出的输出值都相同。
- 第一步: 计算 (h \circ (g \circ f))(x)。
- 根据复合的定义，这等于 h( (g \circ f)(x) )。
- 再对括号里的 (g \circ f)(x) 使用一次定义，它等于 g(f(x))。
- 所以，最终结果是 h(g(f(x)))。
- 第二步: 计算 ((h \circ g) \circ f)(x)。
- 根据复合的定义，这等于 (h \circ g)( f(x) )。
- 现在，把 f(x) 看作一个整体，作为函数 h \circ g 的输入。
- 根据复合的定义，(h \circ g) 作用于任何输入 z 的结果是 h(g(z))。这里我们的输入是 f(x)。
- 所以，最终结果是 h(g(f(x)))。
- 结论：由于两种计算顺序对于任意 $x$ 都得到了相同的结果 h(g(f(x)))，因此这两个复合函数是相等的。

📝 [总结]

该命题及其证明确立了函数复合运算满足结合律。这意味着在进行一长串函数复合时，我们可以省略括号，写成如 $h \circ g \circ f$ 的形式，其含义是明确的。

1. 6.4. 通常函数复合不是交换的 ... (续)

📜 [原文43]

通常函数复合不是交换的。例如，给定 $f: X \rightarrow Y$ ，我们只能在 $X=Z$ 时以两种顺序与 $g: Y \rightarrow Z$ 进行复合。在这种情况下， $g \circ f: X \rightarrow X$ 和 $f \circ g: Y \rightarrow Y$ ，我们只能在 $X=Y$ 时比较它们。最后，非常简单的例子表明，即使 $Y=X$ ，如果我们随机选择两个函数 $f: X \rightarrow X$ 和 $g: X \rightarrow X$ ，那么 $g \circ f \neq f \circ g$ （只要 $X$ 有多于一个元素）。换句话说，两个随机函数的复合（其定义域和值域都等于一个固定集合 $X$ ）将取决于顺序（例如，取 $X=\mathbb{R}, f(x)=e^{x}, g(x)=x^{2}+1$ ，并检查 $g \circ f \neq f \circ g$ ）。

📖 [逐步解释]

这部分内容强调了函数复合的一个关键特性：不满足交换律 (Not Commutative)。

交换律是什么？ 一个运算 满足交换律，是指 a b = b * a。例如，加法和乘法满足交换律。
为什么复合通常不可交换？
- 情况1：根本无法交换
- 考虑 $f: X \rightarrow Y$ 和 $g: Y \rightarrow Z$ 。
- 我们可以计算 g \circ f (因为 f 的值域是 g 的定义域)。
- 但我们能计算 f \circ g 吗？f 的输入必须来自 X，而 g 的输出是在 Z 中。为了让 g 的输出能作为 f 的输入，必须要求 Z=X。
- 所以，除非 $Z=X$ ，否则 f \circ g 这个表达式本身就是无意义的。
- 情况2：可以交换，但结果函数的类型不同
- 即使满足了 $Z=X$ ，即 $f: X \rightarrow Y$ 和 $g: Y \rightarrow X$ 。
- g \circ f 是一个从 $X$ 到 $X$ 的函数。
- f \circ g 是一个从 $Y$ 到 $Y$ 的函数。
- 这两个函数的定义域和值域都不同（除非 $X=Y$ ），所以它们不可能是相等的函数。
- 情况3：定义域值域都相同，但结果仍不相等
- 这是最能说明问题的情况。我们把所有函数都限制在同一个集合上，即 $f: X \rightarrow X$ 和 $g: X \rightarrow X$ 。
- 这时，g \circ f 和 f \circ g 都是从 $X$ 到 $X$ 的函数，它们是“可比较”的。
- 但即使如此，它们的结果通常也不同。
具体反例：
- 作者给出了一个经典例子： $X=\mathbb{R}$ 。
- $f(x) = e^x$
- $g(x) = x^2+1$
- 计算 g \circ f:
- (g \circ f)(x) = g(f(x)) = g(e^x) = (e^x)^2 + 1 = e^{2x} + 1。
- 计算 f \circ g:
- (f \circ g)(x) = f(g(x)) = f(x^2+1) = e^{x^2+1}。
- 显然， $e^{2x}+1$ 和 $e^{x^2+1}$ 是两个完全不同的函数。因此 $g \circ f \neq f \circ g$ 。

📝 [总结]

本段通过层层分析和具体反例，有力地证明了函数复合运算在绝大多数情况下都不满足交换律。改变复合的顺序会从根本上改变运算的含义和结果。

1. 6.5. 我们已经看到恒等函数的作用 ... (续)

📜 [原文44]

我们已经看到恒等函数的作用非常类似于实数加法或乘法的恒等元。我们也可以询问逆函数：

2. 定义 1.6.4.

设 $f: X \rightarrow Y$ 是一个函数。逆函数 $g: Y \rightarrow X$ 是一个函数 $g$ ，使得 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ g=\operatorname{Id}_{Y}$ 。

📖 [逐步解释]

这个定义正式引入了逆函数 (Inverse Function) 的概念，它完全是基于复合运算和恒等函数来定义的。

类比：
- 在乘法中，一个数 $a$ 的逆（倒数） $a^{-1}$ 是指满足 a a^{-1} = 1 和 a^{-1} a = 1 的数，其中 1 是乘法恒等元。
- 在函数复合这个“代数系统”中，恒等函数 Id 扮演了恒等元的角色。
逆函数的定义：
- 给定一个函数 f: X -> Y。
- 它的逆函数 g 必须是一个“反向”的函数，即 g: Y -> X。
- 这个函数 g 必须满足两个条件：
g \circ f = \mathrm{Id}_X：先用 f 再用 g，结果相当于什么都没做，回到了定义域 $X$ 的起点。这被称为左逆 (Left Inverse) 条件。
f \circ g = \mathrm{Id}_Y：先用 g 再用 f，结果也相当于什么都没做，回到了值域 $Y$ 的起点。这被称为右逆 (Right Inverse) 条件。
- 一个函数 g 只有同时满足左逆和右逆两个条件，才能被称为 f 的逆函数。

📝 [总结]

本段从代数结构的角度，通过与乘法求逆类比，定义了函数的逆函数。一个函数 g 是 f 的逆函数，当且仅当它们在两个方向上的复合结果都分别是相应集合上的恒等函数。

1. 6.6. 例 1.6.5.

📜 [原文45]

对于恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$ ，由于 $\operatorname{Id}_{X} \circ \operatorname{Id}_{X}=\operatorname{Id}_{X}$ ， $\operatorname{Id}_{X}$ 是自身的逆函数。

📖 [逐步解释]

这个例子非常简单，它说明了恒等函数的逆函数就是它自己。

验证定义：
- 我们想求 f = \mathrm{Id}_X 的逆函数 g。
- 根据定义，g 必须满足 g \circ f = \mathrm{Id}_X 且 f \circ g = \mathrm{Id}_X。
- 我们来尝试 g = \mathrm{Id}_X 是否满足条件。
- g \circ f = \mathrm{Id}_X \circ \mathrm{Id}_X。根据恒等函数是复合单位元的性质，\mathrm{Id}_X \circ \mathrm{Id}_X = \mathrm{Id}_X。第一个条件满足。
- f \circ g = \mathrm{Id}_X \circ \mathrm{Id}_X = \mathrm{Id}_X。第二个条件也满足。
结论：因为 \mathrm{Id}_X 满足了作为自身逆函数的两个条件，所以恒等函数的逆函数就是它自己。

📝 [总结]

恒等函数是自身的逆函数。这再次加强了它与数字 1（1的倒数是 1）或数字 0（0的相反数是 0）的类比。

1. 6.7. 正如我们很快将展示的 ... (续)

📜 [原文46]

正如我们很快将展示的，如果逆函数存在，它就是唯一的，并且实际上就是我们记作 $f^{-1}$ 的函数。这不应与可以为任何函数定义的原像混淆，也不应与 $1 / f$ 混淆，后者可以为从不为零的实值函数定义。请注意，如果 $f: X \rightarrow Y$ 是一个双射，其逆函数为 $f^{-1}$ ，那么 $f^{-1}(y)$ 可能表示 $f^{-1}$ 在 $y$ 上的值，它是一个 $X$ 的元素，或者表示 $y$ 的原像，它是子集 $f^{-1}(\{(y)\}) \subseteq X$ ，因此等于单元素子集 $\left\{f^{-1}(y)\right\}$ 。

📖 [逐步解释]

这段话再次强烈地提醒读者注意符号 f^{-1} 的歧义性，并预告了逆函数的唯一性。

唯一性预告：作者告诉我们，如果一个函数有逆函数，那么这个逆函数是唯一的。因此，我们可以给它一个确定的名字，就是 $f^{-1}$ 。
符号 f^{-1} 的三种含义：
- 含义1：逆函数 (Inverse Function)。这是一个函数，只有当原函数是双射时才存在。
- 含义2：原像 (Preimage)。这是一个操作，作用于值域的子集，得到定义域的子集。它对任何函数都定义。f^{-1}(B)。
- 含义3：倒数 (Reciprocal)。这只对输出值为非零实数或复数的函数有意义，表示 1/f(x)。例如，如果 f(x) = x+2，那么 1/f 是指函数 g(x) = 1/(x+2)。
- 结论：上下文至关重要！你必须根据 f^{-1} 后面跟的是元素还是集合，以及讨论的背景，来判断它到底是什么意思。
双射情况下，逆函数与原像的关系：
- 当 f 是双射时，逆函数 f^{-1} 存在。
- f^{-1}(y) 这个写法出现了歧义：
- 解释A (逆函数求值)：将 y 作为元素输入到逆函数 f^{-1} 中，得到一个输出元素 x。
- 解释B (原像操作)：求单点集 \{y\} 的原像，得到一个集合 \{x \in X : f(x)=y\}。
- 关系：因为 f 是双射，所以对于任何 y，满足 f(x)=y 的 x 有且仅有一个。这个唯一的 x 正好就是逆函数 f^{-1} 在 y 点的值。
- 所以，f^{-1}(\{y\}) (作为原像集合) 等于 \{ f^{-1}(y) \} (由逆函数值构成的单元素子集)。
- 这种完美的对应关系，就是这个符号虽然有歧义但仍被广泛接受的原因。

📝 [总结]

本段强调了即将证明的逆函数的唯一性，并花费大量篇幅剖析了 f^{-1} 这一符号可能产生的三种不同含义（逆函数、原像、倒数），澄清了在双射情况下逆函数求值和原像操作之间的精确关系。

1. 6.8. 类似地，对于 $f$ 的左逆 ... (续)

📜 [原文47]

类似地，对于 $f$ 的左逆是一个函数 $g: Y \rightarrow X$ 使得 $g \circ f=\operatorname{Id}_{X}$ ，而对于 $f$ 的右逆是一个函数 $g: Y \rightarrow X$ 使得 $f \circ g=\operatorname{Id}_{Y}$ 。一个函数可能有一个右逆但没有左逆，反之亦然。然而，如果一个函数同时具有右逆和左逆，它们是相等的：

2. 命题 1.6.6.

假设 $f: X \rightarrow Y$ 是一个函数，并且 $g: Y \rightarrow X$ 和 $h: Y \rightarrow X$ 是函数，使得 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ h=\operatorname{Id}_{Y}$ 。那么 $g=h$ ，因此 $g=h$ 是 $f$ 的逆函数。

证明。考虑 $g \circ f \circ h$ 。由于函数复合是结合的，这等于

(g \circ f) \circ h=\mathrm{Id}_{X} \circ h=h

但以另一种方式结合则表明它也等于

g \circ(f \circ h)=g \circ \operatorname{Id}_{Y}=g

因此 $g=h$ 。

📖 [逐步解释]

这个命题极其精妙和重要。它揭示了左逆和右逆的关系，并直接证明了逆函数的唯一性。

左逆 (Left Inverse) 和右逆 (Right Inverse)：
- 左逆 $g$ ：g 写在 f 的左边，g \circ f = \mathrm{Id}_X。
- 右逆 $h$ ：h 被 f 写在左边（即 h 在 f 的右边），f \circ h = \mathrm{Id}_Y。
- 一个函数可能只有其中一种。我们后面会看到，有左逆等价于单射，有右逆等价于满射。
命题的核心论断：
- 如果一个函数 f 同时拥有一个左逆 g 和一个右逆 h，那么这个 g 和 h 必然是同一个函数！
- 这个结论的直接推论是：f 的逆函数（如果存在）是唯一的。因为一个逆函数既是左逆又是右逆。如果存在两个逆函数 $g_1, g_2$ ，那么 $g_1$ 是右逆， $g_2$ 是左逆，根据本命题， $g_1=g_2$ 。
证明剖析 (一个极其经典的代数证明)：
- 目标：证明 $g=h$ 。
- 工具：只使用复合的结合律和恒等函数的性质。
- 构造一个关键表达式: g \circ f \circ h。这个表达式之所以巧妙，是因为它同时包含了 g \circ f 和 f \circ h 这两个我们已知的条件。
- 第一种计算方式（先算左边）:
- (g \circ f) \circ h
- 我们知道 g \circ f = \mathrm{Id}_X。
- 所以表达式变为 \mathrm{Id}_X \circ h。
- 恒等函数与任何函数复合都不改变那个函数。所以 \mathrm{Id}_X \circ h = h。
- 所以，g \circ f \circ h 的结果是 h。
- 第二种计算方式（先算右边）:
- g \circ (f \circ h)
- 我们知道 f \circ h = \mathrm{Id}_Y。
- 所以表达式变为 g \circ \mathrm{Id}_Y。
- 恒等函数与任何函数复合都不改变那个函数。所以 g \circ \mathrm{Id}_Y = g。
- 所以，g \circ f \circ h 的结果是 g。
- 得出结论:
- 我们用两种方式计算了同一个表达式 g \circ f \circ h，得到了两个结果 h 和 g。
- 因此，g 和 h 必须相等！ g = h。
- 因为 g 和 h 相等，并且一个满足左逆条件，一个满足右逆条件，所以 g=h 这个函数同时满足了两个条件，它就是 f 的（唯一的）逆函数。

📝 [总结]

该命题通过一个极为优雅的结合律应用，证明了如果一个函数同时有左逆和右逆，那么它们必然相等。这直接导致了逆函数（如果存在）的唯一性。

1. 6.9. 推论 1.6.7.

📜 [原文48]

如果 $g_{1}$ 和 $g_{2}$ 是 $f$ 的两个逆函数，那么 $g_{1}=g_{2}$ 。换句话说，逆函数如果存在，则是唯一的。

证明。由于逆函数既是左逆又是右逆，我们可以应用前面的命题，例如将 $g_{1}$ 视为右逆，将 $g_{2}$ 视为左逆，从而得出 $g_{1}=g_{2}$ 。

📖 [逐步解释]

这个推论 (Corollary) 是上一个命题的直接结果。

论断：逆函数是唯一的。
证明：
- 假设 f 有两个逆函数，g_1 和 g_2。
- 根据逆函数的定义，g_1 必须满足：
- g_1 \circ f = \mathrm{Id}_X (g1是左逆)
- f \circ g_1 = \mathrm{Id}_Y (g1是右逆)
- 同样，g_2 也必须满足：
- g_2 \circ f = \mathrm{Id}_X (g2是左逆)
- f \circ g_2 = \mathrm{Id}_Y (g2是右逆)
- 现在，我们来应用命题1.6.6。这个命题说，只要有一个左逆和一个右逆，它俩就相等。
- 我们可以选择 g_2 作为左逆（因为它满足 g_2 \circ f = \mathrm{Id}_X）。
- 我们可以选择 g_1 作为右逆（因为它满足 f \circ g_1 = \mathrm{Id}_Y）。
- 根据命题1.6.6，这个左逆 (g_2) 必须等于这个右逆 (g_1)。
- 因此， $g_1 = g_2$ 。
- 这证明了任何两个声称是 f 的逆函数的东西，实际上都是同一个东西。所以逆函数是唯一的。

📝 [总结]

该推论明确指出了逆函数的唯一性，其证明是命题1.6.6的直接应用。

1. 6.10. 注意 $g$ 是 $f$ 的左逆 ... (续)

📜 [原文49]

注意 $g$ 是 $f$ 的左逆 $\Longleftrightarrow f$ 是 $g$ 的右逆，对于右逆也类似。特别是，如果 $f$ 有逆函数 $f^{-1}$ ，那么 $f$ 是 $f^{-1}$ 的右逆和左逆，因此是 $f^{-1}$ 的逆函数。我们可以这样表达：

2. 命题 1.6.8.

假设 $f: X \rightarrow Y$ 有逆函数 $f^{-1}: Y \rightarrow X$ 。那么 $f^{-1}$ 也有一个逆函数，并且事实上它必然等于 $f$ 。换句话说，

\left(f^{-1}\right)^{-1}=f

📖 [逐步解释]

这个命题讨论了“求逆”这个操作的对合性，即“逆的逆等于自身”。

对称关系：
- g 是 f 的左逆 (g \circ f = \mathrm{Id}), 这句话从 g 的角度看，就是 f 是 g 的右逆。
- 这说明左逆/右逆关系是相互的。
逆函数的逆函数：
- 假设 f 有逆函数 f^{-1}。
- 这意味着 f^{-1} \circ f = \mathrm{Id}_X 并且 f \circ f^{-1} = \mathrm{Id}_Y。
- 现在，我们把 f^{-1} 看作主角，想求它的逆函数。我们叫它 g。
- g 必须满足 g \circ f^{-1} = \mathrm{Id}_Y 且 f^{-1} \circ g = \mathrm{Id}_X。
- 我们回头看 f 和 f^{-1} 满足的两个条件。
- f \circ f^{-1} = \mathrm{Id}_Y。这不就说明 f 满足了作为 f^{-1} 的左逆的条件吗？
- f^{-1} \circ f = \mathrm{Id}_X。这不就说明 f 满足了作为 f^{-1} 的右逆的条件吗？
- 因为 f 同时满足 f^{-1} 的左逆和右逆条件，所以 f 就是 f^{-1} 的逆函数。
- 由于逆函数是唯一的，所以 (f^{-1})^{-1} 必然等于 f。

📝 [总结]

该命题指出，“求逆”是一个对称操作。如果 g 是 f 的逆函数，那么 f 也必然是 g 的逆函数。这可以简洁地表示为 (f^{-1})^{-1} = f。

1. 6.11. 左逆和右逆与单射和满射之间的关系 ... (续)

📜 [原文50]

左逆和右逆与单射和满射之间的关系由以下内容给出：

2. 命题 1.6.9.

设 $f: X \rightarrow Y$ 是一个函数。

(i) 如果 $f$ 有左逆，则 $f$ 是单射。

(ii) 如果 $f$ 有右逆，则 $f$ 是满射。

(iii) $f$ 有逆函数当且仅当 $f$ 是双射，在这种情况下，其逆函数是与 ${ }^{t} G_{f}$ 相关联的函数。

证明。(i), (ii)：作为练习（练习 1.7）。事实上，(ii) 是一个当且仅当语句，而 (i) 是一个当且仅当语句，只要 $X \neq \emptyset$ 。

(iii) （概要。）使用 $f: X \rightarrow Y$ 是双射 $\Longleftrightarrow{ }^{t} G_{f} \subseteq Y \times X$ 是函数 $g: Y \rightarrow X$ 的图像这一事实，并检查，必然有 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ g=\operatorname{Id}_{Y}$ 。反之，如果 $f^{-1}: Y \rightarrow X$ 是逆函数，则很容易看出 $G_{f^{-1}}={ }^{t} G_{f}$ ，因此 $f$ 是双射。

📖 [逐步解释]

这个命题是连接函数的代数性质（可逆性）和其映射性质（单射/满射/双射）的核心桥梁。

(i) 左逆 $\implies$ 单射

论断：如果一个函数 f 有左逆 g (即 g \circ f = \mathrm{Id}_X)，那么 f 必须是单射。
证明思路：

要证明 f 是单射，我们需要证明 f(x_1) = f(x_2) 能推出 x_1 = x_2。
假设 f(x_1) = f(x_2)。
将左逆 g 应用于等式两边：g(f(x_1)) = g(f(x_2))。
根据复合定义，左边是 (g \circ f)(x_1)，右边是 (g \circ f)(x_2)。
因为 g \circ f = \mathrm{Id}_X，所以等式变为 \mathrm{Id}_X(x_1) = \mathrm{Id}_X(x_2)。
根据恒等函数的定义，这直接意味着 x_1 = x_2。
证毕。

(ii) 右逆 $\implies$ 满射

论断：如果一个函数 f 有右逆 h (即 f \circ h = \mathrm{Id}_Y)，那么 f 必须是满射。
证明思路：

要证明 f 是满射，我们需要证明对于值域 $Y$ 中的任意一个元素 $y$ ，都存在一个 $X$ 中的元素 $x$ ，使得 f(x)=y。
取任意一个 $y \in Y$ 。
我们不知道要找的 $x$ 是什么，但我们手里有右逆 h: Y -> X。我们可以把 y 输入到 h 中，得到一个在 $X$ 中的元素，我们叫它 x = h(y)。
现在我们来检查这个 x 是否满足 f(x)=y。
f(x) = f(h(y)) = (f \circ h)(y)。
因为 f \circ h = \mathrm{Id}_Y，所以 (f \circ h)(y) = \mathrm{Id}_Y(y) = y。
所以我们确实找到了一个 $x$ (就是 h(y))，使得 f(x)=y。
证毕。

(iii) 逆函数 $\iff$ 双射

论断：这是一个“当且仅当”的论断，是本节最重要的结论。一个函数 f 有逆函数，等价于 f 是双射。
证明思路：
( $\implies$ ) 如果 f 有逆函数，则 f 是双射：

f 有逆函数 f^{-1}，意味着 f^{-1} 既是 f 的左逆，又是右逆。
根据 (i)，有左逆 $\implies$ 单射。
根据 (ii)，有右逆 $\implies$ 满射。
因此 f 既是单射又是满射，故为双射。
- ( $\Longleftarrow$ ) 如果 f 是双射，则 f 有逆函数：
这部分的证明概要在原文中已给出。它依赖于命题 1.5.3 的思想。
因为 f 是双射，所以它的“翻转图像” ${}^t G_f` 是一个从$ Y $到$ X$ 的函数图像。我们把这个新函数叫 g`。
我们需要验证 g 就是 f 的逆函数，即 g \circ f = \mathrm{Id}_X 且 f \circ g = \mathrm{Id}_Y。
这可以通过检查图像的定义来完成，正如命题 1.5.3 的讨论那样。

📝 [总结]

该命题建立了可逆性与映射性质之间的精确对应关系：

有左逆 $\implies$ 单射 (反之在 $X \neq \emptyset$ 时也成立)。
有右逆 $\iff$ 满射。
有逆函数（同时有左右逆） $\iff$ 双射。

1. 6.12. 特别是，证明一个函数是双射的一种非常有效的方法 ... (续)

📜 [原文51]

两个单射的复合是单射，两个满射的复合是满射（练习 1.5）。因此，两个双射的复合是双射。然而，鉴于上述备注，通过描述复合函数的逆函数来证明这个最后的陈述会更好，这还有一个优点，即给出了逆函数的公式。注意公式中的顺序颠倒，这是基本事实。

2. 命题 1.6.10.

假设 $f: X \rightarrow Y$ 有逆函数 $f^{-1}: Y \rightarrow X$ ，并且 $g: Y \rightarrow Z$ 有逆函数 $g^{-1}: Z \rightarrow Y$ 。那么 $g \circ f$ 有一个逆函数，并且它等于 $f^{-1} \circ g^{-1}$ 。

证明。我们必须检查两个等式

\begin{aligned} & (g \circ f) \circ\left(f^{-1} \circ g^{-1}\right)=\operatorname{Id}_{Z} \\ & \left(f^{-1} \circ g^{-1}\right) \circ(g \circ f)=\operatorname{Id}_{X} \end{aligned}

由于它们是相似的，我们只检查第一个：通过结合律，

\begin{aligned} (g \circ f) \circ\left(f^{-1} \circ g^{-1}\right) & =g \circ\left(f \circ f^{-1}\right) \circ g^{-1} \\ & =\left(g \circ \operatorname{Id}_{Y}\right) \circ g^{-1} \\ & =g \circ g^{-1}=\operatorname{Id}_{Z} . \quad \square \end{aligned}

📖 [逐步解释]

这个命题给出了复合函数的逆函数公式，它揭示了一个重要的“穿袜子-脱袜子”原理。

复合函数的性质：
- 作者首先陈述（作为练习）：单射的复合还是单射，满射的复合还是满射。
- 因此，双射（单射+满射）的复合也必然是双射。
更好的证明方式：
- 要证明 g \circ f 是双射，根据命题 1.6.9，我们只需要为它找到一个逆函数就行了。
- 这种方法更“构造性”，因为它不仅证明了双射的存在，还直接给出了逆函数是什么。
逆函数的公式 (穿脱袜子原理)：
- 命题：可逆函数 f 和 g 的复合 g \circ f 的逆函数是 f^{-1} \circ g^{-1}。
- (g \circ f)^{-1} = f^{-1} \circ g^{-1}。
- 顺序颠倒了！ 这是核心。
- 直观理解：想象你早上先穿上袜子 f，再穿上鞋子 g。这个过程是 g \circ f。晚上回家，你必须先脱掉鞋子（g的逆操作 g^{-1}），再脱掉袜子（f的逆操作 f^{-1}）。所以，整个过程的逆操作是 f^{-1} \circ g^{-1}。
证明：
- 要证明 f^{-1} \circ g^{-1} 是 g \circ f 的逆函数，我们需要验证它同时满足左逆和右逆的条件。
- 验证右逆: (g \circ f) \circ (f^{-1} \circ g^{-1}) = \mathrm{Id}_Z。
(g \circ f) \circ (f^{-1} \circ g^{-1})
应用结合律，把括号重新组合：g \circ (f \circ f^{-1}) \circ g^{-1}。
我们知道 f \circ f^{-1} = \mathrm{Id}_Y (因为 f^{-1} 是 f 的逆)。
表达式变为 g \circ \mathrm{Id}_Y \circ g^{-1}。
g \circ \mathrm{Id}_Y 等于 g。
表达式变为 g \circ g^{-1}。
我们知道 g \circ g^{-1} = \mathrm{Id}_Z (因为 g^{-1} 是 g 的逆)。
验证通过。
- 验证左逆: (f^{-1} \circ g^{-1}) \circ (g \circ f) = \mathrm{Id}_X 的证明过程完全类似。

📝 [总结]

该命题给出了复合函数求逆的公式：(g \circ f)^{-1} = f^{-1} \circ g^{-1}，即逆函数的复合顺序与原函数的复合顺序相反。

1. 6.13. 推论 1.6.11.

📜 [原文52]

如果 $f: X \rightarrow Y$ 和 $g: Y \rightarrow Z$ 是双射，那么 $g \circ f$ 也是双射。

📖 [逐步解释]

这个推论是上一个命题的直接结果。

论断：双射函数的复合仍然是双射函数。也就是说，双射这个性质在复合运算下是“封闭”的。
证明：
- 方法1 (直接用定义)：
- 已知 f 和 g 都是单射。可以证明 g \circ f 也是单射。
- 已知 f 和 g 都是满射。可以证明 g \circ f 也是满射。
- 因此 g \circ f 既是单射又是满射，故为双射。
- 方法2 (使用逆函数)：
- 因为 f 和 g 是双射，所以它们各自的逆函数 f^{-1} 和 g^{-1} 都存在。
- 根据命题 1.6.10，g \circ f 的逆函数是 f^{-1} \circ g^{-1}。
- 既然 g \circ f 存在一个逆函数，那么根据命题 1.6.9(iii)，g \circ f 必须是双射。
- 这个证明更优雅。

📝 [总结]

双射的复合是双射。

1. 6.14. 当然，如上所述 ... (续)

📜 [原文53]

当然，如上所述，可以直接从定义证明推论 1.6.11。

双射表达了两个集合具有相同数量元素的思想。我们已经讨论过有限集的情况。对于无限集，这可以用来定义两个无限集具有相同数量元素的含义（康托）。但这样的双射可能非常不明显。例如，可以证明存在从 $\mathbb{R}$ 到 $\mathbb{R}^{2}$ 的双射，或者实际上到任何 $n>0$ 的 $\mathbb{R}^{n}$ 的双射，但这样的双射不具有几何性质，也不能以任何显式方式写出来。

📖 [逐步解释]

这部分阐述了双射的核心意义——作为比较集合大小的工具，并指出了它在无限集上的一些反直觉的应用。

双射的核心意义：
- 存在一个从集合 $X$ 到集合 $Y$ 的双射，这句话的本质含义是： $X$ 和 $Y$ 的元素数量“相同”。
- 有限集：这与我们数数的经验一致。
- 无限集：康托（Georg Cantor）将这个思想推广，用它来定义两个无限集的“大小”（基数）相等。如果能在两个无限集之间找到一个双射，就说它们“等势”。
反直觉的例子：
- 存在从直线 $\mathbb{R}$ (一维) 到平面 $\mathbb{R}^2$ (二维) 的双射。
- 这意味着，从基数的角度看，一条线上的点和整个平面上的点一样“多”！
- 甚至，一条线上的点和任意 $n$ 维空间 $\mathbb{R}^n$ 中的点一样“多”。
- 警告：作者强调，这种双射是存在的，但它们是高度抽象和病态的。它不是像 $f(x)=(x,0)$ 这样简单的函数（这个是单射但不是满射）。这种双射会彻底破坏几何结构（比如连续性），它将一条线“撕碎”然后以一种极其复杂的方式“重新填充”到整个平面上。
- 这种函数通常无法用简单的公式写出来，只能通过极限和构造性过程来证明其存在。这显示了集合论的观点和几何/拓扑的观点有时会得出看似矛盾的结论。

📝 [总结]

本段指出了双射作为衡量集合大小工具的核心地位，并用 $\mathbb{R}$ 和 $\mathbb{R}^2$ 之间存在双射这一惊人事实，说明了在处理无限集时，纯粹的集合论观点可能与我们的几何直觉相悖。

1. 6.15. 另一方面，特别是在代数中 ... (续)

📜 [原文54]

另一方面，特别是在代数中，我们经常寻找“好的”双射，这可能告诉我们两个集合即使在技术上不同，也可能本质上是相同的。例如，如果 $X \neq Y$ ，集合 $X \times Y$ 和 $Y \times X$ 是不同的集合，但存在一个自然函数 $F: X \times Y \rightarrow Y \times X$ ，由 $F(x, y)=(y, x)$ 定义。这个函数是一个双射：如果 $F\left(x_{1}, y_{1}\right)=F\left(x_{2}, y_{2}\right)$ ，那么根据定义 $\left(y_{1}, x_{1}\right)=\left(y_{2}, x_{2}\right)$ 作为 $Y \times X$ 中的有序对。因此，根据有序对相等的运算性质， $y_{1}=y_{2}$ 且 $x_{1}=x_{2}$ ，从而 $\left(x_{1}, y_{1}\right)=\left(x_{2}, y_{2}\right)$ 。因此 $F$ 是单射。为了看出它是满射，设 $(y, x)$ 是 $Y \times X$ 的任意元素。那么 $(y, x)=F(x, y)$ 。因此 $F$ 是满射，从而是一个双射。在不直接验证 $F$ 既是单射又是满射的情况下，很容易找到一个逆函数 $G: Y \times X \rightarrow X \times Y$ 。（这个逆函数是什么？）同样地，存在从 $X_{1} \times\left(X_{2} \times X_{3}\right)$ 到 $\left(X_{1} \times X_{2}\right) \times X_{3}$ 的双射，以及从这两个集合中的任何一个到 $X_{1} \times X_{2} \times X_{3}$ 的双射。事实上，这些双射非常明显，以至于我们不总是显式地写出它们。

📖 [逐步解释]

这部分将关注点从纯粹的集合论转向代数，强调了寻找“自然的”或“保持结构的”双射的重要性，这种双射被称为同构 (Isomorphism)。

“好的”双射：
- 在代数中，我们不仅关心两个集合是否一样“大”，更关心它们的“结构”是否一样。
- 一个“好的”双射（同构）不仅建立了一一对应，还保持了集合上的运算或结构。
- 这种双射告诉我们，两个集合虽然可能由不同的元素构成（技术上不同），但它们的“玩法”或“代数本质”是完全一样的，可以被视为同一个东西的两种不同“实现”。
例子1：笛卡尔积的交换律
- X x Y 和 Y x X 是不同的集合（除非 X=Y 或为空）。它们的元素分别是 (x,y) 和 (y,x)。
- 但是，存在一个非常“自然”的双射函数 F(x,y) = (y,x)。
- 作者证明了 F 是双射：
- 单射：假设 F(x1, y1) = F(x2, y2)，即 (y1, x1) = (y2, x2)。根据有序对相等法则，必须有 y1=y2 且 x1=x2。这反过来意味着 (x1, y1) = (x2, y2)。所以 F 是单射。
- 满射：对于 Y x X 中任意一个元素 (y, x)，我们总能找到一个 X x Y 中的元素 (x, y)，使得 F(x,y)=(y,x)。所以 F 是满射。
- 用逆函数证明：作者提问，F 的逆函数 G 是什么？
- G 是从 Y x X 到 X x Y 的函数。
- 它的作用应该是把 F 的操作“撤销”。F 交换顺序，G 就应该再交换回来。
- 所以 G(y, x) = (x, y)。
- 我们可以验证 G \circ F = Id 且 F \circ G = Id。
- 因为 F 存在逆函数，所以它一定是双射。
- 这个双射的存在，说明 X x Y 和 Y x X 在结构上是“同构”的。
例子2：笛卡尔积的结合律
- X1 x (X2 x X3) 的元素形如 (x1, (x2, x3))。
- (X1 x X2) x X3 的元素形如 ((x1, x2), x3)。
- X1 x X2 x X3 的元素形如 (x1, x2, x3)。
- 它们在技术上都是不同的集合，因为括号嵌套的方式不同。
- 但是，存在非常自然的双射在它们之间转换，比如 f((x1,x2),x3) = (x1,x2,x3)。
- 由于这些双射非常“显然”，我们通常在实践中忽略这种技术上的区别，把它们都当作是同一个东西。

📝 [总结]

本段强调了在代数语境下，我们更关心那些能保持结构的“自然”双射（即同构）。通过笛卡尔积的“交换律”和“结合律”的例子，说明了两个技术上不同的集合可以通过一个自然的双射被视为“本质上相同”。

1. 6.16. 再举一个例子，我们可以将幂集 ... (续)

📜 [原文55]

再举一个例子，我们可以将幂集 $\mathcal{P}(X)$ 与所有从 $X$ 到 $\{0,1\}$ 的函数集等同起来，即与 $\{0,1\}^{X}$ 等同，如下所示。

2. 定义 1.6.12.

设 $X$ 是一个集合，设 $A \subseteq X$ ，即 $A \in \mathcal{P}(X)$ 。定义特征函数 $\chi_{A}: X \rightarrow\{0,1\}$ 为：

\chi_{A}(x)= \begin{cases}1, & \text { 如果 } x \in A \\ 0, & \text { 如果 } x \notin A\end{cases}

那么 $\chi_{A} \in\{0,1\}^{X}$ 。

📖 [逐步解释]

这个定义引入了一个极其重要的函数——特征函数 (Characteristic Function)，它在集合和函数之间建立了一座完美的桥梁。

目标：我们要证明幂集 \mathcal{P}(X) 和函数集 {0,1}^X 是“等同的”，即在它们之间可以建立一个双射。
特征函数的构造：
- 起点：从幂集 \mathcal{P}(X) 中任取一个元素，这个元素是 $X$ 的一个子集 $A$ 。
- 构造一个函数：我们为这个子集 $A$ “量身定做”一个函数，名为 \chi_A。\chi 是希腊字母 Chi，是 "Characteristic" 的代表。
- \chi_A 的定义域是 $X$ ，值域是 {0, 1}。
- 规则：
- 对于任何一个 $x \in X$ ，我们来看它是否在子集 $A$ 中。
- 如果 $x$ 在 $A$ 里面 (x \in A)，那么函数 \chi_A(x) 的输出值为 1。
- 如果 $x$ 不在 $A$ 里面 (x \notin A)，那么函数 \chi_A(x) 的输出值为 0。
- 本质：特征函数 \chi_A 就像一个“成员资格审查员”。你问它任何一个 $x$ ，它会告诉你这个 $x$ 是不是子集 $A$ 的成员（是就回答1，不是就回答0）。
函数集中的位置：
- 因为 \chi_A 是一个从 $X$ 到 {0,1} 的函数，所以根据定义，\chi_A 是函数集 {0,1}^X 的一个元素。

∑ [公式拆解]

\chi_{A}(x)= \begin{cases}1, & \text { 如果 } x \in A \\ 0, & \text { 如果 } x \notin A\end{cases}

这是一个分段函数的定义。

\chi_A: 函数名，下标 A 表明这个函数是由子集 A 决定的。
(x): 输入变量。
\begin{cases} ... \end{cases}: 表示根据不同情况有不同的规则。
1, \text{如果} x \in A: 当输入 x 是 A 的成员时，输出为1。
0, \text{如果} x \notin A: 当输入 x 不是 A 的成员时，输出为0。

💡 [数值示例]

示例1：
令 $X = \{1, 2, 3, 4\}$ 。
令子集 $A = \{1, 3\} \in \mathcal{P}(X)$ 。
我们来构造特征函数 \chi_A: X -> \{0,1\}。
\chi_A(1) = 1 (因为 $1 \in A$ )
\chi_A(2) = 0 (因为 $2 \notin A$ )
\chi_A(3) = 1 (因为 $3 \in A$ )
\chi_A(4) = 0 (因为 $4 \notin A$ )

示例2 (特殊子集)：
令 $X = \{1, 2, 3, 4\}$ 。
空集的特征函数: A = \emptyset。
对于任何 $x \in X$ ，都有 $x \notin \emptyset$ 。
所以 \chi_\emptyset(x) = 0 对于所有 $x$ 。这是一个常数函数0。
全集的特征函数: A = X。
对于任何 $x \in X$ ，都有 $x \in X$ 。
所以 \chi_X(x) = 1 对于所有 $x$ 。这是一个常数函数1。

📝 [总结]

本段定义了特征函数 \chi_A，它将一个集合 $X$ 的子集 $A$ 与一个从 $X$ 到 {0,1} 的函数唯一地联系起来。这个函数可以被看作是该子集的“数字指纹”。

1. 6.17. 因此，给定 $\mathcal{P}(X)$ 的一个元素 ... (续)

📜 [原文56]

因此，给定 $\mathcal{P}(X)$ 的一个元素 $A$ ，我们定义了一个函数 $\chi_{A}: X \rightarrow\{0,1\}$ ，即 $\{0,1\}^{X}$ 的一个元素。反之，如果 $f \in\{0,1\}^{X}$ ，即 $f$ 是一个从 $X$ 到 $\{0,1\}$ 的函数，定义 $S_{f}=f^{-1}(1)= \{x \in X: f(x)=1\}$ 。更正式地，我们通过公式

F(A)=\chi_{A}

定义了一个函数 $F: \mathcal{P}(X) \rightarrow\{0,1\}^{X}$ 。

函数 $G:\{0,1\}^{X} \rightarrow \mathcal{P}(X)$ 定义为

G(f)=f^{-1}(1)

是 $F$ 的逆函数，可以通过验证以下两个陈述来检查：

\begin{aligned} & G \circ F=\operatorname{Id}_{\mathcal{P}(X)} \\ & F \circ G=\operatorname{Id}_{\{0,1\}^{X}} \end{aligned}

这些陈述通过展开定义来检查（参见练习 1.9）。

📖 [逐步解释]

这部分内容完成了在幂集和函数集之间建立双射的证明。

构造两个方向的映射：
- 方向一 (从子集到函数)：
- 我们定义一个高阶函数 F，它的定义域是幂集 \mathcal{P}(X)，值域是函数集 {0,1}^X。
- F: \mathcal{P}(X) -> \{0,1\}^X。
- 它的规则是：F(A) = \chi_A。即，输入一个子集 A，输出它对应的那个特征函数 \chi_A。
- 方向二 (从函数到子集)：
- 我们定义另一个高阶函数 G，它的方向相反。
- G: \{0,1\}^X -> \mathcal{P}(X)。
- 它的规则是：输入一个从 $X$ 到 $\{0,1\}$ 的函数 f，输出一个 $X$ 的子集。这个子集是如何定义的呢？G(f) = f^{-1}(1)，即所有那些被 f 映射到 1 的元素 x 的集合。
证明互为逆函数：
- 要证明 F 是一个双射，我们只需要证明 G 是 F 的逆函数。
- 这需要验证两个方向的复合都等于恒等函数。
- 验证 G \circ F = \mathrm{Id}_{\mathcal{P}(X)}:
- 这个复合函数的输入是一个子集 A \in \mathcal{P}(X)。我们希望它的输出也是 A。
- (G \circ F)(A) = G(F(A))
- F(A) 的结果是特征函数 \chi_A。所以表达式变为 G(\chi_A)。
- G 的作用是，对输入的函数（这里是 \chi_A）求 1 的原像。
- 所以 G(\chi_A) = (\chi_A)^{-1}(1) = \{x \in X : \chi_A(x)=1\}。
- 根据特征函数的定义，\chi_A(x)=1 当且仅当 x \in A。
- 所以 \{x \in X : \chi_A(x)=1\} 正好就是集合 A。
- 因此，(G \circ F)(A) = A。这等于 \mathrm{Id}_{\mathcal{P}(X)}(A)。验证通过。
- 验证 F \circ G = \mathrm{Id}_{\{0,1\}^X}:
- 这个复合函数的输入是一个函数 f \in \{0,1\}^X。我们希望它的输出也是 f。
- (F \circ G)(f) = F(G(f))。
- G(f) 的结果是子集 S_f = f^{-1}(1)。所以表达式变为 F(S_f)。
- F 的作用是，为输入的子集（这里是 S_f）构造特征函数 \chi_{S_f}。
- 所以 (F \circ G)(f) = \chi_{S_f}。
- 我们需要证明 \chi_{S_f} 和 f 是同一个函数。我们来检查它们对任意 x \in X 的值。
- \chi_{S_f}(x) = 1 \iff x \in S_f \iff x \in f^{-1}(1) \iff f(x)=1。
- \chi_{S_f}(x) = 0 \iff x \notin S_f \iff x \notin f^{-1}(1) \iff f(x) \neq 1。因为 f的输出只能是0或1，所以 f(x) \neq 1 就是 f(x)=0。
- 所以，\chi_{S_f}(x) 的值总是和 f(x) 一样。
- 因此，\chi_{S_f} = f。所以 (F \circ G)(f) = f = \mathrm{Id}_{\{0,1\}^X}(f)。验证通过。
结论：因为 F 和 G 互为逆函数，所以 F 是一个双射。这证明了幂集 \mathcal{P}(X) 和函数集 {0,1}^X 之间存在一一对应。

📝 [总结]

本段通过构造一对互逆的映射 F 和 G，严格地证明了集合 $X$ 的幂集 \mathcal{P}(X) 与从 $X$ 到 {0,1} 的函数集 {0,1}^X 是双射等价的。F 将一个子集 A 映射到其特征函数 \chi_A，而 G 将一个函数 f 映射到其值为1的原像集合。

1. 6.18. 那么根据备注 1.5.4 ... (续)

📜 [原文57]

那么根据备注 1.5.4，如果 $X$ 是一个有限集且 $\#(X)=n$ ，则

\#(\mathcal{P}(X))=\#\left(\{0,1\}^{X}\right)=2^{n}

上述例子说明了数学中的一个普遍模式 ... (略)

📖 [逐步解释]

这是前面证明的一个直接推论，它解释了为什么幂集的基数是 $2^n$ 。

双射与基数相等：根据备注 1.5.4，如果能在两个有限集之间建立双射，那么它们的基数必然相等。
应用：
- 我们刚刚证明了在 \mathcal{P}(X) 和 {0,1}^X 之间存在一个双射 F。
- 因此，\#(\mathcal{P}(X)) = \#(\{0,1\}^X)。
计算函数集的基数：
- 我们要求的是从集合 $X$ （基数为 $n$ ）到集合 $\{0,1\}$ （基数为 2）的函数集的基数。
- 根据例 1.3.3(viii) 的公式 \#(Y^X) = (\#(Y))^{\#(X)}。
- 这里 Y = \{0,1\}，所以 \#(Y) = 2。
- \#(X) = n。
- 所以，\#(\{0,1\}^X) = 2^n。
结论：结合第2和第3步，我们得出 \#(\mathcal{P}(X)) = 2^n。

📝 [总结]

本段利用幂集与特征函数集之间的双射关系，以及函数集的基数公式，严格地推导出了一个n元有限集的幂集的基数为 $2^n$ 。

1. 6.19. 最后，我们讨论从一个集合到自身的所有双射的集合。这个对象将在本书中反复出现。

2. 定义 1.6.13.

设 $X$ 是一个集合。我们定义 $S_{X}$ ，即 $X$ 的置换集，为所有双射 $f: X \rightarrow X$ 的集合。因此 $S_{X} \subseteq X^{X}$ ，即所有从 $X$ 到 $X$ 的函数集。

3. 命题 1.6.14.

如果 $X$ 是一个集合且 $S_{X}$ 如上定义，则

(i) 对于所有 $f, g \in S_{X}$ ， $g \circ f \in S_{X}$ 。

(ii) $\operatorname{Id}_{X} \in S_{X}$ 。

(iii) 如果 $f \in S_{X}$ ，则 $f^{-1} \in S_{X}$ 。

换句话说， $S_{X}$ 在复合下是封闭的，包含 $X$ 上的恒等函数，并且 $S_{X}$ 的每个元素都有一个逆元素，它也在 $S_{X}$ 中。

📖 [逐步解释]

这部分内容引入了一个在抽象代数中极端重要的核心概念——置换群 (Permutation Group) 或 对称群 (Symmetric Group)。

置换集的定义：
- 对象：我们只关注从一个集合 $X$ 映射到其自身的函数。
- 筛选条件：在所有这些 f: X -> X 的函数中，我们只挑选出那些是双射的。
- S_X：这个由所有从 $X$ 到 $X$ 的双射组成的集合，被称为 $X$ 的置换集。一个置换就是一种对 $X$ 中元素的“重新排列”。
- 与函数集的关系：S_X 是所有从 $X$ 到 $X$ 的函数集 X^X 的一个子集。
命题1.6.14：S_X 的代数结构
- 这个命题指出了 S_X 在函数复合 \circ 这个运算下具有三个非常好的性质。这三个性质是定义一个“群 (Group)”的核心公理。
- (i) 封闭性 (Closure)：
- 如果 f, g \in S_X，则 g \circ f \in S_X。
- f 和 g 都是 $X$ 上的双射。
- 根据推论1.6.11，双射的复合还是双射。
- 所以 g \circ f 也是一个从 $X$ 到 $X$ 的双射，因此它也属于 S_X。
- 这意味着在 S_X 内部做复合运算，结果不会“跑出” S_X 这个集合。
- (ii) 存在单位元 (Identity Element)：
- \mathrm{Id}_X \in S_X。
- 根据例1.5.2(iii)，我们知道恒等函数 \mathrm{Id}_X 是一个双射。
- 所以 \mathrm{Id}_X 是 S_X 的一个成员。它在复合运算中扮演“单位元”的角色。
- (iii) 存在逆元 (Inverse Element)：
- 如果 f \in S_X，则 f^{-1} \in S_X。
- 因为 f 是双射，所以它的逆函数 f^{-1} 存在。
- 根据命题1.6.8，f^{-1} 的逆函数是 f，所以 f^{-1} 本身也必须是双射。
- 因此，f^{-1} 也是一个从 $X$ 到 $X$ 的双射，它也属于 S_X。
- 这意味着 S_X 中每个元素都有一个“反操作”，且这个“反操作”也在 S_X 内部。
群 (Group) 的概念：
- 一个集合配上一个运算，如果满足封闭性、结合律（函数复合已证明）、有单位元、有逆元，那么这个集合和运算就构成一个群。
- 因此，(S_X, \circ) 是一个群。这是群论中第一个也是最重要的例子。

📝 [总结]

本段定义了集合 $X$ 的置换集 S_X，即所有从 $X$ 到自身的双射的集合。并证明了 S_X 在函数复合运算下满足封闭性、存在单位元和存在逆元这三个性质，这使得 (S_X, \circ) 构成一个群。

1. 6.20. 对于一个有限集 $X$ ... (续)

📜 [原文58]

对于一个有限集 $X$ ，其 $\#(X)=n$ ，我们通常将 $X$ 取为具有 $n$ 个元素的标准有限集，即 $\{1, \ldots, n\}$ ，并用 $S_{n}$ 缩写 $S_{\{1, \ldots, n\}}$ 。通过计数， $\#\left(S_{n}\right)=n!$ ，因为要定义一个双射 $f:\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ ，对于 $f(1)$ 有 $n$ 种可能的选择，但对于 $f(2)$ 只有 $n-1$ 种选择，因为值 $f(1)$ 被排除：由于 $f$ 是单射，我们不能有 $f(1)=f(2)$ 。继续下去，对于 $f(3)$ 有恰好 $n-2$ 种选择，...，对于 $f(n-1)$ 有 2 种选择，对于 $f(n)$ 只有一种选择。这表明单射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 的总数是

n(n-1) \cdots 2 \cdot 1=n!.

但根据备注 1.5.4，单射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 与双射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 是同一回事。因此 $\#\left(S_{n}\right)=n!$ 。当然，类似的论证表明，对于任何具有 $\#(X)=n$ 的有限集 $X$ ， $\#\left(S_{X}\right)=n!$ 。

2. 定义 1.6.15.

集合 $S_{n}$ 是 $n$ 个字母上的对称群或度数为 $n$ 的对称群。

📖 [逐步解释]

这部分专注于有限集上的置换集，并计算其大小。

标准化与记号：
- 当处理一个有 $n$ 个元素的有限集时，为了方便，我们通常直接使用标准集合 \{1, 2, ..., n\} 来代表它。
- 作用在这个标准集合上的置换集，被简写为 S_n。
计算 S_n 的大小 (#(S_n))：
- S_n 的元素是所有从 \{1,...,n\} 到自身的双射函数。我们要计算这种函数有多少个。
- 我们来构造一个这样的双射 f：
- 为 f(1) 选择一个输出值：可以从 \{1,...,n\} 中任选一个，有 $n$ 种选择。
- 为 f(2) 选择一个输出值：因为函数必须是单射的，所以输出值不能和 f(1) 重复。所以只剩下 $n-1$ 种选择。
- 为 f(3) 选择一个输出值：输出值不能和 f(1) 或 f(2) 重复。只剩下 $n-2$ 种选择。
- ...
- 为 f(n-1) 选择输出值：只剩下 2 种选择。
- 为 f(n) 选择输出值：只剩下最后 1 种选择。
- 根据乘法原理，所有可能的构造方式总数是 $n \times (n-1) \times (n-2) \times \dots \times 2 \times 1$ 。
- 这个连乘积就是n的阶乘 (n factorial)，记作 n!。
单射与双射的等价性：
- 上面的计数过程实际上是在计算单射的数量。
- 但根据备注 1.5.4(iv)，对于两个等大的有限集（这里都是 \{1,...,n\}），单射、满射和双射是等价的。
- 所以，单射的数量就等于双射的数量。
- 因此，\#(S_n) = n!。
定义：对称群 (Symmetric Group)：
- 集合 S_n（连同其上的复合运算）被称为 n个字母上的对称群。它是群论研究的核心对象之一。

💡 [数值示例]

示例 (S_3)：
X = \{1, 2, 3\}。n=3。
S_3 的大小应该是 3! = 3 2 1 = 6。
这6个置换（双射函数）是：

Id: (1->1, 2->2, 3->3) (恒等)
f1: (1->2, 2->1, 3->3) (交换1和2)
f2: (1->3, 2->2, 3->1) (交换1和3)
f3: (1->1, 2->3, 3->2) (交换2和3)
f4: (1->2, 2->3, 3->1) (轮换 1->2->3->1)
f5: (1->3, 2->1, 3->2) (轮换 1->3->2->1)
- 这6个元素在复合运算下构成一个群 S_3。

📝 [总结]

本段确定了作用于n元有限集上的置换集 S_n 的大小为 n!，并通过定义1.6.15正式将其命名为对称群。

26.1 行间公式索引

集合描述法示例：

\{1,2,4,5\}=\{n \in \mathbb{Z}: 1 \leq n \leq 5, n \neq 3\}

自然数集定义：

\mathbb{N}=\{1,2,3, \ldots\}

整数集定义：

\mathbb{Z}=\{\ldots,-3,-2,-1,0,1,2,3, \ldots\}

并集定义：

X_{1} \cup X_{2}=\left\{x: x \in X_{1} \text { 或 } x \in X_{2}\right\} .

多集合并集定义：

\bigcup_{i=1}^{n} X_{i}=\left\{x: \text { 对于某个 } i, x \in X_{i}\right\}

并集的交换律与结合律：

\begin{gathered} X_{1} \cup X_{2}=X_{2} \cup X_{1} \\ \left(X_{1} \cup X_{2}\right) \cup X_{3}=X_{1} \cup X_{2} \cup X_{3}=X_{1} \cup\left(X_{2} \cup X_{3}\right) . \end{gathered}

交集定义：

X_{1} \cap X_{2}=\left\{x: x \in X_{1} \text { 且 } x \in X_{2}\right\}

多集合交集定义：

\bigcap_{i=1}^{n} X_{i}=\left\{x: \text { 对于所有 } i, x \in X_{i}\right\}

交集的交换律与结合律：

\begin{gathered} X_{1} \cap X_{2}=X_{2} \cap X_{1} \\ \left(X_{1} \cap X_{2}\right) \cap X_{3}=X_{1} \cap X_{2} \cap X_{3}=X_{1} \cap\left(X_{2} \cap X_{3}\right) . \end{gathered}

差集（相对补集）定义：

\left\{x \in X_{1}: x \notin X_{2}\right\} .

集合运算的分配律：

\begin{aligned} & \left(X_{1} \cup X_{2}\right) \cap Y=\left(X_{1} \cap Y\right) \cup\left(X_{2} \cap Y\right) \\ & \left(X_{1} \cap X_{2}\right) \cup Y=\left(X_{1} \cup Y\right) \cap\left(X_{2} \cup Y\right) \end{aligned}

笛卡尔积基数公式：

\#(X \times Y)=\#(X) \#(Y)

多集合笛卡尔积基数公式：

\#\left(X_{1} \times \cdots \times X_{n}\right)=\#\left(X_{1}\right) \times \cdots \times \#\left(X_{n}\right)

幂集定义：

\mathcal{P}(X)=\{A: A \subseteq X\}

三层幂集运算示例：

\mathcal{P}(\{\emptyset,\{\emptyset\}\})=\{\emptyset,\{\emptyset\},\{\{\emptyset\}\},\{\emptyset,\{\emptyset\}\}\}

函数图像定义：

G_{f}=\{(x, y) \in X \times Y: y=f(x)\}

恒等函数图像（对角线）定义：

\Delta_{X}=\{(x, x): x \in X\}

函数集（函数空间）定义：

Y^{X}=\{f: f \text { 是从 } X \text { 到 } Y \text { 的函数 }\} .

求值函数 ev_x 定义：

\mathrm{ev}_{x}(f)=f(x)

通用求值函数 e 定义：

e(x, f)=f(x)

函数像的定义：

\{y \in Y: \text { 存在 } x \in X \text { 使得 } f(x)=y\}

子集像的定义：

f(A)=\{y \in Y: \text { 存在 } x \in A \text { 使得 } f(x)=y\}

原像（逆像）定义：

f^{-1}(B)=\{x \in X: f(x) \in B\}

像与原像的复合关系：

\begin{aligned} & f\left(f^{-1}(B)\right) \subseteq B \\ & A \subseteq f^{-1}(f(A)) \end{aligned}

图像转置操作定义：

{ }^{t} A=\{(y, x):(x, y) \in A\}

反函数的定义性质：

y=f(x) \Longleftrightarrow x=f^{-1}(y)

复合函数的定义：

g \circ f(x)=g(f(x))

复合函数图像的集合论定义：

G_{g \circ f}=\pi_{1,3}\left(\left(G_{f} \times Z\right) \cap\left(X \times G_{g}\right)\right),

函数复合的结合律：

h \circ(g \circ f)=(h \circ g) \circ f

结合律证明中的表达式：

\begin{aligned} & (h \circ(g \circ f))(x)=h((g \circ f)(x))=h(g(f(x))) \\ & ((h \circ g) \circ f)(x)=(h \circ g)(f(x))=h(g(f(x))) \end{aligned}

左逆与右逆相等证明中的表达式（1）：

(g \circ f) \circ h=\mathrm{Id}_{X} \circ h=h

左逆与右逆相等证明中的表达式（2）：

g \circ(f \circ h)=g \circ \operatorname{Id}_{Y}=g

逆函数的逆函数：

\left(f^{-1}\right)^{-1}=f

复合函数的逆函数验证（右逆）：

(g \circ f) \circ\left(f^{-1} \circ g^{-1}\right)=\operatorname{Id}_{Z}

复合函数的逆函数验证（左逆）：

\left(f^{-1} \circ g^{-1}\right) \circ(g \circ f)=\operatorname{Id}_{X}

复合函数的逆函数证明步骤：

\begin{aligned} (g \circ f) \circ\left(f^{-1} \circ g^{-1}\right) & =g \circ\left(f \circ f^{-1}\right) \circ g^{-1} \\ & =\left(g \circ \operatorname{Id}_{Y}\right) \circ g^{-1} \\ & =g \circ g^{-1}=\operatorname{Id}_{Z} . \quad \square \end{aligned}

特征函数定义：

\chi_{A}(x)= \begin{cases}1, & \text { 如果 } x \in A \\ 0, & \text { 如果 } x \notin A\end{cases}

子集到特征函数的映射 F 定义：

F(A)=\chi_{A}

特征函数到子集的映射 G 定义：

G(f)=f^{-1}(1)

验证 F 和 G 互为逆函数：

\begin{aligned} & G \circ F=\operatorname{Id}_{\mathcal{P}(X)} \\ & F \circ G=\operatorname{Id}_{\{0,1\}^{X}} \end{aligned}

幂集基数公式推导：

\#(\mathcal{P}(X))=\#\left(\{0,1\}^{X}\right)=2^{n}

置换集基数（阶乘）公式：

n(n-1) \cdots 2 \cdot 1=n!.

[[END_OF_RESPONSE]]所有解释内容已全部输出完毕。

📝 我的笔记

11. Ch1. 预备知识 Preliminaries P1

11.1. Ch1.1. 集合与函数 Sets and functions P1

1. 1.1. 1. 集合 Sets

1. 1.2. 定义 1.1.1.

1. 1.3. 一个基本的集合例子是空集 $\emptyset$：

1. 1.4. 定义 1.1.2.

1. 1.5. 接下来我们定义子集：

1. 1.6. 定义 1.1.3.

1. 1.7. 备注 1.1.4.

1. 1.8. 我们将处理的许多集合都是有限集：

1. 1.9. 定义 1.1.5.

1. 1.10. 最后，我们收集一些将在本书中使用的标准数集符号：

21.2. 2. 从旧集合构造新集合 New sets from old

1. 2.1. 回忆集合的标准运算：

1. 2.2. 定义 1.2.1.

1. 2.3. 定义 1.2.1. (续)

1. 2.4. 定义 1.2.1. (续)

1. 2.5. 备注 1.2.2.

1. 2.6. 定义 1.2.3.

1. 2.7. 备注 1.2.4.

1. 2.8. 备注 1.2.5.

1. 2.9. 最后，一个非常重要的构造是集合的幂集：

1. 2.10. 定义 1.2.6.

1. 2.11. 例 1.2.7.

31.3. 3. 函数 Functions

1. 3.1.

1. 3.2. 定义 1.3.1.

1. 3.3. 备注 1.3.2.

1. 3.4. 例 1.3.3.

1. 3.5. 例 1.3.3. (续)

1. 3.6. 例 1.3.3. (续)

1. 3.7. 例 1.3.3. (续)

1. 3.8. 例 1.3.3. (续)

1. 3.9. 例 1.3.3. (续)

1. 3.10. 例 1.3.3. (续)

1. 3.11. 例 1.3.3. (续)

1. 3.12. 例 1.3.3. (续)

1. 3.13. 例 1.3.3. (viii) (续) - 求值函数

41.4. 4. 像和原像 Images and preimages

1. 4.1. 定义 1.4.1.

1. 4.2. 定义 1.4.1. (续)

1. 4.3. 定义 1.4.1. (续)

1. 4.4. 备注 1.4.2.

1. 4.5. 我们经常需要限制给定函数的值，这导致了以下内容：

1. 4.6. 定义 1.4.3.

51.5. 5. 单射、满射、双射 Injections, Surjections, Bijections

1. 5.1. 定义 1.5.1.

1. 5.2. 例 1.5.2.

1. 5.3. 函数 $f: X \rightarrow Y$ 是单射 $\Longleftrightarrow$ ... (续)

1. 5.4. 命题 1.5.3.

1. 5.5. 备注 1.5.4.

1. 5.6. 备注 1.5.5.

61.6. 6. 函数复合 Function composition

1. 6.1. 定义 1.6.1.

1. 6.2. 例 1.6.2.

1. 6.3. 函数复合运算有点像代数运算 ... (续)

1. 6.4. 通常函数复合不是交换的 ... (续)

1. 6.5. 我们已经看到恒等函数的作用 ... (续)

2. 定义 1.6.4.

1. 6.6. 例 1.6.5.

1. 6.7. 正如我们很快将展示的 ... (续)

1. 6.8. 类似地，对于 $f$ 的左逆 ... (续)

2. 命题 1.6.6.

1. 6.9. 推论 1.6.7.

1. 6.10. 注意 $g$ 是 $f$ 的左逆 ... (续)

2. 命题 1.6.8.

1. 6.11. 左逆和右逆与单射和满射之间的关系 ... (续)

2. 命题 1.6.9.

1. 6.12. 特别是，证明一个函数是双射的一种非常有效的方法 ... (续)

2. 命题 1.6.10.

1. 6.13. 推论 1.6.11.

1. 6.14. 当然，如上所述 ... (续)

1. 6.15. 另一方面，特别是在代数中 ... (续)

1. 6.16. 再举一个例子，我们可以将幂集 ... (续)

2. 定义 1.6.12.

1. 6.17. 因此，给定 $\mathcal{P}(X)$ 的一个元素 ... (续)

1. 6.18. 那么根据备注 1.5.4 ... (续)

1. 6.19. 最后，我们讨论从一个集合到自身的所有双射的集合。这个对象将在本书中反复出现。

2. 定义 1.6.13.

1. 1.3. 一个基本的集合例子是空集 $\emptyset$ ：