还没有笔记
选中页面文字后点击「高亮」按钮添加
📜 [原文1]
就像我们在上一课所做的那样,我们将从讨论经典信息开始本课。
再次强调,概率描述和量子描述在数学上是相似的,识别数学在熟悉的经典信息背景下是如何运作的,有助于理解为什么量子信息以这种方式被描述。
这部分是引言,为整个课程内容设定了学习的基调和方法论。
假设我们有一个不均匀的硬币,抛出正面的概率是 $p=0.6$,反面的概率是 $1-p=0.4$。我们可以用一个概率向量来描述这个硬币的概率状态:
$v = \begin{pmatrix} 0.6 \\ 0.4 \end{pmatrix}$
这里的第一个分量 $0.6$ 对应“正面”这个经典状态,第二个分量 $0.4$ 对应“反面”这个经典状态。这个向量就用数学语言精确地描述了这枚经典硬币的不确定性。
一个量子比特(qubit)可以处于 $|0\rangle$ 和 $|1\rangle$ 状态的叠加态。它的量子态可以用一个态向量来描述,例如:
$|\psi\rangle = \sqrt{0.6} |0\rangle + \sqrt{0.4} |1\rangle$
写成向量形式就是:
$|\psi\rangle = \begin{pmatrix} \sqrt{0.6} \\ \sqrt{0.4} \end{pmatrix}$
当我们测量这个量子比特时,得到结果“0”的概率是 $(\sqrt{0.6})^2 = 0.6$,得到结果“1”的概率是 $(\sqrt{0.4})^2 = 0.4$。
对比这两个例子,你会发现描述经典硬币的概率向量 $\begin{pmatrix} 0.6 \\ 0.4 \end{pmatrix}$ 和描述量子比特的态向量 $\begin{pmatrix} \sqrt{0.6} \\ \sqrt{0.4} \end{pmatrix}$ 在结构上非常相似。它们都是二维列向量。不同之处在于,概率向量的分量是概率本身,它们的和必须为1。而量子态向量的分量是概率幅,它们的模长的平方和必须为1。这种数学上的相似性就是引言中所强调的。
本段是课程的开场白,它设定了学习策略:通过回顾和分析我们熟悉的经典信息及其概率描述,来类比和理解更为抽象的量子信息及其量子描述。它强调了两种描述在数学形式上的相似性,并指出利用这种相似性是通往理解量子世界的桥梁。
本段的目的是为学生建立一个正确的学习心态和方法论。它告诉学生,即将学习的量子概念虽然听起来很神秘,但并非无迹可寻。我们可以从已有的知识(经典概率论)出发,找到通向新知识(量子力学)的“脚手架”。这有助于降低学习门槛,增强学生攻克难题的信心。
你可以把学习量子信息想象成学习一门新的外语(比如拉丁语)。直接从头硬背语法和单词会非常痛苦。但是,如果你发现拉丁语的很多词根和语法结构与你已经掌握的母语(比如英语)有相似之处(例如,“information”源自拉丁语“informatio”),你就可以通过类比来加速学习。本段就是告诉你:“量子语言”和“经典概率语言”在“语法”(数学结构)上有很多相似之处,让我们先复习一下熟悉的“经典概率语言”,再去看“量子语言”是怎么表达思想的。
想象你面前有两幅地图,一幅是你的家乡的详细地图(经典信息),另一幅是某个遥远未知星球的地图(量子信息)。乍一看,未知星球的地图上符号怪异,地形奇特。但这时有人告诉你,两幅地图的图例系统(比如,等高线表示高度,蓝色表示水域)在设计上遵循了相同的逻辑。于是,你开始仔细研究家乡地图的图例是如何工作的(概率描述),当你彻底搞懂了之后,再去看未知星球的地图,你就能猜出那些怪异符号的大概含义了(量子描述)。这个过程就是本段所倡导的学习方法。
📜 [原文2]
我们将从一个非常基础的层面开始,讨论多系统的经典状态。
为简单起见,我们将首先讨论两个系统,然后推广到两个以上的系统。
准确地说,令 $\mathsf{X}$ 为一个其经典状态集为 $\Sigma$ 的系统,
并令 $\mathsf{Y}$ 为第二个其经典状态集为 $\Gamma$ 的系统。
注意,因为我们将这些集合称为经典状态集,所以我们的假设是 $\Sigma$ 和 $\Gamma$ 都是有限且非空的。
可能存在 $\Sigma = \Gamma$ 的情况,但这并非必然——而且无论如何,为了清晰起见,使用不同的名称来指代这些集合将会有所帮助。
现在想象这两个系统 $\mathsf{X}$ 和 $\mathsf{Y}$ 并排放置,$\mathsf{X}$ 在左侧,$\mathsf{Y}$ 在右侧。
如果我们愿意,我们可以将这两个系统视为形成了一个单一系统,根据我们的偏好,可以将其表示为 $(\mathsf{X},\mathsf{Y})$ 或 $\mathsf{XY}$。
关于这个复合系统 $(\mathsf{X},\mathsf{Y})$,一个自然的问题是,“它的经典状态是什么?”
这部分内容开始正式引入描述多系统的第一个核心数学工具:笛卡尔积。
本段为引入笛卡尔积做了铺垫。它首先定义了什么是多系统,并使用集合($\Sigma, \Gamma$)来形式化地表示单个经典系统的所有可能状态。然后,它引导我们将两个独立的系统($\mathsf{X}, \mathsf{Y}$)看作一个单一的复合系统($(\mathsf{X},\mathsf{Y})$),并提出了一个关键问题:这个复合系统的状态集应该如何描述?
本段的目的是建立描述多系统的基本词汇和数学框架。在物理和计算机科学中,我们经常需要处理由多个部分组成的复杂系统。为了能够精确地分析和操作这样的系统,我们必须先有一种统一的、无歧义的数学语言来描述它。本段就在做这个“打地基”的工作,为后面引入笛卡尔积、张量积等更高级的概念做好准备。
想象你在一个餐厅点餐,菜单上有两类:主食和饮料。
将这两个系统组合成一个复合系统 $(\mathsf{X},\mathsf{Y})$,就相当于“一份完整的套餐”。那么,这个“套餐”的所有可能状态是什么呢?这就是本段提出的问题。
想象你正在组装一台电脑。
当你把CPU和内存条都装到主板上时,你就得到了一个复合系统。这台电脑的“配置状态”是什么?一个可能的状态就是 (Intel CPU, 16GB内存条)。本段就是要找到一种方法,来系统地列出所有可能的配置状态。
📜 [原文3]
答案是 $(\mathsf{X},\mathsf{Y})$ 的经典状态集是 $\Sigma$ 和 $\Gamma$ 的笛卡尔积,该集合定义为
简单来说,笛卡尔积正是一个数学概念,它捕捉了将一个集合中的元素和第二个集合中的元素放在一起查看的想法,就好像它们构成了一个单一集合中的单个元素。
在当前情况下,说 $(\mathsf{X},\mathsf{Y})$ 处于经典状态 $(a,b)\in\Sigma\times\Gamma$ 意味着 $\mathsf{X}$ 处于经典状态 $a\in\Sigma$ 且 $\mathsf{Y}$ 处于经典状态 $b\in\Gamma$;
并且如果 $\mathsf{X}$ 的经典状态是 $a\in\Sigma$ 且 $\mathsf{Y}$ 的经典状态是 $b\in\Gamma$,那么联合系统 $(\mathsf{X},\mathsf{Y})$ 的经典状态就是 $(a,b)$。
这一部分正式给出了上一段问题的答案,并详细解释了笛卡尔积的含义。
总结一下:这个公式的含义是,集合 $\Sigma\times\Gamma$ 是由所有可能的有序对 $(a,b)$ 组成的集合,其中 $a$ 必须取自集合 $\Sigma$,$b$ 必须取自集合 $\Gamma$。
$\Sigma\times\Gamma = \{ (\text{米饭}, \text{可乐}), (\text{米饭}, \text{茶}), (\text{米饭}, \text{水}), (\text{面条}, \text{可乐}), (\text{面条}, \text{茶}), (\text{面条}, \text{水}) \}$
$\Sigma\times\Gamma = \{ (0,0), (0,1), (1,0), (1,1) \}$
本段给出了描述复合经典系统状态的数学答案:使用笛卡尔积。它定义了笛卡尔积 $\Sigma\times\Gamma$ 是由所有可能的有序对 $(a,b)$ 构成的集合,其中 $a$ 来自 $\Sigma$,$b$ 来自 $\Gamma$。并且,它清晰地建立了物理直觉和数学符号之间的对应关系:复合系统的一个状态 $(a,b)$ 就等同于其子系统分别处于状态 $a$ 和状态 $b$。
本段的目的是将一个直观的“组合”概念(比如组合套餐、组合电脑配置)精确地、无歧义地形式化为一个数学运算(笛卡尔积)。这种形式化是科学发展的基石,一旦我们有了这个工具,我们就可以:
笛卡尔积就像一个“组合器”或“配对机”。想象一条传送带(集合 $\Sigma$)上过来不同的上衣,另一条传送带(集合 $\Gamma$)上过来不同的裤子。这个“配对机”会取出第一条传送带上的每一件上衣,与第二条传送带上的每一件裤子都搭配一次,形成一套完整的服装。所有这些可能的服装搭配组合,就构成了笛卡尔积这个新的集合。
想象一张Excel表格。
那么,表格中每一个单元格的内容,就是由它所在的行标题和列标题组成的有序对。例如,米饭那一列和 茶那一行的交叉点,就是 (米饭, 茶)。整个表格的所有单元格,就直观地展示了笛卡尔积 $\Sigma\times\Gamma$ 的所有元素。
| 米饭 | 面条 | |
|---|---|---|
| 可乐 | (米饭, 可乐) | (面条, 可乐) |
| 茶 | (米饭, 茶) | (面条, 茶) |
| 水 | (米饭, 水) | (面条, 水) |
📜 [原文4]
对于两个以上的系统,情况以自然的方式推广。
如果我们假设 $\mathsf{X}_1,\ldots,\mathsf{X}_n$ 是分别具有经典状态集 $\Sigma_1,\ldots,\Sigma_n$ 的系统,对于任何正整数 $n$,被视为单一联合系统的 $n$ 元组 $(\mathsf{X}_1,\ldots,\mathsf{X}_n)$ 的经典状态集是笛卡尔积
这部分将前面两个系统的概念推广到任意 $n$ 个系统。
这个公式是前面两系统定义的直接推广:
总结一下:$n$ 个集合的笛卡尔积是由所有可能的 $n$-元组 $(a_1, \ldots, a_n)$ 组成的集合,其中每个 $a_i$ 都来自对应的集合 $\Sigma_i$。联合系统的总状态数就是 $|\Sigma_1| \times |\Sigma_2| \times \cdots \times |\Sigma_n|$。
本段将笛卡尔积的概念从两个系统推广到了任意 $n$ 个系统。它指出,一个由 $n$ 个子系统组成的联合系统的经典状态集,是这 $n$ 个子系统各自状态集的笛卡尔积。这个笛卡尔积集合中的每个元素是一个 $n$-元组 $(a_1, \ldots, a_n)$,代表了联合系统的一个确定的经典状态。
本段的目的是提供一个可以描述任意复杂度经典复合系统的通用数学框架。真实世界的系统(如计算机、网络、生物体)很少是单一组件,几乎都是由大量子系统构成的。有了这个推广,我们就有能力用统一的语言来描述一个拥有10个比特的寄存器,或一个拥有数百万像素的屏幕,为后续分析这些系统的概率状态和操作打下了基础。
想象你在填写一份有多项选择的调查问卷。
你提交的一份完整的答卷,就是从每个问题中各选一个答案组成的列表,例如 $(\text{答案}_1, \text{答案}_2, \ldots, \text{答案}_n)$。这个列表就是一个 $n$-元组。所有可能的完整答卷的集合,就是这 $n$ 个选项集的笛卡尔积。
想象一个老式的机械密码锁,它有 $n$ 个拨轮。
这个密码锁的每一种可能的显示状态,比如 "3-5-2-8-...",就是一个 $n$-元组 $(3, 5, 2, 8, \ldots)$。所有这些可能状态的集合,就是这 $n$ 个拨轮上数字集合的笛卡尔积。
📜 [原文5]
当然,我们可以随意使用任何我们希望的名称来命名系统,并按我们的选择对其进行排序。
特别地,如果我们有如上所述的 $n$ 个系统,我们可以选择将它们命名为 $\mathsf{X}_{0},\ldots,\mathsf{X}_{n-1}$ 并从右到左排列,从而使联合系统变为 $(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0)$。
遵循相同的命名相关经典状态和经典状态集的模式,我们随后可能会提到这个复合系统的一个经典状态
事实上,这是 Qiskit 在命名多个量子比特时使用的排序惯例。
我们将在下一课回到这个惯例以及它如何与量子线路联系起来,但我们现在就开始使用它以帮助适应。
这部分讨论了对多系统进行命名和排序的惯例,并特别引出了一个在量子计算中非常重要的“从右到左”的约定。
这个公式本身和之前的 $n$ 元组笛卡尔积公式在数学结构上是完全一样的,唯一的区别是下标的命名方式从 $1, \ldots, n$ 变成了 $n-1, \ldots, 0$。这种改变是为了匹配计算机科学中的“位序”概念。
本段引入了一个在(特别是Qiskit实现的)量子计算中至关重要的书写和排序惯例。该惯例包含两点:1) 系统从0开始索引($\mathsf{X}_0, \mathsf{X}_1, \ldots$)。2) 在表示联合系统或其状态时,索引号小的在右边,索引号大的在左边(如 $(\mathsf{X}_{n-1}, \ldots, \mathsf{X}_0)$ 和 $(a_{n-1}, \ldots, a_0)$)。这种看似反常的顺序是为了与二进制数的书写方式保持一致,从而方便地将多比特系统的状态映射为一个整数。
本段的目的是让学习者提前适应专业工具(如Qiskit)和文献中广泛采用的惯例。如果不提前说明并强制练习,学习者在后面接触实际的量子电路和代码时会遇到巨大的混淆和障碍。通过在简单的经典信息背景下引入这个惯例,可以降低适应成本,为后续平稳过渡到量子信息的表示打下基础。
想象一下我们写十进制数字,比如“三百二十一”,我们写作 321。
我们的书写习惯就是“高位在左,低位在右”。Qiskit的惯例就是把这个我们习以为常的数字书写方式,应用到了比特系统的排列上。
所以,当我们把它们组合起来看时,很自然地就写成 $(\mathsf{X}_2, \mathsf{X}_1, \mathsf{X}_0)$,其状态 $(a_2, a_1, a_0)$ 就对应数字 $a_2a_1a_0$。
想象一条有多个车道的单行道高速公路。
一排汽车同时在这条高速上行驶,每辆车占据一个车道。这一整排车就是一个联合系统的状态。当我们从远处(比如直升机上)给这一排车拍照时,照片从左到右依次显示了 $n-1$ 号车道的车、...、1号车道的车、0号车道的车。这张照片的内容 $(车_{n-1}, \ldots, 车_0)$ 就是联合系统的一个经典状态。
📜 [原文6]
为了简练,通常方便将形式为 $(a_{n-1},\ldots,a_0)$ 的经典状态写为一个 <DefinitionTooltip definition="字符串是符号或字符的有限、有序序列。">字符串 </DefinitionTooltip> $a_{n-1}\cdots a_0$,特别是在经典状态集 $\Sigma_0,\ldots,\Sigma_{n-1}$ 与符号或字符集相关联的典型情况下。
在这种背景下,字母表这一术语通常用于指代用于形成字符串的符号集,但字母表的数学定义与经典状态集的定义完全相同:它是一个有限且非空的集合。
这部分内容介绍了从元组表示到字符串表示的简化写法,并引入了“字母表”这一术语。
本段介绍了一种更简洁地表示复合经典系统状态的方法:用字符串(如 "101")替代元组(如 (1,0,1))。这种方法在子系统的状态本身是单个符号(如0或1)时尤其方便。同时,本段引入了“字母表”的概念,并阐明它在数学上与“经典状态集”是等价的,都是指一个有限非空集。
本段的目的是进一步简化我们的数学记法,使其更接近计算机科学中的实践。在算法和信息论中,我们总是和字符串打交道。通过将复合系统的状态直接看作字符串,我们可以更方便地应用字符串处理、编码理论和信息论中的各种工具和思想。同时,这也强化了量子比特状态和二进制数之间的联系。
这就像我们写一个电话号码。
我们省略了所有的标签、括号和逗号,因为我们都知道这些数字是按顺序排列的,每个都代表电话号码的一个部分。只要上下文清晰,字符串表示法就更高效。
想象一串DNA序列。
📜 [原文7]
例如,假设 $\mathsf{X}_0,\ldots,\mathsf{X}_9$ 是比特,因此这些系统的经典状态集都是相同的。
那么联合系统 $(\mathsf{X}_9,\ldots,\mathsf{X}_0)$ 有 $2^{10} = 1024$ 个经典状态,它们是集合
的元素。以字符串形式书写,这些经典状态如下所示:
例如,对于经典状态 $0000000110$,我们看到 $\mathsf{X}_1$ 和 $\mathsf{X}_2$ 处于状态 $1$,而所有其他系统都处于状态 $0$。
这是一个非常具体的例子,将前面几段的所有概念(多系统、从0索引、从右到左排列、笛卡尔积、字符串表示法)全部应用到一个10比特的系统上。
这个公式表示从 $\Sigma_0$ 到 $\Sigma_9$ 这10个集合都是完全相同的,它们都等于集合 $\{0,1\}$。
这是一个用 array 环境(在LaTeX中)排版出的列表,展示了 $\{0,1\}^{10}$ 集合中的一些元素。
本段本身就是一个非常详尽的具体例子,我们再补充一个更小规模的。
本段通过一个10比特系统的实例,生动地展示了如何应用前面学到的所有概念来描述一个具体的多系统。它演示了如何计算总状态数 ($2^{10}=1024$),如何用字符串表示法列出所有状态(从 "0000000000" 到 "1111111111"),并练习了如何根据“从右到左,从0开始”的惯例来准确解读一个具体的状态字符串。
本段的目的是巩固和深化理解。抽象概念需要通过具体例子来“落地”。这个10比特的例子足够大,能够体现多系统的复杂性,但又足够基础(基于比特),能够清晰地与我们熟悉的二进制数联系起来。通过这个例子,所有抽象的符号和规则都变得鲜活和可用,为接下来讨论更复杂的概率状态做好了充分的准备。
想象一个有10个灯泡的面板,从右到左依次编号为0到9。每个灯泡只有“亮”(1)和“灭”(0)两种状态。
这个10灯泡面板的所有可能亮灭组合,就是这个10比特系统的所有经典状态。
想象你在做一道有10个判断题的考试,每个题只能填“对”(1)或“错”(0)。
📜 [原文8]
回想上一课,一个概率状态将一个概率与一个系统的每个经典状态相关联。
因此,多系统(被集体视为一个单一系统)的一个概率状态,将一个概率与单个系统的经典状态集的笛卡尔积中的每个元素相关联。
这部分从讨论“确定的”经典状态过渡到“不确定的”概率状态。
本段将概率状态的概念从单系统推广到了多系统。核心思想是,首先通过笛卡尔积构建出多系统的完整的复合经典状态空间,然后将概率状态定义为一个为该空间中的每一个点(即每一个复合经典状态)分配一个概率的概率分布。
本段的目的是为描述不确定的多系统建立数学模型。在现实世界和量子世界中,不确定性是普遍存在的。一个多比特量子计算机在计算过程中,其状态通常是所有经典状态的一个概率叠加。为了描述这种不确定性,我们需要一个能够处理联合概率的框架。本段所定义的多系统概率状态正是经典世界里与之一一对应的模型,是理解后续量子概念的基础。
想象一个有多个轮盘的抽奖游戏。
这张完整的“中奖概率表”,就是这个多轮盘系统的概率状态。
想象一张地图,上面有几个城市,这是经典状态。现在,天上下起了“概率雨”。雨下得有多有少,每个城市上空都积累了一定的“概率水深”。
📜 [原文9]
例如,假设 $\mathsf{X}$ 和 $\mathsf{Y}$ 都是比特,因此它们对应的经典状态集分别为 $\Sigma = \{0,1\}$ 和 $\Gamma = \{0,1\}$。
这是这对比特 $(\mathsf{X},\mathsf{Y})$ 的一个概率状态:
在这个概率状态中,$\mathsf{X}$ 和 $\mathsf{Y}$ 都是随机比特——每个比特为 $0$ 的概率为 $1/2$,为 $1$ 的概率为 $1/2$——但这两个比特的经典状态总是保持一致。
这是这些系统之间存在相关性的一个例子。
这部分通过一个非常重要的例子,具体展示了一个多系统的概率状态,并引出了核心概念——相关性。
本段本身就是一个核心示例,我们再看一个负相关的例子和一个不完全相关的例子。
本段通过一个具体的2-比特的概率状态实例,引入了相关性这一至关重要的概念。它揭示了一个深刻的现象:即使多系统的每个子系统在单独看来是完全随机的,它们作为一个整体也可以表现出高度的确定性行为(例如,状态总是保持一致)。这种现象就是相关性的体现,它意味着子系统之间不是独立的。
本段的目的是为量子纠缠这个核心概念做一个经典的铺垫。文中所描述的经典相关性,在很多方面都是量子纠缠的一个“影子”或“经典类比物”。量子纠缠是量子世界里的一种超强相关性,它比任何经典相关性都要奇特和强大。通过先在熟悉的经典框架下理解“相关性意味着什么”(即,子系统间不独立,信息共享),我们可以更好地把握量子纠缠的本质,并理解它为何如此特别。
想象你有一双手套,被分别放进两个一模一样的盒子里,然后寄给相距遥远的两个人,Alice和Bob。
在他们打开盒子之前,对于Alice来说,她盒子里是左手套还是右手套的概率都是1/2。对于Bob也是一样。
但是,这两个系统是完美相关的。一旦Alice打开盒子发现是“左手套”,她立刻100%确定Bob的盒子里必然是“右手套”。
这个“手套游戏”的概率状态就是:
这和本段中的负相关例子是完全一样的模型。原文的例子则是两只都是左手套或者两只都是右手套的情况。
想象一对双胞胎,他们心有灵犀。你分别在两个房间问他们同一个是非题。
📜 [原文10]
系统的概率状态可以用概率向量来表示,正如上一课所讨论的那样。
特别地,向量条目代表系统处于该系统可能的经典状态的概率,且默认已经选择了一组条目与经典状态集之间的对应关系。
选择这样的对应关系实际上意味着决定经典状态的排序,这通常是自然的或由标准惯例决定的。
例如,二进制字母表 $\{0,1\}$ 自然地以 $0$ 在前、$1$ 在后排序,因此代表一个比特的概率状态的概率向量中的第一个条目是它处于状态 $0$ 的概率,第二个条目是它处于状态 $1$ 的概率。
这部分内容将概率状态的描述从“概率列表”的形式,转换到更紧凑、更适合线性代数运算的“概率向量”形式。这个转换的第一步,是解决“如何排序”的问题。
本段的核心思想是:为了用概率向量来表示一个概率状态,我们必须首先为系统的所有经典状态确定一个排序。这个排序建立起了经典状态与向量分量索引之间的一一对应关系。一旦排序被约定,概率向量的第 $i$ 个分量就代表了第 $i$ 个经典状态出现的概率。
本段的目的是将对概率状态的描述从一种比较松散的“列表”或“函数”形式,转化为线性代数中的标准对象——向量。这种转化极其重要,因为一旦我们把状态表示成了向量,我们就可以利用线性代数这一强大而成熟的数学武库来分析和操纵这些状态。例如,对系统施加一个操作,就可以被描述为用一个矩阵去乘以这个状态向量。这是从描述到操作的关键一步。
想象你要给班上的同学排队拍合影。
如果你不先让他们排好队,直接给你一堆概率值,你是不知道哪个概率对应哪个同学的。所以,“排队”(排序)是建立向量表示的第一步。
想象一个音乐播放列表。
这个播放列表的顺序就构成了状态到向量索引的对应关系。
📜 [原文11]
在多系统的背景下,这一切都没有改变,但需要做一个决定。
被集体视为单一系统的多系统的经典状态集,是单个系统的经典状态集的笛卡尔积——因此我们必须决定如何对笛卡尔积的元素进行排序。
我们遵循一个简单的惯例来执行此操作,即从单个经典状态集已有的任何排序开始,然后按字母顺序对笛卡尔积的元素进行排序。
另一种表达方式是,每个 $n$ 元组中的条目(或者等效地,每个字符串中的符号)被视为具有从左到右递减的重要性。
例如,根据这一惯例,笛卡尔积 $\{1,2,3\}\times\{0,1\}$ 的排序如下:
当 $n$ 元组被写为字符串并以这种方式排序时,我们观察到了熟悉的模式,例如 $\{0,1\}\times\{0,1\}$ 被排序为 $00, 01, 10, 11$,而集合 $\{0,1\}^{10}$ 则按本课早些时候书写的方式排序。
作为另一个例子,将集合 $\{0, 1, \dots, 9\} \times \{0, 1, \dots, 9\}$ 视为一组字符串,我们得到了从 $00$ 到 $99$ 的两位数,并按数值顺序排列。
这显然不是巧合;
我们的十进制数字系统正是使用了这种字母顺序排序,这里的字母顺序应该被理解为具有广泛的含义,既包括字母也包括数字。
这部分解决了为多系统的复合状态进行排序的问题,并引入了“字母顺序”这一核心排序规则。
这不是一个需要推导的公式,而是一个应用字母顺序排序规则得到的结果。
$00, 01, 02, 10, 11, 12, 20, 21, 22$。
$(A, 1), (A, 2), (B, 1), (B, 2)$。
本段为多系统的复合经典状态集建立了一个标准、通用的排序规则:字母顺序。该规则基于预先定义好的各子系统状态集的内部排序,并以“从左到右,重要性递减”的方式比较元组或字符串。这个规则不仅在数学上清晰无歧义,而且与我们日常使用的数字系统和字典排序的直觉高度吻-
合,尤其当应用于比特系统时,它自然地产生了与二进制数大小一致的排序。
本段的目的是完成构建多系统概率向量表示的最后一块拼图。我们已经知道需要排序,本段就给出了一个“最佳实践”的排序方案。有了这个统一的字母顺序规则,我们就可以将任何多系统的任何概率状态都唯一地、无歧义地转换成一个概率向量,从而为使用线性代数进行后续分析(如计算相关性、应用操作等)铺平了道路。
字母顺序就是“查字典”的规则。
我们对复合经典状态的排序,完全遵循同样的逻辑。
想象日历的日期表示。一个日期可以看作一个复合状态 (年, 月, 日)。
这种我们每天都在使用的日期排序方法,就是字母顺序的一个完美实例。
📜 [原文12]
回到上面两个比特的例子,前面描述的概率状态因此由以下概率向量表示,为了清晰起见,条目被明确标记。
这部分将前面介绍的排序规则应用到之前那个展示了“相关性”的2-比特例子上,从而写出了它对应的概率向量。
本段本身就是之前例子的向量化表示,我们为之前补充的另两个例子也写出其概率向量。
这正是一个4维的标准基向量。
本段将之前所有关于多系统经典状态、概率状态和排序规则的讨论结合在一起,通过一个具体的例子,完整地演示了如何将一个用自然语言和列表描述的概率状态,严格地、无歧义地转换成一个概率向量。这个向量形式是后续进行线性代数分析的基础。
本段的目的是“实践出真知”。通过亲手将一个例子转化为向量,可以加深对字母顺序排序规则的理解,并直观地看到一个概率分布是如何“编码”到一个向量中的。这为我们后续引入狄拉克符号(如 $|00\rangle, |01\rangle$)以及张量积等更抽象的工具做好了最后的、也是最具体的一步准备。
这就像填写一张标准化的调查问卷。
这个填写了概率的、顺序固定的问卷,就是概率向量。它把口头的、非结构化的信息,变成了一种机器可读的、标准化的数据格式。
想象一个有4个杯子的吧台,从左到右依次标记为 "00", "01", "10", "11"。你有一升(总量为1)的“概率”果汁。
这一排标记好顺序、装有不同量果汁的杯子,就是概率向量的一个直观形象。
📜 [原文13]
两个系统的一种特殊类型的概率状态是系统相互独立的状态。
直观地说,如果了解其中任何一个系统的经典状态对与另一个系统相关的概率没有影响,那么这两个系统就是独立的。
也就是说,了解其中一个系统处于什么经典状态,完全无法提供关于另一个系统经典状态的信息。
这部分开始定义独立性 (Independence),这是相关性 (Correlation) 的对立面,也是概率论中的一个基石概念。
本段用直观的语言定义了两个系统相互独立的含义。其核心思想是“信息隔离”:关于一个系统的信息对另一个系统的概率预测毫无帮助。如果知道一个系统的状态能以任何方式改变我们对另一个系统状态的概率评估,那么它们就是不独立的(即相关的)。
本段的目的是在给出严格的数学公式之前,先建立起对独立性这个概念的正确直觉。独立性是概率论和统计学的基石,也是我们理解多体系统(无论是经典的还是量子的)行为的关键。独立的系统是最简单的多体系统,它们的联合行为可以由它们各自的行为简单地推导出来。而更有趣、更复杂的现象(如相关性和纠缠)都源于对独立性的偏离。因此,清晰地定义独立性是理解这一切的起点。
想象两个完全隔音的房间里各有一个人在唱歌。
这两个系统是独立的。你跑到第一个房间听到了他在唱周杰伦的歌,这个信息对你猜测第二个房间里的人在唱什么歌,没有任何帮助。他可能在唱陈奕迅,也可能在唱摇滚,概率和你没去第一个房间听之前是一样的。
想象你在两个不同的网站上抽奖。
这两个抽奖活动通常是独立的。你在网站A中了大奖,并不会增加或减少你在网站B中奖的概率。你在网站A抽奖结果的这个信息,对于预测网站B的结果来说是“无用信息”。
📜 [原文14]
为了精确定义这一概念,让我们再次假设 $\mathsf{X}$ 和 $\mathsf{Y}$ 分别是具有经典状态集 $\Sigma$ 和 $\Gamma$ 的系统。
对于这些系统的一个给定的概率状态,如果满足以下条件,则称它们是独立的
对于 $a\in\Sigma$ 和 $b\in\Gamma$ 的每种选择都成立。
这部分给出了独立性的严格数学定义。
本段给出了判断两个系统是否独立的严格数学判据:对于任意一对子系统状态 $(a,b)$,其联合概率必须等于各自边际概率的乘积。这个乘法法则必须对所有可能的状态组合都成立。如果哪怕只有一个组合不满足,系统就是相关的。
本段的目的是将独立性从一个直观概念转化为一个可计算、可验证的数学属性。有了这个公式,我们就可以通过分析一个多系统的概率向量来确定其子系统之间是否存在相关性。这是进行信息论分析(例如计算互信息)和理解量子纠缠与经典相关性区别的基础。
这个公式是“没有意外惊喜”的数学表达。
想象一个巨大的由像素点组成的屏幕,屏幕的宽度代表系统 $\mathsf{X}$ 的状态,高度代表系统 $\mathsf{Y}$ 的状态。每个像素 $(a,b)$ 的亮度代表了联合概率 $\operatorname{Pr}((\mathsf{X},\mathsf{Y})=(a,b))$。
📜 [原文15]
为了用概率向量来表达这个条件,假设 $(\mathsf{X},\mathsf{Y})$ 给定的概率状态由一个以狄拉克符号书写的概率向量描述,即
那么独立性条件 $(2)$ 等价于存在两个概率向量
分别代表与 $\mathsf{X}$ 和 $\mathsf{Y}$ 的经典状态相关的概率,使得
对于所有 $a\in\Sigma$ 和 $b\in\Gamma$ 成立。
这部分将上一段的独立性乘法法则,用概率向量和新引入的狄拉克符号来重新表达。
这是一个概率向量的狄拉克表示。
这是两个子系统的概率向量的狄拉克表示。
这是独立性条件的系数形式。它说联合概率向量的系数 $p_{ab}$ 可以分解为两个子系统概率向量的相应系数 $q_a$ 和 $r_b$ 的乘积。
本段将独立性的数学定义从基础概率论语言翻译成了线性代数和狄拉克符号的语言。它指出,一个复合系统的概率状态是独立的,当且仅当描述其状态的联合概率向量的各个系数($p_{ab}$),都能被分解为两个描述其子系统状态的概率向量的相应系数的乘积($q_a \times r_b$)。
本段的目的是为引入张量积 (Tensor Product) 这一终极工具做最后的铺垫。$p_{ab}=q_a r_b$ 这个看似简单的系数关系,实际上隐藏着一种深刻的向量/ 矩阵运算,那就是张量积。通过将独立性与系数的乘法联系起来,下一步就可以自然地将这种“系数的乘法”抽象和提升为一种“向量的乘法”,即张量积。狄拉克符号的引入也是为此服务的,因为它与张量积的运算规则能完美地结合。
这就像是用两个一维的列表(向量)来生成一个二维的表格(矩阵)。
继续看那个像素屏幕的例子。
📜 [原文16]
例如,由向量表示的一对比特 $(\mathsf{X},\mathsf{Y})$ 的概率状态
是 $\mathsf{X}$ 和 $\mathsf{Y}$ 相互独立的状态。
具体来说,独立性所需的条件对于以下概率向量是成立的
例如,要使 $00$ 状态的概率匹配,我们需要 $\frac{1}{6} = \frac{1}{4} \times \frac{2}{3}$,事实确实如此。其他条目可以用类似的方式验证。
这是一个具体的数值例子,用于演示和验证上一段提出的独立性的向量判据。
一个更深入的问题:在考试中,可能不会直接给出 $|\phi\rangle$ 和 $|\psi\rangle$,而是只给联合概率,让你判断是否独立。你该如何反向找出 $q_a$ 和 $r_b$ 呢?
这是一个概率向量的具体实例。其对应的列向量形式为 $\begin{pmatrix} 1/6 \\ 1/12 \\ 1/2 \\ 1/4 \end{pmatrix}$。
这是分解出的两个子系统的概率向量。
本段本身就是一个完整的数值示例。我们再构造一个。
本段通过一个具体的、非平凡的数值例子,完整地走了一遍验证独立性的流程。它展示了如何将一个给定的联合概率向量分解为两个子系统的概率向量,并验证联合概率确实是边际概率的乘积。这个例子有力地证明了独立性是一个可以通过计算来判定的精确数学属性。
本段的目的是将抽象的独立性定义“具象化”,让学习者看到这个定义在实际计算中是如何操作的。通过正向(用边际概率构造联合概率)和逆向(从联合概率计算边际概率并验证)的思考,可以加深对独立性乘法法则的理解,并为下一段中发现更简洁的判断方法(张量积)埋下伏笔。
这就像一个侦探在破案。
想象一个矩形农田的产量问题。
📜 [原文17]
另一方面,概率状态 $(1)$,我们可以写成
并不代表系统 $\mathsf{X}$ 和 $\mathsf{Y}$ 之间的独立性。
论证这一点的一个简单方法如下。
假设确实存在如上面方程 $(3)$ 所示的概率向量 $\vert \phi\rangle$ 和 $\vert \psi \rangle$,对于 $a$ 和 $b$ 的每种选择,都满足条件 $(4)$。
那么必然会有
这意味着要么 $q_0 = 0$ 要么 $r_1 = 0$,因为如果两者都不为零,乘积 $q_0 r_1$ 也将不为零。
这将导致要么 $q_0 r_0 = 0$(在 $q_0 = 0$ 的情况下),要么 $q_1 r_1 = 0$(在 $r_1 = 0$ 的情况下)。
然而,我们看到这些等式都不可能成立,因为我们必须满足 $q_0 r_0 = 1/2$ 且 $q_1 r_1 = 1/2$。
因此,不存在满足独立性所需性质的向量 $\vert\phi\rangle$ 和 $\vert\psi\rangle$。
这部分通过反证法 (Proof by Contradiction),严谨地证明了我们遇到的第一个相关状态确实是不独立的。
这和之前的状态(1)是同一个东西,只是用狄拉克符号写了出来,并且省略了概率为0的项。
$p_{00}=1/2, p_{01}=0, p_{10}=0, p_{11}=1/2$。
这是证明的关键步骤。它将一个已知的联合概率 ($p_{01}=0$) 与假设存在的边际概率的乘积 ($q_0 r_1$) 联系起来。
本段本身就是对一个核心例子的严谨证明。我们用同样的逻辑来证明“完美负相关”状态也是不独立的。
本段使用反证法,严格地证明了概率状态 $\frac{1}{2}|00\rangle + \frac{1}{2}|11\rangle$ 是不独立的。其核心逻辑是:假设该状态是独立的,那么其联合概率必须满足乘法法则 $p_{ab}=q_a r_b$。然而,通过分析概率为零的项(如 $p_{01}=0$),可以推导出与概率不为零的项(如 $p_{00}=1/2$)相矛盾的结论。这个矛盾证明了最初的“独立性”假设不成立。
本段的目的是展示如何严格地、数学地去证伪一个命题。科学不仅在于证实,也在于证伪。通过一个清晰的反证法示例,学习者可以体会到数学论证的严密性和力量。同时,它也从反面加深了对独立性定义苛刻性的理解:只要有一个环节对不上,整个独立性的大厦就崩塌了。这为理解相关性的普遍存在提供了数学依据。
这就像一个逻辑谜题:“如果A是真的,那么B就必须是真的。如果B是真的,那么C就必须是假的。但我们已知C是真的。请问:A是真的还是假的?”
本段的证明过程就完全是这个逻辑结构。
想象一个只在对角线上发光的像素屏幕。
📜 [原文18]
定义了两个系统之间的独立性后,我们现在可以定义相关性的含义:它即是缺乏独立性。
例如,因为由向量 $(5)$ 表示的概率状态中的两个比特不是独立的,所以根据定义,它们是相关的。
这是一个非常简短但概念上极其重要的段落,它正式定义了相关性。
本段给出了相关性的正式定义:相关性就是不独立。这是一个简洁而强大的定义,它将相关性与独立性这两个概念紧密地捆绑在一起,形成了一个对多系统概率状态的完整分类。
本段的目的是在概念体系中为“相关性”找到一个精确的位置。通过将其定义为独立性的对立面,避免了循环定义或模糊描述。这使得整个理论框架更加清晰和自洽。现在,我们有了一个明确的任务:要理解一个多系统,关键在于判断它是否独立。如果是,它的行为很简单;如果不是,它就是相关的,其行为会更复杂、更有趣,值得我们进一步研究。
这就像定义“奇数”。
这个定义方式和本段定义“相关性”的逻辑是完全一样的。我们先定义了性质良好的“独立性”(像偶数),然后把其他所有情况都归为“相关性”(像奇数)。
想象一下检查两份考试卷是否雷同(作弊)。
📜 [原文19]
刚才描述的独立性条件可以通过张量积的概念简洁地表达。
虽然张量积是一个非常通用的概念,可以非常抽象地定义并应用于各种数学结构,但我们在当前情况下可以采用一个简单且具体的定义。
这部分是引子,预告了一个更高级、更简洁的数学工具——张量积 (Tensor Product)——的登场。
由于本段是引言,还没有给出定义,我们可以预演一下它将要做什么。
本段是一个过渡,它宣告了张量积的引入。引入张量积的目的是为了用一个单一的、优雅的数学运算来概括和表达多系统的独立性条件。它承诺将给出一个具体、易于操作的定义,而非其在高等数学中的抽象形式。
本段的目的是“承上启下”。它总结了之前对独立性的描述($p_{ab}=q_a r_b$)的不足之处(不够简洁),并指明了前进的方向(寻找一种新的运算)。这使得张量积的出现不是凭空而来,而是为了解决一个实际问题(如何更优雅地表达独立性),从而让整个理论的构建显得更加自然和有逻辑。
这就像你学会了用 2+2+2 来算3个2相加,然后有人告诉你:“有一个更简洁的符号叫乘法,你可以写成 3×2”。
想象你在用一个图形软件。
📜 [原文20]
给定两个向量
张量积 $\vert \phi \rangle \otimes \vert \psi \rangle$ 是定义为以下的向量
这个新向量的条目对应于笛卡尔积 $\Sigma\times\Gamma$ 的元素,它们在前面的方程中被写为字符串。
等效地,向量 $\vert \pi \rangle = \vert \phi \rangle \otimes \vert \psi \rangle$ 由方程
对每一个 $a\in\Sigma$ 和 $b\in\Gamma$ 都成立来定义。
这部分给出了张量积的正式定义,并用两种等价的方式来描述。
这是张量积的“构造性”定义。它直接告诉我们如何一步步构建出最终的向量。
$|\phi\rangle \otimes |\psi\rangle$
$= \alpha_0\beta_0 |00\rangle$ (a=0, b=0)
$+ \alpha_0\beta_1 |01\rangle$ (a=0, b=1)
$+ \alpha_1\beta_0 |10\rangle$ (a=1, b=0)
$+ \alpha_1\beta_1 |11\rangle$ (a=1, b=1)
这是张量积的“按需查询”定义。它不直接构造出整个向量,而是告诉我们如何查询最终向量的任意一个分量。
$= (1 \times 3) |00\rangle + (1 \times 4) |01\rangle + (2 \times 3) |10\rangle + (2 \times 4) |11\rangle$
$= 3|00\rangle + 4|01\rangle + 6|10\rangle + 8|11\rangle$
$= (\frac{1}{\sqrt{2}} \times \frac{1}{\sqrt{2}})|00\rangle + (\frac{1}{\sqrt{2}} \times -\frac{1}{\sqrt{2}})|01\rangle + (\frac{1}{\sqrt{2}} \times \frac{1}{\sqrt{2}})|10\rangle + (\frac{1}{\sqrt{2}} \times -\frac{1}{\sqrt{2}})|11\rangle$
$= \frac{1}{2}|00\rangle - \frac{1}{2}|01\rangle + \frac{1}{2}|10\rangle - \frac{1}{2}|11\rangle$
本段正式定义了向量的张量积。它是一种将两个(或多个)来自较小向量空间的向量,组合成一个单一的、来自更大向量空间的向量的运算。其核心规则是:新向量的系数,是由原来两个向量的系数两两相乘得到的。本段提供了两种等价的定义形式:一种是直接构造最终向量的“求和式”,另一种是描述如何获取最终向量任意分量的“查询式”。
本段的目的是将独立性的描述从系数层面 ($p_{ab}=q_a r_b$) 提升到向量运算层面。有了张量积这个工具,我们就可以非常简洁地处理和识别独立的概率状态(以及后面的量子态)。它是多体系统(无论是经典还是量子)数学描述的基石。所有独立的复合系统状态都可以通过张量积构建,而所有不能这样构建的状态,都是相关或纠缠的。
张量积就像是分配律 (Distributive Law) 的一种“升级版”。
$= (\alpha_0|0\rangle \otimes |\psi\rangle) + (\alpha_1|1\rangle \otimes |\psi\rangle)$
$= \alpha_0|0\rangle \otimes (\beta_0|0\rangle + \beta_1|1\rangle) + \alpha_1|1\rangle \otimes (\beta_0|0\rangle + \beta_1|1\rangle)$
$= \alpha_0\beta_0(|0\rangle\otimes|0\rangle) + \alpha_0\beta_1(|0\rangle\otimes|1\rangle) + \alpha_1\beta_0(|1\rangle\otimes|0\rangle) + \alpha_1\beta_1(|1\rangle\otimes|1\rangle)$
回到用两个一维列表生成一个二维表格的模型。
📜 [原文21]
我们现在可以重新表述独立性的条件:
对于处于由概率向量 $\vert \pi \rangle$ 表示的概率状态下的联合系统 $(\mathsf{X}, \mathsf{Y})$,如果 $\vert\pi\rangle$ 是通过对每个子系统 $\mathsf{X}$ 和 $\mathsf{Y}$ 的概率向量 $\vert \phi \rangle$ 和 $\vert \psi \rangle$ 进行张量积运算得到的,即
则系统 $\mathsf{X}$ 和 $\mathsf{Y}$ 是独立的。
在这种情况下,$\vert \pi \rangle$ 被称为是一个乘积态或乘积向量。
这一小段是画龙点睛之笔,它用刚刚定义的张量积,给出了独立性最简洁、最优雅的定义。
这是本节最重要的公式之一。它用一个极其简洁的方程表达了独立性。
这个方程的含义是:联合系统的状态向量可以由子系统的状态向量通过张量积运算“构建”出来。
$|\phi\rangle \otimes |\psi\rangle = (\frac{1}{4}|0\rangle + \frac{3}{4}|1\rangle) \otimes (\frac{2}{3}|0\rangle + \frac{1}{3}|1\rangle)$
$= (\frac{1}{4}\frac{2}{3})|00\rangle + (\frac{1}{4}\frac{1}{3})|01\rangle + (\frac{3}{4}\frac{2}{3})|10\rangle + (\frac{3}{4}\frac{1}{3})|11\rangle$
$= \frac{2}{12}|00\rangle + \frac{1}{12}|01\rangle + \frac{6}{12}|10\rangle + \frac{3}{12}|11\rangle$
$= \frac{1}{6}|00\rangle + \frac{1}{12}|01\rangle + \frac{1}{2}|10\rangle + \frac{1}{4}|11\rangle$
本段给出了独立性最精炼的定义:一个复合系统的概率状态是独立的,当且仅当其状态向量是一个乘积态,即它可以被写成其各个子系统状态向量的张量积。所有不独立的状态(即相关状态)都不能写成这种张量积的形式。
本段的目的是将独立性这个物理/概率概念,完全转化为一个线性代数的结构问题。判断独立性,现在等价于判断一个高维向量是否可以被分解为几个低维向量的张量积。这个问题(称为张量分解)是线性代数中的一个重要问题。通过这种转换,我们可以利用更多、更强大的数学工具来分析多体系统的状态。这一定义对于量子信息尤其重要,因为纠缠的定义正是“不是乘积态的量子态”。
这就像判断一幅画是不是“拼贴画”。
回到那个矩形农田的例子。
📜 [原文22]
在对右矢进行张量积运算时,我们经常省略符号 $\otimes$,例如写成 $\vert \phi \rangle \vert \psi \rangle$ 而不是 $\vert \phi \rangle \otimes \vert \psi \rangle$。
这一惯例体现了这样一个想法,即在这种情况下,张量积是进行两个向量乘积最自然或默认的方式。
虽然不太常见,但有时也会使用符号 $\vert \phi\otimes\psi\rangle$。
这部分介绍了张量积的一些简化记法。
本段介绍了两种简化张量积书写的方法:最常用的是直接省略 $\otimes$ 符号,将两个 ket 向量并置;另一种不太常用的是将 $\otimes$ 写入 ket 内部。这些简化旨在让表达式更简洁,并强调了张量积在多体系统描述中的核心地位。
本段的目的是让学习者熟悉文献和实际使用中的常见记法。科学的发展总是倾向于使用更经济、更强大的符号系统。了解这些约定俗成的简化,是读懂他人工作和与他人有效交流的必要前提。
这就像在代数中:
对张量积符号的简化,完全是出于同样的考虑。
想象你在发短信。
我们省略了很多冗余的符号(比如空格),因为接收方的大脑能自动补全并正确理解。省略张量积符号 $\otimes$ 也是基于同样的信任,即读者知道两个并排的 ket 向量意味着张量积。
📜 [原文23]
当我们使用字母顺序惯例对笛卡尔积的元素进行排序时,我们得到以下两个列向量的张量积的规范。
这部分给出了张量积在列向量表示下的具体计算方法,这个方法也被称为克罗内克积 (Kronecker Product)。
上面这个更详细的写法展示了“块状”结构。原文的公式是其最终展开形式。
本段给出了计算两个列向量张量积的具体算法(即克罗内克积)。该算法通过将第一个向量的每个分量分别与第二个向量相乘,并将结果按块堆叠,从而生成一个更大的列向量。这个算法的结构与我们之前约定的复合状态的字母顺序排序是完美匹配的。
本段的目的是将张量积从一个抽象的狄拉克符号定义,转化为一个可以在纸上或计算机上具体执行的数值计算过程。有了这个算法,我们就可以对任意给定的子系统向量,实际地计算出它们所构成的独立复合系统的状态向量,这在编程实现和数值模拟中是必不可少的。
这个算法就像是“俄罗斯套娃”。
想象你在用Photoshop的“复制-粘贴-缩放”功能。
📜 [原文24]
作为一个重要的旁注,请注意以下标准基向量的张量积表达式:
我们也可以选择将 $(a,b)$ 写成有序对,而不是字符串,在这种情况下我们得到 $\vert a \rangle \otimes \vert b \rangle = \vert (a,b) \rangle$。
然而,在这种情况下更常见的是省略括号,而是写成 $\vert a \rangle \otimes \vert b \rangle = \vert a,b \rangle$。
这在更广泛的数学中也是典型的;不增加清晰度或不消除歧义的括号通常会被直接省略。
这部分指出了一个非常重要且有用的张量积特性:基向量的张量积等于复合基向量。
$|0\rangle \otimes |1\rangle = \begin{pmatrix}1\\0\end{pmatrix} \otimes \begin{pmatrix}0\\1\end{pmatrix} = \begin{pmatrix} 1 \times \begin{pmatrix}0\\1\end{pmatrix} \\ 0 \times \begin{pmatrix}0\\1\end{pmatrix} \end{pmatrix} = \begin{pmatrix} 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}$。
这是一个非常基础和核心的张量积恒等式。它建立了子空间基向量和复合空间基向量之间的联系。这个等式是我们能够使用“分配律”来展开张量积的根本原因。
例如:
$(\alpha_0|0\rangle + \alpha_1|1\rangle) \otimes (\beta_0|0\rangle + \beta_1|1\rangle)$
$= \alpha_0|0\rangle \otimes \beta_0|0\rangle + \dots$ (使用分配律)
$= \alpha_0\beta_0 (|0\rangle \otimes |0\rangle) + \dots$ (提出标量)
$= \alpha_0\beta_0 |00\rangle + \dots$ (使用本段的恒等式)
这与我们之前的定义完全自洽。
$|1\rangle_B = \begin{pmatrix}0\\1\end{pmatrix}$。$|2\rangle_T = \begin{pmatrix}0\\0\\1\end{pmatrix}$。
$|1\rangle_B \otimes |2\rangle_T = \begin{pmatrix}0\\1\end{pmatrix} \otimes \begin{pmatrix}0\\0\\1\end{pmatrix} = \begin{pmatrix} 0 \times \begin{pmatrix}0\\0\\1\end{pmatrix} \\ 1 \times \begin{pmatrix}0\\0\\1\end{pmatrix} \end{pmatrix} = \begin{pmatrix}0\\0\\0\\0\\0\\1\end{pmatrix}$。
本段揭示并验证了一个关键的规则:两个子系统的标准基向量的张量积,等于复合系统中对应的那个标准基向量。这个规则,即 $|a\rangle \otimes |b\rangle = |ab\rangle$,极大地简化了包含狄拉克符号的张量积运算,使之可以像普通代数中的多项式乘法一样使用分配律来展开。同时,本段也澄清了 ket 符号内部内容的不同写法,如 $|ab\rangle$, $|(a,b)\rangle$, 和 $|a,b\rangle$,它们都指代同一个复合基向量。
本段的目的是提供一个进行符号运算的有力工具。相比于使用庞大的列向量进行克罗内克积计算,使用狄拉克符号和 $|a\rangle \otimes |b\rangle = |ab\rangle$ 这条规则进行代数推导,往往更加简洁、直观,并且更能揭示物理过程的本质。这是从“数值计算”思维转向“符号和结构”思维的重要一步。
这就像是对坐标轴的操作。
想象你在用乐高积木搭建。
📜 [原文25]
两个向量的张量积具有一个重要的性质,即它是双线性的,这意味着在假设另一个参数固定的情况下,它对两个参数中的每一个分别都是线性的。
此性质可以通过这些方程表达:
这部分介绍了张量积最重要的代数性质:双线性 (Bilinearity)。
所有这些方程都是张量积定义的直接推论。我们来验证其中一个,比如第一个参数的可加性。
要证明: $(\vert\phi_1\rangle + \vert\phi_2\rangle)\otimes \vert\psi\rangle = \vert\phi_1\rangle \otimes \vert\psi\rangle + \vert\phi_2\rangle \otimes \vert\psi\rangle$
$|\phi_1\rangle = \sum_a \alpha_{1,a}|a\rangle$
$|\phi_2\rangle = \sum_a \alpha_{2,a}|a\rangle$
$|\psi\rangle = \sum_b \beta_b|b\rangle$
$|\phi_1\rangle + |\phi_2\rangle = \sum_a (\alpha_{1,a} + \alpha_{2,a})|a\rangle$。这是一个新向量,其在基 $|a\rangle$ 上的系数是 $(\alpha_{1,a} + \alpha_{2,a})$。
根据张量积的定义 $(\text{系数相乘})$,$(\vert\phi_1\rangle + \vert\phi_2\rangle)\otimes \vert\psi\rangle$ 在基 $|ab\rangle$ 上的系数是 $(\alpha_{1,a} + \alpha_{2,a})\beta_b = \alpha_{1,a}\beta_b + \alpha_{2,a}\beta_b$。
$|\phi_1\rangle \otimes |\psi\rangle$ 在基 $|ab\rangle$ 上的系数是 $\alpha_{1,a}\beta_b$。
$|\phi_2\rangle \otimes |\psi\rangle$ 在基 $|ab\rangle$ 上的系数是 $\alpha_{2,a}\beta_b$。
两者相加后,新向量在基 $|ab\rangle$ 上的系数是 $\alpha_{1,a}\beta_b + \alpha_{2,a}\beta_b$。
$|\phi_1\rangle + |\phi_2\rangle = \begin{pmatrix}1\\1\end{pmatrix}$。
$(\vert\phi_1\rangle + \vert\phi_2\rangle)\otimes \vert\psi\rangle = \begin{pmatrix}1\\1\end{pmatrix} \otimes \begin{pmatrix}2\\3\end{pmatrix} = \begin{pmatrix} 1 \times \begin{pmatrix}2\\3\end{pmatrix} \\ 1 \times \begin{pmatrix}2\\3\end{pmatrix} \end{pmatrix} = \begin{pmatrix}2\\3\\2\\3\end{pmatrix}$。
$|\phi_1\rangle \otimes |\psi\rangle = \begin{pmatrix}1\\0\end{pmatrix} \otimes \begin{pmatrix}2\\3\end{pmatrix} = \begin{pmatrix} 1 \times \begin{pmatrix}2\\3\end{pmatrix} \\ 0 \times \begin{pmatrix}2\\3\end{pmatrix} \end{pmatrix} = \begin{pmatrix}2\\3\\0\\0\end{pmatrix}$。
$|\phi_2\rangle \otimes |\psi\rangle = \begin{pmatrix}0\\1\end{pmatrix} \otimes \begin{pmatrix}2\\3\end{pmatrix} = \begin{pmatrix} 0 \times \begin{pmatrix}2\\3\end{pmatrix} \\ 1 \times \begin{pmatrix}2\\3\end{pmatrix} \end{pmatrix} = \begin{pmatrix}0\\0\\2\\3\end{pmatrix}$。
$|\phi_1\rangle\otimes|\psi\rangle + |\phi_2\rangle\otimes|\psi\rangle = \begin{pmatrix}2\\3\\0\\0\end{pmatrix} + \begin{pmatrix}0\\0\\2\\3\end{pmatrix} = \begin{pmatrix}2\\3\\2\\3\end{pmatrix}$。
$(\alpha\vert\phi\rangle)\otimes \vert\psi\rangle = \begin{pmatrix}5\\10\end{pmatrix} \otimes \begin{pmatrix}3\\4\end{pmatrix} = \begin{pmatrix} 5 \times 3 \\ 5 \times 4 \\ 10 \times 3 \\ 10 \times 4 \end{pmatrix} = \begin{pmatrix}15\\20\\30\\40\end{pmatrix}$。
$|\phi\rangle \otimes |\psi\rangle = \begin{pmatrix}1\\2\end{pmatrix} \otimes \begin{pmatrix}3\\4\end{pmatrix} = \begin{pmatrix}3\\4\\6\\8\end{pmatrix}$。
$\alpha(\vert\phi\rangle\otimes \vert\psi\rangle) = 5 \begin{pmatrix}3\\4\\6\\8\end{pmatrix} = \begin{pmatrix}15\\20\\30\\40\end{pmatrix}$。
本段明确指出了张量积运算的核心代数性质:双线性。这意味着张量积对它的两个输入参数都分别满足线性的两个特征:可加性(和的张量积等于张量积的和)和齐次性(标量可以自由地在运算内外移动)。这个性质使得我们可以像处理多项式乘法一样,使用分配律来展开和计算包含张量积的复杂表达式。
本段的目的是为使用张量积进行代数运算提供理论依据。没有双线性这个性质,张量积就只是一个呆板的数值计算规则。有了双线性,它就变成了一个灵活、强大的代数工具,可以方便地用于各种理论推导中,尤其是在量子力学中处理叠加态的演化时。
双线性就像是“公平”。
想象一个制作混合颜料的工厂。
📜 [原文26]
考虑到这两对方程中的第二个方程,
我们看到标量在张量积中“自由浮动”:
因此,直接书写 $\alpha\vert\phi\rangle\otimes\vert\psi\rangle$,或者写成 $\alpha\vert\phi\rangle\vert\psi \rangle$ 或 $\alpha\vert\phi\otimes\psi\rangle$ 来指代这个向量,不会产生歧义。
这部分是对双线性中齐次性质的一个推论和总结,并解释了为什么包含标量乘法的张量积表达式可以写得更简洁。
这个链式等式是本段的核心。
本段指出了张量积的齐次性质带来的一个重要便利:标量乘子可以在张量积表达式中自由移动位置,而不会改变最终结果。这使得我们可以省略掉很多括号,用更简洁、无歧义的形式(如 $\alpha|\phi\rangle\otimes|\psi\rangle$)来书写表达式。
本段的目的是进一步简化符号系统,提高书写和阅读效率。在量子力学的计算中,充满了各种系数和常数。如果每次都要用括号严格规定它们的结合顺序,表达式将变得异常臃肿和难以阅读。确立了“标量自由浮动”的规则后,就可以大大简化代数推导过程。
这就像在做饭时加盐。
想象在一条生产线上组装产品。
📜 [原文27]
独立性和张量积的概念可以直接推广到三个或更多的系统。
如果 $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}$ 分别是具有经典状态集 $\Sigma_0,\ldots,\Sigma_{n-1}$ 的系统,那么如果相关的概率向量采取以下形式,则联合系统 $(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0)$ 的一个概率状态就是一个乘积态
其中概率向量 $\vert \phi_0 \rangle,\ldots,\vert \phi_{n-1}\rangle$ 描述了 $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}$ 的概率状态。
这部分将独立性和张量积的概念从2个系统推广到任意 $n$ 个系统。
这是 $n$ 系统乘积态的定义式。
$p_{a_2 a_1 a_0} = q_{2, a_2} \times q_{1, a_1} \times q_{0, a_0}$。
本段将乘积态和张量积的概念从两个系统无缝推广到了 $n$ 个系统。它定义了一个 $n$-系统概率状态为乘积态(即独立的),如果其联合概率向量可以表示为 $n$ 个子系统各自概率向量的张量积。
本段的目的是为描述任意多个子系统组成的复合系统提供一个统一和通用的数学框架。这对于量子计算至关重要,因为量子计算机就是一个由大量量子比特($n$ 可能很大)组成的多体系统。有了这个推广,我们就有能力用数学语言来描述一个 $n$-量子比特寄存器的状态,并区分哪些是简单的乘积态,哪些是蕴含了计算能力的复杂的纠缠态。
这就像计算一个由多个独立部件组成的机器的总可靠性。
想象一个 $n$ 维的超立方体。
📜 [原文28]
在这里,张量积的定义以自然的方式推广:向量
由方程
对每一个 $a_0\in\Sigma_0, \ldots a_{n-1}\in\Sigma_{n-1}$ 都成立来定义。
定义三个或更多向量的张量积的另一种但等效的方法是根据两个向量的张量积进行递归:
与仅两个向量的张量积类似,在假设所有其他参数固定的情况下,三个或更多向量的张量积对每一个参数分别都是线性的。
在这种情况下,称三个或更多向量的张量积是多线性的。
就像两个系统的情况一样,我们可以说当系统 $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}$ 处于乘积态时,它们是独立的,但使用术语相互独立更为精确。
恰好还有三个或更多系统的其他独立性概念,例如两两独立,它们既有趣又重要——但在本课程的背景下并非如此。
这部分详细阐述了n-系统张量积的定义和性质。
-系统的问题转化为了一个2-系统的问题,而2-系统的张量积我们已经定义了。这个递归可以一直进行下去,直到最后变成我们熟悉的两向量张量积。
这是n-系统张量积的“查询式”定义。
这是n-系统张量积的“递归”定义。它把一个大问题分解成一个小问题和一个规模减一的同样问题。
$= \begin{pmatrix}1\\1\end{pmatrix} \otimes \begin{pmatrix}3\\4\\6\\8\end{pmatrix} = \begin{pmatrix} 1 \times \begin{pmatrix}3\\4\\6\\8\end{pmatrix} \\ 1 \times \begin{pmatrix}3\\4\\6\\8\end{pmatrix} \end{pmatrix} = \begin{pmatrix}3\\4\\6\\8\\3\\4\\6\\8\end{pmatrix}$。
本段将n-系统张量积的定义和性质阐述完整。它给出了“查询式”和“递归式”两种等价定义,并指出了其多线性的性质。它还澄清了物理上我们关心的独立性是概率论中更强的“相互独立”,它完全等价于概率状态向量可以被写成一个乘积态。
本段的目的是为n-系统张量积提供一个坚实的数学基础,并厘清与概率论中不同独立性概念的关系。通过递归定义,它展示了复杂问题可以分解为简单问题的思想。通过引入“相互独立”的术语,它精确化了我们讨论的物理情景,并巧妙地避开了更复杂的概率论问题的干扰,使课程能聚焦于乘积态 vs 非乘积态这一核心二分法上。
张量积的递归定义就像做千层饼。
📜 [原文29]
推广早先关于标准基向量的张量积的观察,对于任何正整数 $n$ 和任何经典状态 $a_0,\ldots,a_{n-1}$,我们有
这一小段是将之前对2-系统基向量的观察,推广到n个系统的情况。
$|a_{n-1}\rangle \otimes \cdots \otimes |a_0\rangle$
$= |a_{n-1}\rangle \otimes ( |a_{n-2}\rangle \otimes \cdots \otimes |a_0\rangle )$ (根据递归定义)
$= |a_{n-1}\rangle \otimes |a_{n-2}\cdots a_0\rangle$ (根据归纳假设)
本段将基向量的张量积等于复合基向量这一重要规则推广到了任意n个系统的情况。这个规则 $|a_{n-1}\rangle \otimes \cdots \otimes |a_0\rangle = |a_{n-1}\cdots a_0\rangle$ 是使用狄拉克符号进行多体系统代数运算的基石。
本段的目的是提供一个强大的符号运算工具。它使得张量积的展开变得像多项式乘法一样直观和机械。更重要的是,它完美地连接了子系统的状态空间和复合系统的状态空间之间的结构关系,即复合空间的基底可以由子空间基底的张量积来生成。这个性质在线性代数上称为“张量积是基的”。
这就像文件系统的路径。
想象你在画一幅像素画。
📜 [原文30]
现在让我们继续讨论多系统的概率状态的测量。
通过选择将多系统集体视为单一系统,我们立即获得了关于多系统如何进行测量的规范——前提是测量了所有系统。
这部分将讨论的重点从“状态的表示”转移到了“对状态的操作”,首先从最简单的操作——测量 (Measurement) 开始。
本段指出,对于同时测量多体系统中所有子系统的情况,其测量规则与单体系统完全相同:系统以各自的概率“塌缩”到联合经典状态空间中的某一个经典状态上,这个概率就是联合概率向量中对应的分量。
本段的目的是建立一个最简单的多体测量模型作为后续讨论的基准。通过先处理“一次性全测完”这种最简单的情况,我们可以平滑地过渡到更复杂、也更贴近现实的“只测量一部分子系统”(即部分测量)的情况,后者是理解量子计算中信息提取和状态演化的关键。
**[直觉心-
智模型]**
这就像一次期末大考。
想象一个有多个轮盘的抽奖机。
📜 [原文31]
例如,如果两个比特 $(\mathsf{X},\mathsf{Y})$ 的概率状态由概率向量描述
那么结果 $00$——意味着对 $\mathsf{X}$ 的测量结果为 $0$ 且对 $\mathsf{Y}$ 的测量结果为 $0$——以 $1/2$ 的概率获得,且结果 $11$ 也以 $1/2$ 的概率获得。
在每种情况下,我们都会相应地更新对我们知识的概率向量描述,使得概率状态分别变为 $|00\rangle$ 或 $|11\rangle$。
这是一个应用“全局测量”规则的具体例子,使用的是我们熟悉的那个相关状态。
这是一个概率向量。
本段本身就是一个完整的数值示例。我们再看一个。
本段通过一个相关状态的具体例子,完整地演示了对多体系统进行全局测量的过程:1) 可能的测量结果是联合经典状态,如 00 11。2) 获得某个结果的概率由概率向量中对应的系数决定。3) 测量之后,系统状态塌缩到与测量结果对应的那个标准基向量上,不确定性消失。
本段的目的是通过一个具体的例子,巩固对全局测量和状态塌缩的理解,并为下一节更复杂的部分测量做对比和铺垫。它清楚地显示了,只要我们把多体系统视为一个整体,测量的规则是简单而直观的。
这就像从一个装有彩球的黑箱子里摸球。
想象一个薛定谔的盒子,但里面有两只“相关”的猫,$\mathsf{X}$和$\mathsf{Y}$。它们要么都活着,要么都死了,两种可能性各占50%。
📜 [原文32]
然而,我们可以选择不测量每一个系统,而是只测量其中的一些系统。
这将导致每个被测量的系统都有一个测量结果,并且(通常)还会影响我们对未测量剩余系统的了解。
为了解释这是如何运作的,我们将重点关注两个系统的情况,其中一个系统被测量。
更一般的情况——即测量三个或更多系统中的某个真子集——当我们将被测量的系统集体视为一个系统,并将未测量的系统视为第二个系统时,实际上简化为两个系统的情况。
这部分引入了一个更复杂、更现实的测量场景:部分测量 (Partial Measurement)。
本段引入了部分测量的概念,即只测量多体系统中的一部分子系统。其核心要点是:对一个子系统的测量,不仅会给出该子系统的确定结果,通常还会(在系统存在相关性时)影响和更新我们对其他未测量子系统的概率描述。本段还指出,任何复杂的部分测量问题都可以通过“打包”的思路,简化为“二体系统测一体”的基本模型。
本段的目的是打开通往更现实、更复杂的测量场景的大门。部分测量是量子算法(如量子隐形传态)和量子纠错的核心操作之一。在经典世界中理解部分测量如何更新我们的知识(即条件概率),是理解量子世界中部分测量如何改变量子态的关键一步。
这就像玩“狼人杀”游戏。
想象一个数独谜题。
📜 [原文33]
准确地说,让我们假设 $\mathsf{X}$ 和 $\mathsf{Y}$ 分别是具有经典状态集 $\Sigma$ 和 $\Gamma$ 的系统,并且这两个系统共同处于某种概率状态。
我们将考虑当只测量 $\mathsf{X}$ 而对 $\mathsf{Y}$ 不做任何操作时会发生什么。
只测量 $\mathsf{Y}$ 而对 $\mathsf{X}$ 不发生任何操作的情况是对称处理的。
首先,我们知道在假设 $\mathsf{Y}$ 也被测量的情况下,当只测量 $\mathsf{X}$ 时观察到特定经典状态 $a\in\Sigma$ 的概率必须与我们将获得的概率一致。
也就是说,我们必须满足
这就是所谓的 $\mathsf{X}$ 单独的约化(或边际)概率状态公式。
这部分开始具体分析“二体测一体”模型的第一步:如何计算测量结果的概率。
这个公式是概率论公理的直接应用,即不相交事件的并的概率等于各事件概率之和。
本段给出了计算部分测量结果概率的公式,即边际概率公式。它指出,要得到测量子系统 $\mathsf{X}$ 获得结果 $a$ 的概率,我们需要将联合概率分布中所有 $\mathsf{X}$ 固定为 $a$ 的项的概率值全部加起来。
本段是描述部分测量过程的第一步,它解决了“结果的概率是多少”的问题。这是后续讨论“测量后状态如何变化”的基础。这个边际概率公式在经典概率论和量子力学中是完全通用的(在量子力学中,是对密度矩阵求偏迹(Partial Trace),其物理意义和这里的求和是类似的)。
这就像在做人口普查数据分析。
$\operatorname{Pr}(\text{年龄}=30) = \sum_{\text{所有其他属性}} \operatorname{Pr}(\text{年龄}=30, \text{其他属性})$
你“忽略”了性别、职业等所有其他变量,只关注年龄。这个过程就是“边缘化”。
回到那个像素屏幕的亮度图。
📜 [原文34]
这个公式在直观层面上非常有意义,因为如果它是错的,那一定发生了非常奇怪的事情。
如果它是错的,那就意味着测量 $\mathsf{Y}$ 可能会以某种方式影响与 $\mathsf{X}$ 测量的不同结果相关的概率,而与 $\mathsf{Y}$ 测量的实际结果无关。
如果 $\mathsf{Y}$ 碰巧位于遥远的地方,例如在另一个星系的某个地方,这将允许超光速通信——基于我们对物理学的理解,我们拒绝这一点。
另一种理解这一点的方式来自将概率解释为反映某种信念程度。
仅仅是别人可能决定观察 $\mathsf{Y}$ 这一事实并不能改变 $\mathsf{X}$ 的经典状态,因此在没有任何关于他们做了什么或没看到什么的信息的情况下,一个人对 $\mathsf{X}$ 状态的信念不应因此而改变。
这部分为上一段提出的边际概率公式提供了两个非常深刻的物理解释和哲学支撑,以证明其合理性。
本段从两个深刻的物理和哲学角度论证了边际概率公式的正确性和必要性。第一个是“无超光速通信”原理,它要求局域操作的统计结果不能瞬时影响远处,这保证了因果律。第二个是贝叶斯概率的观点,即我们的信念(概率)只应被我们获得的新信息所更新。这两个论证都强有力地支持了“计算一个子系统的概率时,我们应该对其他我们一无所知的子系统进行求和(边缘化)”这一做法。
本段的目的不仅仅是给出一个数学公式,更是要建立起这个公式与物理实在和逻辑推理之间的深刻联系。它告诉我们,这个公式不是凭空捏造的,而是物理世界基本法则(如因果律)的数学体现。这种从物理原理出发来理解数学公式的方法,对于培养物理直觉至关重要,尤其是在学习抽象的量子力学时。
想象一个巨大的赌场,里面有成千上万张正在进行的扑克牌局。
📜 [原文35]
现在,给定仅测量 $\mathsf{X}$ 而不测量 $\mathsf{Y}$ 的假设,关于 $\mathsf{Y}$ 的经典状态可能仍然存在不确定性。
出于这个原因,我们不能将对 $(\mathsf{X},\mathsf{Y})$ 的概率状态的描述更新为对于 $a\in\Sigma$ 和 $b\in\Gamma$ 的某种选择的 $\vert ab\rangle$,而是必须更新我们的描述,以便正确反映这种关于 $\mathsf{Y}$ 的不确定性。
以下条件概率公式反映了这种不确定性。
这里,表达式 $\operatorname{Pr}(\mathsf{Y} = b \,\vert\, \mathsf{X} = a)$ 表示在条件于(或给定)$\mathsf{X} = a$ 的情况下 $\mathsf{Y} = b$ 的概率。
从技术上讲,这个表达式只有在 $\operatorname{Pr}(\mathsf{X}=a)$ 非零时才有意义,因为如果 $\operatorname{Pr}(\mathsf{X}=a) = 0$,那么我们就除以了零,得到了不定型 $\frac{0}{0}$。
然而,这并不是问题,因为如果与 $a$ 相关的概率为零,那么我们永远不会得到 $a$ 作为 $\mathsf{X}$ 的测量结果,因此我们不需要关注这种可能性。
这部分开始讨论部分测量的第二步:在获得一个测量结果之后,我们对未测量的那个系统的知识该如何更新。
这是条件概率的定义式。它是概率论中最核心的公式之一。
这个公式可以被看作是联合概率定义的重排:$P(A \cap B) = P(A)P(B|A)$。即A和B同时发生的概率,等于A发生的概率,乘以“在A发生的条件下B也发生的概率”。
本段给出了更新部分测量后未测量系统状态的数学工具:条件概率公式。该公式指出,在测得 $\mathsf{X}=a$ 的条件下,$\mathsf{Y}=b$ 的新概率,等于联合概率 $P(a,b)$ 除以边际概率 $\operatorname{Pr}(\mathsf{X}=a)$。这本质上是将我们的概率空间“重新归一化”到以“$\mathsf{X}=a$”为新全体的子空间上。
本段的目的是完成对经典部分测量过程的完整数学描述。我们现在有了两套工具:1) 边际概率公式,用于计算测量结果的概率。2) 条件概率公式,用于更新测量后剩余系统的状态。这套完整的框架是贝叶斯推断的核心,也是理解量子态投影测量的基础。量子测量中的“波函数塌缩”规则,在数学形式上与这里的条件概率更新非常相似。
这就像在玩“猜豆子”游戏。
想象一张选民调查的交叉分析表。
| 支持A | 支持B | 总计 | |
|---|---|---|---|
| 年轻人 | 400 | 100 | 500 |
| 老年人 | 200 | 300 | 500 |
| 总计 | 600 | 400 | 1000 |
📜 [原文36]
为了用概率向量来表达这些公式,考虑一个描述 $(\mathsf{X},\mathsf{Y})$ 的联合概率状态的概率向量 $\vert \psi \rangle$。
单独测量 $\mathsf{X}$ 以如下概率产生每个可能的结果 $a\in\Sigma$
因此,代表单独 $\mathsf{X}$ 的概率状态的向量由下式给出
在获得 $\mathsf{X}$ 测量的特定结果 $a\in\Sigma$ 后,$\mathsf{Y}$ 的概率状态根据条件概率公式进行更新,使其由该概率向量表示:
在对 $\mathsf{X}$ 的测量导致经典状态 $a$ 的情况下,我们因此将对联合系统 $(\mathsf{X},\mathsf{Y})$ 的概率状态的描述更新为 $\vert a\rangle \otimes \vert\pi_a\rangle$。
这部分将前面讨论的边际概率和条件概率的计算,完全翻译成向量语言。
输入的联合概率向量。
计算边际概率(测量结果a的概率)的公式。
由边际概率构成的 $\mathsf{X}$ 的边际概率向量。
核心公式:计算测量后 $\mathsf{Y}$ 的条件概率向量。
$|\pi_0\rangle = \frac{p_{00}|0\rangle_Y + p_{01}|1\rangle_Y}{\operatorname{Pr}(\mathsf{X}=0)} = \frac{\frac{1}{2}|0\rangle_Y + 0|1\rangle_Y}{1/2} = 1|0\rangle_Y = |0\rangle_Y$。
$|\pi_0\rangle = \frac{p_{00}|0\rangle_Y + p_{01}|1\rangle_Y}{0.5} = \frac{0.4|0\rangle_Y + 0.1|1\rangle_Y}{0.5} = 0.8|0\rangle_Y + 0.2|1\rangle_Y$。
本段将经典的部分测量过程完全“翻译”成了向量语言。它给出了一个操作流程:
本段的目的是提供一个可操作的、基于线性代数的算法来模拟部分测量过程。这套流程是量子力学中著名的投影测量 (Projective Measurement) 规则的经典版本。理解这个经典版本如何通过“切片”和“归一化”来更新状态,将极大地帮助我们理解量子测量是如何通过“投影”和“归一化”来使波函数“塌缩”的。
这就像给一堆混合物做筛选。
回到交叉分析表。
| 支持A | 支持B | 总计 | |
|---|---|---|---|
| 年轻人 | 400 | 100 | 500 |
| 老年人 | 200 | 300 | 500 |
📜 [原文37]
思考 $\vert\pi_a\rangle$ 定义的一种方式是将其视为向量 $\sum_{b\in\Gamma} p_{ab} \vert b\rangle$ 的归一化,我们将其除以该向量中条目的总和以获得一个概率向量。
这种归一化有效地解释了对 $\mathsf{X}$ 的测量已导致结果 $a$ 这一事件的条件化。
举一个具体的例子,假设 $\mathsf{X}$ 的经典状态集为 $\Sigma = \{0,1\}$,$\mathsf{Y}$ 的经典状态集为 $\Gamma = \{1,2,3\}$,且 $(\mathsf{X},\mathsf{Y})$ 的概率状态为
我们的目标是确定两个可能结果($0$ 和 $1$)的概率,并在假设系统 $\mathsf{X}$ 被测量的情况下,计算两个结果所导致的 $\mathsf{Y}$ 的概率状态。
这部分首先对条件概率向量的计算做了一个总结性的诠释,然后设置了一个新的、更复杂的数值例子来演练整个部分测量过程。
这是一个6维的概率向量。
本段的核心就是一个待解决的数值示例,我们将在下一段跟随原文对其进行解答。
本段首先将条件概率向量的计算过程,精辟地总结为“切片”和“归一化”两个步骤,并将其与概率论中的“条件化”概念等同起来。然后,它提出了一个由一个比特和一个三态系统组成的、更复杂的部分测量问题,并明确了求解目标,为接下来的具体计算做好了铺垫。
本段的目的是通过诠释和设例,进一步深化对部分测量计算流程的理解。将计算过程抽象为“切片+归一化”,有助于形成更清晰的算法思路。而引入一个非对称的、更复杂的例子,旨在检验学习者是否能将之前学到的规则应用到新的、不熟悉的情境中,从而巩固和泛化所学知识。
“切片+归一化”就像是从一大块蛋糕上切下一块,然后想知道这块小蛋糕里各种成分的比例。
想象一份全国人口数据表格。
📜 [原文38]
利用张量积的双线性,特别是它在第二个参数上是线性的这一事实,我们可以将向量 $\vert \psi \rangle$ 重写如下:
简而言之,我们所做的是分离出第一个系统(即被测量的那个系统)的不同标准基向量,将每一个与第二个系统的标准基向量的线性组合进行张量积运算,这个组合是通过挑选出与第一个系统的相应经典状态一致的原始向量条目而得到的。
稍加思考就会发现,无论我们从哪个向量开始,这总是可能的。
这部分介绍了一种非常巧妙且强大的代数技巧,来重新组织联合概率向量,从而使部分测量的计算变得异常直观。
$|\psi\rangle = \frac{1}{2}|0\rangle\otimes|1\rangle + \frac{1}{12}|0\rangle\otimes|3\rangle + \frac{1}{12}|1\rangle\otimes|1\rangle + \frac{1}{6}|1\rangle\otimes|2\rangle + \frac{1}{6}|1\rangle\otimes|3\rangle$
$\frac{1}{2}|0\rangle\otimes|1\rangle + \frac{1}{12}|0\rangle\otimes|3\rangle = |0\rangle \otimes (\frac{1}{2}|1\rangle + \frac{1}{12}|3\rangle)$
$\frac{1}{12}|1\rangle\otimes|1\rangle + \frac{1}{6}|1\rangle\otimes|2\rangle + \frac{1}{6}|1\rangle\otimes|3\rangle = |1\rangle \otimes (\frac{1}{12}|1\rangle + \frac{1}{6}|2\rangle + \frac{1}{6}|3\rangle)$
$|\psi\rangle = |0\rangle_X \otimes |\text{vec}_0\rangle_Y + |1\rangle_X \otimes |\text{vec}_1\rangle_Y + \dots$
其中,|0>_X 和 |1>_X 是被测系统 $\mathsf{X}$ 的基向量。而 $|\text{vec}_0\rangle_Y$ 和 $|\text{vec}_1\rangle_Y$ 是在未被测量的系统 $\mathsf{Y}$ 的空间中的(通常未归一化的)向量。
这是一个非常有用的表示形式,也称为施密特分解 (Schmidt Decomposition) 的预备形式(对于纯态)。
$|\psi\rangle = |0\rangle \otimes (\frac{1}{2}|0\rangle) + |1\rangle \otimes (\frac{1}{2}|1\rangle)$。
本段介绍了一种极其有用的代数技巧:通过利用张量积的双线性,可以将任何一个联合状态向量 $|\psi\rangle$ 重写为 $\sum_a |a\rangle_X \otimes |\text{vec}_a\rangle_Y$ 的形式。其中 $|a\rangle_X$ 是被测系统的基,而 $|\text{vec}_a\rangle_Y$ 是一个未归一化的、包含了所有条件化信息的向量。这种形式将联合向量巧妙地“解耦”,使得部分测量的分析变得非常直观。
本段的目的是展示一个更优雅、更“物理”的视角来看待部分测量。相比于之前那种按部就班的“算系数、求和、做除法”的流程,这种代数重写的方法,让我们能直接从状态向量的结构中“看”出测量的各种可能性及其后果。这在量子力学中是至关重要的技能,因为量子态的演化和测量很大程度上就是对其状态向量的代数操作。
这就像整理一个大书架。
想象你在用Excel的数据透视表功能。
📜 [原文39]
通过这种方式表达我们的概率向量,测量第一个系统的效果就变得容易分析了。
两个结果的概率可以通过将括号中的概率求和得到。
这些概率的和为一,正如预期的那样——但这是对我们计算的一个有用检查。
现在,对于每个可能结果的 $\mathsf{Y}$ 的条件概率状态可以通过将括号中的向量归一化来推断。
也就是说,我们将这些向量除以我们刚才计算的相关概率,使它们成为概率向量。
这部分利用了上一段重写后的向量形式,来实际计算部分测量的概率和测量后的状态。
这是对边际概率的具体计算。
本段和下一段是连贯的,下一段会完成本例的计算。我们用双胞胎状态来演练本段的计算。
本段演示了如何利用代数重写后的联合状态向量,来轻松地完成部分测量的第一步:计算测量结果的边际概率。其方法是:与被测系统某个基向量 $|a\rangle$ 相配对的那个子向量 $|\text{vec}_a\rangle$ 的所有系数之和,就是测得结果 $a$ 的概率。
本段的目的是将上一段介绍的代数技巧付诸实践,展示其在简化计算方面的威力。它将一个看似复杂的“对高维向量按列求和”的过程,转化为了一个直观的“对低维向量求系数和”的过程,让整个计算流程更加清晰和不易出错。
回到“数据透视表”的模型。
想象你整理好的那个书架。
际概率**: 你想知道首字母是'A'的作者的书,占整个书架的百分比。
📜 [原文40]
因此,在条件于 $\mathsf{X}$ 为 $0$ 的情况下,$\mathsf{Y}$ 的概率状态变为
而在条件于 $\mathsf{X}$ 的测量结果为 $1$ 的情况下,$\mathsf{Y}$ 的概率状态变为
这部分完成了部分测量例子的最后一步:计算测量后 $\mathsf{Y}$ 的条件概率向量。
$|\pi_0\rangle = \frac{\frac{1}{2}|1\rangle + \frac{1}{12}|3\rangle}{7/12} = (\frac{1}{2} \div \frac{7}{12})|1\rangle + (\frac{1}{12} \div \frac{7}{12})|3\rangle$
$= (\frac{1}{2} \times \frac{12}{7})|1\rangle + (\frac{1}{12} \times \frac{12}{7})|3\rangle$
$= \frac{6}{7}|1\rangle + \frac{1}{7}|3\rangle$。
$|\pi_1\rangle = \frac{\frac{1}{12}|1\rangle + \frac{1}{6}|2\rangle + \frac{1}{6}|3\rangle}{5/12}$
$= (\frac{1}{12} \times \frac{12}{5})|1\rangle + (\frac{1}{6} \times \frac{12}{5})|2\rangle + (\frac{1}{6} \times \frac{12}{5})|3\rangle$
$= \frac{1}{5}|1\rangle + \frac{2}{5}|2\rangle + \frac{2}{5}|3\rangle$。
这两个公式都是条件概率向量定义的直接应用和计算。
这里除法的意思是将分子中向量的每个系数都除以分母的标量。
本段本身就是对之前例子的完整解答。我们把之前双胞胎状态的例子也计算完整。
本段完整地执行了部分测量的第二步——状态更新。通过将之前代数重写得到的“切片”向量,除以对应的边际概率(即进行归一化),我们成功地计算出了在不同测量结果下,未测量系统 $\mathsf{Y}$ 的新的条件概率向量。这个过程清晰地展示了测量一个子系统是如何改变我们对另一个子系统状态的知识的。
本段的目的是通过一个完整的、非平凡的计算,让学习者熟练掌握部分测量的全过程。它将前面所有抽象的公式和技巧都落实到了具体的数字上,将“切片+归一化”的思想转化为了实际的计算步骤。掌握这个计算过程,对于理解量子测量、密度矩阵的演化以及量子信息处理至关重要。
回到“筛选混合物”的模型。
回到“选民调查”的表格。
| 支持A | 支持B | |
|---|---|---|
| 年轻人 | 400 | 100 |
📜 [原文41]
为了结束关于多系统的经典信息的讨论,我们将考虑处于概率状态下的多系统上的操作。
遵循与之前相同的思路,我们可以将多系统集体视为单一的复合系统,然后参考上一课来看看这是如何运作的。
回到典型的设置,即我们有两个系统 $\mathsf{X}$ and $\mathsf{Y}$,让我们考虑复合系统 $(\mathsf{X},\mathsf{Y})$ 上的经典操作。
基于上一课和上面的讨论,我们得出结论,任何此类操作都由一个随机矩阵表示,其行和列由笛卡尔积 $\Sigma\times\Gamma$ 索引。
这部分开启了本课最后一个大主题:如何在多系统上执行操作 (Operations)。
其中 $p(i|j)$ 是从状态 $j$ 转移到状态 $i$ 的转移概率。这一列的四个概率加起来必须等于1。
本段将单系统上的操作模型推广到了多系统。其核心思想是:将多系统视为一个单一的复合系统,因此,对多系统的操作就可以由一个作用于联合概率向量的单一的大随机矩阵来描述。这个大随机矩阵的维度由复合状态空间的大小决定,其行和列的索引遵循复合状态的排序规则。
本段为描述多体系统的动力学演化提供了数学框架。它是连接“状态表示”和“状态改变”的桥梁。有了这个框架,我们就可以分析各种复杂的多体操作(如量子计算中的受控门),看看它们是如何改变系统的概率分布的,这是理解算法和物理过程的基础。
这就像一个城市里的交通网络。
想象一个棋盘游戏。
📜 [原文42]
例如,假设 $\mathsf{X}$ 和 $\mathsf{Y}$ 是比特,考虑一个具有以下描述的操作。
<Figure title="操作">
如果 $\mathsf{X} = 1$,则对 $\mathsf{Y}$ 执行 NOT 操作。\
否则什么都不做。
</Figure>
这是一个被称为受控非(controlled-NOT)操作的确定性操作,其中 $\mathsf{X}$ 是决定是否应对目标位 $\mathsf{Y}$ 应用 NOT 操作的控制位。
这是该操作的矩阵表示:
它对标准基态的作用如下。
这部分介绍了一个极其重要的多体操作的例子:受控非门 (Controlled-NOT, CNOT)。
这是CNOT门的矩阵表示(当 $\mathsf{X}$ 是控制位,$\mathsf{Y}$ 是目标位时)。
这是CNOT门作用的映射表示。
$\begin
1 & 0 & 0 & 0\\
0 & 1 & 0 & 0\\
0 & 0 & 0 & 1\\
0 & 0 & 1 & 0
\end
\begin
0\\0\\1/2\\1/2
\end
====
\begin{pmatrix}
0\\0\\1/2\\1/2
\end{pmatrix}$
$\begin
1 & 0 & 0 & 0\\
0 & 1 & 0 & 0\\
0 & 0 & 0 & 1\\
0 & 0 & 1 & 0
\end
\begin
1/2\\0\\1/2\\0
\end
====
\begin
1/2 \times 1 + 0 \times 0 + 1/2 \times 0 + 0 \times 0 \\
1/2 \times 0 + 0 \times 1 + 1/2 \times 0 + 0 \times 0 \\
1/2 \times 0 + 0 \times 0 + 1/2 \times 0 + 0 \times 1 \\
1/2 \times 0 + 0 \times 0 + 1/2 \times 1 + 0 \times 0
\end
====
\begin{pmatrix}
1/2\\0\\0\\1/2
\end{pmatrix}$
本段详细介绍和定义了受控非 (CNOT) 这个关键的二比特操作。它阐明了其“控制-目标”逻辑,推导了其对应的随机矩阵(一个置换矩阵),并展示了它如何确定性地变换四个标准基态。CNOT门是第一个真正意义上的“交互式”多体操作,它的行为不能分解为两个独立的单比特操作。
本段的目的是引入第一个,也是最重要的一个双比特量子门的经典对应物。CNOT门是构建通用量子计算机所必需的“基本构建块”之一(与所有单比特门一起)。通过在经典背景下彻底理解其作用矩阵和逻辑功能,可以为后续理解它在量子世界中创造纠缠这一神奇能力打下坚实基础。
CNOT门就像一个“条件开关控制的电灯”。
想象在队伍里传话。
📜 [原文43]
如果我们交换 $\mathsf{X}$ 和 $\mathsf{Y}$ 的角色,将 $\mathsf{Y}$ 作为控制位并将 $\mathsf{X}$ 作为目标位,那么该操作的矩阵表示将变为
它对标准基态的作用将如下所示:
这部分展示了当控制位和目标位互换后,CNOT操作的矩阵和行为会发生怎样的变化。
这是CNOT门的矩阵表示(当 $\mathsf{Y}$ 是控制位,$\mathsf{X}$ 是目标位时)。
这个映射表直观地反映了新的操作规则。
$\begin
1 & 0 & 0 & 0\\
0 & 0 & 0 & 1\\
0 & 0 & 1 & 0\\
0 & 1 & 0 & 0
\end
\begin
1/2\\0\\1/2\\0
\end
====
\begin{pmatrix}
1/2\\0\\1/2\\0
\end{pmatrix}$
本段通过显式地推导和展示,阐明了当CNOT门的控制位和目标位互换后,其对应的操作矩阵和状态映射关系都会发生改变。这强调了CNOT操作的非对称性,以及在描述和使用它时精确指明控制/目标位的极端重要性。
本段的目的是为了深化对CNOT门的理解,并消除一个潜在的误解,即认为它是一个对称的操作。通过对比两个不同的CNOT矩阵,它迫使学习者去关注操作的内部结构和比特的角色,而不仅仅是把它当作一个黑箱。这对于后续设计和分析包含多个CNOT门的复杂量子电路是必不可少的。
这就像一个有两个开关的电路。
这两个电路的行为显然是不同的。本段就是在强调这种区别。
想象两个舞者,A和B。
这是两条完全不同的指令,会导致舞蹈动作(状态演化)完全不同。
📜 [原文44]
另一个例子是具有此描述的操作:
<Figure title="操作">
以 $1/2$ 的概率执行以下两个操作之一:
</Figure>
该操作的矩阵表示如下:
此操作对标准基向量的作用如下:
这部分介绍了一个非确定性的多体操作,即操作的结果是概率性的。
$M = \frac{1}{2}M_1 + \frac{1}{2}M_2 = \frac{1}{2}\begin{pmatrix} 1+1&1+0&0+1&0+0 \\ 0&0&0&0 \\ 0&0&0&0 \\ 0+0&0+1&1+0&1+1 \end{pmatrix} = \begin{pmatrix} 1&1/2&1/2&0 \\ 0&0&0&0 \\ 0&0&0&0 \\ 0&1/2&1/2&1 \end{pmatrix}$。
$M |01\rangle = \begin{pmatrix} 1&1/2&1/2&0 \\ 0&0&0&0 \\ 0&0&0&0 \\ 0&1/2&1/2&1 \end{pmatrix} \begin{pmatrix}0\\1\\0\\0\end{pmatrix} = \begin{pmatrix}1/2\\0\\0\\1/2\end{pmatrix}$,这正是 $\frac{1}{2}|00\rangle + \frac{1}{2}|11\rangle$。
本段的两个公式在上面已经详细推导和解释过了。这个例子是随机矩阵加权平均的一个绝佳演示。
本段通过一个具体的例子,展示了如何为一个非确定性(随机)的多体操作构建其对应的随机矩阵。其核心方法是:首先为每个确定性的子操作构建矩阵,然后将这些矩阵按照它们发生的概率进行加权平均,得到最终的总操作矩阵。这个例子也展示了一个确定性的输入可以如何通过一个随机操作演化为一个不确定的输出(概率叠加)。
本段的目的是将上一课关于随机操作和矩阵加权平均的知识,应用到多体系统的场景中,从而处理更复杂的非确定性操作。这在经典和量子世界中都非常普遍,因为噪声、退相干等过程往往都是概率性的。掌握如何用随机矩阵来描述这些过程,是建立真实物理系统模型的基础。
这就像一个“协调员”机器人。
想象一个法官在调解两个人的纠纷。
📜 [原文45]
在这些例子中,我们只是简单地将两个系统一起视为一个单一系统,并按照上一课的内容进行。
同样的事情也可以对任意数量的系统进行。
例如,想象我们有三个比特,我们将这三个比特对 $8$ 取模递增——这意味着我们认为这三个比特使用二进制表示编码了一个 $0$ 到 $7$ 之间的数字,加 $1$,然后取除以 $8$ 后的余数。
表达此操作的一种方式是这样的:
另一种表达方式是
假设我们已经同意右矢内部从 $0$ 到 $7$ 的数字指的是这些数字的三位二进制编码。
第三种选择是将此操作表示为一个矩阵。
这部分将复合操作的概念从2-系统推广到n-系统,并用一个3-比特的“加法器”作为例子,展示了描述同一个操作的三种不同数学形式。
这是一个算符的紧凑表示。
本段通过一个3-比特模8加法器的具体例子,展示了描述一个多体确定性操作的三种等价方式:1) 直观的外积求和表示,2) 紧凑的求和式表示,以及3) 可用于计算的矩阵表示。这再次强调了“将多体系统视为单体”的策略,并为我们提供了更丰富的数学工具来描述和分析复杂操作。
本段的目的是展示描述操作的多种数学语言,并让学习者熟悉它们之间的转换。在不同的上下文和应用中,不同的表示法各有优势。映射关系最直观,求和式最紧凑,矩阵最适合计算机数值计算,而外积求和在理论推导中非常有用。熟练掌握它们,才能在阅读文献和解决问题时游刃有余。
这就像描述一个“向右传递”的游戏规则。
这三种方式描述的是同一个游戏规则。
想象一个音乐盒的滚筒。
📜 [原文46]
现在假设我们有多个系统,并且我们分别在系统上独立地执行不同的操作。
例如,采用我们通常由 $\mathsf{X}$ 和 $\mathsf{Y}$ 组成的两个系统设置,其经典状态集分别为 $\Sigma$ 和 $\Gamma$,让我们假设我们在 $\mathsf{X}$ 上执行一个操作,并完全独立地在 $\mathsf{Y}$ 上执行另一个操作。
正如我们从上一课所知道的,这些操作由随机矩阵表示——准确地说,让我们说 $\mathsf{X}$ 上的操作由矩阵 $M$ 表示,而 $\mathsf{Y}$ 上的操作由矩阵 $N$ 表示。
因此,$M$ 的行和列的索引与 $\Sigma$ 的元素相对应,同样,$N$ 的行和列对应于 $\Gamma$ 的元素。
这部分提出了一个新的问题:如果对多体系统的操作本身是“独立”的,那该如何描述?
本段提出了“独立操作”这个新情景。它指的是对多体系统的每个子系统分别施加各自的、互不影响的操作。如果每个子操作都由一个“小”随机矩阵(如 $M, N$)描述,那么描述整个独立操作组合的那个“大”联合操作矩阵应该是什么?这个问题引出了对矩阵张量积的需求。
本段的目的是为了与之前讨论的“独立状态”形成完美的对偶和类比。
通过这种类比,它自然地引出“联合操作矩阵 = 子操作矩阵的张量积”这一结论。这再次展示了张量积作为描述“组合独立系统”的核心数学工具的普适性和强大能力。
这就像一个工厂有两条独立的生产线。
想象你在用图像处理软件同时编辑一张大图的左右两个部分。
📜 [原文47]
矩阵
和
的张量积 $M\otimes N$ 是矩阵
等效地,$M$ 和 $N$ 的张量积由方程
对 $a,b\in\Sigma$ 和 $c,d\in\Gamma$ 的每种选择都成立来定义。
这部分定义了矩阵的张量积,其形式与向量的张量积高度相似。
这个定义可以通过张量积的双线性和 $(A\otimes B)(C\otimes D)=(AC)\otimes(BD)$ 的性质来推导。
$(|a\rangle\langle b|) \otimes (|c\rangle\langle d|) = (|a\rangle\otimes|c\rangle)(\langle b|\otimes\langle d|)$ (这是一个需要证明的性质)
$= |ac\rangle \langle bd|$ (行向量的张量积 $\langle b|\otimes\langle d| = \langle bd|$ )
$M \otimes N = (\sum \alpha_{ab}|a\rangle\langle b|) \otimes (\sum \beta_{cd}|c\rangle\langle d|)$
利用双线性(多线性)展开这个求和:
$= \sum \sum \alpha_{ab}\beta_{cd} (|a\rangle\langle b|) \otimes (|c\rangle\langle d|)$
$= \sum \sum \alpha_{ab}\beta_{cd} |ac\rangle\langle bd|$。
这是最直接的定义。它告诉我们如何计算张量积矩阵的每一个元素。
$\langle 0|M|1\rangle \times \langle 1|N|0\rangle$
$= (M_{01}) \times (N_{10})$
$= 1 \times 0 = 0$。
本段给出了矩阵张量积的两种等价定义。一种是基于外积求和的构造性定义,它在理论推导中很有用。另一种是基于矩阵元素的查询式定义,它揭示了联合矩阵的元素是如何由子矩阵元素通过乘法得到的。这两种定义都与向量张量积的定义在结构上高度平行。
本段的目的是为“独立操作”提供其对应的数学语言。就像向量张量积用来组合独立状态一样,矩阵张量积就是用来组合独立操作的工具。提供了这个定义之后,我们就可以把“对子系统分别进行操作”这个物理过程,精确地翻译成一个单一的、作用于联合系统的张量积矩阵。
这就像是两个函数的组合。
想象你在设计一个“自动穿搭”程序。
📜 [原文48]
描述 $M\otimes N$ 的另一种但等效的方法是,它是满足方程的唯一矩阵
对于向量 $\vert\phi\rangle$ 和 $\vert\psi\rangle$ 的每种可能选择都成立,假设 $\vert\phi\rangle$ 的索引对应于 $\Sigma$ 的元素,且 $\vert\psi\rangle$ 的索引对应于 $\Gamma$ 的元素。
这部分给出了矩阵张量积的第三种、也是从物理和应用角度看最重要的一种定义。
这个公式是张量积最重要的性质之一。让我们用基向量来验证它。
$(M\otimes N) ( |b\rangle \otimes |d\rangle ) = (M\otimes N) |bd\rangle$
$= (\sum_{a,c} \langle ac|M\otimes N|b'd'\rangle |ac\rangle\langle b'd'|) |bd\rangle$
$= \sum_{a,c} \langle ac|M\otimes N|bd\rangle |ac\rangle$
$= \sum_{a,c} \langle a|M|b\rangle \langle c|N|d\rangle |ac\rangle$
$(M|b\rangle) \otimes (N|d\rangle)$
$= (\sum_a \langle a|M|b\rangle |a\rangle) \otimes (\sum_c \langle c|N|d\rangle |c\rangle)$
利用双线性展开:
$= \sum_{a,c} (\langle a|M|b\rangle \langle c|N|d\rangle) (|a\rangle \otimes |c\rangle)$
$= \sum_{a,c} \langle a|M|b\rangle \langle c|N|d\rangle |ac\rangle$
本段给出了矩阵张量积的第三种、也是最符合物理直觉的定义:联合操作 $M\otimes N$ 是那个唯一的、能够满足“作用于独立输入态等于独立输出态的组合”这一行为准则的矩阵。这个定义将独立操作的物理图像与张量积的数学形式完美地统一了起来。
本段的目的是提供一个更高级、更概念化的视角来理解矩阵的张量积。相比于前两种基于元素和系数的“微观”定义,这第三种定义是“宏观”的,它从操作如何变换向量的层面来定义自身。这种通过行为和性质来定义对象的思想,在现代数学和物理中非常普遍。对于物理学家来说,这通常是最有用的定义,因为它直接与物理过程(独立地进行操作)相对应。
这就像一个公司的管理原则。
想象你在用代码写一个函数。
operate_XY_jointly( tensor_product(state_X, state_Y) )
必须总是等于
tensor_product( operate_X(state_X), operate_Y(state_Y) )。
📜 [原文49]
遵循前面描述的对笛卡尔积元素排序的惯例,我们也可以将两个矩阵的张量积明确地写成如下形式:
这部分给出了矩阵张量积的具体计算方法,即克罗内克积 (Kronecker Product),其形式与向量的计算方法完全平行。
我在原文的公式中补上了一个中间步骤,以便看得更清楚。
这清楚地展示了块矩阵的结构。这个定义与前面基于元素 $\langle ac|M\otimes N|bd\rangle = \langle a|M|b\rangle\langle c|N|d\rangle$ 的定义是等价的,前提是我们遵循字母顺序排序。
$= \begin{pmatrix} 0 \cdot N & 1 \cdot N \\ 1 \cdot N & 0 \cdot N \end{pmatrix}$
$= \begin{pmatrix} \begin{pmatrix}0&0\\0&0\end{pmatrix} & \begin{pmatrix}1&0\\0&1\end{pmatrix} \\ \begin{pmatrix}1&0\\0&1\end{pmatrix} & \begin{pmatrix}0&0\\0&0\end{pmatrix} \end{pmatrix}$
$\begin{pmatrix}
0&0&1&0 \\
0&0&0&1 \\
1&0&0&0 \\
0&1&0&0
\end{pmatrix}$
$= \begin{pmatrix} 1 \cdot N & 0 \cdot N \\ 0 \cdot N & 0 \cdot N \end{pmatrix} = \begin{pmatrix} N & \mathbf{0} \\ \mathbf{0} & \mathbf{0} \end{pmatrix}$ (这里0是零矩阵)
$= \begin{pmatrix}
1&2&0&0 \\
3&4&0&0 \\
0&0&0&0 \\
0&0&0&0
\end{pmatrix}$
本段给出了计算矩阵张量积的具体算法——克罗内克积。它将一个张量积运算分解为一个由标量与矩阵相乘构成的、分块的构造过程。这个方法直观、机械,非常适合在计算机上编程实现,并且其结果与基于字母顺序的理论定义完全吻合。
本段的目的是将矩阵张量积从抽象定义落实到具体计算。它为我们提供了一个“铅笔和纸”的方法,来实际地写出任意两个子操作矩阵所对应的联合操作矩阵。这是连接理论和实践的关键一步。
这就像是一个“分形”或“自相似”的构造过程。
想象你在电脑屏幕上平铺一个窗口。
📜 [原文50]
三个或更多矩阵的张量积以类似的方式定义。
如果 $M_0, \ldots, M_{n-1}$ 是索引对应于经典状态集 $\Sigma_0,\ldots,\Sigma_{n-1}$ 的矩阵,那么张量积 $M_{n-1}\otimes\cdots\otimes M_0$ 由以下条件定义
对于经典状态 $a_0,b_0\in\Sigma_0,\ldots,a_{n-1},b_{n-1}\in\Sigma_{n-1}$ 的每种选择都成立。
或者,三个或更多矩阵的张量积可以递归定义,根据两个矩阵的张量积来定义,类似于我们对向量所观察到的。
这部分将矩阵张量积推广到n个矩阵的情况。
这两个定义是平行的,并且都与n-向量张量积的定义方式一致。克罗内克积的计算方法也可以递归地应用。
$= \begin{pmatrix} \mathbf{0}_{4\times4} & (\text{结果1}) \\ (\text{结果1}) & \mathbf{0}_{4\times4} \end{pmatrix} = \begin{pmatrix}
0&0&0&0 & 1&1&0&0 \\
0&0&0&0 & 0&0&0&0 \\
0&0&0&0 & 0&0&1&1 \\
0&0&0&0 & 0&0&0&0 \\
1&1&0&0 & 0&0&0&0 \\
0&0&0&0 & 0&0&0&0 \\
0&0&1&1 & 0&0&0&0 \\
0&0&0&0 & 0&0&0&0
\end{pmatrix}$。
本段将矩阵张量积的定义从2个矩阵推广到n个矩阵,提供了“元素定义”和“递归定义”两种方式,并指出其“可结合”的实用性质。
📜 [原文51]
矩阵的张量积有时被称为具有可乘性,因为方程
总是成立的,对于矩阵 $M_0,\ldots,M_{n-1}$ 和 $N_0\ldots,N_{n-1}$ 的任何选择,前提是乘积 $M_0 N_0, \ldots, M_{n-1} N_{n-1}$ 有意义。
这部分介绍了矩阵张量积的另一个极其重要的代数性质:可乘性 (Multiplicativity)。
我们来证明2x2的情况。
$(M\otimes N)(P\otimes Q) (|\phi\rangle\otimes|\psi\rangle)$
$= (M\otimes N) [ (P|\phi\rangle) \otimes (Q|\psi\rangle) ]$ (根据定义(3))
令 $|\phi'\rangle = P|\phi\rangle, |\psi'\rangle = Q|\psi\rangle$。
$= (M\otimes N) (|\phi'\rangle\otimes|\psi'\rangle)$
$= (M|\phi'\rangle) \otimes (N|\psi'\rangle)$ (再次用定义(3))
$= (M(P|\phi\rangle)) \otimes (N(Q|\psi\rangle))$
$= ((MP)|\phi\rangle) \otimes ((NQ)|\psi\rangle)$ (矩阵乘法结合律)
$[(MP)\otimes(NQ)] (|\phi\rangle\otimes|\psi\rangle)$
$= ((MP)|\phi\rangle) \otimes ((NQ)|\psi\rangle)$ (根据定义(3) )
本段介绍了矩阵张量积的可乘性质:张量积的乘积等于乘积的张量积。这个性质极大地简化了对连续独立操作的分析和计算,允许我们将高维空间的矩阵运算分解到低维子空间中进行。
📜 [原文52]
我们现在可以回答之前提出的问题:
如果 $M$ 是 $\mathsf{X}$ 上的概率操作,$N$ 是 $\mathsf{Y}$ 上的概率操作,并且这两个操作是独立执行的,那么在复合系统 $(\mathsf{X},\mathsf{Y})$ 上产生的操作就是张量积 $M\otimes N$。
因此,对于概率状态和概率操作,张量积都代表了独立性。
如果我们有两个系统 $\mathsf{X}$ 和 $\mathsf{Y}$,它们独立地处于概率状态 $\vert\phi\rangle$ 和 $\vert\pi\rangle$,那么复合系统 $(\mathsf{X},\mathsf{Y})$ 就处于概率状态 $\vert\phi\rangle\otimes\vert\pi\rangle$;
并且如果我们独立地对这两个系统应用概率操作 $M$ 和 $N$,那么在复合系统 $(\mathsf{X},\mathsf{Y})$ 上产生的动作就由操作 $M\otimes N$ 描述。
这部分是对之前所有关于独立性和张量积讨论的一个总结陈词。
本段明确指出,张量积是描述“独立”这一物理概念的统一数学工具。无论是组合独立的状态,还是组合独立的操作,都通过张量积来完成。独立联合状态是子状态的张量积,独立联合操作是子操作的张量积。
📜 [原文53]
让我们看一个例子,它回想了上一课中单个比特上的概率操作:
如果该比特的经典状态为 $0$,则不予理会;如果该比特的经典状态为 $1$,则以 $1/2$ 的概率将其翻转为 0。
我们观察到此操作由矩阵表示
如果此操作在一个比特 $\mathsf{X}$ 上执行,并且(独立地)在第二个比特 $\mathsf{Y}$ 上执行一个 NOT 操作,那么在复合系统 $(\mathsf{X},\mathsf{Y})$ 上的联合操作具有矩阵表示
通过检查,我们看到这是一个随机矩阵。
情况将总是如此:两个或更多随机矩阵的张量积始终是随机的。
这是一个计算独立操作的联合矩阵的具体例子。
$M\otimes N = \begin{pmatrix} 1 \cdot N & \frac{1}{2} \cdot N \\ 0 \cdot N & \frac{1}{2} \cdot N \end{pmatrix} = \begin{pmatrix} \begin{pmatrix}0&1\end{pmatrix} & \begin{pmatrix}0&1/2\\1/2&0\end{pmatrix} \\ \begin{pmatrix}0&0\\0&0\end{pmatrix} & \begin{pmatrix}0&1/2\\1/2&0\end{pmatrix} \end{pmatrix}$
📜 [原文54]
我们遇到的一种常见情况是,在一个系统上执行一个操作,而对另一个系统什么都不做。
在这种情况下,遵循完全相同的规定,记住“什么都不做”由单位矩阵表示。
例如,将比特 $\mathsf{X}$ 重置为 $0$ 状态而对 $\mathsf{Y}$ 什么都不做,在 $(\mathsf{X},\mathsf{Y})$ 上产生的概率(事实上是确定性)操作由矩阵表示
这部分讨论了一种特殊的、但非常常见的独立操作:只操作一个子系统,其他子系统保持不变。
$M\otimes I = \begin{pmatrix}1&1\\0&0\end{pmatrix} \otimes \begin{pmatrix}1&0\\0&1\end{pmatrix}$
$= \begin{pmatrix} 1\cdot I & 1\cdot I \\ 0\cdot I & 0\cdot I \end{pmatrix} = \begin{pmatrix} I & I \\ \mathbf{0} & \mathbf{0} \end{pmatrix}$
$= \begin{pmatrix} \begin{pmatrix}1&0\\0&1\end{pmatrix} & \begin{pmatrix}1&0\\0&1\end{pmatrix} \\ \begin{pmatrix}0&0\\0&0\end{pmatrix} & \begin{pmatrix}0&0\\0&0\end{pmatrix} \end{pmatrix}$
$\begin{pmatrix} 1&0&1&0 \\ 0&1&0&1 \\ 0&0&0&0 \\ 0&0&0&0 \end{pmatrix}$。
$M\otimes I \begin{pmatrix}0\\0\\1\\0\end{pmatrix} = \begin{pmatrix}1&0&1&0\\0&1&0&1\\0&0&0&0\\0&0&0&0\end{pmatrix}\begin{pmatrix}0\\0\\1\\0\end{pmatrix} = \begin{pmatrix}1\\0\\0\\0\end{pmatrix}$
这个结果是 $|00\rangle$。这与我们的逻辑推导 10 -> 00 是一致的。
这个结果是 $|01\rangle$。这与我们的逻辑推导 11 -> 01 是一致的。
本段通过一个具体例子,阐明了如何表示“只对部分子系统进行操作”这一常见情景。其方法是将未被操作的子系统视为执行了单位操作(由单位矩阵 $I$ 表示),然后与其他子系统的操作矩阵进行张量积。
1. 两个系统的笛卡尔积定义:
这个公式定义了两个集合的笛卡尔积,它是由所有可能的有序对组成的集合,其中有序对的第一个元素来自第一个集合,第二个元素来自第二个集合。
2. n个系统的笛卡尔积定义:
这是对两个系统笛卡尔积的推广,定义了n个集合的笛卡尔积是由所有可能的n元组构成的集合。
3. Qiskit惯例下的经典状态:
这个公式展示了在从右到左、从0开始索引的惯例下,一个n系统复合状态的表示形式。
4. 10比特系统的状态集:
定义了10个比特系统中每个比特的状态集都是{0,1}。
5. 10比特系统的复合状态空间:
说明10个比特的复合状态空间是{0,1}的10次笛卡尔积,简写为$\{0,1\}^{10}$。
6. 10比特系统经典状态示例列表:
以字符串形式列出了10比特系统的一些经典状态,展示了从0到1023的二进制表示。
7. 相关性的2比特概率状态示例:
给出了一个具体的2比特联合概率分布,其中两个比特的状态总是相同的,这是一个典型的相关状态。
8. 相关状态的概率向量表示:
将上述的相关概率状态用一个4维的列向量来表示,并标注了每个分量对应的状态。
9. 独立性的数学定义:
给出了两个系统相互独立的严格数学定义:联合概率等于边际概率的乘积。
10. 狄拉克符号表示的联合概率向量:
引入了使用狄拉克符号(ket向量)来表示一个联合概率向量,作为标准基向量的线性组合。
11. 狄拉克符号表示的子系统概率向量:
用狄拉克符号分别表示两个子系统的概率向量。
12. 独立性的系数形式:
将独立性条件用向量系数的形式表达:联合概率向量的系数等于子系统概率向量系数的乘积。
13. 一个独立的概率状态示例:
给出了一个可以分解为两个独立子系统概率状态的联合概率向量的例子。
14. 上述独立状态的子系统分解:
展示了上一个例子中的联合概率向量是如何由两个更简单的子系统概率向量构成的。
15. 相关状态的狄拉克表示法:
用狄拉克符号和省略零项的方式,简洁地表示了之前那个典型的相关状态。
16. 证明相关性所用的关键方程:
在反证法中,从联合概率为0的状态出发,推导出边际概率乘积也必须为0。
17. 向量张量积的定义:
给出了两个向量张量积的构造性定义:新向量的系数是原向量系数的乘积。
18. 向量张量积的等效定义:
用bra-ket内积的形式给出了张量积的等效定义,强调了分量之间的关系。
19. 独立性的张量积表述:
用一个简洁的向量方程重新定义了独立性:联合状态是独立(乘积态),当且仅当它可以写成子状态的张量积。
20. 向量张量积的克罗内克积形式:
给出了计算两个列向量张量积的具体算法,即克罗内克积。
21. 基向量的张量积:
指出了一个关键规则:子系统标准基向量的张量积等于复合系统的标准基向量。
22. 张量积的双线性(对第一个参数):
展示了张量积对第一个输入参数满足可加性和齐次性(分配律)。
23. 张量积的双线性(对第二个参数):
展示了张量积对第二个输入参数也满足可加性和齐次性。
24. 标量在张量积中的自由浮动性质:
总结了齐次性带来的便利:标量乘子可以自由移动,使得表达式可以无歧义地简化。
25. n系统乘积态的定义:
将乘积态的定义推广到n个系统,即联合状态是n个子系统状态的张量积。
26. n系统张量积的元素定义:
给出了n系统张量积向量的任意一个系数的计算方法。
27. n系统张量积的递归定义:
提供了一种等效的递归方法来定义和计算n系统张量积,体现了其结合性。
28. n系统基向量的张量积:
将基向量张量积的规则推广到n个系统。
29. 边际概率(约化概率)公式:
定义了如何从联合概率分布计算一个子系统的边际概率,即对另一个系统的所有状态求和。
30. 条件概率公式:
定义了条件概率,即在已知一个事件发生的条件下,另一个事件发生的概率。
31. 联合概率向量的狄拉克表示:
用系数和基向量的形式表示一个联合概率向量。
32. 部分测量概率的系数形式:
将边际概率公式用联合概率向量的系数来表示。
33. 边际概率向量:
展示了如何从联合概率系数构造一个子系统的边际概率向量。
34. 条件概率向量的定义:
给出了计算部分测量后未测量系统的新状态向量(条件概率向量)的公式,包含“切片”和“归一化”两个步骤。
35. 部分测量例子的初始状态:
提供了一个由一个比特和一个三态系统组成的复合系统的具体概率状态,用于演练部分测量。
36. 初始状态的代数重写形式:
将初始状态向量按照被测系统(第一个比特)的基向量进行分解和重写,使部分测量的分析更直观。
37. 部分测量概率的计算:
根据重写后的向量形式,计算测量第一个比特得到0或1的边际概率。
38. 测量X=0后Y的状态更新:
计算当测得X=0时,对Y的未归一化向量进行归一化,得到Y的新的条件概率向量。
39. 测量X=1后Y的状态更新:
计算当测得X=1时,对Y的未归一化向量进行归一化,得到Y的另一个新的条件概率向量。
40. CNOT(X,Y)操作矩阵:
给出了当第一个比特X为控制位,第二个比特Y为目标位时的受控非门(CNOT)的4x4矩阵表示。
41. CNOT(X,Y)对基态的作用:
用映射关系展示了CNOT(X,Y)门如何变换四个标准基态。
42. CNOT(Y,X)操作矩阵:
给出了当第二个比特Y为控制位,第一个比特X为目标位时的CNOT门的矩阵表示,它与前一个矩阵不同。
43. CNOT(Y,X)对基态的作用:
用映射关系展示了CNOT(Y,X)门的操作逻辑。
44. 一个随机操作的矩阵:
给出了一个非确定性操作的随机矩阵,并展示了它如何由两个确定性子操作的矩阵加权平均得到。
45. 随机操作对基态的作用:
展示了一个确定性的输入如何通过一个随机操作演化为一个不确定的概率状态。
46. 3比特加法器的外积求和表示:
用外积求和的形式详细描述了一个3比特模8加法器操作,每一项代表一个状态转移。
47. 3比特加法器的紧凑求和表示:
用一个紧凑的求和公式来表示同一个模8加法器操作。
48. 3比特加法器的矩阵表示:
给出了模8加法器操作的8x8矩阵形式,这是一个循环置换矩阵。
49. 矩阵M的外积求和表示:
用外积求和的形式定义一个通用矩阵M,其元素为 $\alpha_{ab}$。
50. 矩阵N的外积求和表示:
用外积求和的形式定义一个通用矩阵N,其元素为 $\beta_{cd}$。
51. 矩阵张量积的构造性定义:
通过组合子矩阵的外积表示来定义矩阵张量积。
52. 矩阵张量积的元素定义:
通过定义联合矩阵的元素等于子矩阵元素的乘积,来等效地定义矩阵张量积。
53. 矩阵张量积的行为定义:
通过张量积矩阵作用在乘积态上的行为来定义它,这最符合独立操作的物理直觉。
54. 矩阵张量积的克罗内克积形式:
给出了计算两个矩阵张量积的具体分块算法,即克罗内克积。
55. n矩阵张量积的元素定义:
将矩阵张量
的元素定义推广到n个矩阵。
56. 张量积的可乘性:
指出了张量积的关键性质:张量积的乘积等于乘积的张量积,极大地简化了运算。
57. 一个单比特随机操作的矩阵:
给出了一个非确定性单比特操作的随机矩阵例子。
58. 两个独立操作的联合矩阵:
通过克罗内克积计算了由一个随机操作和一个NOT操作组成的独立联合操作的4x4随机矩阵。
59. 只操作部分子系统的联合矩阵:
演示了如何通过与单位矩阵进行张量积,来表示只对一个子系统进行操作(另一个不变)的联合操作。