2.量子力学基础

我不是物理学家,但我知道什么是最重要的。 ——《Popeye 航海家》 量子力学:真正的黑色魔法演算。 ——阿尔伯特•爱因斯坦 量子力学是对已知世界最精确而完整的描述。它也是理解量子计算和量子信息的基础。本章将介绍完全理解量子计算和量子信息所需要的量子力学背景知识,并不假设读者已有量子力学知识。

尽管量子力学以难懂闻名,但它很容易学。它的这种名声在于它在某些应用方面的困难,像理解复杂的分子结构,不过这不是掌握这门学科的基础,我们不打算讨论这类应用。理解这门学科的唯一前提是熟悉一些基本的线性代数知识。只要有这方面的背景知识,你就可以用几个小时解决一些简单的问题,即使没有量子力学的先验知识。

已经熟悉量子力学的读者可以速读这一章,熟悉我们常用的标准符号,以确保自己熟悉所有的材料。对量子力学了解一点或不了解的读者应该精读这一章,尝试着做后边的习题。如果做题时遇到困难,继续往下读,然后再回头尝试解决它。

本章 2.1 节以对所需线性代数知识的回顾开始。本节假设读者熟悉基本的线性代数知识,只不过引人了一些物理学家描述量子力学用的记号,这些记号不同于大多数介绍线性代数知识的材料所用。 2.2 节描述量子力学基本公设。完成这一节后,你将会理解所有的量子力学基本原理。这一节设计了一些简单的习题,以帮助你巩固对材料的理解。本章及本书剩余的部分不再介绍新的物理原理,都是基于这些原理来阐述的。 2.3 节解释了量子信息处理中的超密编码(superdense coding),这是个令人吃惊的富于启发性的例子,它以一种简单的方式融合了许多量子力学原理。 2.4 节和 2.5 节介绍了密度算子,纯化(purification)和施密特分解这些强大的数学工具——它们在量子计算和量子信息的研究中极其有用。理解这些工具将有助于你加深对基本量子力学的理解。最后, 2.6 节考察量子力学如何超越对世界运行方式的经典理解的问题。

2.1 线性代数

> 本书带来的烦恼不亚于所传授的知识。 > Banesh Hoffmann 所著 About Vectors 第一行

人生好比复数——它既有实部又有虚部。 ——无名氏

线性代数研究线性空间及其上的线性算子。牢固掌握基本线性代数知识是理解好量子力学的基础。本节我们复习线性代数的一些基本概念,并给出在量子力学中使用这些概念的标准记号。图 2-1 总结了这些记号,其中量子记号在左栏,线性代数说明在右栏。你可以浏览一下这个表,看看右栏中的概念认识多少。

在我们看来,认同量子力学公设的主要障碍不是公设本身,而是为理解它们所需要的大量的线性代数概念。再加上量子力学中被物理学家采用的不常用的狄拉克(Dirac)记号,它可能看起来(其实不然)相当可怕。基于这些原因,我们建议不熟悉量子力学的读者很快读完接下来的材料,只在集中理解将要用到的最基础的记号时稍作停留。接着认真学习本章的主题——量子力学基本公设,等到必要时再回头深人学习所需的线性代数概念和记号。

线性代数的基本概念是向量空间(vector space)。我们最感兴趣的向量空间是所有 $n$ 元复数组成的向量空间 $\mathbb{C}^{n}$ 。向量空间的元素称为向量,我们有时用列矩阵记号

$$ \left[\begin{array}{c} z_{1} \tag{2.1}\\ \vdots \\ z_{n} \end{array}\right] $$

来表示向量。存在加法运算,可以把一对向量变成其他向量。 $\mathbb{C}^{n}$ 上的向量加法运算定义为

$$ \left[\begin{array}{c} z_{1} \tag{2.2}\\ \vdots \\ z_{n} \end{array}\right]+\left[\begin{array}{c} z_{1}^{\prime} \\ \vdots \\ z_{n}^{\prime} \end{array}\right] \equiv\left[\begin{array}{c} z_{1}+z_{1}^{\prime} \\ \vdots \\ z_{n}+z_{n}^{\prime} \end{array}\right] $$

其中,右边的加法运算就是通常的复数加法。进一步,向量空间中存在标量乘运算。 $\mathbb{C}^{n}$ 上的这个运算定义为

$$ z\left[\begin{array}{c} z_{1} \tag{2.3}\\ \vdots \\ z_{n} \end{array}\right] \equiv\left[\begin{array}{c} z z_{1} \\ \vdots \\ z z_{n} \end{array}\right] $$

其中,$z$ 是标量,也就是复数,并且右边的乘法就是通常的复数乘法。物理学家有时把复数称为 $c$ 数。

量子力学是我们研究线性代数知识的主要动机,因此,对于这些线性代数概念我们将使用量

子力学的标准记号。向量空间中向量的标准量子力学记号为

$$ \begin{equation*} |\psi\rangle \tag{2.4} \end{equation*} $$

$\psi$ 是向量的标签(任意的标签都是有效的,尽管我们喜欢用像 $\psi$ 和 $\varphi$ 这样的简单标签)。记号 $|\cdot\rangle$ 用来表示其中的对象是向量。整个对象 $|\psi\rangle$ 有时称为一个 ket,尽管我们不太常用这个术语。

向量空间也包含一个特殊的零向量,我们用 0 表示。它满足以下性质:对任意其他向量 $|v\rangle$ , $|v\rangle+0=|v\rangle$ 。注意,对于零向量,我们不用 ket——它是我们唯一的例外。这个例外的原因是传统上用 $|0\rangle$ 完全可以表示其他的事情。对于任意的复数 $z$ ,标量乘运算使得 $z 0=0$ 。为了方便起见,我们用符号 $\left(z_{1}, \cdots, z_{n}\right)$ 表示项为 $z_{1}, \cdots, z_{n}$ 的列矩阵。 $\mathbb{C}^{n}$ 的零元是 $(0, \cdots, 0)$ 。向量空间 $V$的一个向量子空间是 $V$ 的一个子集 $W$ ,满足:$W$ 也是一个向量空间,也就是 $W$ 必须对标量乘和加法运算封闭。

符号 描述
$z^{*}$ 复数$z$ 的复共轭。 $(1+\mathrm{i})^{*}=1-\mathrm{i}$
$|\psi\rangle$ 向量,也称为 ket
$\langle\psi|$ $|\psi\rangle$ 的对偶向量,也称为 bra
$\langle\varphi \mid \psi\rangle$ 向量$|\varphi\rangle$ 和 $|\psi\rangle$ 的内积
$|\varphi\rangle \otimes|\psi\rangle$ $|\varphi\rangle$ 和 $|\psi\rangle$ 的张量积
$|\varphi\rangle|\psi\rangle$ $|\varphi\rangle$ 和 $|\psi\rangle$ 张量积的缩写
$A^{*}$ 矩阵$A$ 的复共轭
$A^{\mathrm{T}}$ 矩阵$A$ 的转置
$A^{\dagger}$ 矩阵$A$ 的厄米共轭或伴随,$A^{\dagger}=\left(A^{\mathrm{T}}\right)^{*} \circ\left[\begin{array}{ll}a & b \\ c & d\end{array}\right]^{\dagger}=\left[\begin{array}{ll}a^{*} & c^{*} \\ b^{*} & d^{*}\end{array}\right]$
$\langle\varphi| A|\psi\rangle$ $|\varphi\rangle$ 和 $A|\psi\rangle$ 的内积。等价地,$A^{\dagger}|\varphi\rangle$ 和 $|\psi\rangle$ 的内积

图 2-1 一些线性代数概念在量子力学中的标准记号的总结。这些就是 Dirac 记号

2.1.1 基和线性无关性

向量空间的生成集是向量集 $\left|v_{1}\right\rangle, \cdots,\left|v_{n}\right\rangle$ ,则该向量空间中任意一个向量 $|v\rangle$ 都可以写成该向量集中向量的线性组合 $|v\rangle=\sum_{i} a_{i}\left|v_{i}\right\rangle_{\circ}$ 例如,向量空间 $\mathbb{C}^{2}$ 的生成集是

$$ \left|v_{1}\right\rangle \equiv\left[\begin{array}{l} 1 \tag{2.5}\\ 0 \end{array}\right] ; \quad\left|v_{2}\right\rangle \equiv\left[\begin{array}{l} 0 \\ 1 \end{array}\right] $$

由于向量空间 $\mathbb{C}^{2}$ 中的任意向量

$$ |v\rangle=\left[\begin{array}{l} a_{1} \tag{2.6}\\ a_{2} \end{array}\right] $$

量空间 $\mathbb{C}^{2}$ 。

一般地,一个向量空间可以有不同的生成集。向量空间 $\mathbb{C}^{2}$ 的第二个生成集是

$$ \left|v_{1}\right\rangle \equiv \frac{1}{\sqrt{2}}\left[\begin{array}{l} 1 \tag{2.7}\\ 1 \end{array}\right] ; \quad\left|v_{2}\right\rangle \equiv \frac{1}{\sqrt{2}}\left[\begin{array}{c} 1 \\ -1 \end{array}\right] $$

由于任意的向量 $|v\rangle=\left(a_{1}, a_{2}\right)$ 可以写成 $\left|v_{1}\right\rangle$ 和 $\left|v_{2}\right\rangle$ 的线性组合,

$$ \begin{equation*} |v\rangle=\frac{a_{1}+a_{2}}{\sqrt{2}}\left|v_{1}\right\rangle+\frac{a_{1}-a_{2}}{\sqrt{2}}\left|v_{2}\right\rangle \tag{2.8} \end{equation*} $$

对于非零向量集 $\left|v_{1}\right\rangle, \cdots,\left|v_{n}\right\rangle$ ,若存在一个复数集合 $a_{1}, \cdots, a_{n}$ ,其中至少一个 $a_{i} \neq 0$ ,使得

$$ \begin{equation*} a_{1}\left|v_{1}\right\rangle+a_{2}\left|v_{2}\right\rangle+\cdots+a_{n}\left|v_{n}\right\rangle=0 \tag{2.9} \end{equation*} $$

则称其是线性相关的。若它不是线性相关的,则称其线性无关。可以证明,任意两个张成向量空间的无关组所含元素的个数是相同的。我们称这种集合为向量空间 $V$ 的一组基。进一步讲,这种基总是存在的。基中的元素个数称为向量空间的维数。本书中我们仅对有限维向量空间感兴趣。在无限维向量空间中有许多有趣和困难的问题。我们不需要担心这些问题。

习题 2.1 (线性相关:例子)证明 $(1,-1),(1,2),(2,1)$ 是线性相关的。

2.1.2 线性算子和矩阵

向量空间 $V$ 和 $W$ 之间的线性算子(linear operator)定义为对输人具有线性性质的映射 $A$ : $V \rightarrow W$ :

$$ \begin{equation*} A\left(\sum_{i} a_{i}\left|v_{i}\right\rangle\right)=\sum_{i} a_{i} A\left(\left|v_{i}\right\rangle\right) \tag{2.10} \end{equation*} $$

通常将 $A(|v\rangle)$ 写成 $A|v\rangle$ 。当我们说定义在线性空间 $V$ 上的线性算子 $A$ 时,意味着 $A$ 是一个从 $V$ 到 $V$ 的线性算子。在任意向量空间 $V$ 上,一个重要的线性算子是恒等算子(identity operator), $I_{V}$ ,定义为对任意的向量 $|v\rangle, I_{V}(|v\rangle)=|v\rangle$ 。在不会出现混淆时,我们丢弃下标 $V$ 仅用 $I$ 表示恒等算子。另一个重要的线性算子是零算子(zero operator),用 0 表示。零算子把所有的向量都映射为零向量,即 $0|v\rangle=0$ 。从式子(2.10)很容易看出,一旦线性算子在基上的行为确定,$A$ 在所有输人上的行为也就确定了。

假设 $V, W$ 和 $X$ 是向量空间,$A: V \rightarrow W, B: W \rightarrow X$ 是线性算子,则用符号 $B A$ 表示 $B$ 和 $A$ 的复合,定义为 $(B A)(|v\rangle) \equiv B(A(|v\rangle))$ 。同样地,我们将 $(B A)(|v\rangle)$ 缩写为 $B A|v\rangle$ 。

理解线性算子最便利的方式是通过其矩阵表示(matrix representation)。事实上,线性算子和矩阵是完全等价的。然而你可能更熟悉矩阵方式。为了弄清其联系,首先要理解 $m \times n$ 复矩阵 $A$ ,其元素为 $A_{i j}$ ,同向量 $\mathbb{C}^{n}$ 做矩阵乘法时,事实上是一个把向量从 $\mathbb{C}^{n}$ 空间映到 $\mathbb{C}^{m}$ 空间的线

性算子。更确切地,矩阵 $A$ 是线性算子的断言意味着

$$ \begin{equation*} A\left(\sum_{i} a_{i}\left|v_{i}\right\rangle\right)=\sum_{i} a_{i} A\left|v_{i}\right\rangle \tag{2.11} \end{equation*} $$

作为等式是正确的,其中运算是矩阵 $A$ 和列向量的乘积。很显然这是对的。 我们已经看到矩阵可以看作线性算子。线性算子能有矩阵表示吗?事实上是可以的,现在我们来解释。两种观点的等价使我们在全书中可以交替使用矩阵理论和算子理论的术语。假设 $A: V \rightarrow W$ 是向量空间 $V$ 和 $W$ 之间的线性算子。 $\left|v_{1}\right\rangle, \cdots,\left|v_{m}\right\rangle$ 是 $V$ 的一组基,$\left|w_{1}\right\rangle, \cdots,\left|w_{n}\right\rangle$是 $W$ 的一组基。则对 $1, \cdots, m$ 中任意的 $j$ 存在复数 $A_{1 j}$ 到 $A_{n j}$ ,使得

$$ \begin{equation*} A\left|v_{j}\right\rangle=\sum_{i} A_{i j}\left|w_{i}\right\rangle \tag{2.12} \end{equation*} $$

我们称这个元素为 $A_{i j}$ 的矩阵形成了算子 $A$ 的一个矩阵表示。 $A$ 的矩阵表示完全等价于算子 $A$ ,因而我们将交替使用矩阵和算子的概念。需要注意的是,为了建立矩阵和线性算子之间的联系,我们需要为线性算子的输人和输出向量空间各指定一组输人和输出基矢态。

习题2.2(矩阵表示:例子)假设 $V$ 是一个向量空间,基向量是 $|0\rangle$ 和 $|1\rangle$ 。 $A$ 是从 $V$ 到 $V$ 的线性算子,使得 $A|0\rangle=|1\rangle, A|1\rangle=|0\rangle$ 。按输入基 $|0\rangle$ 和 $|1\rangle$ 及输出基 $|0\rangle$ 和 $|1\rangle$ 给出 $A$ 的一个矩阵表示。找出可以使 $A$ 产生不同矩阵表示的输入和输出基。 习题 2.3 (算子乘积的矩阵表示)假设 $A$ 是一个从向量空间 $V$ 到向量空间 $W$ 的线性算子,$B$是从向量空间 $W$ 到向量空间 $X$ 的线性算子。令 $\left|v_{i}\right\rangle,\left|w_{j}\right\rangle$ 和 $\left|x_{k}\right\rangle$ 分别为向量空间 $V, W$ 和 $X$ 的基。证明线性变换 $B A$ 的矩阵表示是 $B$ 和 $A$ 在合适的基下矩阵表示的乘积。 习题 2.4 (恒等算子的矩阵表示)证明如果矩阵表示的输人和输出基相同,向量空间 $V$ 上的恒等算子的矩阵表示是对角线上的元素全为一,其余元素全为零。这个矩阵就是恒等矩阵(identity matrix )。

2.1.3 泡利矩阵

我们经常用到的 4 个极其有用的矩阵是泡利矩阵(Pauli matrix)。它们都是 $2 \times 2$ 矩阵,用不同的记号表示。这些矩阵及其对应的记号如图 2-2 所示。泡利矩阵在量子计算和量子信息研究中非常有用,因此鼓励大家通过详细研究后面几节中与之相关的大量例子和习题进行记忆。

$$ \begin{aligned} \sigma_{0} \equiv I \equiv\left[\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right] & \sigma_{1} \equiv \sigma_{x} \equiv X \equiv\left[\begin{array}{lr} 0 & 1 \\ 1 & 0 \end{array}\right] \\ \sigma_{2} \equiv \sigma_{y} \equiv Y \equiv\left[\begin{array}{rr} 0 & -\mathrm{i} \\ \mathrm{i} & 0 \end{array}\right] & \sigma_{3} \equiv \sigma_{z} \equiv Z \equiv\left[\begin{array}{rr} 1 & 0 \\ 0 & -1 \end{array}\right] \end{aligned} $$

图 2-2 泡利矩阵。有时省略掉 $I$ ,仅以 $X, Y, Z$ 表示泡利矩阵

2.1.4 内积

内积是从向量空间取两个向量 $|v\rangle$ 和 $|w\rangle$ 作为输人然后输出一个复数的函数。从现在开始,为了方便,$|v\rangle$ 和 $|w\rangle$ 的内积记为 $(|v\rangle,|w\rangle)$ 。这不是标准的量子力学记号;为了教学的清晰性,符号 $(\cdot, \cdot)$ 在本章偶尔会使用。内积 $(|v\rangle,|w\rangle)$ 的标准量子力学记号是 $\langle v \mid w\rangle$ ,其中 $|v\rangle$ 和 $|w\rangle$ 是内积空间的向量,记号 $\langle v|$ 是向量 $|v\rangle$ 的对偶向量;对偶是从内积空间 $V$ 映射到复数 $\mathbb{C}$ 的一个线性算子,其中 $\langle v|(|w\rangle) \equiv\langle v \mid w\rangle \equiv(|v\rangle,|w\rangle)$ 。我们很快将看到对偶向量的矩阵表示就是一个行向量。

一个从 $V \times V$ 到复数空间 $\mathbb{C}$ 的函数 $(\cdot, \cdot)$ ,如果满足下面的要求: 1.$(\cdot, \cdot)$ 对于第二个参数是线性的:

$$ \begin{equation*} \left(|v\rangle, \sum_{i} \lambda_{i}\left|w_{i}\right\rangle\right)=\sum_{i} \lambda_{i}\left(|v\rangle,\left|w_{i}\right\rangle\right) \tag{2.13} \end{equation*} $$

2.$(|v\rangle,|w\rangle)=(|w\rangle,|v\rangle)^{*}$ 3.$(|v\rangle,|v\rangle) \geqslant 0$ ,当且仅当 $|v\rangle=0$ 时等式成立。 则称函数 $(\cdot, \cdot)$ 是一个内积。例如, $\mathbb{C}^{n}$ 中的内积定义为

$$ \left(\left(y_{1}, \cdots, y_{n}\right),\left(z_{1}, \cdots, z_{n}\right)\right) \equiv \sum_{i} y_{i}^{*} z_{i}=\left[y_{1}^{*}, \cdots, y_{n}^{*}\right]\left[\begin{array}{c} z_{1} \tag{2.14}\\ \vdots \\ z_{n} \end{array}\right] $$

我们称定义了内积的向量空间为内积空间(inner product space)。 习题 2.5 验证上述定义的函数 $(\cdot, \cdot)$ 是 $\mathbb{C}^{n}$ 上的内积。 习题 2.6 证明任何内积函数 $(\cdot, \cdot)$ 关于第一个参数是共轭线性的。

$$ \begin{equation*} \left(\sum_{i} \lambda_{i}\left|w_{i}\right\rangle,|v\rangle\right)=\sum_{i} \lambda_{i}^{*}\left(\left|w_{i}\right\rangle,|v\rangle\right) \tag{2.15} \end{equation*} $$

量子力学的讨论总是关系到希尔伯特空间。在量子计算和量子信息中出现的有限维复向量空间中,希尔伯特空间和内积空间完全相同。从现在开始,我们交替使用这两个术语,较多用希尔伯特空间这个术语。在无限维度,希尔伯特空间满足内积空间之上和之外的技术限制,我们不需要担心。

如果向量 $|w\rangle$ 和 $|v\rangle$ 的内积是 0 ,那么它们是正交的(orthogonal)。例如,$|w\rangle \equiv(1,0)$ 和 $|v\rangle \equiv(0,1)$ 关于式(2.14)定义的内积是正交的。我们定义向量 $|v\rangle$ 的范数(norm)为

$$ \begin{equation*} ||v\rangle | \equiv \sqrt{\langle v \mid v\rangle} \tag{2.16} \end{equation*} $$

向量 $|v\rangle$ 若满足 $||v\rangle |=1$ ,则为单位向量。如果 $||v\rangle |=1$ ,则说 $|v\rangle$ 是正规化(normalized)的。简单来说,正规化一个向量就是用该向量除以它的范数;因此,对任意的向量 $|v\rangle,|v\rangle / ||v\rangle |$ 是 $|v\rangle$ 的正规化。对于一个向量集 $|i\rangle$ ,其中 $i$ 是指标,如果集合中的每一个向量都是单位向量,而且不同的向量之间是正交的,即 $\langle i \mid j\rangle=\delta_{i j}$ ,这里 $i, j$ 取自指标集,那么称该向量集为标准正交的(orthonormal)。

习题 2.7 证明 $|w\rangle \equiv(1,1)$ 和 $|v\rangle \equiv(1,-1)$ 是正交的。这些向量的正规化形式是什么? 假设 $\left|w_{1}\right\rangle, \cdots,\left|w_{d}\right\rangle$ 是某个内积向量空间 $V$ 的一组基。存在一个有用的方法——格拉姆-施密特正交化方法,可以产生向量空间 $V$ 的一组标准正交基 $\left|v_{1}\right\rangle, \cdots,\left|v_{d}\right\rangle_{\circ}$ 定义 $\left|v_{1}\right\rangle \equiv\left|w_{1}\right\rangle / |\left|w_{1}\right\rangle |$ ,并且对于 $1 \leqslant k \leqslant d-1$ ,归纳地定义

$$ \begin{equation*} \left|v_{k+1}\right\rangle \equiv \frac{\left|w_{k+1}\right\rangle-\sum_{i=1}^{k}\left\langle v_{i} \mid w_{k+1}\right\rangle\left|v_{i}\right\rangle}{|\left|w_{k+1}\right\rangle-\sum_{i=1}^{k}\left\langle v_{i} \mid w_{k+1}\right\rangle\left|v_{i}\right\rangle |} \tag{2.17} \end{equation*} $$

不难验证向量 $\left|v_{1}\right\rangle, \cdots,\left|v_{d}\right\rangle$ 形成一组标准正交集,也是向量空间 $V$ 的一组基。因此,任意维数为 $d$ 的有限维向量空间有一组标准正交基 $\left|v_{1}\right\rangle, \cdots,\left|v_{d}\right\rangle_{\circ}$ 习题 2.8 证明格拉姆-施密特正交化方法可以产生向量空间 $V$ 的一组标准正交基。 从现在起,当我们说一个线性算子的矩阵表示时,意味着关于标准正交输人和输出基的矩阵表示。我们还使用这样的约定:如果线性算子的输人和输出空间相同,那么输入和输出基相同,除非另有说明。

根据这些约定,希尔伯特空间的内积可以方便地用矩阵表示。令 $|w\rangle=\sum_{i} w_{i}|i\rangle,|v\rangle=$ $\sum_{j} v_{j}|j\rangle$ 为向量 $|w\rangle$ 和 $|v\rangle$ 在某组标准正交基下的表示。则由于 $\langle i \mid j\rangle=\delta_{i j}$ ,

$$ \begin{align*} \langle v \mid w\rangle & =\left(\sum_{i} v_{i}|i\rangle, \sum_{j} w_{j}|j\rangle\right)=\sum_{i j} v_{i}^{*} w_{j} \delta_{i j}=\sum_{i} v_{i}^{*} w_{i} \tag{2.18}\\ & =\left[v_{1}^{*} \cdots v_{n}^{*}\right]\left[\begin{array}{c} w_{1} \\ \vdots \\ w_{n} \end{array}\right] \tag{2.19} \end{align*} $$

也就是说,只要向量的矩阵表示按同一组标准正交基给出,两个向量的内积就等于向量矩阵表示的内积。我们也看到对偶向量 $\langle v|$ 作为行向量有一个好的解释,它的元素是向量 $|v\rangle$ 的列向量表示中对应分量的复共轭。

有一种表示线性算子的有用方式,充分地利用了内积,称为外积(outer product)表示。假设 $|v\rangle$ 是内积空间 $V$ 的一个向量,$|w\rangle$ 是内积空间 $W$ 的一个向量。定义 $|w\rangle\langle v|$ 为从 $V$ 到 $W$ 的一个线性算子,其作用为

$$ \begin{equation*} (|w\rangle\langle v|)\left(\left|v^{\prime}\right\rangle\right) \equiv|w\rangle\left\langle v \mid v^{\prime}\right\rangle=\left\langle v \mid v^{\prime}\right\rangle|w\rangle \tag{2.20} \end{equation*} $$

这个方程与我们的记号约定完美吻合,表达式 $|w\rangle\left\langle v \mid v^{\prime}\right\rangle$ 可能含有以下两种含义之一:我们用它表示算子 $|w\rangle\langle v|$ 作用在 $\left|v^{\prime}\right\rangle$ 上的结果,也可以解释为 $|w\rangle$ 被一个复数 $\left\langle v \mid v^{\prime}\right\rangle$ 相乘。我们选择的定义使得这两种潜在意思是一致的,事实上我们通过后者定义了前者!

我们可以用自然的方式取外积算子的线性组合。根据定义 $\sum_{i} a_{i}\left|w_{i}\right\rangle\left\langle v_{i}\right|$ 是线性算子,作用在 $\left|v^{\prime}\right\rangle$ 上,输出 $\sum_{i} a_{i}\left|w_{i}\right\rangle\left\langle v_{i} \mid v^{\prime}\right\rangle$ 。

外积记号的有用性可以从标准正交向量满足的完备性关系中看清楚。令 $|i\rangle$ 为向量空间 $V$ 的任意一组标准正交基,那么任意向量 $|v\rangle$ 可以写为 $|v\rangle=\sum v_{i}|i\rangle, v_{i}$ 是一组复数。注意到 $\langle i \mid v\rangle=v_{i}$ ,因此

$$ \begin{equation*} \left(\sum_{i}|i\rangle\langle i|\right)|v\rangle=\sum_{i}|i\rangle\langle i \mid v\rangle=\sum_{i} v_{i}|i\rangle=|v\rangle \tag{2.21} \end{equation*} $$

由于最后的等式对于任意的 $|v\rangle$ 成立,这等于说

$$ \begin{equation*} \sum_{i}|i\rangle\langle i|=I \tag{2.22} \end{equation*} $$

这个等式就是著名的完备性关系。完备性关系的一个应用是用外积的记号给出任意算子的表示方式。假设 $A: V \rightarrow W$ 是一个线性算子,$\left|v_{i}\right\rangle$ 是 $V$ 的一组标准正交基,$\left|w_{i}\right\rangle$ 是 $W$ 的一组标准正交基。运用两次完备性关系,可以得到

$$ \begin{align*} A & =I_{W} A I_{V} \tag{2.23}\\ & =\sum_{i j}\left|w_{j}\right\rangle\left\langle w_{j}\right| A\left|v_{i}\right\rangle\left\langle v_{i}\right| \tag{2.24}\\ & =\sum_{i j}\left\langle w_{j}\right| A\left|v_{i}\right\rangle\left|w_{j}\right\rangle\left\langle v_{i}\right| \tag{2.25} \end{align*} $$

这是 $A$ 的外积表示。从这个方程我们还看到,$A$ 的第 $i$ 列第 $j$ 行的矩阵元素为 $\left\langle w_{j}\right| A\left|v_{i}\right\rangle$ ,与输人基 $\left|v_{i}\right\rangle$ 和输出基 $\left|w_{i}\right\rangle$ 有关。

说明完备性关系有用的第二个应用是柯西-施瓦茨不等式。这个重要结果将在专题 2.1 中讨论。

习题2.9(泡利算子和外积)给定二维希尔伯特空间的一组标准正交基 $|0\rangle,|1\rangle$ ,泡利矩阵 (图 2-2)可以看作算子。使用外积记号表达泡利算子。 习题2.10 假设 $\left|v_{i}\right\rangle$ 是内积空间 $V$ 的一组标准正交基。关于基 $\left|v_{i}\right\rangle$ ,算子 $\left|v_{j}\right\rangle\left\langle v_{k}\right|$ 的矩阵表示是什么?

专题 2.1 柯西-施瓦茨不等式

柯西-施瓦茨不等式是关于希尔伯特空间的一个重要的几何事实。它规定对任意两个向量 $|v\rangle$ 和 $|w\rangle,|\langle v \mid w\rangle|^{2} \leqslant\langle v \mid v\rangle\langle w \mid w\rangle$ 。要看到这个结果,可以运用格拉姆-施密特方法构造向量空间的一组标准正交基,其中基 $|i\rangle$ 的第一个成员是 $|w\rangle / \sqrt{\langle w \mid w\rangle}$ 。运用完备性关系 $\sum_{i}|i\rangle\langle i|=I$ ,并且丢掉一些非负项得

$$ \begin{align*} \langle v \mid v\rangle\langle w \mid w\rangle & =\sum_{i}\langle v \mid i\rangle\langle i \mid v\rangle\langle w \mid w\rangle \tag{2.26}\\ & \geqslant \frac{\langle v \mid w\rangle\langle w \mid v\rangle}{\langle w \mid w\rangle}\langle w \mid w\rangle \tag{2.27}\\ & =\langle v \mid w\rangle\langle w \mid v\rangle=|\langle v \mid w\rangle|^{2} \tag{2.28} \end{align*} $$

很容易看到等式成立当且仅当 $|v\rangle$ 和 $|w\rangle$ 是线性相关的,即对于某个标量 $z,|v\rangle=z|w\rangle$或 $|w\rangle=z|v\rangle$ 。

2.1.5 特征向量和特征值

向量空间中线性算子 $A$ 的特征向量(本征向量)是一个非零向量 $|v\rangle$ ,使得 $A|v\rangle=v|v\rangle$ ,其中 $v$ 是一个复数,称为与 $A$ 的特征向量 $|v\rangle$ 对应的特征值(本征值)。同一个符号 $v$ ,既作为特征向量的标签又作为特征值使用,这往往很方便。我们假设读者熟悉特征值和特征向量的基本性质 ——特别是如何根据特征方程求出它们。特征函数定义为 $c(\lambda) \equiv \operatorname{det}|A-\lambda I|$ ,其中 $\operatorname{det}$ 是矩阵的行列式;可以证明特征函数仅依赖于算子 $A$ ,而不是 $A$ 的特殊矩阵表示。本征方程(characteristic function )$c(\lambda)=0$ 的解是算子 $A$ 的特征值。根据代数基本定理,任意多项式至少有一个复数根,因此任意算子 $A$ 至少有一个特征值和一个对应的特征向量。与特征值 $v$ 对应的特征空间(本征空间,eigenspace)是以 $v$ 为特征值的向量的集合。它是 $A$ 作用的向量空间的子空间。

算子 $A$ 在向量空间 $V$ 的对角表示为 $A=\sum_{i} \lambda_{i}|i\rangle\langle i|$ ,其中对应特征值 $\lambda_{i}$ 的向量 $|i\rangle$ 组成 $A$的特征向量的标准正交基。如果一个算子有对角表示,则称其为可对角化的(diagonalizable)。在下一节我们将会发现一组简单的希尔伯特空间中算子可对角化的充要条件。作为一个可对角化的例子,注意到泡利矩阵 $Z$ 可以写为

$$ Z=\left[\begin{array}{cc} 1 & 0 \tag{2.29}\\ 0 & -1 \end{array}\right]=|0\rangle\langle 0|-|1\rangle\langle 1| $$

其中矩阵表示分别考虑到标准正交向量 $|0\rangle$ 和 $|1\rangle$ 。对角表示有时也称为标准正交分解(orthomor- mal decomposition)。

当特征空间高于一维时,我们说它是退化的(degenerate)。例如,矩阵 $A$ 定义为

$$ A \equiv\left[\begin{array}{lll} 2 & 0 & 0 \tag{2.30}\\ 0 & 2 & 0 \\ 0 & 0 & 0 \end{array}\right] $$

对应特征值 2 有一个二维子空间。特征向量 $(1,0,0)$ 和 $(0,1,0)$ 称为退化的,由于它们是算子 $A$的同一特征值的线性无关的特征向量。

习题 2.11 (泡利矩阵的特征值分解)给出泡利矩阵 $X, Y, Z$ 的特征向量,特征值及对角表示。习题 2.12 证明下述矩阵不能对角化:

$$ A \equiv\left[\begin{array}{ll} 1 & 0 \tag{2.31}\\ 1 & 1 \end{array}\right] $$

2.1.6 伴随和厄米算子

假设 $A$ 是希尔伯特空间 $V$ 上的任意一个线性算子。事实上在 $V$ 上存在一个唯一的线性算子 $A^{\dagger}$ ,满足对所有的向量 $|v\rangle,|w\rangle \in V$ 都有

$$ \begin{equation*} (|v\rangle, A|w\rangle)=\left(A^{\dagger}|v\rangle,|w\rangle\right) \tag{2.32} \end{equation*} $$

这个线性算子称为 $A$ 算子的伴随(adjoint)或厄米共轭(Hermitian conjugate)。根据定义易知 $(A B)^{\dagger}=B^{\dagger} A^{\dagger}$ 。一般地,如果 $|v\rangle$ 是一个向量,那么我们定义 $|v\rangle^{\dagger} \equiv\langle v|$ 。根据这个定义不难看出 $(A|v\rangle)^{\dagger}=\langle v| A^{\dagger}$ 。 习题 2.13 如果 $|w\rangle$ 和 $|v\rangle$ 是两个任意的向量,证明 $(|w\rangle\langle v|)^{\dagger}=|v\rangle\langle w|$ 。 习题 2.14 (伴随的反线性)证明伴随算子是反线性的:

$$ \begin{equation*} \left(\sum_{i} a_{i} A_{i}\right)^{\dagger}=\sum_{i} a_{i}^{*} A_{i}^{\dagger} \tag{2.33} \end{equation*} $$

习题 2.15 证明 $\left(A^{\dagger}\right)^{\dagger}=A_{\text {。 }}$ 在算子 $A$ 的矩阵表示中,厄米共轭运算是将矩阵 $A$ 取共轭转置,$A^{\dagger}=\left(A^{*}\right)^{\mathrm{T}}$ ,其中 $*$ 意味着复共轭, T 是转置操作。例如,我们有

$$ \left[\begin{array}{cc} 1+3 \mathrm{i} & 2 \mathrm{i} \tag{2.34}\\ 1+\mathrm{i} & 1-4 \mathrm{i} \end{array}\right]^{\dagger}=\left[\begin{array}{cc} 1-3 \mathrm{i} & 1-\mathrm{i} \\ -2 \mathrm{i} & 1+4 \mathrm{i} \end{array}\right] $$

如果算子 $A$ 的伴随矩阵还是 $A$ ,那么称算子 $A$ 为厄米的或自伴算子。有一类重要的厄米算子是投影(projector)。假设 $W$ 是 $d$ 维向量空间 $V$ 的一个 $k$ 维向量子空间。根据格拉姆-施密特方法可以构造出一组 $V$ 的标准正交基 $|1\rangle, \cdots,|d\rangle$ ,使得 $|1\rangle, \cdots,|k\rangle$ 是 $W$ 的一组标准正交基。根据定义,

$$ \begin{equation*} P \equiv \sum_{i=1}^{k}|i\rangle\langle i| \tag{2.35} \end{equation*} $$

是在子空间 $W$ 上的投影。很容易验证这个定义不依赖于 $W$ 中的正交基 $|1\rangle, \cdots,|k\rangle$ 的选取。根据定义可知,对任意的向量 $|\nu\rangle,|\nu\rangle\langle\nu|$ 是厄米的,因此 $P$ 是厄米的,$P^{\dagger}=P$ 。我们通常将"向量空间"$P$ 称为投影算子 $P$ 到向量空间的投影的简写。 $P$ 的正交补(orthogonal complement)是

算子 $Q \equiv I-P$ 。不难发现,$Q$ 是由 $|k+1\rangle, \cdots,|d\rangle$ 张成的向量空间上的投影,它也可以被称为 $P$ 的正交补,记为 $Q$ 。 习题 2.16 证明对任意的投影算子 $P$ 都有 $P^{2}=P$ 。 如果 $A^{\dagger} A=A A^{\dagger}$ ,那么称 $A$ 为正规的(normal)。显然,如果一个算子是厄米的,那么它一定是正规的。对于正规算子,有一个很有名的表示定理,叫做谱分解。它表明如果一个算子是正规的,当且仅当它可对角化。专题 2.2 中会证明这个结果,应该仔细阅读。 习题 2.17 证明一个正规矩阵是厄米的当且仅当它的特征值为实数。 如果一个矩阵 $U$ 满足 $U^{\dagger} U=I$ ,那么称它是酉的。类似地,如果一个算子 $U$ 满足 $U^{\dagger} U=I$ ,那么称它是西的。很容易验证一个算子是西的当且仅当它的每一个矩阵表示都是西的。西算子也满足 $U U^{\dagger}=I$ ,因此 $U$ 是正规的并且可以谱分解。从几何的角度来看,酉算子是很重要的,因为它保持向量的内积不变。为了证明它,令 $|v\rangle$ 和 $|w\rangle$ 是任意两个向量。那么 $U|v\rangle$ 与 $U|w\rangle$ 的内积和 $|v\rangle$ 与 $|w\rangle$ 的内积相等:

$$ \begin{equation*} (U|v\rangle, U|w\rangle)=\langle v| U^{\dagger} U|w\rangle=\langle v| I|w\rangle=\langle v \mid w\rangle \tag{2.36} \end{equation*} $$

这个结果表明对任意的西算子 $U$ 都有如下的优雅外积表示。设 $\left|v_{i}\right\rangle$ 是任意一组标准正交基。定义 $\left|w_{i}\right\rangle \equiv U\left|v_{i}\right\rangle$ ,因为西算子保持内积不变,所以 $\left|w_{i}\right\rangle$ 也是一组标准正交基。注意到 $U=\sum_{i}\left|w_{i}\right\rangle\left\langle v_{i}\right|$ 。反之,如果 $\left|v_{i}\right\rangle$ 和 $\left|w_{i}\right\rangle$ 是两组标准正交基,那么很容易验证算子 $U \equiv \sum_{i}\left|w_{i}\right\rangle\left\langle v_{i}\right|$ 是酉算子。 习题2.18 证明西矩阵的所有特征值的模都为 1 ,也就是说,它可以写成 $\mathrm{e}^{\mathrm{i} \theta}$ 的形式,其中 $\theta$ 是某个实数。

习题 2.19 (泡利矩阵:厄米的和酉的)证明泡利矩阵是厄米的和西的。 习题 2.20 (基的变换)假设 $A^{\prime}$ 和 $A^{\prime \prime}$ 是向量空间 $V$ 上的算子 $A$ 在两组不同的正交基 $\left|v_{i}\right\rangle$ 和 $\left|w_{i}\right\rangle$ 下的矩阵表示。那么,$A^{\prime}$ 和 $A^{\prime \prime}$ 的元素分别是 $A_{i j}^{\prime}=\left\langle v_{i}\right| A\left|v_{j}\right\rangle$ 和 $A_{i j}^{\prime \prime}=\left\langle w_{i}\right| A\left|w_{j}\right\rangle$ 。说明 $A^{\prime}$和 $A^{\prime \prime}$ 之间的关系。

厄米算子有一个特殊子类极其重要,它就是正算子。正算子 $A$ 定义为,对任意的向量 $|v\rangle$ 都有 $(|v\rangle, A|v\rangle)$ 是一个非负实数。如果对所有的 $|v\rangle \neq 0,(|v\rangle, A|v\rangle)$ 都严格大于 0 ,则称 $A$ 为正定的。在习题 2.24 中,你将证明任意的正算子都自动是厄米的,因而根据谱分解定理,它有对角表示 $\sum_{i} \lambda_{i}|i\rangle\langle i|$ ,其中 $\lambda_{i}$ 是它的非负特征值。 习题 2.21 当 $M$ 是厄米的时,将专题 2.2 里的谱分解重新证明一次,并尽可能简化证明过程。 习题 2.22 证明厄米算子的两个不同特征值对应的特征向量一定正交。 习题 2.23 证明投影算子 $P$ 的特征值是 0 或 1 。 习题 2.24 (正算子的厄米性)证明正算子一定是厄米的。(提示:证明任意的算子 $A$ 都可写成 $A=B+\mathrm{i} C$ ,其中 $B$ 和 $C$ 是厄米的。)

习题 2.25 证明对任意的算子 $A, A^{\dagger} A$ 是半正定的。

专题 2.2 谱分解——极其重要!

谱分解对正规算子来说是一个极其有用的表示定理。 定理2.1(谱分解)向量空间 $V$ 上的任意正规算子 $M$ 在 $V$ 的某组正交基下是可对角化的。反之,任意可对角化的算子都是正规的。

证明 反向的证明是一个简单的练习,所以我们仅通过对 $d$ 维空间 $V$ 进行归纳来证明正向的关系。 $d=1$ 的情况是平凡的。设 $\lambda$ 是 $M$ 的一个特征值,$P$ 是到 $\lambda$ 本征空间上的投影,$Q$ 是到其正交补上的投影。所以 $M=(P+Q) M(P+Q)=P M P+Q M P+P M Q+Q M Q$ 。显然 $P M P=\lambda P$ 。而且由于 $M$ 把子空间 $P$ 映到其自身,所以 $Q M P=0$ 。我们说 $P M Q=0$ 也成立。为了证明它,设 $|v\rangle$ 是子空间 $P$ 中的一个元素。那么 $M M^{\dagger}|v\rangle=M^{\dagger} M|v\rangle=\lambda M^{\dagger}|v\rangle$ 。因此 $M^{\dagger}|v\rangle$ 有特征值 $\lambda$ ,所以它是子空间 $P$ 中的一个元素。故 $Q M^{\dagger} P=0$ 。对该式取伴随运算,有 $P M Q=0$ 。所以 $M=P M P+Q M Q$ 。下面我们要证明 $Q M Q$ 是正规的。为了证明这一点,注意到 $Q M=Q M(P+Q)=Q M Q$ ,并且 $Q M^{\dagger}=Q M^{\dagger}(P+Q)=Q M^{\dagger} Q$ 。所以,根据 $M$ 的正规性并注意到 $Q^{2}=Q$ ,有

$$ \begin{align*} Q M Q Q M^{\dagger} Q & =Q M Q M^{\dagger} Q \tag{2.37}\\ & =Q M M^{\dagger} Q \tag{2.38}\\ & =Q M^{\dagger} M Q \tag{2.39}\\ & =Q M^{\dagger} Q M Q \tag{2.40}\\ & =Q M^{\dagger} Q Q M Q \tag{2.41} \end{align*} $$

所以 $Q M Q$ 是正规的。根据归纳假设,$Q M Q$ 在子空间 $Q$ 的某个标准正交基下是可对角化的,而 $P M P$ 对 $P$ 中的某个标准正交基已经是对角化的。因此 $M=P M P+Q M Q$ 相对于全向量空间下的某个标准正交基可对角化。

按外积表示,这意味着 $M$ 能够写成 $M=\sum_{i} \lambda_{i}|i\rangle\langle i|$ 。其中 $\lambda_{i}$ 是 $M$ 的特征值,$|i\rangle$ 是 $V$中的一组标准正交基,并且每个 $|i\rangle$ 是 $M$ 的特征值 $\lambda_{i}$ 对应的特征向量。从投影算子的角度来看,$M=\sum_{i} \lambda_{i} P_{i}$ ,其中 $\lambda_{i}$ 还是表示 $M$ 的特征值,$P_{i}$ 是 $M$ 在 $\lambda_{i}$ 的本征空间里的投影。这些投影算子满足完备性关系 $\sum_{i} P_{i}=I$ 和正交性关系 $P_{i} P_{j}=\delta_{i j} P_{i}$ 。

2.1.7 张量积

张量积是将向量空间复合在一起形成一个更大的向量空间的方法。这个构造对理解量子力学中的多粒子系统至关重要。下面的讨论有一点抽象,如果你对张量积不熟悉可能很难跟上,所以

现在可以跳过去等到后面在量子力学中提到张量积时再回来重看。 设 $V$ 和 $W$ 分别是 $m$ 维和 $n$ 维的向量空间。方便起见,我们设 $V$ 和 $W$ 都是希尔伯特空间。那么 $V \otimes W$(读作 $V$ 张量 $W$ )是一个 $m n$ 维的向量空间。 $V \otimes W$ 里的元素是 $V$ 空间中的元素 $|v\rangle$ 和 $W$ 空间中的元素 $|w\rangle$ 的张量积 $|v\rangle \otimes|w\rangle$ 的线性组合。特别地,如果 $|i\rangle$ 和 $|j\rangle$ 是空间 $V$ 和 $W$ 中的标准正交基,那么 $|i\rangle \otimes|j\rangle$ 是 $V \otimes W$ 的一组基。我们常用缩写符号 $|v\rangle|w\rangle, ~|v, w\rangle$ ,甚至 $|v w\rangle$ 表示张量积 $|v\rangle \otimes|w\rangle$ 。例如,如果 $V$ 是一个二维向量空间,$|0\rangle$ 和 $|1\rangle$ 是其中的一组基,那么 $|0\rangle \otimes|0\rangle+|1\rangle \otimes|1\rangle$ 是 $V \otimes V$ 中的一个元素。

根据定义,张量积满足以下基本性质: 1.对任意的标量 $z, V$ 中元素 $|v\rangle$ 和 $W$ 中元素 $|w\rangle$ ,有

$$ \begin{equation*} z(|v\rangle \otimes|w\rangle)=(z|v\rangle) \otimes|w\rangle=|v\rangle \otimes(z|w\rangle) \tag{2.42} \end{equation*} $$

2.对 $V$ 中的任意向量 $\left|v_{1}\right\rangle$ 和 $\left|v_{2}\right\rangle$ ,以及 $W$ 中任意向量 $|w\rangle$ ,有

$$ \begin{equation*} \left(\left|v_{1}\right\rangle+\left|v_{2}\right\rangle\right) \otimes|w\rangle=\left|v_{1}\right\rangle \otimes|w\rangle+\left|v_{2}\right\rangle \otimes|w\rangle \tag{2.43} \end{equation*} $$

3.对 $V$ 中任意向量 $|v\rangle$ 和 $W$ 中任意向量 $\left|w_{1}\right\rangle,\left|w_{2}\right\rangle$ ,有

$$ \begin{equation*} |v\rangle \otimes\left(\left|w_{1}\right\rangle+\left|w_{2}\right\rangle\right)=|v\rangle \otimes\left|w_{1}\right\rangle+|v\rangle \otimes\left|w_{2}\right\rangle \tag{2.44} \end{equation*} $$

$V \otimes W$ 空间上的线性算子类型有哪些?假设 $|v\rangle$ 和 $|w\rangle$ 分别是 $V$ 和 $W$ 中的向量,$A$ 和 $B$ 分别是 $V$ 和 $W$ 中的线性算子。那么我们可以根据以下等式来定义 $V \otimes W$ 上的线性算子 $A \otimes B$ :

$$ \begin{equation*} (A \otimes B)(|v\rangle \otimes|w\rangle) \equiv A|v\rangle \otimes B|w\rangle \tag{2.45} \end{equation*} $$

为确保 $A \otimes B$ 的线性,$A \otimes B$ 的定义可以很自然地扩展到 $V \otimes W$ 上的所有元素,也就是

$$ \begin{equation*} (A \otimes B)\left(\sum_{i} a_{i}\left|v_{i}\right\rangle \otimes\left|w_{i}\right\rangle\right) \equiv \sum_{i} a_{i} A\left|v_{i}\right\rangle \otimes B\left|w_{i}\right\rangle \tag{2.46} \end{equation*} $$

可以证明这样定义的 $A \otimes B$ 是 $V \otimes W$ 上的定义良好的线性算子。两个算子的张量积记号显然可以推广到不同向量空间之间的映射 $A: V \rightarrow V^{\prime}$ 和 $B: W \rightarrow W^{\prime}$ 。事实上,任意一个从 $V \otimes W$到 $V^{\prime} \otimes W^{\prime}$ 上的线性算子 $C$ 都可以写成映射 $V$ 到 $V^{\prime}$ 的算子和映射 $W$ 到 $W^{\prime}$ 的算子的张量积的线性组合

$$ \begin{equation*} C=\sum_{i} c_{i} A_{i} \otimes B_{i} \tag{2.47} \end{equation*} $$

根据定义可知

$$ \begin{equation*} \left(\sum_{i} c_{i} A_{i} \otimes B_{i}\right)|v\rangle \otimes|w\rangle \equiv \sum_{i} c_{i} A_{i}|v\rangle \otimes B_{i}|w\rangle \tag{2.48} \end{equation*} $$

空间 $V$ 和 $W$ 上的内积能够用来定义一个 $V \otimes W$ 空间上的自然的内积。定义

$$ \begin{equation*} \left(\sum_{i} a_{i}\left|v_{i}\right\rangle \otimes\left|w_{i}\right\rangle, \sum_{j} b_{j}\left|v_{j}^{\prime}\right\rangle \otimes\left|w_{j}^{\prime}\right\rangle\right) \equiv \sum_{i j} a_{i}^{*} b_{j}\left\langle v_{i} \mid v_{j}^{\prime}\right\rangle\left\langle w_{i} \mid w_{j}^{\prime}\right\rangle \tag{2.49} \end{equation*} $$

可以证明这样定义的函数是一个定义良好的内积。根据这个内积,空间 $V \otimes W$ 继承了我们所熟悉的其他性质,例如:伴随性,酉性,正规性和厄米性。

所有的这些讨论都相当抽象。但当用矩阵的克罗内克积表示时,问题会具体得多。假设 $A$ 是一个 $m \times n$ 矩阵,$B$ 是一个 $p \times q$ 矩阵,则有矩阵表示

$$ A \otimes B \equiv \overbrace{\left[\begin{array}{cccc} A_{11} B & A_{12} B & \cdots & A_{1 n} B \tag{2.50}\\ A_{21} B & A_{22} B & \cdots & A_{2 n} B \\ \vdots & \vdots & \vdots & \vdots \\ A_{m 1} B & A_{m 2} B & \cdots & A_{m n} B \end{array}\right]}^{n q} $$

在这种表示中,$A_{11} B$ 这种项表示一个正比于 $B$ ,且所有的比例常数都是 $A_{11}$ 的 $p \times q$ 子矩阵。例如,向量 $(1,2)$ 和 $(2,3)$ 的张量积是向量

$$ \left[\begin{array}{l} 1 \tag{2.51}\\ 2 \end{array}\right] \otimes\left[\begin{array}{l} 2 \\ 3 \end{array}\right]=\left[\begin{array}{l} 1 \times 2 \\ 1 \times 3 \\ 2 \times 2 \\ 2 \times 3 \end{array}\right]=\left[\begin{array}{l} 2 \\ 3 \\ 4 \\ 6 \end{array}\right] $$

泡利矩阵 $X$ 和 $Y$ 的张量积是

$$ X \otimes Y=\left[\begin{array}{cc} 0 \cdot Y & 1 \cdot Y \tag{2.52}\\ 1 \cdot Y & 0 \cdot Y \end{array}\right]=\left[\begin{array}{cccc} 0 & 0 & 0 & -\mathrm{i} \\ 0 & 0 & \mathrm{i} & 0 \\ 0 & -\mathrm{i} & 0 & 0 \\ \mathrm{i} & 0 & 0 & 0 \end{array}\right] $$

最后,我们提一下一个有用的记号 $|\psi\rangle^{\otimes k}$ ,它的意思是 $|\psi\rangle$ 与它自身的 $k$ 次张量积。例如,$|\psi\rangle^{\otimes 2}=$ $|\psi\rangle \otimes|\psi\rangle$ 。在张量积空间上的算子也会用到类似的记号。 习题 2.26 令 $|\psi\rangle=(|0\rangle+|1\rangle) / \sqrt{2}$ ,用例如 $|0\rangle|1\rangle$ 这样的张量积形式和克罗内克积分别写出 $|\psi\rangle^{\otimes 2}$和 $|\psi\rangle^{\otimes 3}$ 的具体形式。 习题 2.27 计算泡利算子张量积的矩阵表示:(a)$X$ 和 $Z$ ;(b)$I$ 和 $Z$ ;(c)$X$ 和 $I$ 。张量积是可交换的吗?

习题 2.28 证明转置,复共轭,伴随算子关于张量积具有"分配性"。

$$ \begin{equation*} (A \otimes B)^{*}=A^{*} \otimes B^{*} ; \quad(A \otimes B)^{T}=A^{T} \otimes B^{T} ; \quad(A \otimes B)^{\dagger}=A^{\dagger} \otimes B^{\dagger} \tag{2.53} \end{equation*} $$

习题 2.29 证明两个酉算子的张量积是酉的。 习题 2.30 证明两个厄米算子的张量积是厄米的。 习题 2.31 证明两个正算子的张量积是半正定的。 习题 2.32 证明两个投影算子的张量积是投影算子。 习题 2.33 单量子比特上阿达玛算子可写成

$$ \begin{equation*} H=\frac{1}{\sqrt{2}}[(|0\rangle+|1\rangle)\langle 0|+(|0\rangle-|1\rangle)\langle 1|] \tag{2.54} \end{equation*} $$

证明 $n$ 量子比特上的阿达玛变换 $|H\rangle^{\otimes n}$ 可写成

$$ \begin{equation*} H^{\otimes n}=\frac{1}{\sqrt{2^{n}}} \sum_{x, y}(-1)^{x \cdot y}|x\rangle\langle y| \tag{2.55} \end{equation*} $$

写出 $|H\rangle^{\otimes 2}$ 具体的矩阵表示。

2.1.8 算子函数

有很多重要的函数可以通过算子和矩阵来定义。一般来说,给定一个从复数域映射到复数域的函数 $f$ ,就可以根据下面的步骤定义正规矩阵(或者是其子类,例如厄米矩阵)上的相应矩阵函数。设 $A=\sum_{a} a|a\rangle\langle a|$ 是正规算子 $A$ 的一个谱分解。定义 $f(A) \equiv \sum_{a} f(a)|a\rangle\langle a|$ 。易知 $f(A)$是唯一定义的。这个过程可用于一些情况,例如定义一个正算子的平方根,正定算子的对数,或者正规算子的指数。例如:

$$ \exp (\theta Z)=\left[\begin{array}{cc} \mathrm{e}^{\theta} & 0 \tag{2.5}\\ 0 & \mathrm{e}^{-\theta} \end{array}\right] $$

其中 $|0\rangle$ 和 $|1\rangle$ 是 $Z$ 的特征向量。 习题 2.34 找出下面矩阵的平方根和对数

$$ \left[\begin{array}{ll} 4 & 3 \tag{2.57}\\ 3 & 4 \end{array}\right] $$

习题 2.35 (泡利矩阵的指数)设 $\vec{v}$ 是任意的三维实单位向量,$\theta$ 是一个实数。证明:

$$ \begin{equation*} \exp (\mathrm{i} \theta \vec{v} \cdot \vec{\sigma})=\cos (\theta) I+\mathrm{i} \sin (\theta) \vec{v} \cdot \vec{\sigma} \tag{2.58} \end{equation*} $$

其中 $\vec{v} \cdot \vec{\sigma} \equiv \sum_{i=1}^{3} v_{i} \sigma_{i}$ 。这个习题会在问题 2.1 中得到推广。

另外一个重要的矩阵函数是矩阵的迹。 $A$ 的迹定义为其对角元素的和:

$$ \begin{equation*} \operatorname{tr}(A) \equiv \sum_{i} A_{i i} \tag{2.59} \end{equation*} $$

很容易看到迹是循环的, $\operatorname{tr}(A B)=\operatorname{tr}(B A)$ ,也是线性的, $\operatorname{tr}(A+B)=\operatorname{tr}(A)+\operatorname{tr}(B), \operatorname{tr}(z A)=$ $z \operatorname{tr}(A)$ ,其中 $A$ 和 $B$ 是任意的矩阵,$z$ 是一个复数。进一步,由循环性可知,矩阵的迹在酉相似变换 $A \rightarrow U A U^{\dagger}$ 下是不变的,因为 $\operatorname{tr}\left(U A U^{\dagger}\right)=\operatorname{tr}\left(U^{\dagger} U A\right)=\operatorname{tr}(A)$ 。根据这个结果,可以定义算子 $A$ 的迹为 $A$ 的任意矩阵表示的迹。迹在西相似变换下的不变性确保了算子的迹是定义良好的。

作为迹的一个例子,设 $|\psi\rangle$ 是单位向量,$A$ 是一个任意的算子。为了计算 $\operatorname{tr}(A|\psi\rangle\langle\psi|)$ ,用格拉姆-施密特方法将 $|\psi\rangle$ 扩展到一组正交基 $|i\rangle$ 上,其中 $|\psi\rangle$ 是它的第一个元素。我们有

$$ \begin{align*} \operatorname{tr}(A|\psi\rangle\langle\psi|) & =\sum_{i}\langle i| A|\psi\rangle\langle\psi \mid i\rangle \tag{2.60}\\ & =\langle\psi| A|\psi\rangle \tag{2.61} \end{align*} $$

这个结果,也就是 $\operatorname{tr}(A|\psi\rangle\langle\psi|)=\langle\psi| A|\psi\rangle$ ,在计算算子迹的时候特别有用。 习题 2.36 证明除 $I$ 外的泡利矩阵的迹都是 0 。 习题 2.37 (迹的循环性)若 $A$ 和 $B$ 是两个线性算子,证明:

$$ \begin{equation*} \operatorname{tr}(A B)=\operatorname{tr}(B A) \tag{2.62} \end{equation*} $$

习题2.38(迹的线性性)若 $A$ 和 $B$ 是两个线性算子,证明:

$$ \begin{equation*} \operatorname{tr}(A+B)=\operatorname{tr}(A)+\operatorname{tr}(B) \tag{2.63} \end{equation*} $$

若 $z$ 是任意复数,证明:

$$ \begin{equation*} \operatorname{tr}(z A)=z \operatorname{tr}(A) \tag{2.64} \end{equation*} $$

习题2.39(算子上的希尔伯特-施密特内积)希尔伯特空间上的线性算子集合 $L_{V}$ 显然是一个向量空间——两个线性算子的和还是一个线性算子,如果 $A$ 是一个线性算子而 $z$ 是一个复数,那么 $z A$ 是一个线性算子,并且有零元素 $0_{\text {。 }}$ 另外一个重要的结论是,赋予向量空间 $L_{V}$ 一些自然的内积结构后,它会变成希尔伯特空间。

1.证明在 $L_{V} \times L_{V}$ 上按如下方式定义的函数 $(\cdot, \cdot)$

$$ \begin{equation*} (A, B) \equiv \operatorname{tr}\left(A^{\dagger} B\right) \tag{2.65} \end{equation*} $$

是一个内积函数。这个内积叫作希尔伯特-施密特内积或者迹内积。 2.若 $V$ 是 $d$ 维的,证明 $L_{V}$ 是 $d^{2}$ 维的。 3.找出希尔伯特空间 $L_{V}$ 上的厄米矩阵的标准正交基。

2.1.9 对易式和反对易式

两个算子 $A$ 和 $B$ 的对易式(commutator)定义为

$$ \begin{equation*} [A, B] \equiv A B-B A \tag{2.66} \end{equation*} $$

如果 $[A, B]=0$ ,也就是 $A B=B A$ ,那么我们说 $A$ 和 $B$ 是对易的。类似地,两个算子 $A$ 和 $B$ 的反对易式(anti-commutator)定义为

$$ \begin{equation*} {A, B} \equiv A B+B A \tag{2.67} \end{equation*} $$

如果 ${A, B}=0$ ,我们说 $A$ 和 $B$ 是反对易的。事实上,算子的很多重要性质都可以从其对易式和反对易式推导出来。也许最有用的关系是对易式与厄米算子 $A$ 和 $B$ 可同时对角化之间的联系,即可以写成 $A=\sum_{i} a_{i}|i\rangle\langle i|, B=\sum_{i} b_{i}|i\rangle\langle i|$ ,其中 $|i\rangle$ 是 $A$ 和 $B$ 公共特征向量的标准正交集。 定理2.2(可同时对角化定理)假设 $A$ 和 $B$ 是厄米算子。那么 $[A, B]=0$ 成立当且仅当存在一组标准正交基使得 $A$ 和 $B$ 可同时对角化。我们说这种情况下 $A$ 和 $B$ 是可同时对角化的。

这个结果将很容易计算的两个算子的对易式和事先难以确定的可同时对角化联系了起来。例如,考虑下面的情况

$$ \begin{align*} {[X, Y] } & =\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right]\left[\begin{array}{cc} 0 & -\mathrm{i} \\ \mathrm{i} & 0 \end{array}\right]-\left[\begin{array}{cc} 0 & -\mathrm{i} \\ \mathrm{i} & 0 \end{array}\right]\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right] \tag{2.68}\\ & =2 \mathrm{i}\left[\begin{array}{cc} 1 & 0 \\ 0 & -1 \end{array}\right] \tag{2.69}\\ & =2 \mathrm{i} Z \tag{2.70} \end{align*} $$

所以 $X$ 和 $Y$ 不是对易的。在习题 2.11 中已经证明 $X$ 和 $Y$ 没有相同的特征向量,与我们从可同时对角化定理中得到的结果一致。

证明 很容易验证,如果 $A$ 和 $B$ 在相同的标准正交基下可同时对角化,那么 $[A, B]=0$ ,为了证明反方向也成立,设 $|a, j\rangle$ 是 $A$ 的特征值 $a$ 的本征空间 $V_{a}$ 的一组标准正交基;指标 $j$ 用来标记可能的简并。注意到

$$ \begin{equation*} A B|a, j\rangle=B A|a, j\rangle=a B|a, j\rangle \tag{2.71} \end{equation*} $$

因此 $B|a, j\rangle$ 是本征空间 $V_{a}$ 里的一个元素。设 $P_{a}$ 为空间 $V_{a}$ 上的投影,定义 $B_{a} \equiv P_{a} B P_{a}$ 。易知 $B_{a}$ 限制到空间 $V_{a}$ 上是厄米的,因此在张成空间 $V_{a}$ 的特征向量组成的标准正交基下可以进行谱分解。我们称这些特征向量为 $|a, b, k\rangle$ ,其中 $a$ 和 $b$ 表示 $A$ 和 $B_{a}$ 的特征值,$k$ 是一个额外的指标,表示 $B_{a}$ 中可能出现的简并。注意到 $B|a, b, k\rangle$ 是 $V_{a}$ 中的一个元素,所以 $B|a, b, k\rangle=P_{a} B|a, b, k\rangle$ 。

量子计算与量子信息: 10 周年版

与此同时,我们有 $P_{a}|a, b, k\rangle=|a, b, k\rangle$ ,所以

$$ \begin{equation*} B|a, b, k\rangle=P_{a} B P_{a}|a, b, k\rangle=b|a, b, k\rangle \tag{2.72} \end{equation*} $$

故 $|a, b, k\rangle$ 是 $B$ 的特征值 $b$ 对应的特征向量,因此 $|a, b, k\rangle$ 是 $A$ 和 $B$ 共同特征向量组成的一组标准正交集,它张成了 $A$ 和 $B$ 所在的整个向量空间。也就是说,$A$ 和 $B$ 可同时对角化。

习题 2.40 (泡利矩阵的对易关系)验证下面的对易关系

$$ \begin{equation*} [X, Y]=2 \mathrm{i} Z ; \quad[Y, Z]=2 \mathrm{i} X ; \quad[Z, X]=2 \mathrm{i} Y \tag{2.73} \end{equation*} $$

它还有一种优雅的书写方式,使用有三个指标的反对称张量 $\epsilon_{j k l \circ}$ 其中除了 $\epsilon_{123}=\epsilon_{231}=\epsilon_{312}=1$和 $\epsilon_{321}=\epsilon_{213}=\epsilon_{132}=-1$ ,其余的 $\epsilon_{j k l}=0$ :

$$ \begin{equation*} \left[\sigma_{j}, \sigma_{k}\right]=2 \mathrm{i} \sum_{l=1}^{3} \epsilon_{j k l} \sigma_{l} \tag{2.74} \end{equation*} $$

习题 2.41 (泡利矩阵的反对易关系)验证下面的反对易关系

$$ \begin{equation*} \left\{\sigma_{i}, \sigma_{j}\right\}=0 \tag{2.75} \end{equation*} $$

其中在集合 $1,2,3$ 中选择的 $i$ 和 $j$ 满足 $i \neq j$ 。再验证 $(i=0,1,2,3)$ :

$$ \begin{equation*} \sigma_{i}^{2}=I \tag{2.76} \end{equation*} $$

习题 2.42 验证

$$ \begin{equation*} A B=\frac{[A, B]+{A, B}}{2} \tag{2.77} \end{equation*} $$

习题 2.43 证明对 $j, k=1,2,3$ 有

$$ \begin{equation*} \sigma_{j} \sigma_{k}=\delta_{j k} I+\mathrm{i} \sum_{l=1}^{3} \epsilon_{j k l} \sigma_{l} \tag{2.78} \end{equation*} $$

习题 2.44 假设 $[A, B]=0,{A, B}=0$ ,并且 $A$ 是可逆的。证明 $B$ 必须是 0 。 习题 2.45 证明 $[A, B]^{\dagger}=\left[B^{\dagger}, A^{\dagger}\right]$ 。 习题 2.46 证明 $[A, B]=-[B, A]$ 。 习题 2.47 假设 $A$ 和 $B$ 是厄米的,证明 $\mathrm{i}[A, B]$ 是厄米的。

2.1.10 极式分解和奇异值分解

极式(polar)分解和奇异值(singular value)分解是将线性算子分解得更简单有用的方法。特别地,这些分解可将一般的线性算子分解为西算子和正算子的乘积。虽然我们对一般的线性算子的结构了解得不是特别清楚,但对西算子和正算子的很多细节都有了解。极式分解和奇异值分解可用来更好地理解一般的线性算子。

定理 2.3(极式分解)设 $A$ 是向量空间 $V$ 上一个线性算子。那么存在酉算子 $U$ 和正算子 $J, K$使得

$$ \begin{equation*} A=U J=K U \tag{2.79} \end{equation*} $$

其中 $J \equiv \sqrt{A^{\dagger} A}, K \equiv \sqrt{A A^{\dagger}}$ ,并且 $J$ 和 $K$ 是唯一满足这些等式的正算子。而且,如果 $A$ 是可逆的,那么 $U$ 是唯一的。

我们称表达式 $A=U J$ 是 $A$ 的左极式分解,$A=K U$ 是 $A$ 的右极式分解。通常,我们会省略掉"左"和"右",而用"极式分解"来表示两个表达式,根据上下文来推断究竟是哪一个。

证明 $J \equiv \sqrt{A^{\dagger} A}$ 是一个正算子,所以它能够被谱分解,$J=\sum_{i} \lambda_{i}|i\rangle\langle i|\left(\lambda_{i} \geqslant 0\right)$ 。定义 $\left|\psi_{i}\right\rangle \equiv A|i\rangle$ 。根据定义,我们有 $\left\langle\psi_{i} \mid \psi_{i}\right\rangle=\lambda_{i}^{2}$ 。从现在开始只考虑那些满足 $\lambda_{i} \neq 0$ 的 $i$ 。对于这些 $i$ ,定义 $\left|e_{i}\right\rangle \equiv\left|\psi_{i}\right\rangle / \lambda_{i}$ ,所以 $\left|e_{i}\right\rangle$ 是归一化的。而且它们是正交的,因为如果 $i \neq j$ ,那么 $\left\langle e_{i} \mid e_{j}\right\rangle=$ $\langle i| A^{\dagger} A|j\rangle / \lambda_{i} \lambda_{j}=\langle i| J^{2}|j\rangle / \lambda_{i} \lambda_{j}=0$ 。 准正交基,我们也用 $\left|e_{i}\right\rangle$ 来表示它。定义西算子 $U \equiv \sum_{i}\left|e_{i}\right\rangle\langle i|$ 。当 $\lambda_{i} \neq 0$ 时有 $U J|i\rangle=\lambda_{i}\left|e_{i}\right\rangle=$ 因此 $A=U J$ 。 $J$ 是唯一的。因为将 $A=U J$ 左边乘以伴随等式 $A^{\dagger}=J U^{\dagger}$ 得到 $J^{2}=A^{\dagger} A$ ,从中可以看出 $J=\sqrt{A^{\dagger} A}$ ,并且它是唯一的。容易知道,如果 $A$ 是可逆的,那么 $J$ 也是可逆的,所以 $U$ 唯一地由方程 $U=A J^{-1}$ 确定。右极式分解的证明如下,因为 $A=U J=U J U^{\dagger} U=K U$ ,其中 $K \equiv U J U^{\dagger}$ 是一个正算子。又因为 $A A^{\dagger}=K U U^{\dagger} K=K^{2}$ ,所以肯定有 $K=\sqrt{A A^{\dagger}}$ ,证毕。

奇异值分解将极式分解和谱分解定理结合了起来。 推论 2.4 (奇异值分解)设 $A$ 是一个方阵。那么存在酉矩阵 $U$ 和 $V$ ,以及非负对角阵 $D$ ,使得

$$ \begin{equation*} A=U D V \tag{2.80} \end{equation*} $$

$D$ 的对角元素称为 $A$ 的奇异值。

证明 根据极式分解,对西矩阵 $S$ 和半正定矩阵 $J$ 有 $A=S J$ 。根据谱分解定理,对西矩阵 $T$ 和非负对角阵 $D$ 有 $J=T D T^{\dagger}$ 。令 $U \equiv S T$ 和 $V \equiv T^{\dagger}$ 即可完成证明。

习题2.48 半正定矩阵 $P$ 的奇异值分解是什么?西矩阵 $U$ 的奇异值分解是什么?厄米矩阵 $H$ 的奇异值分解是什么?

习题 2.49 用外积的形式表示出一个正规矩阵的极式分解。 习题 2.50 找出下列矩阵的左极式分解和右极式分解。

$$ \left[\begin{array}{ll} 1 & 0 \tag{2.81}\\ 1 & 1 \end{array}\right] $$

2.2 量子力学的假设

所有的理解从拒绝世界的表象开始。

——Alan Kay 最难以理解的事是这个世界是可以理解的。 ——阿尔伯特•爱因斯坦

量子力学是为了发展物理理论而形成的数学框架。量子力学本身不会告诉你量子系统遵循什么样的规律,但它为发展这些规律提供了一个数学和概念的框架。在接下来的几节里,我们会给出量子力学基本公设的完整描述。这些公设为物理世界和量子力学里的数学描述建立了联系。

量子力学的公设基于长期的尝试和(主要是)失败而推导出来,它包含了创始者的大量的猜测和摸索。如果对这个公设的动机不是那么清楚,不要惊讶;因为专家对于量子力学里的这些基本公设也是很惊讶的。通过下面几节的学习,你应该很好地理解这些公设——知道何时及如何应用它们。

2.2.1 状态空间

量子力学的第一条公设确立了量子力学所适用的场合。这个空间是我们在线性代数中所熟悉的——希尔伯特空间。

公设 1:任意一个孤立的物理系统都与一个称为系统状态空间的复内积向量空间(也就是希尔伯特空间)相联系。系统完全由状态向量来描述,它是系统状态空间里的一个单位向量。

量子力学并不告诉我们对于一个给定的物理系统,其状态空间是什么,也不告诉我们这个系统的状态向量是什么。找出一个特定的系统是一个困难的问题,为此物理学家制定了一系列复杂和漂亮的规则。例如,有一个很好的理论叫量子电动力学(通常称为 QED),它描述了原子和

光之间的相互作用。QED 的一个方面告诉了我们该用何种状态空间来给出原子和光的量子描述。我们不太关心例如 QED 这种复杂的理论(除了在第 7 章中应用于物理实现),因为我们最感兴趣的是量子力学提供的一般的框架。就我们的目的而言,我们关于感兴趣的系统的状态空间做一些非常简单(并合理)的假设,并坚持这些假设,这就足够了。

最简单也是我们最关心的量子力学系统是量子比特。量子比特是一个二维的状态空间。假设 $|0\rangle$ 和 $|1\rangle$ 形成了这个状态空间的一组标准正交基。那么这个状态空间的任意向量都可以写成

$$ \begin{equation*} |\psi\rangle=a|0\rangle+b|1\rangle \tag{2.82} \end{equation*} $$

其中 $a$ 和 $b$ 是任意的复数。 $|\psi\rangle$ 是一个单位向量的条件是 $\langle\psi \mid \psi\rangle=1$ ,等价于 $|a|^{2}+|b|^{2}=1$ 。条件 $\langle\psi \mid \psi\rangle=1$ 通常称为状态向量的归一化条件。

我们视量子比特为最基本的量子力学系统。在后面第 7 章中,我们会看到描述量子比特的物理系统是真实存在的。但就目前而言,我们在不涉及特定的实现的抽象层面上讨论就足够了。对量子比特的讨论总是基于提前确定好的标准正交基 $|0\rangle$ 和 $|1\rangle$ 。直观上,状态 $|0\rangle$ 和 $|1\rangle$ 可类比于一个比特能取到的两个值, 0 和 1 。量子比特与比特的区别在于这两个状态可以叠加,产生 $a|0\rangle+b|1\rangle$ 的形式。叠加态下不能说这两个比特处于确定的 $|0\rangle$ 或 $|1\rangle$ 。

最后我们介绍一些在描述量子状态中有用的术语。我们说任意的线性组合 $\sum_{i} \alpha_{i}\left|\psi_{i}\right\rangle$ 应理解为状态 $\left|\psi_{i}\right\rangle$ 以振幅 $\alpha_{i}$ 的叠加。例如,状态

$$ \begin{equation*} \frac{|0\rangle-|1\rangle}{\sqrt{2}} \tag{2.83} \end{equation*} $$

是状态 $|0\rangle$ 和 $|1\rangle$ 的叠加,其中 $|0\rangle$ 的振幅是 $1 / \sqrt{2},|1\rangle$ 的振幅是 $-1 / \sqrt{2}$ 。

2.2.2 演化

量子力学系统里的状态 $|\psi\rangle$ 是如何随着时间而改变的?下面的公设为态的变化提供了一种描述。

公设 2:封闭量子系统的演化可用酉变换(unitary transformation)来描述。也就是说,系统在 $t_{1}$ 时所处的状态 $|\psi\rangle$ 和在 $t_{2}$ 时所处的状态 $\left|\psi^{\prime}\right\rangle$ 是通过一个仅与时间 $t_{1}$ 和 $t_{2}$ 有关的西算子 $U$联系起来的。

$$ \begin{equation*} \left|\psi^{\prime}\right\rangle=U|\psi\rangle \tag{2.84} \end{equation*} $$

正如量子力学不会告诉我们一个特定量子系统中的状态空间或者量子态一样,它也不会告诉我们哪个酉算子 $U$ 描述了现实世界的量子动力学。量子力学仅仅告诉我们封闭量子系统可以这么描述。一个很明显的问题是:自然选择什么样的西算子?在单量子比特的情况下,所有的西算子都能够在实际的系统中实现。

我们来看一些在量子计算和量子信息中很重要的单量子比特上的酉算子的例子。我们已经看到了一些这样的西算子例子——在 2.1.3 节定义的泡利矩阵和第 1 章描述的量子门。正如

在 1.3.1 节说到的那样,$X$ 矩阵经常被视为量子非门,与经典的非门相对应。泡利矩阵的 $X$ 门和 $Z$ 门有时也被视为比特翻转和相位翻转矩阵。矩阵 $X$ 将 $|0\rangle$ 变成 $|1\rangle$ ,将 $|1\rangle$ 变成 $|0\rangle$ ,所以它被称为比特翻转矩阵。 $Z$ 矩阵保持 $|0\rangle$ 不变,将 $|1\rangle$ 变成 $-|1\rangle$ ,因为 -1 被视为相位因子,所以它被称为相位翻转矩阵。我们一般不用相位翻转矩阵来称呼 $Z$ ,因为它很容易与第 4 章定义的相位门相混淆。(2.2.7 节有关于相位一词更详细的讨论。)

另外一个有趣的酉算子是阿达玛门(Hadamard gate),记为 $H_{\circ}$ 。它的作用为 $H|0\rangle \equiv(|0\rangle+$ $|1\rangle) / \sqrt{2}, H|1\rangle \equiv(|0\rangle-|1\rangle) / \sqrt{2}$ ,并且相应的矩阵表示为

$$ H=\frac{1}{\sqrt{2}}\left[\begin{array}{cc} 1 & 1 \tag{2.85}\\ 1 & -1 \end{array}\right] $$

习题 2.51 验证阿达玛门 $H$ 是西的。 习题 2.52 验证 $H^{2}=I$ 。 习题 $2.53 ~ H$ 的特征值和特征向量是什么? 公设 2 要求所描述的系统是封闭的。也就是它与其他系统没有任何形式的相互作用。当然,事实上所有的系统多多少少都与其他系统有相互作用(除了将宇宙作为整体)。然而,可以近似描述为封闭的系统是存在的,并且用西演化可以给出一个很好的近似描述。而且,至少原则上每个开系统都能描述成一个更大的西演化中的封闭系统(宇宙)的一部分。后面我们将介绍描述非封闭系统的更多工具,但现在我们继续描述封闭系统的演化。

公设 2 描述了一个封闭的量子系统的量子态在两个不同时间的关系。这个公设更精细的版本给出了描述量子系统在连续时间上的演化。从这个更精细的公设我们将重新得到公设 2 。在我们开始修改公设前,需要指出两点。一是对记号的注解。下面讨论的算子 $H$ 与我们刚刚介绍的阿达玛算子是不同的。二是下面的公设会用到微分方程。对于那些几乎没有学习过微分方程的读者,我们重申,除了在第 7 章中量子信息处理的真实物理实现部分,微分方程在本书中不会出现太多次。

公设 $\mathbf{2}^{\prime}$ :封闭量子系统中态的演化由薛定谔方程描述

$$ \begin{equation*} \mathrm{i} \hbar \frac{\mathrm{~d}|\psi\rangle}{\mathrm{d} t}=H|\psi\rangle \tag{2.86} \end{equation*} $$

在这个方程中,$\hbar$ 是一个物理常数,被称为普朗克常数,它的值由实验确定。它的精确值对我们来说不重要。实践中,经常把因子 $\hbar$ 放人 $H$ 中,置 $\hbar=1 。 H$ 是一个称为封闭系统哈密顿量的固定厄米算子。

如果我们知道一个系统的哈密顿量,那么(加上对 $\hbar$ 的了解)我们至少在原理上完全理解了它的动力学。一般而言,找出一个描述特定物理系统的哈密顿量是一个非常困难的问题——20世纪物理学的很多工作与这个问题有关——这需要从实验中得到实质性的结果才能回答。对于我们而言,这是在量子力学框架中用物理理论来解决的细节问题——在原子这样或那样的结构中,我们需要用什么样的哈密顿量来描述它们——而并非量子力学理论本身需要解决的问题。在量子

计算和量子信息的讨论中,大部分时间我们都不需要讨论哈密顿量。即使我们用到了,也通常只是假设某个矩阵为哈密顿量来作为问题的起始点,然后继续下去,而不去追究为什么用这个哈密顿量。

因为哈密顿量是一个厄米算子,所以它有谱分解

$$ \begin{equation*} H=\sum_{E} E|E\rangle\langle E| \tag{2.87} \end{equation*} $$

其中它的特征值为 $E$ 并且相应的特征向量为 $|E\rangle$ ,状态 $|E\rangle$ 一般被称为能量本征态(energy eigen- state),有时也被称为稳态(stationary state),$E$ 是状态 $|E\rangle$ 的能量。最低的能量称为系统的基态能量(ground state energy),相应的能量本征态(或本征空间)称为基态(ground state)。状态 $|E\rangle$有时称为定态,原因是它们随时间变化的仅仅是一个数值因子,

$$ \begin{equation*} |E\rangle \rightarrow \exp (-\mathrm{i} E t / \hbar)|E\rangle \tag{2.88} \end{equation*} $$

例如,假设单量子比特有哈密顿量

$$ \begin{equation*} H=\hbar \omega X \tag{2.89} \end{equation*} $$

在这个等式中 $\omega$ 是一个参数,在实际中它的值需要通过实验来确定。我们在此不用过多关心这个参数,它只是为了给出在学习量子计算和量子信息时有时会用到的哈密顿量的类型。这个哈密顿量的能量本征态显然与 $X$ 的本征态相同,即 $(|0\rangle+|1\rangle) / \sqrt{2}$ 和 $(|0\rangle-|1\rangle) / \sqrt{2}$ ,相应的能量是 $\hbar \omega$和 $-\hbar \omega$ 。因此它的基态是 $(|0\rangle-|1\rangle) / \sqrt{2}$ ,基态能量是 $-\hbar \omega$ 。

公设 2 '中的哈密顿量的动力学描述和公设 2 中的西算子描述之间有什么联系?答案在于薛定谔方程的解,很容易验证:

$$ \begin{equation*} \left|\psi\left(t_{2}\right)\right\rangle=\exp \left[\frac{-\mathrm{i} H\left(t_{2}-t_{1}\right)}{\hbar}\right]\left|\psi\left(t_{1}\right)\right\rangle=U\left(t_{1}, t_{2}\right)\left|\psi\left(t_{1}\right)\right\rangle \tag{2.90} \end{equation*} $$

其中定义

$$ \begin{equation*} U\left(t_{1}, t_{2}\right) \equiv \exp \left[\frac{-\mathrm{i} H\left(t_{2}-t_{1}\right)}{\hbar}\right] \tag{2.91} \end{equation*} $$

我们将在习题中证明这个算子是西的,而且,任意的西算子 $U$ 都可以写成 $U=\exp (i K)$ 的形式,其中 $K$ 是某个厄米算子。因此在用西算子的离散时间动力学描述和用哈密顿量的连续时间动力学描述之间存在一一对应关系。本书的大部分内容我们会用量子演化的酉描述。

习题2.54 假设 $A$ 和 $B$ 是对易的厄米算子。证明 $\exp (A) \exp (B)=\exp (A+B)$ 。(提示:用2.1.9节中的结论。)

习题 2.55 证明在式(2.91)中定义的 $U\left(t_{1} t_{2}\right)$ 是酉的。 习题 2.56 用谱分解证明 $K \equiv-\mathrm{i} \log (U)$ 对任意西算子 $U$ 都是厄米的,因此 $U=\exp (i K)$ 对某个厄米的 $K$ 成立。

在量子计算和量子信息中我们经常会说把一个西算子应用到一个特定的量子系统。例如,在量子电路的情况下,我们会说把酉门 $X$ 作用到单量子比特上。这是否与我们之前所说的酉算子是描述封闭系统的演化相矛盾?毕竟,如果我们应用一个西算子,那么就意味着有一个外在的 "我们"与量子系统相互作用,因而这个系统就不封闭了。

将激光聚焦到一个原子上就是这样一个例子。经过一番努力之后就可以写出描述整个原子-激光系统的哈密顿量。有趣的事情在于当我们写下原子-激光系统的哈密顿量并只考虑原子带来的影响时,原子状态向量可用另一个哈密顿量——原子哈密顿量来近似,但不是完全描述。原子哈密顿量包含激光密度和与激光的其他参数有关的项,并且我们可以根据需求改变这些项。尽管原子不是一个封闭系统,但原子的演化仿佛是由我们可以根据需要改变的哈密顿量来描述似的。

更一般地,对于许多像这样的系统都可以写出量子系统的一个时变的哈密顿量。也即系统的哈密顿量不再是一个常数,而是在实验者的控制之下,在实验过程中根据某些参数变化。因此这个系统不再封闭,但在很好的近似程度上,是按照具有时变的哈密顿量的薛定谔方程的演化。

我们得到如下结果:尽管开始时系统不封闭,我们也经常用西算子来描述量子系统的演化。其中一个主要的例外是下一节要讨论的量子测量。随后,我们将更详细地研究由于与其他系统的相互作用而可能偏离酉演化的情况,并更精确地理解现实量子系统的动力学。

2.2.3 量子测量

我们已假定封闭系统按西算子演化。尽管系统的演化不与世界的其余部分相互作用,但有时候实验者或者实验设备——换句话说外部物理系统——需要观察系统,以了解系统内部在发生什么。这个观测作用使得系统不再封㠇是说系统不再遵循西演化。为了解释这样做的影响,我们将引入公设 3 ,它为描述量子系统的测量提供了一种手段。

公设 3:量子测量由一组测量算子(measurement operator)$\left\{M_{m}\right\}$ 描述。这些算子作用在被测系统的状态空间上。指标 $m$ 表示在实验中可能出现的测量结果。如果在测量前量子系统的最新状态是 $|\psi\rangle$ ,那么测量结果是 $m$ 的概率为

$$ \begin{equation*} p(m)=\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle \tag{2.92} \end{equation*} $$

并且测量之后系统的状态为

$$ \begin{equation*} \frac{M_{m}|\psi\rangle}{\sqrt{\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle}} \tag{2.93} \end{equation*} $$

测量算子满足完备性方程:

$$ \begin{equation*} \sum_{m} M_{m}^{\dagger} M_{m}=I \tag{2.94} \end{equation*} $$

完备性方程表达了概率加起来是 1 的事实:

$$ \begin{equation*} 1=\sum_{m} p(m)=\sum_{m}\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle \tag{2.95} \end{equation*} $$

这个方程对所有的 $|\psi\rangle$ 都成立,并且等价于完备性方程。然而,直接检验完备性方程要容易得多,这也是它出现在公设叙述中的原因。

测量的一个简单但重要的例子是在计算基下测量单量子比特。这个在单量子比特上的测量有两个测量结果,由测量算子 $M_{0}=|0\rangle\langle 0|$ 和 $M_{1}=|1\rangle\langle 1|$ 决定。注意到每个测量算子都是厄米的,并且 $M_{0}^{2}=M_{0}, M_{1}^{2}=M_{1}$ 。所以它们满足完备性关系,$I=M_{0}^{\dagger} M_{0}+M_{1}^{\dagger} M_{1}=M_{0}+M_{1}$ 。假设被测的状态是 $|\psi\rangle=a|0\rangle+b|1\rangle$ ,那么得到测量结果为 0 的概率是

$$ \begin{equation*} p(0)=\langle\psi| M_{0}^{\dagger} M_{0}|\psi\rangle=\langle\psi| M_{0}|\psi\rangle=|a|^{2} \tag{2.96} \end{equation*} $$

类似地,测量结果为 1 的概率是 $p(1)=|b|^{2}$ 。这两种情况下测量之后的状态是

$$ \begin{align*} & \frac{M_{0}|\psi\rangle}{|a|}=\frac{a}{|a|}|0\rangle \tag{2.97}\\ & \frac{M_{1}|\psi\rangle}{|b|}=\frac{b}{|b|}|1\rangle \tag{2.98} \end{align*} $$

在 2.2.7 节我们将看到像 $a /|a|$ 这样模为 1 的倍数可以忽略,所以测量之后的有效状态正如第 1 章所述是 $|0\rangle$ 和 $|1\rangle$ 。

公设 3 是基本公设,这让很多人感到困惑。测量设备是量子力学系统,所以被测量的量子系统和测量设备一起是一个更大的孤立量子力学系统的一部分(也许需要包括除被测系统和测量设备外的量子系统才能获得一个完整的孤立系统,而这点是可以做到的)。根据公设 2 ,这个大的孤立系统的演化可以描述为西演化。从这个描述中是否可以推导出公设 3 这个结果?尽管在这个问题上花了很多努力,但物理学家们关于是否能够推导出来这个问题还争论不休。然而我们准备采取非常实际的方式,也就是在应用时明白什么时候用公设 2 ,什么时候用公设 3 ,而不关心如何从一个公设推导出另一个公设。

下面几节我们会把公设 3 用到几个基础但非常重要的测量场景中。2.2.4 节描述了区分一组量子态的问题。2.2.5 节解释了公设 3 里的一个特殊情况,投影测量或冯•诺伊曼测量。2.2.6节解释了公设 3 里的另外一个特殊情况,POVM 测量。很多量子力学的介绍只讨论投影测量,而忽视了对公设 3 或 POVM 元素的完整讨论。因此在专题 2.5 中我们描述了所讨论的不同测量之间的关系。

习题 2.57 (串联的测量等于单次测量)假设 $\left\{L_{l}\right\}$ 和 $\left\{M_{m}\right\}$ 是两组测量算子。证明一个先经过测量算子 $\left\{L_{l}\right\}$ 测量后再经过测量算子 $\left\{M_{m}\right\}$ 测量的顺次测量,在物理上等价于一个由测量算子 $\left\{N_{l m}\right\}$ 定义的测量,其中 $N_{l m} \equiv M_{m} L_{l}$ 。

2.2.4 区分量子状态

公设 3 的一个重要应用是区分量子状态(distinguishing quantum states)。在经典世界里,研究对象的不同物理态至少在原则上是可以区分的。例如,在理想情况下我们总能知道硬币是正面向上还是反面向上。在量子力学里面,这种情况要复杂得多。在 1.6 节我们指出了非正交量子态

不可区分。以公设 3 为基础,我们对这个事实给出更令人信服的说明。 像很多量子计算和量子信息里的观点一样,可区分性用 Alice 和 Bob 的双方游戏来类比说明就很容易理解了。Alice 从双方都知道的一组态之中选择一个态 $\left|\psi_{i}\right\rangle(1 \leqslant i \leqslant n)$ ,她把态 $\left|\psi_{i}\right\rangle$ 交给 Bob,Bob 的任务是找出 Alice 给他的状态的指标 $i$ 。

假设状态 $\left|\psi_{i}\right\rangle$ 是正交的,那么 Bob 可通过以下步骤做量子测量而区分这些态。对每个指标定义一个测量算子 $M_{i} \equiv\left|\psi_{i}\right\rangle\left\langle\psi_{i}\right|$ ,再定义一个测量算子 $M_{0}$ ,它是正算子 $I-\sum_{i \neq 0}\left|\psi_{i}\right\rangle\left\langle\psi_{i}\right|$ 的非负平方根。这些算子满足完备性关系,如果状态是 $\left|\psi_{i}\right\rangle$ ,那么 $p(i)=\left\langle\psi_{i}\right| M_{i}\left|\psi_{i}\right\rangle=1$ ,也就是测量结果一定是 $i$ 。因此,可以可靠地区分正交态 $\left|\psi_{i}\right\rangle$ 。

与之对照,如果态 $\left|\psi_{i}\right\rangle$ 不是正交的,那么我们能够证明没有量子测量能够区分这些态。思路是,Bob 做一个测量算子为 $M_{j}$ ,测量结果为 $j$ 的测量。Bob 根据测量结果用某些规则 $i=f(j)$来猜测指标 $i$ ,其中 $f(\cdot)$ 表示 Bob 用的猜测规则。Bob不能区分非正交态 $\left|\psi_{1}\right\rangle$ 和 $\left|\psi_{2}\right\rangle$ 的关键在于 $\left|\psi_{2}\right\rangle$ 有平行于 $\left|\psi_{1}\right\rangle$ 的分量(非零)和垂直于 $\left|\psi_{1}\right\rangle$ 的分量。假设 $j$ 是使得 $f(j)=1$ 的测量结果, 测量前状态为 $\left|\psi_{2}\right\rangle$ 时,得到的测量结果为 $j$ 的概率不是 0 。所以 Bob 有时会出现错误的判断。专题 2.3 中将讨论非正交态不可区分的一个更严格的证明,但上述讨论给出了其最根本的想法。

专题 2.3 非正交态不可区分的证明

用反证法证明没有测量能够区分非正交态 $\left|\psi_{1}\right\rangle$ 和 $\left|\psi_{2}\right\rangle_{\circ}$ 假设这个测量是可能的,如果测量前的状态是 $\left|\psi_{1}\right\rangle\left(\left|\psi_{2}\right\rangle\right)$ ,则测量到 $j$ 使得 $\left.f(j)=1(f(j)=2)\right)$ 的概率为 1 。定义 $E_{i} \equiv \sum_{j: f(j)=i} M_{j}^{\dagger} M_{j}$ 。这些观测可以写成

$$ \begin{equation*} \left\langle\psi_{1}\right| E_{1}\left|\psi_{1}\right\rangle=1 ; \quad\left\langle\psi_{2}\right| E_{2}\left|\psi_{2}\right\rangle=1 \tag{2.99} \end{equation*} $$

由于 $\sum_{i} E_{i}=I$ ,所以 $\sum_{i}\left\langle\psi_{1}\right| E_{i}\left|\psi_{1}\right\rangle=1$ 。又因为 $\left\langle\psi_{1}\right| E_{1}\left|\psi_{1}\right\rangle=1$ ,所以一定有 $\left\langle\psi_{1}\right| E_{2}\left|\psi_{1}\right\rangle=$ 0 ,因此 $\sqrt{E_{2}}\left|\psi_{1}\right\rangle=0$ 。假设我们有分解 $\left|\psi_{2}\right\rangle=\alpha\left|\psi_{1}\right\rangle+\beta|\varphi\rangle$ ,其中 $|\varphi\rangle$ 与 $\left|\psi_{1}\right\rangle$ 正交,$|\alpha|^{2}+|\beta|^{2}=$ 1 ,并且 $|\beta| < 1$ ,因为 $\left|\psi_{1}\right\rangle$ 和 $\left|\psi_{2}\right\rangle$ 不是正交的。于是 $\sqrt{E_{2}}\left|\psi_{2}\right\rangle=\beta \sqrt{E_{2}}|\varphi\rangle$ ,而这与式(2.99)矛盾,因为

$$ \begin{equation*} \left\langle\psi_{2}\right| E_{2}\left|\psi_{2}\right\rangle=|\beta|^{2}\langle\varphi| E_{2}|\varphi\rangle \leqslant|\beta|^{2} < 1 \tag{2.100} \end{equation*} $$

其中倒数第二个不等式来自以下事实:

$$ \begin{equation*} \langle\varphi| E_{2}|\varphi\rangle \leqslant \sum_{i}\langle\varphi| E_{i}|\varphi\rangle=\langle\varphi \mid \varphi\rangle=1 \tag{2.101} \end{equation*} $$

2.2.5 投影测量

本节将说明一般测量公设——公设 3 的一个重要的特例。这类特殊的测量即投影测量。在量子计算和量子信息中的很多应用中,我们主要考虑投影测量。事实上,在增加了公设 2 中描述的

酉变换的能力之后,投影测量实际上等价于一般测量公设。 2.2 .8 节将详细说明这种等价性,因为投影测量与公设 3 表面上有很大的不同。

投影测量:一个投影测量由被观测系统状态空间上的一个可观测量 $M$ 来描述,$M$ 是一个厄米算子。这个可观测量有谱分解

$$ \begin{equation*} M=\sum_{m} m P_{m} \tag{2.102} \end{equation*} $$

其中 $P_{m}$ 是到特征值为 $m$ 的本征空间 $M$ 上的投影。测量的可能结果对应于可观测量的特征值 $m$ 。当测量状态为 $|\psi\rangle$ 时,得到结果为 $m$ 的概率是

$$ \begin{equation*} p(m)=\langle\psi| P_{m}|\psi\rangle \tag{2.103} \end{equation*} $$

给定测量结果 $m$ ,测量后量子状态立即变成

$$ \begin{equation*} \frac{P_{m}|\psi\rangle}{\sqrt{p(m)}} \tag{2.104} \end{equation*} $$

投影测量可以理解为公设 3 的特例。设公设 3 中的测量算子除了满足完备性关系 $\sum_{m} M_{m}^{\dagger} M_{m}$ $=I$ ,也满足 $M_{m}$ 是正交投影算子这个条件。即,$M_{m}$ 是厄米的,并且 $M_{m} M_{m^{\prime}}=\delta_{m, m^{\prime}} M_{m}$ 。有了这些附加的限制,公设 3 就变成了刚刚定义的投影测量。

专题 2.4 海森伯不确定性原理

也许量子力学里面最有名的结果就是海森伯不确定性原理(旧译作测不准原理)。假设 $A$ 和 $B$ 是两个厄米算子,$|\psi\rangle$ 是一个量子态。假设 $\langle\psi| A B|\psi\rangle=x+i y$ ,其中 $x$ 和 $y$ 是实数。注意到 $\langle\psi|[A, B]|\psi\rangle=2 i y$ 和 $\langle\psi|{A, B}|\psi\rangle=2 x$ 。这意味着

$$ \begin{equation*} \left.\left.|\langle\psi|[A, B]| \psi\rangle\left.\right|^{2}+|\langle\psi|{A, B}| \psi\right\rangle\left.\right|^{2}=4|\langle\psi| A B| \psi\right\rangle\left.\right|^{2} \tag{2.105} \end{equation*} $$

根据柯西-施瓦茨不等式,有

$$ \begin{equation*} |\langle\psi| A B| \psi\rangle\left.\right|^{2} \leqslant\langle\psi| A^{2}|\psi\rangle\langle\psi| B^{2}|\psi\rangle \tag{2.106} \end{equation*} $$

将它与式(2.105)结合并去掉非负项,有

$$ \begin{equation*} |\langle\psi|[A, B]| \psi\rangle\left.\right|^{2} \leqslant 4\langle\psi| A^{2}|\psi\rangle\langle\psi| B^{2}|\psi\rangle \tag{2.107} \end{equation*} $$

假设 $C$ 和 $D$ 是两个可观测量,将 $A=C-\langle C\rangle$ 和 $B=D-\langle D\rangle$ 代入上述不等式,就得到了

海森伯不确定性原理的一般表达式

$$ \begin{equation*} \Delta(C) \Delta(D) \geqslant \frac{|\langle\psi|[C, D]| \psi\rangle \mid}{2} \tag{2.108} \end{equation*} $$

需要注意一下对于不确定性原理的一个常见误解,那就是以 $\Delta(C)$ 的精度观测 $C$ 会引起 $D$的值受到大小为 $\Delta(D)$ 的千扰,$\Delta(D)$ 满足某些类似于式(2.108)的不等式。尽管在量子力学里面测量会引起被测系统的扰动是真的,但这不是不确定性原理所强调的。

对不确定性原理正确的解读是如果我们准备了大量具有相同状态 $|\psi\rangle$ 的量子系统。在其中一些系统上测量 $C$ ,在其余的系统上测量 $D$ 。那么 $C$ 的结果的标准差 $\Delta(C)$ 乘以 $D$ 的结果的标准差 $\Delta(D)$ 满足不等式(2.108)。

作为不确定性原理的一个例子,在测量量子状态 $|0\rangle$ 时考虑可观测量 $X$ 和 $Y$ 。在式(2.70)中我们证明了 $[X, Y]=2 i Z$ ,所以不确定性原理告诉我们

$$ \begin{equation*} \Delta(X) \Delta(Y) \geqslant\langle 0| Z|0\rangle=1 \tag{2.109} \end{equation*} $$

它的一个基本结论是 $\Delta(X)$ 和 $\Delta(Y)$ 都必须严格大于 0 ,这个结论可以通过直接计算来验证。

投影测量有许多很好的性质。特别地,很容易计算投影测量的平均值。根据定义,测量的平均值(见附录 A 中关于概率论的基本定义和结论)是

$$ \begin{align*} \mathrm{E}(M) & =\sum_{m} m p(m) \tag{2.110}\\ & =\sum_{m} m\langle\psi| P_{m}|\psi\rangle \tag{2.111}\\ & =\langle\psi|\left(\sum_{m} m P_{m}\right)|\psi\rangle \tag{2.112}\\ & =\langle\psi| M|\psi\rangle \tag{2.113} \end{align*} $$

这是一个很有用的公式,能简化很多计算。可观测量 $M$ 的平均值一般写成 $\langle M\rangle \equiv\langle\psi| M|\psi\rangle$ 。从这个平均值公式可推出与观测 $M$ 相联系的标准差的公式

$$ \begin{align*} {[\Delta(M)]^{2} } & =\left\langle(M-\langle M\rangle)^{2}\right\rangle \tag{2.114}\\ & =\left\langle M^{2}\right\rangle-\langle M\rangle^{2} \tag{2.115} \end{align*} $$

这个标准差是对测量 $M$ 的观测值典型分散程度的一个度量。特别地,如果进行大量的实验,其状态为 $|\psi\rangle$ ,可观测量 $M$ 被测量,则观测值的标准差 $\Delta(M)$ 由公式 $\Delta(M)=\sqrt{\left\langle M^{2}\right\rangle-\langle M\rangle^{2}}$ 决定。这个对可观测量给出的测量和标准差的公式是推导出诸如海森伯不确定性原理等结论的一种优美的方法(见专题 2.4 )。 习题 2.58 假设我们有一个量子系统处于可观测量 $M$ 的本征态 $|\psi\rangle$ ,其对应的特征值为 $m \circ$ 那么 $M$ 的平均观测值和标准差是多少?

这里强调一下关于测量的两个广泛使用的说法。人们通常列一组满足关系 $\sum_{m} P_{m}=I$ 和 $P_{m} P_{m^{\prime}}=\delta_{m m^{\prime}} P_{m}$ 的正交投影算子 $P_{m}$ 而不是描述投影算子的观测量。这种做法的相应观测量为 $M=\sum_{m} m P_{m}$ 。另外一个广泛使用的术语"在基 $|m\rangle$ 下测量",其中 $|m\rangle$ 是一组标准正交基。它仅仅是指在投影算子 $P_{m}=|m\rangle\langle m|$ 下的投影测量。

我们看一个在单量子比特上投影测量的例子。首先是对可观测量 $Z$ 的测量,它有特征值 +1和 -1 ,相应的特征向量为 $|0\rangle$ 和 $|1\rangle$ 。因此,例如,在状态 $|\psi\rangle=(|0\rangle+|1\rangle) / \sqrt{2}$ 下测量 $Z$ ,以概率 $\langle\psi \mid 0\rangle\langle 0 \mid \psi\rangle=1 / 2$ 得到结果 +1 。类似地,会以 $1 / 2$ 的概率得到 -1 。更一般地,假设 $\vec{v}$ 是一个任意的三维实单位向量。那么我们可以定义观测量

$$ \begin{equation*} \vec{v} \cdot \vec{\sigma} \equiv v_{1} \sigma_{1}+v_{2} \sigma_{2}+v_{3} \sigma_{3} \tag{2.116} \end{equation*} $$

对这个可观测量的测量,由于历史原因有时也被称为"对自旋沿着 $\vec{v}$ 轴的测量"。在下面三个习题中,你将发现这种测量的一些基本但很重要的性质。

习题 2.59 假设有一个状态为 $|0\rangle$ 的量子比特,并且我们测量可观测量 $X$ ,求 $X$ 的平均值和标准差分别是多少? 习题 2.60 证明 $\vec{v} \cdot \vec{\sigma}$ 有特征值 $\pm 1$ ,并且到相应的本征空间上的投影是 $P_{ \pm}=(I \pm \vec{v} \cdot \vec{\sigma}) / 2$ 。 习题 2.61 测量之前的状态为 $|0\rangle$ ,计算对 $\vec{v} \cdot \vec{\sigma}$ 测量之后得到结果 +1 的概率。如果测量结果是 +1 ,那么测量之后系统的状态是什么?

2.2.6 POVM 测量

量子测量公设,即公设 3,包含两个要素。第一,它给出了描述测量统计的规则。即分别得到不同测量结果的概率。第二,它给出了描述测量之后系统状态的规则。然而,在某些应用之中我们对测量之后系统的状态不感兴趣,主要关心的是不同测量结果出现的概率。例如仅在结束时对系统测量一次的实验就是这种情况。这种情形下,名为 POVM 形式的数学工具特别适合于对测量结果的分析。(缩写词 POVM 代表"Positive Operator-Valued Measure",这是一个技术术语,我们不追究其历史起源。)这种形式体系是测量公设 3 一般描述的简单结论,但是 POVM 理论是如此优美且广为使用,故值得在这里单独讨论。

假设在状态为 $|\psi\rangle$ 的量子系统中执行由测量算子 $M_{m}$ 描述的测量。则得到结果 $m$ 的概率由 $p(m)=\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle$ 给出。假设我们定义

$$ \begin{equation*} E_{m} \equiv M_{m}^{\dagger} M_{m} \tag{2.117} \end{equation*} $$

根据公设 3 和初等线性代数,$E_{m}$ 是一个满足 $\sum_{m} E_{m}=I$ 和 $p(m)=\langle\psi| E_{m}|\psi\rangle$ 的正算子。因此,算子 $E_{m}$ 的集合足以确定不同测量结果的概率。运算符 $E_{m}$ 被称为与测量相关联的 POVM 元素。完整的集合 $\left\{E_{m}\right\}$ 称为一个 POVM。

作为 POVM 的一个示例,考虑由测量算子 $P_{m}$ 描述的投影测量,其中 $P_{m}$ 是满足 $P_{m} P_{m^{\prime}}=$ $\delta_{m m^{\prime}} P_{m}$ 和 $\sum_{m} P_{m}=I$ 的投影算子。在这个实例中(并且仅在这个实例中),所有 POVM 元与测量算子本身相同,因为 $E_{m} \equiv P_{m}^{\dagger} P_{m}=P_{m}$ 。

习题 2.62 证明测量算子和 POVM 元一致的任意测量都是投影测量。 上面提到,POVM算子是半正定的并且满足 $\sum_{m} E_{m}=I_{\circ}$ 设 $\left\{E_{m}\right\}$ 是任意满足 $\sum_{m} E_{m}=I$的正算子集合。我们将证明存在一组测量算子 $M_{m}$ 来定义由 POVM $\left\{E_{m}\right\}$ 描述的测量。定义 $M_{m} \equiv \sqrt{E_{m}}$ ,我们将看到 $\sum_{m} M_{m}^{\dagger} M_{m}=\sum_{m} E_{m}=I_{0}$ 。因此集合 $\left\{M_{m}\right\}$ 描述了使用 $\operatorname{POVM}\left\{E_{m}\right\}$的测量。由于这个原因,将 POVM 定义为满足如下条件的算子集合 $\left\{E_{m}\right\}$ 是很方便的:(a)每个算子 $E_{m}$ 都是半正定的;(b)满足完备性关系 $\sum_{m} E_{m}=I$ ,它表达了概率和为 1 的事实。为了完成 POVM 的描述,我们再次注意到,给定 POVM $\left\{E_{m}\right\}$ ,得到结果 $m$ 的概率为 $p(m)=\langle\psi| E_{m}|\psi\rangle$ 。

我们曾把投影测量看成是 POVM 的一个例子,由于我们没有学到很多新东西,所以并不是很令人兴奋。下面更复杂的例子说明了 POVM 形式体系的应用在量子计算和量子信息中对我们有直觉的指导意义。假设 Alice 给 Bob一个量子比特,其状态处于 $\left|\psi_{1}\right\rangle=|0\rangle$ 或 $\left|\psi_{2}\right\rangle=(|0\rangle+|1\rangle) / \sqrt{2}$ 。正如在 2.2.4 节中解释的那样,Bob 不可能完全可靠地确定给他的态处于 $\left|\psi_{1}\right\rangle$ 还是 $\left|\psi_{2}\right\rangle$ 。然而,他可以进行一项在某些时候能区分状态并且不误判的测量。考虑一个由三个元素构成的 POVM

$$ \begin{align*} E_{1} & \equiv \frac{\sqrt{2}}{1+\sqrt{2}}|1\rangle\langle 1| \tag{2.118}\\ E_{2} & \equiv \frac{\sqrt{2}}{1+\sqrt{2}} \frac{(|0\rangle-|1\rangle)(\langle 0|-\langle 1|)}{2} \tag{2.119}\\ E_{3} & \equiv I-E_{1}-E_{2} \tag{2.120} \end{align*} $$

可以很直接地验证这些正算子满足完备性关系 $\sum_{m} E_{m}=I$ ,因此它们是一组合格的 POVM。 假设 Bob 收到的态是 $\left|\psi_{1}\right\rangle$ ,他用 $\operatorname{POVM}\left\{E_{1}, E_{2}, E_{3}\right\}$ 来进行测量。他观测到结果 $E_{1}$ 的概率是 0 ,因为 $E_{1}$ 的选取保证了 $\left\langle\psi_{1}\right| E_{1}\left|\psi_{1}\right\rangle=0$ 。因此,如果 Bob 测量的结果是 $E_{1}$ ,那么 Bob 可以很自信地说他收到的态一定是 $\left|\psi_{2}\right\rangle_{\circ}$ 同理可得,如果测量结果是 $E_{2}$ ,那么 Bob 收到的态一定是 $\left|\psi_{1}\right\rangle$ 。然而有时候 Bob 的测量结果是 $E_{3}$ ,这个时候他区分不出来收到的是哪个态。不过关键在于 Bob 永远不会误判他收到的态。这个不错的性能是以 Bob 有时候得不到所收到量子态的任何信息为代价的。

这个简单的例子说明了 POVM 形式体系在只有测量统计重要的情况下,是刻画量子测量的一种简单而直观的方法。在本书后面的许多情况中,我们将只关注测量统计学,因此将使用 POVM,而不是在公设 3 中所描述的更一般的测量。

习题 2.63 假设有一个由测量算子 $M_{m}$ 描述的测量。证明存在西算子 $U_{m}$ 使得 $M_{m}=U_{m} \sqrt{E_{m}}$ ,其中 $E_{m}$ 是与测量相联系的 POVM。

习题2.64 假设 Bob 收到从一组线性无关组 $\left|\psi_{1}\right\rangle, \cdots,\left|\psi_{m}\right\rangle$ 中选出的量子态。构造 POVM $\left\{E_{1}, E_{2}\right.$ , $\left.\cdots, E_{m+1}\right\}$ 使得如果结果为 $E_{i}, 1 \leqslant i \leqslant m$ ,那么 Bob 可以确切地知道他收到的状态为 $\left|\psi_{i}\right\rangle$ ( POVM 必须使得对每个 $i$ 都有 $\left\langle\psi_{i}\right| E_{i}\left|\psi_{i}\right\rangle > 0$ )。

专题 2.5 一般测量,投影测量和 POVM

量子力学的大多数介绍材料都只描述投影测量,因此对于多数物理学家来说,可能对公设 3 中给出的测量的一般描述不熟悉,也可能不熟悉 2.2 .6 节中描述的 POVM 形式体系。大多数物理学家不了解一般测量形式的原因是大部分物理系统只能以非常粗略的方式进行测量。在量子计算和量子信息中,我们的目标是对可能进行的测量进行精确的把控,因此应用更全面的测量形式描述是有帮助的。

当然,如2.2.8节所示,当考虑量子力学的其他公理时,投影测量加上西操作与一般测量完全等价。因此,掌握了投影测量的物理学家可能会问:我们从一般形式体系公设3开始的目的是什么?这样做有几个原因。首先,从数学上看,一般测量在某种意义上比投影测量更简单,因为它们对测量算子的限制更少;例如,对于一般测量,不需要类似于投影测量的条件 $P_{i} P_{j}=\delta_{i j} P_{i}$ 。这种简单的结构还为一般测量提供了许多投影测量不具有的有用特性。其次,量子计算和量子信息中存在的重要问题——例如区分一组量子态的最优方法——的答案涉及一般测量,而不是投影测量。

从公设 3 开始的第三个原因与投影测量的可重复性有关。投影测量在以下情况是可重复的,即如果我们执行一次投影测量并获得结果 $m$ ,则重复测量会再次得到结果 $m$ 并且不改变状态。为了证明这一点,假设 $|\psi\rangle$ 是初始状态。在第一次测量之后,状态为 $\left|\psi_{m}\right\rangle=$ $\left(P_{m}|\psi\rangle\right) / \sqrt{\langle\psi| P_{m}|\psi\rangle}$ 。将 $P_{m}$ 应用到 $\left|\psi_{m}\right\rangle$ 上不会改变它,因此我们有 $\left\langle\psi_{m}\right| P_{m}\left|\psi_{m}\right\rangle=1$ 。所以重复测量每次都给出结果 $m$ ,而不改变状态。

投影测量的可重复性提醒我们量子力学中的许多重要测量都不是投影测量。例如,如果我们使用镀银屏幕来测量光子的位置,我们会在此过程中破坏光子。这当然使得无法重复测量光子的位置!许多其他量子测量在与投影测量相同的意义下也不能重复测量。对于这样的测量,必须使用公设 3 的一般测量公设。POVM 适用于什么场景?POVM 最好被视为一般测量形式的一个特例,它提供了一种研究一般测量的统计特性的最简单的方法,而无须了解测量后的状态。它是一种方便的数学工具,有时可为量子测量研究提供额外灵感。

2.2.7 相位

相位是量子力学中一个常用的术语,依据上下文具有几种不同的含义。这里可以方便地回顾其中的几个含义。例如,考虑状态 $\mathrm{e}^{\mathrm{i} \theta}|\psi\rangle$ ,其中 $|\psi\rangle$ 是状态向量,$\theta$ 是一个实数。我们认为除了全局相位因子(global phase factor) $\mathrm{e}^{\mathrm{i} \theta}$ ,状态 $\mathrm{e}^{\mathrm{i} \theta}|\psi\rangle$ 等于 $|\psi\rangle$ 。值得注意的是,对这两种状态的测量统计结果是相同的。为了说明这一点,假设 $M_{m}$ 是一个与某个量子测量相关的测量算子,并注意到出现结果 $m$ 的概率分别为 $\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle$ 和 $\langle\psi| \mathrm{e}^{-\mathrm{i} \theta} M_{m}^{\dagger} M_{m} \mathrm{e}^{\mathrm{i} \theta}|\psi\rangle=\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle$ 。因此,从观测的角度,这两个状态是相同的。出于这个原因,我们可以忽略全局相位因子,因为它与物理系统的可观测性质无关。

还有一种相位叫做相对相位(relative phase),它有着完全不同的含义。考虑状态

$$ \begin{equation*} \frac{|0\rangle+|1\rangle}{\sqrt{2}} \quad \text { 和 } \quad \frac{|0\rangle-|1\rangle}{\sqrt{2}} \tag{2.121} \end{equation*} $$

第一个状态中 $|1\rangle$ 的振幅为 $1 / \sqrt{2}$ ,第二个状态中振幅为 $-1 / \sqrt{2}$ 。在每一种情况下,振幅的大小是相同的,但它们的符号不同。更一般地,如果存在实数 $\theta$ ,使得 $a=\exp (\mathrm{i} \theta) b$ ,那么我们称两个振幅 $a$ 和 $b$ 相差一个相对相位。如果两个状态的每个振幅都由一个相位因子相联系,那么我们称这两个状态在该基下相差一个相对相位。例如,上面的两种状态除一个相对相移外是相同的,因为 $|0\rangle$ 的振幅是相同的(相对相位因子为 1 ),而 $|1\rangle$ 的振幅仅相差一个相对因子 -1 。相对相位因子与全局相位因子的区别在于,相对相位的相位因子可能因振幅而异。这就使得相对相位不同于全局相位,它是依赖基的选择的。因此,在某个基下,仅相对相位不同的状态会在测量统计中产生物理上可观测的差异,而不能像我们对仅差全局相位因子状态那样把这些态视为物理等价。 习题 2.65 在一个基下把状态 $(|0\rangle+|1\rangle) / \sqrt{2}$ 和 $(|0\rangle-|1\rangle) / \sqrt{2}$ 表示成相差一个相对相移的形式。

2.2.8 复合系统

假设我们感兴趣的是一个由两个(或多个)不同物理系统组成的复合量子系统。我们应该如何描述复合系统的状态?下面的公设描述了复合系统的状态空间是如何由分系统的状态空间构成的。

公设 4:复合物理系统的状态空间是分物理系统的状态空间的张量积。此外,如果系统编号为 1 到 $n$ ,且系统 $i$ 的状态被准备为 $\left|\psi_{i}\right\rangle$ ,则整个系统的联合状态是 $\left|\psi_{1}\right\rangle \otimes\left|\psi_{2}\right\rangle \otimes \cdots \otimes\left|\psi_{n}\right\rangle$ 。

为什么用张量积来描述一个复合物理系统的状态空间的数学结构呢?在一个层面上,我们可以不把它归约为更基本的概念,而是简单地作为一个基本公设来接受,并继续我们的讨论。毕竟,我们当然希望在量子力学中有一些描述复合系统的规范方法。我们还有别的办法可以得出这样的公设吗?这里有一个有时会用到的启发性方法。物理学家有时喜欢谈论量子力学的叠加原理 (superposition principle of quantum mechanics),它指的是,如果 $|x\rangle$ 和 $|y\rangle$ 是一个量子系统的两种状态,那么任何叠加 $\alpha|x\rangle+\beta|y\rangle$ 也应该是量子系统的一个允许的状态,其中 $|\alpha|^{2}+|\beta|^{2}=1$ 。对于复合系统,很自然地有,如果 $|A\rangle$ 是系统 $A$ 的一个状态,$|B\rangle$ 是系统 $B$ 的一个状态,那么就应该有一个联合系统 $A B$ 的相应的状态,记作 $|A\rangle|B\rangle$ 。将叠加原理应用于这种形式的乘积状态,我们就得到了上面给出的张量积公设。因为我们不把叠加原理视为我们描述量子力学的一个基本部分,所以这不是推导,但它让我们看到同一思想有时可以有不同的表述形式。

在文献中会遇到各种不同的复合系统符号。这种多样化的部分原因是,不同的符号更适合于不同的应用,并且有时引入一些专门的符号是很方便的。在上下文不明确时,可以用一个下标符号表示不同系统上的状态和运算符。例如,在包含三个量子比特的系统中,用 $X_{2}$ 表示作用在第二个量子比特上的泡利算子 $\sigma_{x}$ 。 习题2.66 证明对一个处于状态 $(|00\rangle+|11\rangle) / \sqrt{2}$ 的两量子比特系统的可观测量 $X_{1} Z_{2}$ 测量的平均值为零。

在 2.2.5 节,我们曾指出投影测量和西演化足以实现一般测量。这一说法的证明利用了复合量子系统,并且是公设 4 作用的一个很好的例子。假设我们有一个状态空间为 $Q$ 的量子系统,希望在系统 $Q$ 上执行由测量算子 $M_{m}$ 定义的测量。为此,我们引入一个状态空间为 $M$ 的辅助系统,该系统具有与我们希望实现的测量的可能结果一一对应的正交基 $|m\rangle$ 。这个辅助系统可以被看做仅仅是出现在构造中的一个数学装置,或者可以被物理地解释为引人到这个问题中的一个附加的量子系统,且其状态空间满足要求的性质。

令 $|0\rangle$ 为 $M$ 的任一固定状态,在 $Q$ 中状态 $|\psi\rangle$ 和状态 $|0\rangle$ 的乘积 $|\psi\rangle|0\rangle$ 上定义一个西算子 $U$如下:

$$ \begin{equation*} U|\psi\rangle|0\rangle \equiv \sum_{m} M_{m}|\psi\rangle|m\rangle \tag{2.122} \end{equation*} $$

利用状态集 $|m\rangle$ 的标准正交性和完备性关系 $\sum_{m} M_{m}^{\dagger} M_{m}=I$ ,我们可以看到 $U$ 保持形如 $|\psi\rangle|0\rangle$的状态之间的内积,即

$$ \begin{align*} \langle\varphi|\langle 0| U^{\dagger} U|\psi\rangle|0\rangle & =\sum_{m, m^{\prime}}\langle\varphi| M_{m}^{\dagger} M_{m^{\prime}}|\psi\rangle\left\langle m \mid m^{\prime}\right\rangle \tag{2.123}\\ & =\sum_{m}\langle\varphi| M_{m}^{\dagger} M_{m}|\psi\rangle \tag{2.124}\\ & =\langle\varphi \mid \psi\rangle \tag{2.125} \end{align*} $$

由习题 2.67 的结果可知,$U$ 可以被扩张为空间 $Q \otimes M$ 上的西算子,我们仍记为 $U$ 。 习题 2.67 假设 $V$ 是希尔伯特空间且 $W$ 是其子空间,设 $U: W \rightarrow V$ 是一个保持内积的线性算子,即对于 $W$ 中的 $\left|w_{1}\right\rangle$ 和 $\left|w_{2}\right\rangle$ ,有

$$ \begin{equation*} \left\langle w_{1}\right| U^{\dagger} U\left|w_{2}\right\rangle=\left\langle w_{1} \mid w_{2}\right\rangle \tag{2.126} \end{equation*} $$

证明存在扩张 $U$ 的西算子 $U^{\prime}: V \rightarrow V$ ,即对所有 $W$ 中的 $|w\rangle$ 有 $U^{\prime}|w\rangle=U|w\rangle$ ,但 $U^{\prime}$ 是定义在整个空间 $V$ 上。通常我们省略符号 ${ }^{\prime}$ ,仅用 $U$ 来表示这个扩张。

在 $U$ 作用在 $|\psi\rangle|0\rangle$ 之后,假设在两个系统上进行由投影算子 $P_{m} \equiv I_{Q} \otimes|m\rangle\langle m|$ 描述的投影测量,结果 $m$ 出现的概率是

$$ \begin{align*} p(m) & =\langle\psi|\langle 0| U^{\dagger} P_{m} U|\psi\rangle|0\rangle \tag{2.127}\\ & =\sum_{m^{\prime}, m^{\prime \prime}}\langle\psi| M_{m^{\prime}}^{\dagger}\left\langle m^{\prime}\right|\left(I_{Q} \otimes|m\rangle\langle m|\right) M_{m^{\prime \prime}}|\psi\rangle\left|m^{\prime \prime}\right\rangle \tag{2.128}\\ & =\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle \tag{2.129} \end{align*} $$

正如在公设 3 中所给出的那样。在结果 $m$ 出现的条件下,联合系统 $Q M$ 在测量后的状态是

$$ \begin{equation*} \frac{P_{m} U|\psi\rangle|0\rangle}{\sqrt{\langle 0|\langle\psi| U^{\dagger} P_{m} U|\psi\rangle|0\rangle}}=\frac{M_{m}|\psi\rangle|m\rangle}{\sqrt{\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle}} \tag{2.130} \end{equation*} $$

系统 $M$ 的测量后状态为 $|m\rangle$ ,且系统 $Q$ 的状态为

$$ \begin{equation*} \frac{M_{m}|\psi\rangle}{\sqrt{\langle\psi| M_{m}^{\dagger} M_{m}|\psi\rangle}} \tag{2.131} \end{equation*} $$

正如公设 3 所规定的那样。因此西演化,投影测量及引人辅助系统的能力,共同使任何形式的测量在公设 3 中得到实现。

公设 4 还使我们能够定义与复合量子系统相关的最有趣和最令人费解的想法之一——纠缠 (entanglement)。考虑两量子比特态

$$ \begin{equation*} |\psi\rangle=\frac{|00\rangle+|11\rangle}{\sqrt{2}} \tag{2.132} \end{equation*} $$

这个状态具有一个显著的特性,即不存在单量子比特态 $|a\rangle$ 和 $|b\rangle$ ,使得 $|\psi\rangle=|a\rangle|b\rangle$ 。该事实读者可以自己证明。

习题 2.68 证明对于所有单量子比特态 $|a\rangle$ 和 $|b\rangle$ ,都有 $|\psi\rangle \neq|a\rangle|b\rangle$ 。 我们说,具有这种性质(不能写成其分系统状态的乘积)的复合系统的状态是一个纠缠态 ( entangled state)。纠缠态在量子计算和量子信息中起着至关重要的作用,并在本书的其余部分反复出现,但其原因没有人完全明白。在 1.3.7节,我们已经看到纠缠在量子隐形传态中起了至关重要的作用。本章中,我们将给出纠缠量子态带来的奇异效应的两个例子:超密编码(2.3节)和贝尔不等式的违反(2.6节)。

2.2.9 量子力学:总览

我们现在已经解释了量子力学的所有基本公设。本书其余的大部分内容都将用这些公设来推导结论。让我们快速回顾一下这些公设并试着以全局视角看待。

公设 1 通过指定如何描述一个孤立量子系统的状态来设定量子力学的研究范畴。公设 2 告诉我们封闭量子系统的动态演化是由薛定谔方程,也就是西演化来描述。公设 3 告诉我们如何通过规定测量的描述从量子系统中提取信息。公设 4 告诉我们如何把不同量子系统的状态空间相结合来描述复合系统。

至少用经典的眼光来看,量子力学的奇怪之处是我们不能直接观察状态向量。这有点像某种国际象棋游戏,你永远找不到每个棋子的确切位置,而只知道在棋盘上的排列。经典物理学及我们的直觉告诉我们物体的基本属性,如能量,位置和速度,可以直接通过观察得到。在量子力学中,这些量不再是基本的,取而代之的是无法直接观测到的状态向量。就好像量子力学中有一个只能间接和不完全地访问的隐藏世界。此外,仅仅观察一个经典系统并不一定会改变系统的状态。想象一下,如果你每次观测球都会改变它的位置,那么打网球将会多么困难!但根据公设 3,量子力学中的观测是一种破坏性的过程,它通常会改变系统的状态。

我们应该从量子力学的这些奇异特征中得出什么结论呢?是否有可能以一种数学上等价的方式重新表述量子力学,使它更类似经典物理学的结构?在 2.6 节中,我们将证明贝尔不等式,这

个令人惊讶的结果表明任何重新描述量子力学的尝试都是注定要失败的,我们无法摆脱量子力学反直觉的性质。当然,对此的正确反应是欢乐,而不是悲伤!它给了我们一个开发量子力学直观化思想工具的机会。此外,我们可以利用状态向量的隐藏特性来完成在经典世界中不可能的信息处理任务。没有这种反直觉的行为,量子计算和量子信息就没那么有趣了。

我们也可以问自己:"如果量子力学和经典物理学如此不同,那么为什么日常世界看起来如此经典呢?"为什么我们在日常生活中看不到隐藏状态矢量的迹象?事实上,我们所看到的经典世界可以通过对量子力学在日常生活的时间,长度和质量尺度上作近似描述推导出来。解释量子力学如何推导出经典物理学的细节超出了这本书的范畴,感兴趣的读者可以查阅第 8 章末尾的 "背景资料与延伸阅读"部分。

2.3 应用:超密编码

超密编码(superdense coding)是基本量子力学原理的一个简单但惊人的应用。如前几节所述,它以一种具体的,非平凡的方式结合了前面几节涉及的基础量子力学的所有基本思想,因此是可以用量子力学完成的信息处理任务的理想例子。

超密编码涉及两方,通常称为 Alice 和 Bob,他们彼此相距很远。他们的目标是将一些经典信息从 Alice 发送到 Bob。假设 Alice 拥有两个经典比特的信息要发送给 Bob,但只允许向 Bob 发送一个量子比特。她能实现自己的目标吗?

超密编码告诉我们,这个问题的答案是肯定的。假设 Alice 和 Bob 最初共享一对纠缠态

$$ \begin{equation*} |\psi\rangle=\frac{|00\rangle+|11\rangle}{\sqrt{2}} \tag{2.133} \end{equation*} $$

的量子比特。最初,Alice 拥有第一个量子比特,而 Bob 拥有第二个量子比特,如图 2-3 所示。注意,$|\psi\rangle$ 是固定状态;为制备此状态,Alice 不需要发送给 Bob 任何量子比特。相反,某个第三方可能提前制备了该纠缠状态,把其中一个量子比特发送给 Alice,另一个发送给 Bob。

通过将拥有的单个量子比特发送给 Bob,Alice 可以将两位经典信息传递给 Bob。下面是她采用的步骤。如果她想发送比特串" 00 "给 Bob,那么就不需要对她的量子比特做什么。如果她希望发送" 01 ",那么将相位翻转 $Z$ 应用于她的量子比特上。如果她想发送" 10 ",那么将量子门 $X$ 应用到她的量子比特上。如果她想发送" 11 ",那么将 $i Y$ 门应用于她的量子比特上。结果很容易看出,为以下 4 个状态:

$$ \begin{align*} & 00:|\psi\rangle \rightarrow \frac{|00\rangle+|11\rangle}{\sqrt{2}} \tag{2.134}\\ & 01:|\psi\rangle \rightarrow \frac{|00\rangle-|11\rangle}{\sqrt{2}} \tag{2.135}\\ & 10:|\psi\rangle \rightarrow \frac{|10\rangle+|01\rangle}{\sqrt{2}} \tag{2.136}\\ & 11:|\psi\rangle \tag{2.137} \end{align*} > \frac{|01\rangle-|10\rangle}{\sqrt{2}}, $$

正如 1.3.6节所述,这 4 种状态被称为贝尔基,贝尔态或 EPR 对,以纪念几位首先发现纠缠现象新奇之处的先驱者。注意到贝尔态组成了一组标准正交基,因此可以通过适当的量子测量来区分。如果 Alice 把她的比特送给 Bob,让 Bob 拥有这两个量子比特,然后,通过在贝尔基上进行一次测量,Bob 可以确定 Alice 发送的是 4 个可能的比特串中的哪一个。

图 2-3 超密编码的初始设置,其中 Alice 和 Bob 均拥有一个纠缠量子比特对的一半。仅仅使用单个量子比特的通信和这种预先设定的纠缠,Alice 就可以使用超密编码来传送两个经典比特的信息给 Bob

总之,Alice 只与一个量子比特进行交互就可以向 Bob 发送两比特信息。当然,协议中涉及两个量子比特,但是 Alice 不需要与第二量子比特交互。从经典意义上讲,正如我们将在第 12 章中证明的,Alice 不可能只传送一个经典的比特而完成任务。此外,这令人瞩目的超密编码协议在实验室得到了部分验证(有关实验验证的参考资料,请参阅"背景资料与延伸阅读")。在后面的章节中,我们将看到量子力学被用来执行信息处理任务的许多其他例子,其中一些比超密编码更加壮观。然而,在这个漂亮的例子中已经可以看到一个关键点:信息是物理的,量子力学等令人惊讶的物理理论可能预测出惊人的信息处理能力。

习题 2.69 验证贝尔基构成两量子比特状态空间的一组标准正交基。 习题2.70 假设 $E$ 是作用于 Alice 的量子比特上的任何正算子。证明当 $|\psi\rangle$ 是 4 种贝尔态之一时,值 $\langle\psi| E \otimes I|\psi\rangle$ 是相同的。假设某个恶意的第三方(Eve)在通过超密编码协议发送给 Bob 的途中截获了 Alice 的量子比特。Eve 能推断出 Alice 试图发送的是 4 条可能的比特串 $00,01,10,11$ 中的哪一条吗?如果能,怎么推断?如果不能,为什么?