凡是有可能出错的地方,就肯定会出错。
我们在电话中交谈时都不时遇到困难。当我们听不清线路另一端的人说话时,我们说我们有一条"坏线"。这是所有信息处理系统中普遍存在的噪声的一个例子。如第 10 章所述,纠错码可用于对抗噪声的影响,即使存在非常严重的噪声,也可以进行可靠的通信和计算。给定特定的噪声通信信道 $\mathcal{N}$ ,一个有趣的问题是通过该信道能可靠地传输多少信息。例如,使用信道 1000 次以适当的纠错码来发送 500 比特的信息,能以高概率从信道引入的任何错误中恢复出原始信息。我们说这样的编码的码率为 $500 / 1000=1 / 2$ 。信息论的一个基本问题是确定通过信道 $\mathcal{N}$ 进行可靠通信的最大码率,这个量称为信道容量。
对于有噪声的经典通信信道,可以使用香农噪声信道编码定理来计算信道的容量。我们以研究存在噪声时经典信息的通信开始,在 12.3 .1 节讨论香农噪声信道编码定理背后的一些主要思想。在 12.3.2 节中,我们继续详细研究问题的推广形式,即双方试图通过使用有噪声的量子信道来传递经典信息。
许多关于噪声信道编码的主要思想,无论是量子信道还是经典信道,都可以通过二元对称信道来理解。回顾 10.1 节,二元对称信道是用于单比特信息的噪声通信信道,其效果是以概率 $p > 0$ 翻转传输的比特,而以概率 $1-p$ 正确无误地传输,如图 12-4 所示。
图 12-4 二元对称信道 每次使用二元对称信道,我们可以可靠地传输多少信息?可以使用纠错码通过该信道发送信息,但是需要建立在用于完成通信的比特数的额外开销上。我们将论证信息可靠传输的最大码率是 $1-H(p)$ ,其中 $H(\cdot)$ 是香农熵。
可靠地完成传输是什么意思?这是一个很好的问题,因为不同的答案会导致不同方案的码率不同。我们将使用以下对于可靠性的定义:我们假设信道的输人可以以大的块一次全部编码,并且需要使用所述编码在块变大时其传输出错的概率趋近于零。可靠性的另一种可能定义是依然假设编码可以以块的形式进行,但是随着块大小变得足够大,错误的概率恰好变为零。不幸的是,该定义对于通过纠错可以实现的目标过于乐观,并导致二元对称信道的容量为零!类似地,如果我们不允许在大块中执行编码,则容量也会变为零。实际上,令人惊讶的是(并且不是十分显
然),如果我们对可靠性的定义不那么过于夸张,我们是可以实现非零的信息传输码率的。为了证明这一可能性,我们需要几个巧妙的想法。
假设我们希望使用我们的二元对称信道 $n$ 次来传输 $n R$ 比特的信息,也就是说,我们希望通过信道以码率 $R$ 传输信息。我们将证明存在一个纠错码在 $n$ 充分大时低错误概率实现 $R < 1-H(p)$的传输方案。我们需要的第一个思想是构造纠错码的随机编码法。假设 $(q, 1-q)$ 是信道输入 $(0$和1)的任意固定概率分布。(这种分布通常被称为码的先验分布——引人这种分布的目的是使随机编码法能够工作,该分布中的随机性不应与信道中的随机性混淆。)然后我们通过对每个 $j=1, \cdots, n$ 独立地以概率 $q$ 选择 $x_{j}=0,1-q$ 选择 $x_{j}=1$ 的简单方法为我们选择一个码字 $x=\left(x_{1}, \cdots, x_{n}\right)$ 。我们重复这一过程 $2^{n R}$ 次,创建一个 $2^{n R}$ 个条目的密码本 $C$ ,我们用 $x^{j}$ 表示代码本中的某个条目。
显然,使用这一过程可能产生一些效果非常差的纠错码!如果我们足够不幸,我们构造的码其中所有的码字都是由 $n$ 个 0 组成的字符串,这显然对信息传输没有任何用处。然而事实证明,平均而言,这种随机编码程序提供了非常好的纠错码。为了理解为什么会这样,让我们看看信道对码中的单个码字做了什么。由于所有码字都以相同的方式构造,我们不妨看看第一个码字 $x^{1}$ 。
二元对称信道对 $x^{1}$ 有什么影响?在长度为 $n$ 的码字上,我们期望大约 $n p$ 的比特被翻转,因此很有可能来自信道的输出将具有与码字 $x^{1}$ 相差大约 $n p$ 的汉明距离,如图 12-5 所示。我们说这样的输出是在围绕 $x^{1}$ 半径为 $n p$ 的汉明球上。汉明球中有多少元素?答案是大约有 $2^{n H(p)}$ 个,因为汉明球由信道中所有经常出现的输出 $y=x^{1} \oplus e$ 组成,其中 $e$ 是信道中出现的误差,$\oplus$ 表示按位模 2 加。通过典型序列定理,这种典型误差 $e$ 的数量约为 $2^{n H(p)}$ 。
图 12-5 假设通过二元对称信道的 $n$ 次使用发送码字 $x^{1}$ 。然后,来自信道的典型输出是以发送序列为球心半径为 $n p$ 的汉明球上的元素(此图为图 12-6 的特写)
我们集中注意力到单个码字,所有码字都可能出现同样类型的损坏。我们可以想象所有码字及其周围汉明球的空间,如图 12-6 所示。如果像画的那样,汉明球不重叠,那么 Bob 就可以轻松
地解码信道的输出。他只要检查输出是否在其中一个汉明球中,如果是,则输出相应的码字,如果不是,则输出"错误"。由于我们假设球体不重叠,因此任何码字作为输人,都能以很高的概率成功解码。实际上,即使球体稍微重叠,如果重叠很小,Bob 仍有可能以很高的成功率进行解码,即很有可能信道输出将属于一个(不是零或两个或者更多)汉明球,这样就能被成功解码。
图 12-6 随机选择的二元对称信道的码字被它们的"典型"输出的汉明球包围。单个码字的特写见图 12-5 这种小的重叠条件什么时候会发生?为了理解这一点,我们需要更好地理解信道输出的结构。我们通过从随机变量的集合 $\left(X_{1}, \cdots, X_{n}\right)$ 中采样 $2^{n R}$ 次来获得码的码字,这些随机变量是独立同分布的,其中 $X_{j}=0$ 的概率为 $q, X_{j}=1$ 的概率为 $1-q$ 。假设我们令 $Y_{j}$ 为通过二元对称信道发送 $X_{j}$ 的结果。典型序列定理意味着 $\left(Y_{1}, \cdots, Y_{n}\right)$ 的典型值的集合大小约为 $2^{n H(Y)}$ ,其中 $Y$ 与每个 $Y_{j}$ 同分布。而且,这些典型输出值中的每一个具有大致相等的概率。
现在,如果我们从一百万大小的总体中均匀地抽样一百次,我们不太可能产生重复。事实上,即使我们采样十万次,出现重复的次数也会非常小。直到我们抽样大约一百万个样本,重复的次数才会相对于样本的大小开始变的较大。以类似的方式,我们的半径为 $n p$ 的 $2^{n R}$ 个汉明球之间的重叠不会很大,除非所有球体中元素的总数接近空间的大小 $2^{n H(Y)}$ ,这就保证了我们能有效地从中随机抽样。由于每个球包含大约 $2^{n H(p)}$ 个元素,这意味着我们很有可能有一个好的纠错码,使得
$$ \begin{equation*} 2^{n R} \times 2^{n H(p)} < 2^{n H(Y)} \tag{12.62} \end{equation*} $$
其对应于条件
$$ \begin{equation*} R < H(Y)-H(p) \tag{12.63} \end{equation*} $$
摘 $H(Y)$ 取决于为 $X_{j}$ 选择的先验分布 $(q, 1-q)$ 。为了使码率尽可能高,我们要最大化 $H(Y)$ 。经过简单的计算,使用对应于 $q=1 / 2$ 的均匀先验分布能达到最大值 $H(Y)=1$ ,因此可以实现任意小于 $1-H(p)$ 的码率 $R$ 。
我们刚概述证明了,可以通过二元对称信道以高达 $1-H(p)$ 的码率可靠地传输信息。证明相当简略,但它实际包含了严格证明所需的许多关键思想,即使在量子的情况下也是如此。事实证明,我们已经描述的实现的码率也是通过二元对称信道传输信息的最大码率;任何高于 $1-H(p)$的码率会使得汉明球开始大量重叠,以至于无论码字如何选择都不能确定所发送的码字是什么!
因此, $1-H(p)$ 是二元对称信道的容量。 随机编码作为实现二元对称信道的高码率编码的方法有多实用?确实,如果我们使用随机编码很有可能以接近容量的码率运行。不幸的是,这个过程存在很大的困难。为了进行编码和解码,发送方和接收方(Alice 和 Bob)必须首先就执行这些任务的策略达成一致。在随机编码的情况下,这意味着 Alice 必须向 Bob 发送她所有随机码字的列表。这样做需要使 Alice 和 Bob 额外进行相比其原本在噪声信道中所需要的等量甚至更多的通信。显然,这对许多应用来说都是不可取的!随机编码方法仅仅是一种证明高码率码存在的方法,而不是一种实用的方法。对于广泛的实际应用来说,我们希望的是一种能实现接近信道容量的码率的方法,其不会给 Alice 和 Bob 带来不可接受的通信开销。值得注意的是,即使只对于有噪声的经典信道,经过了数十年的努力,直到最近才发现了构建这种码的方法,而寻找噪声量子信道的构造仍然是一个有趣的开放问题。
香农噪声信道编码定理将二元对称信道容量的结果推广到了离散无记忆信道的情况。这样的信道具有有限输入字母表 $\mathcal{I}$ 和有限输出字母表 $\mathcal{O}$ 。对于二元对称信道,$I=O={0,1}$ 。信道的行为由一组条件概率 $p(y \mid x)$ 描述,其中 $x \in \mathcal{I}, y \in \mathcal{O}$ 。这些表示信道给定输人为 $x$ 时的不同输出 $y$ 的概率,并满足规则
$$ \begin{gather*} p(y \mid x) \geqslant 0 \tag{12.64}\\ \text { 对于任意 } x, \sum_{y} p(y \mid x)=1 \tag{12.65} \end{gather*} $$
信道是无记忆的意味着在每次使用信道时,信道的行为方式相同,并且每次使用彼此独立。我们将用符号 $\mathcal{N}$ 来表示经典噪声信道。
当然,有许多有趣的通信信道不是离散无记忆信道,例如之前给出的电话线的例子,其具有连续的输人和输出。更一般的信道在技术上可能比离散无记忆信道更难以理解,但很多基本思想是相同的,如果需要更多相关信息,参见章末的"背景资料与延伸阅读"部分。
让我们看一下香农噪声信道编码定理的实际表述。因为我们在下一节中将证明更一般的关于量子信道的结果,所以这里不会给出证明细节,但是看一下经典结果的表述也是有益的。首先,我们需要让我们的可靠信息传输的概念更加精确。基本思想如图 12-7 所示。在第一阶段, $2^{n R}$个可能消息之一 $M$ 由 Alice 产生并且使用映射 $C^{n}:\left\{1, \cdots, 2^{n R}\right\} \rightarrow \mathcal{I}^{n}$ 编码,其为 Alice 的每一可能消息分配一个输人字符串,并将字符串通过 $n$ 次使用该信道发送给 Bob,Bob 使用映射 $D^{n}: \mathcal{O}^{n} \rightarrow\left\{1, \cdots, 2^{n R}\right\}$ 解码信道输出,它对每个可能的信道输出的字符串分配一条消息。对于给定的编码解码对,错误概率定义为,对于所有消息 $M$ ,信道 $D(Y)$ 的解码输出不等于消息 $M$的最大概率:
$$ \begin{equation*} p\left(C^{n}, D^{n}\right) \equiv \max _{M} p\left(D^{n}(Y) \neq M \mid X=C^{n}(M)\right) \tag{12.66} \end{equation*} $$
如果存在一系列这样的编码解码对 $\left(C^{n}, D^{n}\right)$ ,并且当 $n \rightarrow \infty$ 时 $p\left(C^{n}, D^{n}\right) \rightarrow 0$ ,那么我们说码率 $R$ 是可达的。给定噪声信道 $\mathcal{N}$ 的容量 $C(\mathcal{N})$ 被定义为信道的所有可达码率的最高值。
图 12-7 经典消息的噪声编码问题。我们要求 $2^{n R}$ 个可能消息中的每一个都应该以高概率通过信道未被破坏地传输
一个先验知识是计算信道的容量并不是很显然的——简单的计算将涉及对非常大(无限!)范围可能的编解码方法取上界,这似乎是不太可能的做法。香农噪声信道编码定理极大地简化了容量计算,将其简化为一个简单且定义明确的优化问题,在许多情况下可以精确地解决,并且即使在精确方案不可行的情况下,计算上也很容易处理。 定理12.7(香农噪声信道编码定理)对于一个噪声信道 $\mathcal{N}$ ,其容量
$$ \begin{equation*} C(\mathcal{N})=\max _{p(x)} H(X: Y) \tag{12.67} \end{equation*} $$
其中最大值需要取遍 $X$ 所有可能的输人分布 $p(x), Y$ 为对应的由信道输出推导出的随机变量。 作为噪声信道编码定理的一个例子,我们考虑以概率 $p$ 翻转比特的二元对称信道,输人分布为 $p(0)=q, p(1)=1-q$ 。我们有
$$ \begin{align*} H(X: Y) & =H(Y)-H(Y \mid X) \tag{12.68}\\ & =H(Y)-\sum_{x} p(x) H(Y \mid X=x) \tag{12.69} \end{align*} $$
但是对于每个 $x, H(Y \mid X=x)=H(p)$ ,所以 $H(X: Y)=H(Y)-H(p)$ ,其可选择 $q=1 / 2$ 来最大化,所以 $H(Y)=1$ ,因此由香农噪声信道编码定理 $C(\mathcal{N})=1-H(p)$ ,正如我们之前对二元对称信道的信道容量的直观计算结果一样。 习题12.9 擦除信道有两个输人 0 和 1 ,以及三个输出 $0,1, e_{\circ}$ 以 $1-p$ 的概率输人保持不变,以概率 $p$ 输人被"擦除",并由 $e$ 代替。
1.证明擦除信道的容量为 $1-p$ 。 2.证明擦除信道的容量大于二元对称信道的容量。这一结果有什么直观解释? 习题12.10 $\mathcal{N}_{1}$ 和 $\mathcal{N}_{2}$ 为两个离散无记忆信道,其中 $\mathcal{N}_{1}$ 的输出字母表和 $\mathcal{N}_{2}$ 的输人字母表相同。证明
$$ \begin{equation*} C\left(\mathcal{N}_{2} \circ \mathcal{N}_{1}\right) \leqslant \min \left(C\left(\mathcal{N}_{1}\right), C\left(\mathcal{N}_{2}\right)\right) \tag{12.70} \end{equation*} $$
并找出不等式严格成立的一个例子。 我们提出的噪声信道编码定理的一个特点是,没有出现经典信源的概念。回想一下,我们之前将经典信源定义为一系列独立同分布的随机变量。我们可以将这种信源的概念与噪声信道编码定理相结合,以获得所谓的信源--信道编码定理。基本思想如图 12-8 所示。具有熵率 $H(X)$ 的信
源正在产生信息。通过香农无噪声信道编码定理,可以压缩来自信源的信息,因此描述它只需要 $n H(X)$ 位,此步骤有时称为信源编码。信源的压缩输出用作噪声信道的输人。以小于容量的码率 $R$ 传输,它需要使用信道 $n H(X) / R$ 次以可靠地将压缩数据发送到接收方,然后接收方可以将其解压缩以恢复出源的原始输出。
图 12-8 经典信源的噪声编码问题,有时称为信源编码模型
您可能想知道是否有通过噪声通道传输信源的更好方案。也许能比压缩编码和解码解压缩这一两阶段方法做更有效的事情?事实上能证明并非如此,我们所描述的信源--信道编码方案就是最优的,但这一事实的证明超出了本书范围,更多细节请参阅章末的"背景资料与延伸阅读"。
假设 Alice 和 Bob 不使用经典噪声通信信道来通信,而是使用噪声量子通信信道。更准确地说,Alice 有一些她希望发送给 Bob 的消息 $M$ 。正如她在经典情况中所做的那样她对消息进行编码,但是现在消息被编码为量子态,并通过噪声量子信道发送。通过以正确的方式编码,我们希望 Bob 能够以较低失败概率确定 Alice 的消息是什么。此外,我们希望 Alice 能够向 Bob 发送信息的码率尽可能高。换言之,我们想要的是用于计算噪声量子信道对经典信息的容量的过程。这个问题尚未完全解决,但已经取得了很大进展,在本节中我们将研究这些。
已知的是当 Alice 使用形式为 $\rho_{1} \otimes \rho_{2} \otimes \cdots$ 的乘积态对其消息进行编码时如何计算通道 $\mathcal{E}$ 的容量,其中 $\rho_{1}, \rho_{2}, \cdots$ 中的每一个都是每次使用信道 $\mathcal{E}$ 时的隐含输入。我们将具有此限制的容量称为乘积态容量,并将其表示为 $C^{(1)}(\mathcal{E})$ ,以表示输人状态不能在信道的两次或更多次使用中产生纠缠。请注意,Alice 和 Bob 之间的这种受限制的通信模型确实允许 Bob 使用在信道的多次使用中纠缠的测量进行解码,而事实证明这也是必需的。唯一的限制(也是不幸的限制)是 Alice只能制备乘积态输人。许多研究人员相信但尚未证实的是,允许信号纠缠不会增加容量。使我们能够计算乘积态容量的结果被称为 Holevo-Schumacher-Westmoreland(HSW)定理。与经典噪声信道的香农噪声信道编码定理一样,HSW 定理为计算指定噪声信道 $\mathcal{E}$ 的乘积态容量提供了有效的手段,并且在某些情况下甚至可以进行精确表达式的推导。
定理12.8(Holevo-Schumacher-Westmoreland(HSW)定理)令 $\mathcal{E}$ 为一个保迹量子算子。定义
$$ \begin{equation*} \chi(\mathcal{E}) \equiv \max _{\left\{p_{j}, \rho_{j}\right\}}\left[S\left(\mathcal{E}\left(\sum_{j} p_{j} \rho_{j}\right)\right)-\sum_{j} p_{j} S\left(\mathcal{E}\left(\rho_{j}\right)\right)\right] \tag{12.71} \end{equation*} $$
其中最大值取遍信道所有可能输入态 $\rho_{j}$ 的集合 $\left\{p_{j}, \rho_{j}\right\} \circ \chi(\mathcal{E})$ 为信道 $\mathcal{E}$ 的乘积态容量,即 $\chi(\mathcal{E})=$ $C^{(1)}(\mathcal{E})$ 。
注意到式(12.71)中的最大值求取范围可能在一个无界集合上,实际中,我们使用以下习题的结果将最大值求取范围限制到最多包含 $d^{2}$ 个元素的纯态集合中,其中 $d$ 为信道输人的维数。
习题12.11 证明式(12.71)中的最大值可以使用纯态集合达到。并证明,只考虑包含最多 $d^{2}$ 个纯态的集合就足够了,其中 $d$ 为信道输人的维数。
HSW 定理的证明涉及数个不同的思想,为了便于理解,我们将讨论分成几个小的部分,然后将各部分综合在一起以证明 HSW 定理。
假设 $\rho_{j}$ 是信道 $\mathcal{E}$ 的一组输入,并且 $\sigma_{j} \equiv \mathcal{E}\left(\rho_{j}\right)$ 是对应的输出。我们将开发一种与前述二元对称信道类似的随机编码技术,使 Alice 和 Bob 能使用态 $\rho_{j}$ 乘积的码字进行通信。我们让 $p_{j}$ 是下标 $j$ 的先验概率分布。Alice 想要从集合 $\left\{1, \cdots, 2^{n R}\right\}$ 中选择一个消息 $M$ 发送给 Bob。对于每个可能的消息 $M$ ,她将码字 $\rho_{M_{1}} \otimes \rho_{M_{2}} \otimes \cdots \otimes \rho_{M_{n}}$ 与之关联起来,其中 $M_{1}, \cdots, M_{n}$ 从索引集 ${j}$ 中选择。( $M_{1}, \cdots, M_{n}$ 不是 $M$ 的十进制表示或任何进制表示。)对于每条消息 $M$ ,Alice 通过从分布 $\left\{p_{j}\right\}$ 中抽样来选择 $M_{1}, M 2$ ,直至 $M_{n}$ ,以构建码字。我们定义 $\rho_{M} \equiv \rho_{M_{1}} \otimes \cdots \otimes \rho_{M_{n}}$ 。对应的输出态简单地用 $\sigma$ 而不是 $\rho$ 表示,比如 $\sigma_{M_{1}}=\mathcal{E}\left(\rho_{M_{1}}\right)$ 及 $\sigma_{M}=\mathcal{E}^{\otimes n}\left(\rho_{M}\right)$ 。
当 Bob 收到特定状态 $\sigma_{M}$(对应于 Alice 试图传递的消息 $M$ )时,他尝试执行测量以确定消息是什么。因为我们只对统计测量感兴趣而对 Bob 的系统测量后的状态不感兴趣,所以我们使用 POVM 形式描述测量就足够了。我们假设对于每个可能的消息 $M$ ,Bob 具有相应的 POVM 元素 $E_{M}$ 。Bob 可能有一个(或多个)POVM 元素与 Alice 发送的任何消息都不对应,显然这些可以加到一个满足 $E_{0}=I-\sum_{M \neq 0} E_{M}$ 的单个 POVM 元素 $E_{0}$ 。Bob 成功识别 $M$ 的概率是 $\operatorname{tr}\left(\sigma_{M} E_{M}\right)$ ,因此对消息 $M$ 产生错误的概率是 $p_{M}^{e} \equiv 1-\operatorname{tr}\left(\sigma_{M} E_{M}\right)$ 。
我们想要证明的是存在高码率码使得所有消息 $M$ 的误差概率 $p_{M}^{\mathrm{e}}$ 都很小。为了这一目的,我们使用香农为经典问题引人的一个反直觉并且十分巧妙的技巧。我们想象 Alice 通过从集合 $\left\{1, \cdots, 2^{n R}\right\}$ 中均匀抽样来产生消息 $M$ ,我们分析平均错误概率
$$ \begin{equation*} p_{\mathrm{av}} \equiv \frac{\sum_{M} p_{M}^{\mathrm{e}}}{2^{n R}}=\frac{\sum_{M}\left(1-\operatorname{tr}\left(\sigma_{M} E_{M}\right)\right)}{2^{n R}} \tag{12.72} \end{equation*} $$
证明的第一步是证明当 $n$ 变大时,存在高码率码使得 $p_{\mathrm{av}}$ 趋向于零。在完成这个之后,我们将使用香农的技巧来证明这存在具有大致相同码率的码,其对于所有 $M, p_{M}^{e}$ 趋近于零。我们首先构
建一个 POVM $\left\{E_{M}\right\}$ ,它表示一种非常好的(尽管可能不是最优的)让 Bob 解码信道输出 $\sigma_{M}$ 的方法。对于经典的二元对称信道,构造中的关键思想是典型的概念。
令 $\epsilon > 0$ ,假设我们定义 $\bar{\sigma} \equiv \sum_{j} p_{j} \sigma_{j}$ ,并令 $P$ 为 $\bar{\sigma}^{\otimes n}$ 的 $\epsilon$ 典型子空间的投影。根据典型序列定理,对于任意 $\delta > 0$ ,当 $n$ 充分大时,
$$ \begin{equation*} \operatorname{tr}\left(\bar{\sigma}^{\otimes n}(I-P)\right) \leqslant \delta \tag{12.73} \end{equation*} $$
对于给定的消息 $M$ ,我们还将定义 $\sigma_{M}$ 的典型子空间的概念,它基于以下思想,通常 $\sigma_{M}$ 是以下态的张量积:约 $n p_{1}$ 个 $\rho_{1}$ ,约 $n p_{2}$ 个 $\rho_{2}$ ,以此类推。定义 $\bar{S} \equiv \sum_{j} p_{j} S\left(\sigma_{j}\right)$ ,假设 $\sigma_{j}$ 具有频谱分解 $\sum_{k} \lambda_{k}^{j}\left|e_{k}^{j}\right\rangle\left\langle e_{k}^{j}\right|$ ,于是
$$ \begin{equation*} \sigma_{M}=\sum_{K} \lambda_{K}^{M}\left|E_{K}^{M}\right\rangle\left\langle E_{K}^{M}\right| \tag{12.74} \end{equation*} $$
其中 $K=\left(K_{1}, \cdots, K_{n}\right)$ ,为方便起见,定义 $\lambda_{K}^{M} \equiv \lambda_{K_{1}}^{M_{1}} \lambda_{K_{2}}^{M_{2}} \cdots \lambda_{K_{n}}^{M_{n}}$ 及 $\left|E_{K}^{M}\right\rangle \equiv\left|e_{K_{1}}^{M_{1}}\right\rangle\left|e_{K_{2}}^{M_{2}}\right\rangle \cdots\left|e_{K_{n}}^{M_{n}}\right\rangle_{\circ}$定义 $P_{M}$ 为到由全部 $\left|E_{K}^{M}\right\rangle$ 张成空间的投影,使得
$$ \begin{equation*} \left|\frac{1}{n} \log \frac{1}{\lambda_{K}^{M}}-\bar{S}\right| \leqslant \epsilon \tag{12.75} \end{equation*} $$
(用 $T_{M}$ 表示所有满足该条件的 $K$ 的集合将会很有用)以与典型序列定理的证明类似的方式,由大数定律得,对于任何 $\delta > 0$ ,当 $n$ 充分大时我们有 $\mathbb{E}\left(\operatorname{tr}\left(\sigma_{M} P_{M}\right)\right) \geqslant 1-\delta$ ,其中期望是对于随机编码产生的码字 $\rho_{M}$(对于固定消息 $M$ )的分布所取,因此对于每个 $M$ ,
$$ \begin{equation*} \mathbb{E}\left[\operatorname{tr}\left(\sigma_{M}\left(I-P_{M}\right)\right)\right] \leqslant \delta \tag{12.76} \end{equation*} $$
还要注意,根据定义(12.75),投影 $P_{M}$ 的维度最多为 $2^{n(\bar{S}+\epsilon)}$ ,因此
$$ \begin{equation*} \mathbb{E}\left(\operatorname{tr}\left(P_{M}\right)\right) \leqslant 2^{n(\bar{S}+\epsilon)} \tag{12.77} \end{equation*} $$
我们现在使用典型性的概念来定义 Bob 的解码 POVM。我们定义
$$ \begin{equation*} E_{M} \equiv\left(\sum_{M^{\prime}} P P_{M^{\prime}} P\right)^{-1 / 2} P P_{M} P\left(\sum_{M^{\prime}} P P_{M^{\prime}} P\right)^{-1 / 2} \tag{12.78} \end{equation*} $$
其中 $A^{-1 / 2}$ 表示 $A^{1 / 2}$ 的广义逆,即在 $A$ 的支集空间上与 $A^{1 / 2}$ 相反,在其补上为 0 的算子。由此得出 $\sum_{M} E_{M} \leqslant I$ ,我们可以额外定义一个正定算子 $E_{0} \equiv I-\sum_{M} E_{M}$ 来补完 POVM。这种结构背后的直观解释类似于为二元对称信道描述的解码方法。很小部分的纠错 $E_{M}$ 等于投影 $P_{M}$ ,并且 Bob 对 $\left\{E_{M}\right\}$ 的测量基本上相当于检查信道的输出是否落在 $P_{M}$ 投影的空间中,该投影算子投影的空间可以类比于二元对称信道的码字周围半径为 $n p$ 的汉明球。
随机编码证明的主要技术是得到平均错误概率 $p_{\mathrm{av}}$ 的上界。专题 12.5 给出了证明的细节。
结果为
$$ \begin{equation*} p_{\mathrm{av}} \leqslant \frac{1}{2^{n R}} \sum_{M}\left[3 \operatorname{tr}\left(\sigma_{M}(I-P)\right)+\sum_{M^{\prime} \neq M} \operatorname{tr}\left(P \sigma_{M} P P_{M^{\prime}}\right)+\operatorname{tr}\left(\sigma_{M}\left(I-P_{M}\right)\right)\right] \tag{12.79} \end{equation*} $$
变量 $p_{\mathrm{av}}$ 是根据特定码字的选择来定义的。我们将计算在所有随机码上该变量的期望值。通过构造 $\mathbb{E}\left(\sigma_{M}\right)=\bar{\sigma}^{\otimes n}$ ,其中 $\sigma_{M}$ 与 $P_{M^{\prime}}$ 当 $M^{\prime} \neq M$ 时独立,于是我们得到
$$ \begin{equation*} \mathbb{E}\left(p_{\mathrm{av}}\right) \leqslant 3 \operatorname{tr}\left(\bar{\sigma}^{\otimes n}(I-P)\right)+\left(2^{n R}-1\right) \operatorname{tr}\left(P \bar{\sigma}^{\otimes n} P \mathbb{E}\left(P_{1}\right)\right)+\mathbb{E}\left(\operatorname{tr}\left(\sigma_{1}\left(I-P_{1}\right)\right)\right) \tag{12.80} \end{equation*} $$
结合式(12.73)与式(12.76)我们得到
$$ \begin{equation*} \mathbb{E}\left(p_{\mathrm{av}}\right) \leqslant 4 \delta+\left(2^{n R}-1\right) \operatorname{tr}\left(P \bar{\sigma}^{\otimes n} P \mathbb{E}\left(P_{1}\right)\right) \tag{12.81} \end{equation*} $$
但是 $P \bar{\sigma}^{\otimes n} P \leqslant 2^{-n(S(\bar{\sigma}-\epsilon))} I$ ,而通过式(12.77)我们有 $\mathbb{E}\left(\operatorname{tr}\left(P_{1}\right)\right) \leqslant 2^{n(\bar{S}+\epsilon)}$ ,因此
$$ \begin{equation*} \mathbb{E}\left(p_{\mathrm{av}}\right) \leqslant 4 \delta+\left(2^{n R}-1\right) 2^{-n(S(\bar{\sigma})-\bar{S}-2 \epsilon)} \tag{12.82} \end{equation*} $$
而 $R < S(\bar{\sigma})-\bar{S}$ ,由此当 $n \rightarrow \infty$ 时 $\mathbb{E}\left(p_{\text {av }}\right) \rightarrow 0$ 。实际上,通过选择合适的集合 $\left\{p_{j}, \rho_{j}\right\}$ 以达到式(12.71)中的最大值,我们知道只要 $R < \chi(\mathcal{E})$ ,这就必定为真。因此必定存在一系列码率为 $R$的码,使得当码的块大小 $n$ 增加时 $p_{\mathrm{av}} \rightarrow 0$ 。因此,对于任何固定的 $\epsilon > 0$(注意到这里的 $\epsilon$ 是新的,而不是已经不再需要的之前那个旧的 ),当 $n$ 充分大时,
$$ \begin{equation*} p_{\mathrm{av}}=\frac{\sum_{M} p_{M}^{\mathrm{e}}}{2^{n R}} < \epsilon \tag{12.83} \end{equation*} $$
显然,为了使之成立,至少有一半的消息 $M$ 必须满足 $p_{M}^{\mathrm{e}} < 2 \epsilon$ 。因此,我们从码率为 $R$ 且 $p_{\mathrm{av}} < \epsilon$的码中删除一半的码字(具有高错误概率 $p_{M}^{\mathrm{e}}$ )来构建新码,从而获得具有 $2^{n R} / 2=2^{n(R-1 / n)}$个码字的新码,并且对于所有消息 $M, p_{M}^{\mathrm{e}} < 2 \epsilon_{\circ}$ 显然,这个码也具有渐近码率 $R$ ,并且当 $n$ 变大时,对于所有码字的错误概率可以任意小。
总而言之,我们已经证明,对于任何码率 $R$ 小于式(12.71)中定义的 $\chi(\mathcal{E})$ ,存在使用乘积态输人的码,能够以码率 $R$ 通过信道 $\mathcal{E}$ 进行传输。我们的证明与香农经典噪声信道编码定理的随机编码证明具有相同的缺陷,尽管它证明了码率能达到容量的码存在,但没有提供如何构造这样的编码的过程。
HSW 定理证明中技术最复杂的部分是对 $p_{\mathrm{av}}$ 的估计。我们在这里描述完成这项工作的
细节,缺少的步骤应被视为要完成的习题。我们定义 $\left|\tilde{E}_{K}^{M}\right\rangle \equiv P\left|E_{K}^{M}\right\rangle$ 。然后
$$ \begin{equation*} E_{M}=\left(\sum_{M^{\prime}} \sum_{K \in T_{M^{\prime}}}\left|\tilde{E}_{K}^{M^{\prime}}\right\rangle\left\langle\tilde{E}_{K}^{M^{\prime}}\right|\right)^{-1 / 2} \sum_{K \in T_{M}}\left|\tilde{E}_{K}^{M}\right\rangle\left\langle\tilde{E}_{K}^{M}\right|\left(\sum_{M^{\prime}} \sum_{K \in T_{M^{\prime}}}\left|\tilde{E}_{K}^{M^{\prime}}\right\rangle\left\langle\tilde{E}_{K}^{M^{\prime}}\right|\right)^{-1 / 2} \tag{12.84} \end{equation*} $$
定义
$$ \begin{equation*} \alpha_{(M, K),\left(M^{\prime}, K^{\prime}\right)} \equiv\left\langle\tilde{E}_{K}^{M}\right|\left(\sum_{M^{\prime \prime}} \sum_{K^{\prime \prime} \in T_{M^{\prime \prime}}}\left|\tilde{E}_{K^{\prime \prime}}^{M^{\prime \prime}}\right\rangle\left\langle\tilde{E}_{K^{\prime \prime}}^{M^{\prime \prime}}\right|\right)^{-1 / 2}\left|\tilde{E}_{K^{\prime}}^{M^{\prime}}\right\rangle \tag{12.85} \end{equation*} $$
平均错误概率能写为
$$ \begin{equation*} p_{\mathrm{av}}=\frac{1}{2^{n R}} \sum_{M}\left[1-\sum_{K} \sum_{K^{\prime} \in T_{M}} \lambda_{K}^{M}\left|\alpha_{(M, K),\left(M, K^{\prime}\right)}\right|^{2}\right] \tag{12.86} \end{equation*} $$
利用 $\sum_{K} \lambda_{K}^{M}=1$ 并略去非正项,我们知道
$$ \begin{equation*} p_{\mathrm{av}} \leqslant \frac{1}{2^{n R}} \sum_{M}\left[\sum_{K \in T_{M}} \lambda_{K}^{M}\left(1-\alpha_{(M, K),(M, K)}^{2}\right)+\sum_{K \notin T_{M}} \lambda_{K}^{M}\right] \tag{12.87} \end{equation*} $$
用条目 $\gamma_{(M, K),\left(M^{\prime}, K^{\prime}\right)} \equiv\left\langle\tilde{E}_{K}^{M} \mid \tilde{E}_{K^{\prime}}^{M^{\prime}}\right\rangle$ 定义矩阵 $\Gamma$ ,其中索引下标满足 $K \in T_{M}$ 且 $K^{\prime} \in T_{M^{\prime}}$ 。在由这些索引定义的矩阵空间中进行证明是为了便于描述,让 $E$ 表示关于这些索引的单位矩阵,并用 sp 来表示关于这些索引的取迹操作。计算表明 $\Gamma^{1 / 2}=\left[\alpha_{(M, K),\left(M^{\prime}, K^{\prime}\right)}\right]$ ,并且 $\alpha_{(M, K),(M, K)}^{2} \leqslant \gamma_{(M, K),(M, K)} \leqslant 1$ 。当 $0 \leqslant x \leqslant 1$ 时 $1-x^{2}=(1+x)(1-x) \leqslant 2(1-x)$ ,利用这点与式(12.87)可得
$$ \begin{equation*} p_{\mathrm{av}} \leqslant \frac{1}{2^{n R}} \sum_{M}\left[2 \sum_{K \in T_{M}} \lambda_{K}^{M}\left(1-\alpha_{(M, K),(M, K)}\right)+\sum_{K \notin T_{M}} \lambda_{K}^{M}\right] \tag{12.88} \end{equation*} $$
定义对角矩阵 $\Lambda \equiv \operatorname{diag}\left(\lambda_{K}^{M}\right)$ ,有
$$ \begin{align*} 2\left(E-\Gamma^{1 / 2}\right) & =\left(E-\Gamma^{1 / 2}\right)^{2}+(E-\Gamma) \tag{12.89}\\ & =(E-\Gamma)^{2}\left(E+\Gamma^{1 / 2}\right)^{-2}+(E-\Gamma) \tag{12.90}\\ & \leqslant(E-\Gamma)^{2}+(E-\Gamma) \tag{12.91} \end{align*} $$
因此
$$ \begin{align*} 2 \sum_{M} \sum_{K \in T_{M}} \lambda_{K}^{M}\left(1-\alpha_{(M, K),(M, K)}\right) & =2 \operatorname{sp}\left(\Lambda\left(E-\Gamma^{1 / 2}\right)\right) \tag{12.92}\\ & \leqslant \operatorname{sp}\left(\Lambda(E-\Gamma)^{2}\right)+\operatorname{sp}(\Lambda(E-\Gamma)) \tag{12.93} \end{align*} $$
计算右侧的 sp 并代入式(12.88),经过简单的计算得到
$$ \begin{array}{r} p_{\mathrm{av}} \leqslant \frac{1}{2^{n R}} \sum_{M}\left[\sum _ { K } \lambda _ { K } {}^ { M } \left(2-2 \gamma_{(M, K),(M, K)}+\sum_{K^{\prime} \neq K}\left|\gamma_{(M, K),\left(M, K^{\prime}\right)}\right|^{2}\right.\right. \\ \left.\left.+\sum_{M^{\prime} \neq M, K^{\prime} \in T_{M^{\prime}}}\left|\gamma_{(M, K),\left(M^{\prime}, K^{\prime}\right)}\right|^{2}\right)+\sum_{K \notin T_{M}} \lambda_{K}^{M}\right] \tag{12.94} \end{array} $$
代入定义并做简单计算得到
$$ \begin{align*} p_{\mathrm{av}} \leqslant \frac{1}{2^{n R}} \sum_{M}[2 & \operatorname{tr}\left(\sigma_{M}(I-P)\right)+\operatorname{tr}\left(\sigma_{M}(I-P) P_{M}(I-P)\right) \\ & \left.+\sum_{M^{\prime} \neq M} \operatorname{tr}\left(P \sigma_{M} P P_{M^{\prime}}\right)+\operatorname{tr}\left(\sigma_{M}\left(I-P_{M}\right)\right)\right] \tag{12.95} \end{align*} $$
第二部分要小于 $\operatorname{tr}\left(\sigma_{M}(I-P)\right)$ ,这就给出了我们需要的误差估计式(12.79)。
假设 $R$ 大于式(12.71)中定义的 $\chi(\mathcal{E})$ 。我们将证明 Alice 不可能通过信道 $\mathcal{E}$ 以这个码率可靠地向 Bob 发送信息。我们的一般策略是想象 Alice 正在从集合 $\left\{1, \cdots, 2^{n R}\right\}$ 中随机均匀地生成消息 $M$ ,然后证明她的平均错误概率必须远大于零,因此最大错误概率也必须远大于零。
假设 Alice 将消息 $M$ 编码为 $\rho_{M}=\rho_{1}^{M} \otimes \cdots \otimes \rho_{n}^{M}$ ,其对应的输出用 $\sigma$ 代替 $\rho$ 表示,并且 Bob使用 POVM $\left\{E_{M}\right\}$ 进行解码。不失一般性,我们可以假设对于每个消息有一个对应元素 $E_{M}$ ,可能还有一个额外的元素 $E_{0}$ 以确保满足完整性关系 $\sum_{M} E_{M}=I$ 。这就给出了平均错误概率:
$$ \begin{equation*} p_{\mathrm{av}}=\frac{\sum_{M}\left(1-\operatorname{tr}\left(\sigma_{M} E_{M}\right)\right)}{2^{n R}} \tag{12.96} \end{equation*} $$
从习题 12.3 中我们知道 $R \leqslant \log (d)$ ,其中 $d$ 是信道输人的维数,因此 POVM $\left\{E_{M}\right\}$ 最多包含 $d^{n}+1$ 个元素。由费诺不等式得
$$ \begin{equation*} H\left(p_{\text {av }}\right)+p_{\text {av }} \log \left(d^{n}\right) \geqslant H(M \mid Y) \tag{12.97} \end{equation*} $$
其中 $Y$ 是 Bob 解码的测量结果,因此
$$ \begin{equation*} n p_{\text {av }} \log d \geqslant H(M)-H(M: Y)-H\left(p_{\text {av }}\right)=n R-H(M: Y)-H\left(p_{\text {av }}\right) \tag{12.98} \end{equation*} $$
首先应用霍列沃界,然后根据熵的次可加性得到
$$ \begin{equation*} H(M: Y) \leqslant S(\bar{\sigma})-\sum_{M} \frac{S\left(\sigma_{1}^{M} \otimes \cdots \otimes \sigma_{n}^{M}\right)}{2^{n R}} \tag{12.99} \end{equation*} $$
$$ \begin{equation*} \leqslant \sum_{j=1}^{n}\left(S\left(\bar{\sigma}^{j}\right)-\sum_{M} \frac{S\left(\sigma_{j}^{M}\right)}{2^{n R}}\right) \tag{12.100} \end{equation*} $$
其中 $\bar{\sigma}^{j} \equiv \sum_{M} \sigma_{j}^{M} / 2^{n R}$ 。右边求和式中的 $n$ 个项中的每一个都不大于式(12.71)中定义的 $\chi(\mathcal{E})$ ,所以
$$ \begin{equation*} H(M: Y) \leqslant n \chi(\mathcal{E}) \tag{12.101} \end{equation*} $$
代人(12.98)得到 $n p_{\mathrm{av}} \log d \geqslant n(R-\chi(\mathcal{E}))-H\left(p_{\mathrm{av}}\right)$ ,因此对 $n$ 变大取极限可以得到
$$ \begin{equation*} p_{\text {av }} \geqslant \frac{R-\chi(\mathcal{E})}{\log (d)} \tag{12.102} \end{equation*} $$
故当 $R > \chi(\mathcal{E})$ 时,平均错误概率与零有常数的偏差。这证明了 $\chi(\mathcal{E})$ 为乘积态容量的上界。
能由 HSW 定理得到的一个有趣结论是,任何量子信道 $\mathcal{E}$ 只要不是常数输出都可用于传输经典信息。因为如果信道不是常数的,则存在纯态 $|\psi\rangle$ 和 $|\varphi\rangle$ 使得 $\mathcal{E}(|\psi\rangle\langle\psi|) \neq \mathcal{E}(|\varphi\rangle\langle\varphi|$ )。将以概率 $1 / 2$ 出现的两个态的集合代人关于乘积态容量的表达式(12.71),我们看到
$$ \begin{equation*} C^{(1)}(\mathcal{E}) \geqslant S\left(\frac{\mathcal{E}(|\psi\rangle\langle\psi|)+\mathcal{E}(|\varphi\rangle\langle\varphi|)}{2}\right)-\frac{1}{2} \mathcal{E}(|\psi\rangle\langle\psi|)-\frac{1}{2} \mathcal{E}(|\varphi\rangle\langle\varphi|) > 0 \tag{12.103} \end{equation*} $$
其中第二个不等式来自 11.3.5 节中得到的嫡的严格凹性。 让我们看一个乘积态容量可以精确计算的简单例子,具有参数 $p$ 的去极化信道。设 $\left\{p_{j},\left|\psi_{j}\right\rangle\right\}$为量子态的集合。然后我们有
$$ \begin{equation*} \mathcal{E}\left(\left|\psi_{j}\right\rangle\left\langle\psi_{j}\right|\right)=p\left|\psi_{j}\right\rangle\left\langle\psi_{j}\right|+(1-p) \frac{I}{2} \tag{12.104} \end{equation*} $$
这样一个具有特征值 $(1+p) / 2$ 和 $(1-p) / 2$ 的量子态,我们有
$$ \begin{equation*} S\left(\mathcal{E}\left(\left|\psi_{j}\right\rangle\left\langle\psi_{j}\right|\right)\right)=H\left(\frac{1+p}{2}\right) \tag{12.105} \end{equation*} $$
这不依赖于具体的 $\left|\psi_{j}\right\rangle_{\circ}$ 式(12.71)中的最大值是通过最大化嫡 $S\left(\sum_{j} \mathcal{E}\left(\left|\psi_{j}\right\rangle\left\langle\psi_{j}\right|\right)\right)$ 来实现的,这可以通过简单地为 $\left|\psi_{j}\right\rangle$ 选择能形成单个量子比特的状态空间的标准正交基(比如 $|0\rangle$ 和 $|1\rangle$ ),给出单比特熵的值,具有参数 $p$ 的去极化信道的乘积态容量
$$ \begin{equation*} C(\mathcal{E})=1-H\left(\frac{1+p}{2}\right) \tag{12.106} \end{equation*} $$
习题 12.12 修改并尽可能简化 HSW 定理的证明过程来证明香农噪声信道编码定理。
通过一个有噪声的量子信道能可靠传递多少量子信息呢?这一确定量子信道容量的问题比确定有噪声量子信道传送经典信息时信道容量的问题更少被人理解。我们现在给出一些已经发展完善的信息论工具来理解量子信息的量子信道容量,最为出名的是费诺不等式(专题 12.2 ),数据处理不等式(11.2.4节)和辛格顿界限(习题10.21)的量子信息论类似物。
对于量子数据压缩,我们在研究这些问题上的观点是:把一个量子源看成一个处于混合态 $\rho$且跟另一个量子系统纠缠的量子系统,同时通过量子操作 $\mathcal{E}$ 来传输量子信息的可靠性的度量是纠缠保真度 $F(\rho, \mathcal{E})$ 。引人符号是有用的,就像第 9 章一样,符号 $Q$ 表示 $\rho$ 所在的系统,符号 $R$表示初始纯化了 $Q$ 的参考系统。在这种定义下,纠缯保真度即为 $Q$ 和 $R$ 之间的纠缠在系统 $Q$ 上作用 $\mathcal{E}$ 的行为下保持得多好。
当作用一个量子操作在量子系统 $Q$ 的状态 $\rho$ 上时,该量子操作会产生多少噪声?一种度量是 $R Q$ 的状态,初始为纯态,在量子操作的作用下变到混合的程度。我们定义操作 $\mathcal{E}$ 作用在输人 $\rho$ 上的嫡交换为
$$ \begin{equation*} S(\rho, \mathcal{E}) \equiv S\left(R^{\prime}, Q^{\prime}\right) \tag{12.107} \end{equation*} $$
假设量子操作 $\mathcal{E}$ 的行为被引入的环境 $E$ 仿制,初始时处于纯态,然后在 $Q$ 和 $E$ 之间作用一个西算子相互作用,正如第8章描述的一样。于是在这个交互作用之后,$R Q E$ 的状态是一个纯态,即 $S\left(R^{\prime}, Q^{\prime}\right)=S\left(E^{\prime}\right)$ ,所以嫡交换也可能利用引人操作 $\mathcal{E}$ 到初始为纯态的环境 $E$ 中的嫡值来确定。
注意到嫡交换并不依赖于 $Q$ 的初态 $\rho$ 纯化到 $R Q$ 的方式,原因是任意两个从 $Q$ 到 $R Q$ 的纯化都与系统 $R$ 上的一个西算子相关,这已经在习题 2.81 中展示过。显然,系统 $R$ 上的这个西算子与 $Q$ 上的量子操作对易,于是 $R^{\prime} Q^{\prime}$ 上由两种不同纯化方式得到的末态都与 $R$ 上的西变换相关,于是就形成了相等的摘交换值。另外,尽管 $\mathcal{E}$ 的环境模型开始于 $E$ 的一个纯态,但是这些结果依然可以推出 $S\left(E^{\prime}\right)$ 并不依赖于该环境模型。
基于量子操作的算子和表示可以给出一个关于熵交换的有用且清晰的方程。假设一个保迹量子操作 $\mathcal{E}$ 的对应操作元为 $\left\{E_{i}\right\}$ ,那么如 8.2.3 节所述,这个量子操作的一个西模型将由 $Q E$ 上定义的西算子 $U$ 给出,并使得
$$ \begin{equation*} U|\psi\rangle|0\rangle=\sum_{i} E_{i}|\psi\rangle|i\rangle \tag{12.108} \end{equation*} $$
成立,其中 $|0\rangle$ 是环境初态,$|i\rangle$ 是环境的一个标准正交基。注意到作用 $\mathcal{E}$ 之后 $E^{\prime}$ 的状态为
$$ \begin{equation*} \rho^{E^{\prime}}=\sum_{i, j} \operatorname{tr}\left(E_{i} \rho E_{j}^{\dagger}\right)|i\rangle\langle j| \tag{12.109} \end{equation*} $$
也就是说, $\operatorname{tr}\left(E_{i} \rho E_{j}^{\dagger}\right)$ 是 $E^{\prime}$ 在基 $|i\rangle$ 下的矩阵元素。给定一个操作元为 $\left\{E_{i}\right\}$ 的量子操作,自然地可以定义一个矩阵 $W$(权重矩阵),其矩阵元素为 $W_{i j} \equiv \operatorname{tr}\left(E_{i} \rho E_{j}^{\prime}\right)$ ,即 $W$ 是 $E^{\prime}$ 在合适基下的
矩阵形式。 $\rho^{E^{\prime}}$ 的这一表达形式给出了在计算中非常有用的一个交换熵方程,即
$$ \begin{equation*} S(\rho, \mathcal{E})=S(W) \equiv-\operatorname{tr}(W \log W) \tag{12.110} \end{equation*} $$
给定一个量子操作 $\mathcal{E}$ 和一个量子态 $\rho$ ,选择 $\mathcal{E}$ 的操作元 $\left\{F_{j}\right\}$ 使得 $W$ 成对角形式,这通常都是可能的;我们称此时的 $W$ 为标准形式。为了弄懂这样的操作元集合确实存在,请回顾第 8章,一个量子操作可以有很多不同的操作元集合表示。特别地,两个算子集 $\left\{E_{i}\right\},\left\{F_{i}\right\}$ 是同一个量子操作的两个操作元集合,当且仅当 $F_{j}=\sum_{j} u_{j i} E_{i}$ ,其中 $u$ 是一个复数域上的西矩阵,并且必要时需要添加零算子给 $\left\{E_{i}\right\}$ 或 $\left\{F_{j}\right\}$ 使得矩阵 $u$ 成为方阵。令 $W$ 是与 $\mathcal{E}$ 的一个特定操作元集合 $\left\{E_{i}\right\}$ 相关的权重矩阵,也就是说 $W$ 是环境密度算子的矩阵表示,所以它是一个可以被酉矩阵 $v$ 对角化的正定矩阵,即 $D=v W v^{\dagger}$ ,其中 $D$ 是元素非负的对角矩阵。定义算子 $F_{j}$ 为 $F_{j} \equiv \sum_{i} v_{j i} E_{i}$ ,那么 $F_{j}$ 也是 $\mathcal{E}$ 的操作元集合,可以生成一个新的权重矩阵,其矩阵元素为
$$ \begin{equation*} \widetilde{W}_{k l}=\operatorname{tr}\left(F_{k} \rho F_{l}^{\dagger}\right)=\sum_{m n} v_{k m} v_{l n}^{*} W_{m n}=D_{k l} \tag{12.111} \end{equation*} $$
因此,若选择 $\left\{F_{j}\right\}$ 来计算则权重矩阵是对角的。 $\mathcal{E}$ 的任意使得对应权重矩阵对角的操作元集合 $\left\{F_{j}\right\}$ 被称为 $\mathcal{E}$ 关于输人 $\rho$ 的一个标准表示。之后我们将看到标准表示在量子纠错中有着特别重要的意义。
嫡交换的许多性质可以很容易地从第 11 章讨论过的熵的性质中得到。比如,对于 $d$ 维空间中的一个保迹量子操作 $\mathcal{E}$ ,我们可以直接得到 $S(I / d, \mathcal{E})=0$ 当且仅当 $\mathcal{E}$ 是一个量子酉操作。因此,$S(I / d, \mathcal{E})$ 可以作为非相干量子噪声作用在系统上程度的度量。第二个例子是矩阵 $W$ 关于 $\rho$呈线性,由摘的凹性可以得到 $S(\rho, \mathcal{E})$ 关于 $\rho$ 是凹的。因为系统 $R Q$ 总是可以被选成至多 $d^{2}$ 维,其中 $d$ 是 $Q$ 的维数,从而嫡交换至多为 $2 \log d$ 。
习题 12.13 证明量子操作 $\mathcal{E}$ 的熵交换是凹的。 直观地,如果量子源 $Q$ 受到能导致纠缠 $R Q$ 混合的噪声影响,那么末态 $R^{\prime} Q^{\prime}$ 与初态 $R Q$ 的保真度一定不是 1 ,并且噪声越大保真度越差。在 12.1.1 节中给出了经典信道研究中一个相似的例子,其中在给定输出 $Y$ 的情况下关于信道输人 $X$ 的不确定性 $H(X \mid Y)$ ,与利用费诺不等式从 $Y$ 中恢复 $X$ 的概率相关。关于这个结果有一个有用的量子类似物,可以把嫡交换 $S(\rho, \mathcal{E})$ 与纠缠保真度 $F(\rho, \mathcal{E})$ 联系起来。 定理12.9(量子费诺不等式)令 $\rho$ 是一个量子态, $\mathcal{E}$ 是一个保迹量子操作,则有
$$ \begin{equation*} S(\rho, \mathcal{E}) \leqslant H(F(\rho, \mathcal{E}))+(1-F(\rho, \mathcal{E})) \log \left(d^{2}-1\right) \tag{12.112} \end{equation*} $$
其中,$H(\cdot)$ 是指二元香农熵。 观察到量子费诺不等式揭示了一个有吸引力的直观意义:如果一个过程的嫡交换很大,那么该过程的纠缠保真度必然很小,这说明 $R$ 和 $Q$ 之间的纠缠没有很好地保持。更进一步,我们注意到嫡交换 $S(\rho, \mathcal{E})$ 在量子费诺不等式中的作用类似于条件熵 $H(X \mid Y)$ 在经典信息论中的作用。
证明 为了证明量子费诺不等式,选取第一个态 $|1\rangle=|R Q\rangle$ 的集合 ${|i\rangle}$ 作为系统 $R Q$ 的标准正交基。如果令 $p_{i} \equiv\langle i| \rho^{R^{\prime} Q^{\prime}}|i\rangle$ ,那么利用 11.3.3 节的结果可以得到
$$ \begin{equation*} S\left(R^{\prime}, Q^{\prime}\right) \leqslant H\left(p_{1}, \cdots, p_{d^{2}}\right) \tag{12.113} \end{equation*} $$
其中 $H\left(p_{i}\right)$ 是集合 $\left\{p_{i}\right\}$ 的香农信息。由初等代数的知识可得
$$ \begin{equation*} H\left(p_{1}, \cdots, p_{d^{2}}\right)=H\left(p_{1}\right)+\left(1-p_{1}\right) H\left(\frac{p_{2}}{1-p_{1}}, \cdots, \frac{p_{d^{2}}}{1-p_{1}}\right) \tag{12.114} \end{equation*} $$
将这个结果与 $H\left(\frac{p_{2}}{1-p_{1}}, \cdots, \frac{p_{d}{ }^{2}}{1-p_{1}}\right) \leqslant \log \left(d^{2}-1\right)$ 相结合,并且利用定义给出的 $p_{1}=F(\rho, \mathcal{E})$ ,可以得到
$$ \begin{equation*} S(\rho, \mathcal{E}) \leqslant H(F(\rho, \mathcal{E}))+(1-F(\rho, \mathcal{E})) \log \left(d^{2}-1\right) \tag{12.115} \end{equation*} $$
这就是量子费诺不等式。
在 11.2.4 节中,我们讨论了经典的数据处理不等式。回顾一下,经典的数据处理不等式是指,对于一个马尔可夫过程 $X \rightarrow Y \rightarrow Z$ ,有下式成立,即
$$ \begin{equation*} H(X) \geqslant H(X: Y) \geqslant H(X: Z) \tag{12.116} \end{equation*} $$
其中,第一个等式成立当且仅当随机变量 $X$ 能以概率 1 从 $Y$ 中恢复出来。从而数据处理不等式为纠错的可能性提供了信息论充要条件。
量子中有一个类似于经典数据处理不等式的公式,适用于由量子操作 $\mathcal{E}_{1}$ 和 $\mathcal{E}_{2}$ 描述的两阶段量子过程,该公式为
$$ \begin{equation*} \rho \xrightarrow{\mathcal{E}_{1}} \rho^{\prime} \xrightarrow{\varepsilon_{2}} \rho^{\prime \prime} \tag{12.117} \end{equation*} $$
定义量子相干信息为
$$ \begin{equation*} I(\rho, \mathcal{E}) \equiv S(\mathcal{E}(\rho))-S(\rho, \mathcal{E}) \tag{12.118} \end{equation*} $$
相干信息这个量被认为(还不知道)在量子信息论中会起到与互信息 $H(X: Y)$ 在经典信息论中类似的作用。产生这种观点的一个原因是相干信息满足量子数据处理不等式,就像互信息满足经典数据处理不等式一样。 定理 12.10 (量子数据处理不等式)令 $\rho$ 是一个量子态, $\mathcal{E}_{1}$ 和 $\mathcal{E}_{2}$ 是保迹量子操作,那么
$$ \begin{equation*} S(\rho) \geqslant I\left(\rho, \mathcal{E}_{1}\right) \geqslant I\left(\rho, \mathcal{E}_{2} \circ \mathcal{E}_{1}\right) \tag{12.119} \end{equation*} $$
第一个等式成立当且仅当操作 $\mathcal{E}_{1}$ 完全可逆,也就是说存在保迹逆操作 $\mathcal{R}$ 使得 $F(\rho, \mathcal{R} \circ \mathcal{E}=1)$ 。 与经典数据处理不等式相比,可以发现相干信息在量子数据处理不等式中所起的作用等同于互信息在经典数据处理不等式中。当然,这种启发式论据并不能当作严格理由,来说明相干信息就是经典互信息的量子对应物这一观点。为了找到一个严格理由,我们应该以类似于互信息和经典信道容量联系的方式把相干信息与量子信道容量联系起来,但是这样一种关系还没有被建立。(部分进展请参考章末的"背景资料与延伸阅读"。)
在量子数据处理不等式中,怎样用已经熟悉的比如量子纠错中出现的概念,来定义完全可逆这个概念呢?按照定义,如果存在一个保迹量子操作 $\mathcal{R}$ 使得
$$ \begin{equation*} F(\rho, \mathcal{R} \circ \mathcal{E})=1 \tag{12.120} \end{equation*} $$
成立,那么称这个保迹量子操作 $\mathcal{E}$ 在输入 $\rho$ 下完全可逆。但是由第 9 章末尾的结论(4)可知,量子操作完全可逆的充要条件是:对 $\rho$ 支集中的任意量子态 $|\psi\rangle$ 都有下式成立,即
$$ \begin{equation*} (\mathcal{R} \circ \mathcal{E})(|\psi\rangle\langle\psi|)=|\psi\rangle\langle\psi| \tag{12.121} \end{equation*} $$
这一观察将完全可逆的概念与量子纠错码联系了起来。回顾量子纠错码是某个由逻辑码字张成的更大希尔伯特空间的一个子空间。为了抵抗量子操作 $\mathcal{E}$ 引人的噪声,量子操作 $\mathcal{E}$ 需要在保迹逆操作 $\mathcal{R}$ 下可逆,即对码中的所有量子态 $|\psi\rangle$ ,都有 $(\mathcal{R} \circ \mathcal{E})(|\psi\rangle\langle\psi|)=|\psi\rangle\langle\psi|$ 成立。这个条件等价于数据处理不等式中完全可逆的标准,即对支集是码空间的某个 $\rho, F(\rho, \mathcal{R} \circ \mathcal{E})=1$ 。
证明 量子数据处理不等式的证明需要用到四系统结构: $\mathcal{R}$ 和 $\mathcal{Q}$ 如前所述,$E_{1}$ 和 $E_{2}$ 初始都处于纯态,并且使得 $\mathcal{Q}$ 与 $E_{1}$ 之间的西作用生成算子 $\mathcal{E}_{1} ; \mathcal{Q}$ 与 $E_{2}$ 之间的酉作用生成算子 $\mathcal{E}_{2}$ 。数据处理不等式中第一个不等式的证明需要利用次可加性 $S\left(R^{\prime}, E_{1}^{\prime}\right) \leqslant S\left(R^{\prime}\right)+S\left(E_{1}^{\prime}\right)$ ,从而得到
$$ \begin{align*} I\left(\rho, \mathcal{E}_{1}\right) & =S\left(\mathcal{E}_{1}(\rho)\right)-S\left(\rho, \mathcal{E}_{1}\right) \tag{12.122}\\ & =S\left(Q^{\prime}\right)-S\left(E_{1}^{\prime}\right) \tag{12.123}\\ & =S\left(R^{\prime}, E_{1}^{\prime}\right)-S\left(E_{1}^{\prime}\right) \tag{12.124}\\ & \leqslant S\left(R^{\prime}\right)+S\left(E_{1}^{\prime}\right)-S\left(E_{1}^{\prime}\right)=S\left(R^{\prime}\right) \tag{12.125}\\ & =S(R)=S(Q)=S(\rho) \tag{12.126} \end{align*} $$
数据处理不等式中第二个不等号的证明需要用到强次可加性,即
$$ \begin{equation*} S\left(R^{\prime \prime}, E_{1}^{\prime \prime}, E_{2}^{\prime \prime}\right)+S\left(E_{1}^{\prime \prime}\right) \leqslant S\left(R^{\prime \prime}, E_{1}^{\prime \prime}\right)+S\left(E_{1}^{\prime \prime}, E_{2}^{\prime \prime}\right) \tag{12.127} \end{equation*} $$
从 $R^{\prime \prime} Q^{\prime \prime} E_{1}^{\prime \prime} E_{2}^{\prime \prime}$ 的整个量子态处于纯态可以得到
$$ \begin{equation*} S\left(R^{\prime \prime}, E_{1}^{\prime \prime}, E_{2}^{\prime \prime}\right)=S\left(Q^{\prime \prime}\right) \tag{12.128} \end{equation*} $$
系统 $R$ 和 $E_{1}$ 都没有出现在第二个过程中,其中系统 $Q$ 和 $E_{2}$ 之间酉相互作用。因此,在这个阶段量子态不变:即 $\rho^{R^{\prime \prime}} E_{1}^{\prime \prime}=\rho^{R^{\prime} E_{1}^{\prime}}$ 。但是从第一阶段之后的系统 $R Q E_{1}$ 处于纯态,可得
$$ \begin{equation*} S\left(R^{\prime \prime}, E_{1}^{\prime \prime}\right)=S\left(R^{\prime}, E_{1}^{\prime}\right)=S\left(Q^{\prime}\right) \tag{12.129} \end{equation*} $$
现在可以把强次可加性式(12.127)中的剩下两项看成是熵交换,即
$$ \begin{equation*} S\left(E_{1}^{\prime \prime}\right)=S\left(E_{1}^{\prime}\right)=S\left(\rho, \mathcal{E}_{1}\right) ; S\left(E_{1}^{\prime \prime}, E_{2}^{\prime \prime}\right)=S\left(\rho, \mathcal{E}_{2} \circ \mathcal{E}_{1}\right) \tag{12.130} \end{equation*} $$
将这些替换项代人到式(12.127)中可得
$$ \begin{equation*} S\left(Q^{\prime \prime}\right)+S\left(\rho, \mathcal{E}_{1}\right) \leqslant S\left(Q^{\prime}\right)+S\left(\rho, \mathcal{E}_{2} \circ \mathcal{E}_{1}\right) \tag{12.131} \end{equation*} $$
上式可以改写为数据处理不等式的第二个不等式,即 $I\left(\rho, \mathcal{E}_{1}\right) \geqslant I\left(\rho, \mathcal{E}_{2} \circ \mathcal{E}_{1}\right)$ 。 为了完成证明,我们需要说明 $\mathcal{E}$ 在输人 $\rho$ 下完全可逆的充要条件是数据处理不等式中的第一个不等式在等式
$$ \begin{equation*} S(\rho)=I(\rho, \mathcal{E})=S\left(\rho^{\prime}\right)-S(\rho, \mathcal{E}) \tag{12.132} \end{equation*} $$
下成立。 为了证明必要性,假设 $\mathcal{E}$ 在输入 $\rho$ 下完全可逆且逆操作为 $\mathcal{R}$ ,那么从第二个不等式可以看出
$$ \begin{equation*} S\left(\rho^{\prime}\right)-S(\rho, \mathcal{E}) \geqslant S\left(\rho^{\prime \prime}\right)-S(\rho, \mathcal{R} \circ \mathcal{E}) \tag{12.133} \end{equation*} $$
由可逆条件可得 $\rho^{\prime \prime}=\rho_{0}$ 更进一步,根据量子费诺不等式(12.112)和完全可逆条件 $F(\rho, \mathcal{R} \circ \mathcal{E})=1$可得 $S(\rho, \mathcal{R} \circ \mathcal{E})=0$ 。因此,当作用 $\rho \rightarrow \mathcal{E}(\rho) \rightarrow(\mathcal{R} \circ \mathcal{E})(\rho)$ 时,量子数据处理不等式的第二个不等式将变为
$$ \begin{equation*} S\left(\rho^{\prime}\right)-S(\rho, \mathcal{E}) \geqslant S(\rho) \tag{12.134} \end{equation*} $$
将这个结果与数据处理不等式的第一个不等式联立,$S(\rho) \geqslant S\left(\rho^{\prime}\right)-S(\rho, \mathcal{E})$ ,可得
$$ \begin{equation*} S\left(\rho^{\prime}\right)=S(\rho)-S(\rho, \mathcal{E}) \tag{12.135} \end{equation*} $$
接下来,我们将给出构造性证明,如果下式成立,即
$$ \begin{equation*} S(\rho)=S\left(\rho^{\prime}\right)-S(\rho, \mathcal{E}) \tag{12.136} \end{equation*} $$
那么就意味着量子操作 $\mathcal{E}$ 在输入 $\rho$ 时可逆。注意到 $S(\rho)=S(Q)=S(R)=S\left(R^{\prime}\right), S\left(\rho^{\prime}\right)=$ $S\left(Q^{\prime}\right)=S\left(R^{\prime}, E^{\prime}\right)$ 及 $S(\rho, \mathcal{E})=S\left(E^{\prime}\right)$ ,于是 $S\left(R^{\prime}\right)+S\left(E^{\prime}\right)=S\left(R^{\prime}, E^{\prime}\right)$ ,在 11.3.4 节中已经得到这等价于条件 $\rho^{R^{\prime} E^{\prime}}=\rho^{R^{\prime}} \otimes \rho^{E^{\prime}}$ 。假设 $Q$ 的初态是 $\rho=\sum_{i} p_{i}|i\rangle\langle i|$ ,并将其纯化为 $R Q$ 上的纯态 $|R Q\rangle=\sum_{i} p_{i}|i\rangle|i\rangle$ ,其中第一个系统是 $R$ ,第二个系统是 $Q$ 。值得注意的是 $\rho^{R^{\prime}}=\rho^{R}=\sum_{i} p_{i}|i\rangle\langle i|$ 。更进一步,假设 $\rho^{E^{\prime}}=\sum_{j} q_{j}|j\rangle\langle j|$ ,其中 ${|j\rangle}$ 是某个标准正交基,使得
$$ \begin{equation*} \rho^{R^{\prime} E^{\prime}}=\sum_{i j} p_{i} q_{j}|i\rangle\langle i| \otimes|j\rangle\langle j| \tag{12.137} \end{equation*} $$
其对应的特征向量是 $|i\rangle\langle i|$ ,故由施密特分解,我们可以将量子操作 $\mathcal{E}$ 作用后 $R^{\prime} Q^{\prime} E^{\prime}$ 上的状态写为
$$ \begin{equation*} \left|R^{\prime} Q^{\prime} E^{\prime}\right\rangle=\sum_{i j} \sqrt{p_{i} q_{j}}|i\rangle|i, j\rangle|j\rangle \tag{12.138} \end{equation*} $$
其中 $|i, j\rangle$ 是系统 $Q$ 的某个标准正交态集合。定义投影算子 $P_{j}$ 为 $P_{j} \equiv \sum_{i}|i, j\rangle\langle i, j|$ ,那么恢复操作的含义就是首先执行由算子 $P_{j}$ 描述的测量,用来揭示环境的状态 $|j\rangle$ ,然后在 $j$ 的条件下作用一个西旋转 $U_{j}$ ,用来将状态 $|i, j\rangle$ 恢复到 $|i\rangle: U_{j}|i, j\rangle \equiv|i\rangle$ 。也就是说,$j$ 是测量结果,$U_{j}$ 是相应的恢复操作。完备的恢复操作如下:
$$ \begin{equation*} \mathcal{R}(\sigma) \equiv \sum_{j} U_{j} P_{j} \sigma P_{j} U_{j}^{\dagger} \tag{12.139} \end{equation*} $$
由量子态 $|i, j\rangle$ 之间的正交性可以得到投影算子 $P_{j}$ 相互正交但可能并不完备。如果是不完备的情况,那么就需要添加剩余算子 $\tilde{P} \equiv I-\sum_{j} P_{j}$ 到投影算子集合中,从而确保量子操作 $\mathcal{R}$ 是保迹的。
逆操作之后系统 $R Q E$ 的末态由下式给出:
$$ \begin{align*} \sum_{j} U_{j} P_{j}\left|R^{\prime} Q^{\prime} E^{\prime}\right\rangle\left\langle R^{\prime} Q^{\prime} E^{\prime}\right| P_{j} U_{j}^{\dagger} & =\sum_{j} \sum_{i_{1}, i_{2}} \sqrt{p_{i_{1}} p_{i_{2}}} q_{j}\left|i_{1}\right\rangle\left\langle i_{2}\right| \otimes\left(U_{j}\left|i_{1}, j\right\rangle\left\langle i_{2}, j\right| U_{j}^{\dagger}\right) \otimes|j\rangle\langle j| \tag{12.140}\\ & =\sum_{i_{1}, i_{2}} \sqrt{p_{i_{1}} p_{i_{2}}}\left|i_{1}\right\rangle\left\langle i_{2}\right| \otimes\left|i_{1}\right\rangle\left\langle i_{2}\right| \otimes \rho^{E^{\prime}} \tag{12.141} \end{align*} $$
从上式中我们可以看出 $\rho^{R^{\prime \prime} Q^{\prime \prime}}=\rho^{R Q}$ ,从而 $F(\rho, \mathcal{R} \circ \mathcal{E})=1$ ,也就是说操作 $\mathcal{E}$ 在输入 $\rho$ 下完全可逆,得证。
到此完成了保迹量子操作信息论可逆条件的证明。关于该结果的一个直观解释大致是:$Q$ 是量子计算机的内存单元,$R$ 是量子计算机的剩余系统,$E$ 是与 $Q$ 有交互并产生噪声的环境。信息论可逆条件也可以被理解为:噪声影响之后环境 $E^{\prime}$ 的状态不再与量子计算机剩余系统 $R^{\prime}$ 的状态有关系。为了更形象地描述这个结果,当环境不能通过与 $Q$ 的交互得到关于量子计算机剩余系统的任何信息时,纠错成为了可能!
更具体地,假设 $Q$ 是一个 $n$ 量子比特系统,$C$ 是系统 $Q$ 的一个 $[n, k]$ 量子纠错码,并且码字 $|x\rangle$ 相互正交且已归一化,$P$ 投影到该码字空间。考虑密度矩阵 $P / 2^{k}$ ,其可以纯化为 $R Q$ 上的一个纯态,即
$$ \begin{equation*} \frac{1}{\sqrt{2^{k}}} \sum_{x}|x\rangle|x\rangle \tag{12.142} \end{equation*} $$
假设这个码能够纠正子集 $Q_{1}$ 上的任意错误,那么如果将这些量子比特交换到环境中并用某个标准状态来替换之后产生的错误也一定能通过该码得到纠正。在这种情况下,信息论可逆条件 $\rho^{R^{\prime} E^{\prime}}=\rho^{R^{\prime}} \otimes \rho^{E^{\prime}}$ 可以被重写为 $\rho^{R Q_{1}}=\rho^{R} \otimes \rho^{Q_{1}}$ 。因此如果纠错是可行的,那么参考系统 $R$ 和能被纠错的子系统 $Q_{1}$ 必然初始不能相关。
习题 12.14 证明 $\rho^{R Q_{1}}=\rho^{R} \otimes \rho^{Q_{1}}$ 也是子系统 $Q_{1}$ 能纠错的充分条件。 量子数据处理不等式的证明中用到的技术可以用来证明更多其他不等式。比如,假设在处于状态 $\rho$ 的量子系统 $Q$ 上作用量子操作 $\mathcal{E}$ ,那么数据处理不等式的第一个不等式可以应用系统 $R^{\prime} E^{\prime}$ 的摘的次可加性来得到。如果换成系统 $Q^{\prime} E^{\prime}$ 的熵的次可加性,那么就会得到
$$ \begin{equation*} S(\rho)=S(R)=S\left(R^{\prime}\right)=S\left(Q^{\prime}, E^{\prime}\right) \leqslant S\left(Q^{\prime}\right)+S\left(E^{\prime}\right)=S(\mathcal{E}(\rho))+S(\rho, \mathcal{E}) \tag{12.143} \end{equation*} $$
即
$$ \begin{equation*} \Delta S+S(\rho, \mathcal{E}) \geqslant 0 \tag{12.144} \end{equation*} $$
其中 $\Delta S \equiv S(\mathcal{E}(\rho))-S(\rho)$ 是由过程 $\mathcal{E}$ 引起的熵的变化值。笼统地说,这个不等式表明系统熵的变化值加上环境熵的变化值一定是非负的,这是一个与热力学第二定律完全一致且非常合理的结论,并且也会帮助我们理解 12.4.4节中关于量子纠错的热力学分析。 习题12.15 应用次可加性和强次可加性所有可能的组合来推导两阶段量子过程 $\rho \rightarrow \rho^{\prime}=\mathcal{E}_{1}(\rho) \rightarrow$ $\rho^{\prime \prime}=\left(\mathcal{E}_{2} \circ \mathcal{E}_{1}\right)(\rho)$ 中的其他不等式,并在涉及摘交换和嫡值 $S(\rho), S\left(\rho^{\prime}\right), S\left(\rho^{\prime \prime}\right)$ 时尝试解释这些结果。如果不能将不等式中出现的值表达成这几个量,请利用 $\rho, \mathcal{E}_{1}$ 的操作元 $\left\{E_{j}\right\}$ ,以及 $\mathcal{E}_{2}$ 的操作元 $\left\{F_{k}\right\}$ 给出一个计算这些值的变形。
量子纠错的信息论方法可以用来证明量子纠错码纠错能力的一个漂亮的界——量子辛格顿界限。回顾 $[n, k, d]$ 码是利用 $n$ 量子比特编码 $k$ 量子比特,并且能纠正局部至多 $d-1$ 个量子比特上的错误(见习题 10.45 )。量子辛格顿界限表明 $n-k \geqslant 2(d-1)$ ,这与经典辛格顿界限一致,经典辛格顿界限由习题 10.21 给出,讲的是对于经典 $[n, k, d]$ 码一定有 $n-k \geqslant d-1$ 成立。因为一个能纠正 $t$ 个错误的量子码的距离必然至少是 $2 t+1$ ,所以有 $n-k \geqslant 4 t$ 成立。因此,比如有一个量子码,能编码 $k=1$ 个量子比特,可以纠正 $t=1$ 个错误,那么该码必然满足 $n-1 \geqslant 4$ ;也就是说 $n$ 必须至少是 5 ,所以第 10 章给出的五量子比特码是能完成这项任务的最小编码。
对量子辛格顿界限的证明是曾用来分析量子纠错码的信息论技术的一种推广应用。假设编码是与系统 $Q$ 关联的 $2^{k}$ 维子空间,其标准正交基记为 $|x\rangle$ 。引人 $2^{k}$ 维参照系统 $R$ ,其标准正交基
同样记为 $|x\rangle$ ,考虑 $R Q$ 上的纠缠态,即
$$ \begin{equation*} |R Q\rangle=\frac{1}{\sqrt{2^{k}}} \sum_{x}|x\rangle|x\rangle \tag{12.145} \end{equation*} $$
将 $Q$ 的 $n$ 个量子比特分成互不相交的 3 块,第 1 块和第 2 块分别记为 $Q_{1}$ 和 $Q_{2}$ ,且均包含 $d-1$个量子比特;第 3 块记为 $Q_{3}$ ,包含剩下的 $n-2(d-1)$ 个量子比特。由于该编码的距离为 $d$ ,任意 $d-1$ 个定位错误都可以得到纠正,因此该编码可以纠正 $Q_{1}$ 或者 $Q_{2}$ 中的错误。另外,$R$ 与 $Q_{1}$ 不相关,同样 $R$ 与 $Q_{2}$ 也不相关。根据这个观察,以及 $R Q_{1} Q_{2} Q_{3}$ 处于纯态和嫡的次可加性,我们可以得到:
$$ \begin{align*} & S(R)+S\left(Q_{1}\right)=S\left(R, Q_{1}\right)=S\left(Q_{2}, Q_{3}\right) \leqslant S\left(Q_{2}\right)+S\left(Q_{3}\right) \tag{12.146}\\ & S(R)+S\left(Q_{2}\right)=S\left(R, Q_{2}\right)=S\left(Q_{1}, Q_{3}\right) \leqslant S\left(Q_{1}\right)+S\left(Q_{3}\right) \tag{12.147} \end{align*} $$
将这两个不等式相加,可得
$$ \begin{equation*} 2 S(R)+S\left(Q_{1}\right)+S\left(Q_{2}\right) \leqslant S\left(Q_{1}\right)+S\left(Q_{2}\right)+2 S\left(Q_{3}\right) \tag{12.148} \end{equation*} $$
不等号两边消元,并利用 $S(R)=k$ 做代换,可得 $k \leqslant S\left(Q_{3}\right)$ 。但是 $Q_{3}$ 包含 $n-2(d-1)$ 个量子比特,所以 $S\left(Q_{3}\right) \leqslant n-2(d-1)$ ,即 $k \leqslant n-2(d-1)$ ,从而得到量子辛格顿界限 $2(d-1) \leqslant n-k$ 。
作为量子辛格顿界限应用的一个例子,我们考虑去极化信道 $\mathcal{E}(\rho)=p \rho+(1-p) / 3(X \rho X+$ $Y \rho Y+Z \rho Z)$ 。假设大数 $n$ 个量子比特独立通过该信道,在 $p < 3 / 4$ 时会有超过四分之一的量子比特出错,所以任意能纠正这些错误的编码都必然满足 $t > n / 4$ 。但是结合量子辛格顿界限得到 $n-k \geqslant 4 t > n$ ,所以 $k$ 必须是负数,也就是说这种情况下的任何编码都不可行。因此在 $p < 3 / 4$时,量子辛格顿界限表明去极化信道关于量子信息的信道容量为零!
量子纠错可以看成是一种量子制冷过程,在噪声影响趋于改变系统嫡的情况下,依然会保持量子系统的嫡不变。事实上,从这个角度来看量子纠错甚至令人费解,因为它似乎允许减少在量子系统的嫡,而这明显违反热力学第二定律!为了理解为什么没有违反第二定律,我们对量子纠错进行分析,这类似于对专题 3.5 中的麦克斯韦妖的分析。量子纠错基本上是一种特殊形式的麦克斯韦妖一一想象一个"妖"可以在量子系统上执行征状测量,之后根据征状测量的结果来纠错。就像分析经典麦克斯韦妖一样,在妖的记忆中存储征状伴随着热力学成本,这与兰道尔原理一致。特别地,由于任何内存都是有限的,为了拥有足够的空间来存储新的结果,妖终将开始从记忆中擦除信息。兰道尔原理告诉我们:从记忆中擦除 1 比特信息会使整个系统(包括量子系统,妖和环境)的摘至少增加 1 比特。
更准确地说,我们可以考虑一个四阶段的量子纠错"环",如图 12-9 所示。 1.系统初始处于状态 $\rho$ ,经过带噪声量子演化之后处于状态 $\rho^{\prime}$ 。在纠错的典型场景中,我们
感兴趣的是系统摘增加的情形,即 $S\left(\rho^{\prime}\right) > S(\rho)$ ,但这并不必然发生。 2.妖在状态 $\rho^{\prime}$ 上执行由测量算子 $\left\{M_{m}\right\}$ 描述的(征状)测量,以概率 $p_{m}=\operatorname{tr}\left(M_{m} \rho^{\prime} M_{m}^{\dagger}\right.$ )得到结果 $m$ ,并且测量后的状态为 $\rho_{m}^{\prime}=M_{m} \rho^{\prime} M_{m}^{\dagger} / p_{m}$ 。
3.妖作用西操作 $V_{m}$(恢复操作),系统状态最终为
$$ \begin{equation*} \rho_{m}^{\prime \prime}=V_{m} \rho_{m}^{\prime} V_{m}^{\dagger}=\frac{V_{m} M_{m} \rho^{\prime} M_{m}^{\dagger} V_{m}^{\dagger}}{p_{m}} \tag{12.149} \end{equation*} $$
4.循环过程重新开始。为了使这个过程真正成为一个环并且是一个成功纠错,每个结果 $m$ 对应的量子态必须要满足 $\rho^{\prime \prime}=\rho$ 。
图 12-9 量子纠错环
现在我们来说明:在第二和第三阶段——纠错阶段——中熵的任意减少都是以产生环境的熵为代价,这至少与被纠错量子系统的熵减少一样大。在第三阶段结束之后,只有测量结果 $m$ 记录在妖的记忆中。为了在下一轮中重置记忆,妖必须擦除关于测量结果的这个记录,根据兰道尔原理,这就导致了环境熵的增加。妖用来存储测量结果的方式决定了必须擦除的比特数;利用香农无噪声信道编码定理,储存测量结果在平均意义下至少需要 $H\left(p_{m}\right)$ 个比特,因此当测量结果被擦除时,单轮纠错过程平均引起 $H\left(p_{m}\right)$ 比特的熵消散到环境中。
在纠错之前,量子系统状态为 $\rho^{\prime}$ 。在纠错之后,量子系统状态为 $\rho$ ,所以由纠错带来的系统摘的净变值为 $\Delta(S) \equiv S(\rho)-S\left(\rho^{\prime}\right)$ 。另外还有由擦除测量结果引起的额外熵消耗 $H\left(p_{m}\right)$(平均意义下),于是熵的总消耗为 $\Delta(S)+H\left(p_{m}\right)$ 。我们的目标是限制这一热力学消耗,并且这样做也是在证明热力学第二定律永远不会被违反。为了达到这一目标,需要引入两个概念:令 $\mathcal{E}$ 表示纠错环第一阶段的噪声过程,即 $\rho \rightarrow \rho^{\prime}=\mathcal{E}(\rho), R$ 表示纠错操作,即
$$ \begin{equation*} \mathcal{R}(\sigma) \equiv \sum_{m} V_{m} M_{m} \sigma M_{m}^{\dagger} V_{m}^{\dagger} \tag{12.150} \end{equation*} $$
这个过程的输入 $\rho^{\prime}$ 是权重矩阵,矩阵元素为 $W_{m n}=\operatorname{tr}\left(V_{m} M_{m} \rho^{\prime} M_{n}^{\dagger} V_{n}^{\dagger}\right)$ ,因此对角元素即为 $W_{m m}=\operatorname{tr}\left(V_{m} M_{m} \rho^{\prime} M_{m}^{\dagger} V_{m}^{\dagger}\right)=\operatorname{tr}\left(M_{m} \rho^{\prime} M_{m}^{\dagger}\right)$ ,这恰好是妖执行征状测量后得到测量结果为 $m$ 时
对应的概率 $p_{m}$ 。根据定理 11.9,矩阵 $W$ 对角元素的熵至少跟矩阵 $W$ 的一样大,所以
$$ \begin{equation*} H\left(p_{m}\right) \geqslant S(W)=S\left(\rho^{\prime}, \mathcal{R}\right) \tag{12.151} \end{equation*} $$
当且仅当算子 $V_{m} M_{m}$ 是 $\mathcal{R}$ 关于 $\rho^{\prime}$ 使 $W$ 的所有非对角元均为零的标准分解时,等式成立。由式(12.144)可得
$$ \begin{equation*} \Delta S+S\left(\rho^{\prime}, \mathcal{R}\right)=S(\rho)-S\left(\rho^{\prime}\right)+S\left(\rho^{\prime}, \mathcal{R}\right) \geqslant 0 \tag{12.152} \end{equation*} $$
结合式(12.151),我们可以推导出 $\Delta S+H\left(p_{m}\right) \geqslant 0$ 。但是 $\Delta S+H\left(p_{m}\right)$ 是纠错过程引起的总嫡变值,从而得到结论:纠错只能导致总熵的净增加,任何由纠错导致的系统熵的减少都被在纠错中产生的错误征状被擦除时新增的熵抵消了。 习题 12.16 若 $\mathcal{R}$ 能完美纠正作用在输人 $\rho$ 上的操作 $\mathcal{E}$ ,证明下述不等式中的等号成立:
$$ \begin{equation*} S(\rho)-S\left(\rho^{\prime}\right)+S\left(\rho^{\prime}, \mathcal{R}\right) \geqslant 0 \tag{12.153} \end{equation*} $$