冯诺依曼的量子测量模型

“哥本哈根诠释”

让我们先看一看著名的“哥本哈根诠释”（有时甚至称为“正统诠释”）的特征。

为什么要打引号呢？因为被冠以“哥本哈根诠释”之名的观点是对许多散落在玻尔、海森堡等人的演讲和著述中的观点的笼统概括，并没有建立一个标准手册，实际上玻尔和海森堡就有诸多分歧——如对不确定性究竟来自于扰动还是内禀的争论。

我们将哥本哈根诠释的基本观点及与其相伴随的问题概括如下。

第一，测量导致量子态投影/波函数坍缩，相应的概率由玻恩定则给出，测量之前不存在力学量的取值，这一点可以说就是标准量子力学的观点。

但尽管都使用了玻恩定则来计算期望值，玻恩本人的系综诠释要更加保守，他并不试图谈论单次测量过程中发生了什么，而是止步于谈论大量测量的结果。实际上，教科书式的观点更接近玻恩的保守观点，而对哥本哈根诠释关于物理实在的激进看法不予理会（如美国学术界的实用主义风气使他们不像欧洲同行那样热衷诠释，后来中国学术界掀起的唯物主义浪潮也拒绝哥本哈根诠释的观点）。爱因斯坦也与玻恩在量子力学提供了对系综的描述这一点上达成了共识，爱因斯坦对量子力学的不满则在于对单个系统的描述。

第二，对于“到底什么力学量被测量了？”的问题，或者也可以说“粒子表现出波动性还是粒子性？”的问题——，常把测量动量/干涉认同为表现波动性，测量位置/路径认同为表现粒子性——哥本哈根诠释没有给出系统性的判断方法，而是遵循对实验设置具体分析（case by case）的原则，就像玻尔在和爱因斯坦进行对各种思想实验的辩论时做的那样。

玻尔本人将这一点“提升”为互补性原理（complementarity principle），波动性和粒子性是互补的，两种角度都不能完全描述物理，而且展现它们的实验设置是互斥的，无法将两种性质结合起来。实际上，对玻尔而言，波函数并不是系统本身的状态，而是和实验设置相联系的，所谓波函数坍缩无非是从一种实验转换到另一种实验时不得不重新给出波函数。

并非所有“哥本哈根学派”的成员都认同这一点。而且其也受到了实验的挑战，如中科院量子信息重点实验室于2012年9月发表在nature: photonics上的工作（Jian-Shun Tang, et al. Realization of quantum Wheeler's delayed-choice experiment. Nature Photon 6, 600–604 (2012)）就发现了一种“非波非粒”的超越互补原理的状态——超越了一种诠释，但并未超出量子力学的基本框架！

第三，直接承接上面两点，哥本哈根诠释认为测量仪器是经典的，对仪器的分析需要使用经典力学。这一点在玻尔热衷的半经典分析中展露无疑，但也并非明确——把什么看成仪器——使用经典定律，什么看成测量对象——使用量子定律——完全是任意的，海森堡在其《量子论的物理原理》（The Physical Principles of the Quantum Theory）一书中就明确表达过这一观点。

这就引出了经典-量子边界问题，或者说海森堡边界（Heisenberg cut）。随着实验技术的发展，人们已经在越来越大的系统中发现了量子效应，从上世纪末的分子到2019年人们已经在超过2000个原子的大分子上实现了干涉实验（Fein, Y.Y., et al. Quantum superposition of molecules beyond 25 kDa. Nat. Phys. 15, 1242–1245 (2019)），更不用说对我们熟悉的固体物质的性质的解释离不开量子力学，而这背后很大程度上是经验事实的推动而不是主观的任意选择，我们需要接受量子力学的普适性。

冯诺依曼的量子仪器

写作了《量子力学的数学基础》（Mathematical Foundations of Quantum Mechanics）的冯诺依曼率先对从第一性原理——我们今天能看到被清晰总结了的原理就归功于冯诺依曼——描述量子测量这一难题发起了挑战，“如果量子力学（除去测量投影假设）是普适的，那会怎么样？”

既然要把仪器看做是量子系统，那它当然也要用态矢量来描述，我们给它赋予一个下标（device，仪器）：

它属于仪器自己的希尔伯特空间，于是系统和仪器组成的复合系统的态矢量应该位于一个更大的希尔伯特空间中：

就代表系统（system），圆圈乘号学名叫做张量积，你只需要知道它是用来连接两个不同的系统的。

仪器本身可能很复杂，但其大多数自由度都与我们关心的实验无关，我们只关心仪器的指针（pointer，泛指一切能显示测量结果的东西）的状态，怎样才配叫做指针呢？

不同的指针态应该能完全区分开，即对指针的位置的本征态的一个集合，其中的态应该两两正交：

符号是矢量点乘的推广。

对于待测的系统力学量，如果其有个本征值，那指针的可能位置数应该满足，否则就不足以指示系统的状态。

初始时刻，仪器处于“准备就绪”态，指针确定地指示，简单起见，先假设系统处于待测力学量的某个本征态。仪器和系统在测量开始前还没有建立任何关联，复合系统的态就是的态“直接乘起来”：

我们希望测量结束后仪器能够忠实反映系统的状态——测量本征态仍然得到本征态，即实现如下演化：

如果这一演化能够实现，我们就把对于抽象的算符而言的本征值-本征态联系转化成了具体的系统态-仪器指针态联系，怎么样实现呢？

别忘了，我们现在可没有“蛮不讲理”的测量投影，演化要遵循薛定谔方程：

于是问题变成，复合系统的哈密顿量（能量）应该是怎样的？系统和仪器原本有自己的哈密顿量，测量发生之前总的是：

其中是单位算符，相当于，意味着只对系统有作用，对仪器没有作用，同理，这样互不影响显然是不行的，我们需要引入相互作用（I，interaction）：

相互作用项仅在一段时间内非零，即我们不再简单地假设测量瞬时发生，而是像任何物理过程一样持续一段时间：开始，结束。

并且表征相互作用强度要足够大——表现为常系数，使得相互作用的这段时间内，系统和仪器因纯自身因素产生的变化可以忽略不计，完全受两者之间相互作用主导。

相互作用项中为与仪器指针位置对应的动量算符——它可以移动指针：

所以相互作用中必须包含仪器指针的动量——动量是空间平移的生成元。

那乘以待测力学量是怎么回事呢？一方面是为了不让相互作用改变系统的状态（这就和很多地方说的测量扰动不同了！），即相互作用和待测力学量对易：

因为只能作用在仪器的态上，在系统的看来就是个常数，可以交换！另一方面也是为了让指针移动的量和待测力学量的取值有关，我们接下来就会看到。

求解由满足上述要求的相互作用主导的薛定谔方程，我们可以得到：

看上去有点复杂是吧？但其实很简单，只要用本征值-本征态关系：

就可以把算符变成普通的数（即便放在指数里也一样！）：

只剩下要对仪器作用的动量了。对比我们上面提到的平移，我们发现指针的平移量就是！测量结束后的末态就是：

这样，我们只需要把称为为第指针态即可在系统和仪器指针之间建立一一对应的联系。

如果系统一开始处于对而言的叠加态呢？

那么态叠加原理，或者说薛定谔方程的线性性告诉我们测量结束后的末态就是：

复合系统整体处于：

系统处于且仪器处于；
系统处于且仪器处于；
……
系统处于且仪器处于。

的叠加态！可以说，相干性传到了更大的系统上。它不能被分解为两个子系统的状态直接相乘：

这种不可分离的状态就称为纠缠态（entangled state），它来自系统和仪器的相互作用，一般而言相互作用会建立纠缠，但纠缠不需要相互作用来维持（之后我们就关掉了相互作用，但上述纠缠态在接下来的演化中仍保持纠缠）。

对于“不求甚解”者，上面这个仪器和系统纠缠态就已经够让人满足的了，“不是已经建立起系统和仪器的一一对应的关联了嘛！”但这是不够的，量子力学，或者说矢量的另一个关键的特征：可以任意选择基矢量将带来一个问题，“到底什么力学量被测量了？”，称为偏好基问题（preferred basis problem）。

偏好基问题：以自旋系统为例

让我们以对自旋粒子，如电子的自旋态的测量来展示什么是偏好基问题。

根据量子力学，电子的自旋相对于某一轴，如轴有两种本征态：

而相对于与其垂直的两个轴，如彼此垂直的轴同样也有两种本征态：

它们可以相互叠加出来，如和之间有：

详情可以参见……，在这里你只需将其作为一个设定接受。注意叠加时一个正负号之差完全改变了叠加得到的结果！这就是相位的重要之所在，概率不能完整地描述量子态。

上述关系式意味着电子的自旋并没有确定的方向！只是表示电子的自旋倾向于轴正方向，准确地说，有确定的方向分量，而并不代表自旋沿着轴——因为分量（以及分量）和分量是无法同时确定的！可以用圆锥面来描述自旋：

我们假设仪器也只有两种指针态，比如就用另一个自旋粒子作为仪器，仪器初始处于，如果系统处于，那么仪器指针就保持，而如果系统处于，那么仪器指针就翻转到。

如果系统初始时处于，仪器处于准备就绪态，那么测量结束后有

现在问题来了！将变换公式（对系统和仪器都适用）：

代入测量末态，有

这意味这我们不能采取“不求甚解”观点，认为得到了系统-仪器叠加态就大功告成了，“不就是两种可能性：

系统上仪器下；
系统下仪器上。

吗？其中一个会实现，这不就得了？”且不说这又把投影/坍缩请了回来，违背了我们解决测量问题的初衷，而且还行不通！上面的变换告诉我们，还可以这样解读：

系统左仪器左；
系统右仪器右。

还可以变换到甚至其它方向，那就又是不同的选项列表了——无穷无尽！但是，态矢量总还是那个，把一个态用哪些别的态来叠加出来纯粹是一种理论上的选择！别忘了这个图像：

在这里谈论坍缩，就像一个选择困难的人想要随机指着菜单点菜，但是却发现没有菜单！

这就是偏好基问题：大自然究竟会偏好哪种选项列表？仅仅把系统和仪器组合到一起，它们都不知道在测量些什么！我们到底该按照哪个方向（哪个力学量）去划分可能性的菜单？

这种基矢选择的自由性也体现了量子纠缠和“一副手套装在两个盒子里”这种经典的关联的根本性不同。

冯诺依曼-魏格纳诠释

作为用量子力学理解仪器的先驱者，冯诺依曼本人是如何理解自己的结果的呢？

上面我们只讨论了仪器和系统两个系统的组合，我们当然还可以再引入更多的系统——用新的仪器再去测量已有的仪器——组成更大的复合系统，但只要薛定谔方程成立，相干性就会无止尽地扩散，在任何一步都不会有违反薛定谔方程的坍缩，这称为冯诺依曼链（von Neumann chain）。

面对这样的推论，冯诺依曼最终选择了向心灵（mind，比意识（consciousness）更广义一些）求助，在当时看来，心灵运转的未知的机制可能会逃脱薛定谔方程的掌握，作为坍缩机制的来源。

继冯诺依曼在30年代的讨论之后，将群论这一强大工具引入量子力学的尤金·魏格纳（Eugene Wigner）在1961年的Remarks on the mind-body question（对心身问题的评论）中提出了魏格纳的朋友（Wigner's friend）思想实验，用来说明心灵介入的“必要性”。

魏格纳设想在自己的实验室里再嵌套一层实验室，让一位朋友在其中进行量子力学实验，如测量一个电子的自旋。内层实验室与外界隔离得很好，直到朋友出来通知实验结果为止，魏格纳对内层发生的事情一无所知，除了待测电子的初态：

朋友要测量方向（“上下”），无论采信何种理论观点，无数实验事实（正是这些实验事实倒逼玻恩提出了他的诠释）告诉他将有的概率得到，的概率得到——当然这概率要准备一个系综才能被测到，看起来没什么问题。

但对于外层的魏格纳而言，电子和朋友组成了一个复合系统，按照薛定谔方程，两者将从彼此无关的直接相乘的初态演化到一个纠缠态，就像我们上面分析过的一样：

如果魏格纳设法对复合系统进行测量，那么魏格纳在多次实验中最终会发现两种结果出现，不仔细想的话会以为这只不过是朋友那里的概率的简单传递，没有什么不对。但别忘了偏好基！魏格纳可以选择测量的方向，这可以验证复合系统究竟是处于叠加态，还是处于已经“尘埃落定”的状态。

假如电子-朋友复合系统已经“尘埃落定”——明确地处于一种结果中，如：

而魏格纳设法在这样一组基：

上进行测量，那么

而

“尘埃落定”的看法和标准量子力学的预言相矛盾，魏格纳原则上可以判断其中的区别。

对人这样复杂的系统进行量子测量、切换测量基等可想而知面对着极大的技术困难，在可预见的未来大概都不可能实现，我们只能确定，如果把朋友换成一个粒子，那么薛定谔方程的预言是正确的。

魏格纳选择了让薛定谔方程给人类心灵让位，在知道朋友在内层做实验的情况下，身处外层的魏格纳就不能再使用薛定谔方程来计算复合系统的演化，而必须认为电子的状态已经因朋友心灵的介入而坍缩了。对魏格纳而言，内层的实验结果现在就像经典的抛硬币一样，是一种因无知造成的经典概率问题，不再具有量子的相干性。

当我们将这一诠释和更广阔的科学图景结合起来的时候就会发现一种严重的不协调：在有心灵的生命诞生之前的世界是怎样运转的呢？更具体地说，在生命演化史上尚不存在心灵和存在心灵之间的临界点发生了什么？

在研究早期宇宙中各种粒子的统计性质时，人们默认量子力学给出的期望值——如量子场的平均能量，但如果没有什么在测量，这些期望值究竟是相对于什么的呢？也许，我们不得不接受“宇宙的不确定的黑暗历史被第一缕意识之光确定下来”这样的激进观点。

一种或许更保险的观点是退一步，认为量子态并不代表系统本身的状态，而只代表实验者对系统的不完全认识，这称为量子态的认识论观点（-epistemic），与之相对立的则是（全文一定程度上默认的）量子态的本体论观点（-ontic）。

按照认识论观点，魏格纳和朋友的分歧不过是它们对实际情况的认知不同——朋友掌握更多的信息，而量子态的坍缩不过是认知更新，并不需要什么未知的物理机制或是心灵机制。

值得一提的是，隐变量理论既可以是量子态的本体论观点，也可以是量子态的认识论观点，我们留到后面再说。

无须急于滑向激进的哲学立场！电子和朋友整体处于纠缠态，这一点不可思议，但也仅仅是不可思议而已，没有什么原理要求自然界的机制必须符合人类的直观。人类的直观是在原始荒野中求生，躲避危险、捕获猎物，而不是为了捕获粒子演化出来的！我们将看到，情况并没有冯诺依曼、魏格纳等人认为的那样“糟糕”。

多世界诠释

从相对态多世界

在魏格纳文章的几年前，1957年，埃弗雷特三世（Everett III）在他的论文'Relative state' formulation of quantum mechanics（量子力学的“相对态”形式）中已经讨论过魏格纳的朋友类型的思想实验——鉴于埃弗雷特曾经当过魏格纳的学生，他们大概早就一起进行过讨论——正是在这篇文章中，埃弗雷特提出了著名的多世界诠释（Many-worlds interpretation）。

实际上，正如文章的名字所言，埃弗雷特本人对其核心概念的称呼是相对态（relative state），在当时文章并没有获得什么影响力，他曾在导师惠勒（Wheeler）的建议下“软化”文章中的观点，并于1959年拜访了玻尔——但得到了否定的回应。

直到70年代，德威特（Dewitt）在考虑如何将量子力学应用到整个宇宙时重新发掘了埃弗雷特的工作，给出了多世界这个称呼，一夜之间，埃弗雷特的想法从无人问津变成了最具争议的课题之一。

要引入多世界诠释，我们的出发点和上文引入冯诺依曼-魏格纳诠释时是一样的，区别在于，埃弗雷特放弃了内层实验者——朋友只能对应一种结果的假设。就像不存在物体自己的、孤立的速度，必须相对于其它物体才能定义速度，埃弗雷特认为，也不存在孤立的朋友的状态，朋友的状态是相对于他周遭的一切——在思想实验中，相对于他测量的粒子的状态而定义的。反之，粒子的状态也是相对于朋友的状态而言的。于是

和

不再是有待落下的硬币的两面，而是朋友是何存在的两种定义，这就是相对态。两种定义没有哪种更加优越，因此应该认为两者都成立，用德威特的话说，就是生成了两个世界分支（branch）。

由此，我们就可以沿着相互作用的“链条”构造出一个“世界的量子态”，或者用埃弗雷特本人的话说，宇宙波函数（universal wavefunction）：

其中，“物体”（object）态代表那些已经稳定下来的分支，而“剩余”态则包含了不同“物体”的组分粒子之间残余的微弱纠缠。于是，整个宇宙的态就是

需要强调的是，埃弗雷特的观点并不是孑然自立的观察者在多个世界之间穿梭，而是世界分支定义了观察者自身——以及其它物体，多世界诠释中并没有观察者的特殊位置。

多世界诠释的问题

由于抛弃了随机的投影/坍缩，而是以薛定谔方程作为唯一的演化来源，多世界诠释下的量子力学是决定论性的，但是对宏观观察者而言却总是发现自己置身于某一个分支中，产生一种“等效的随机性”。尽管原则上世界分支之间是平权的，但我们却注定只能感受到其中一个，这种自我定位可以说是一种对多世界的对称性破缺——也是对多世界诠释的主要批判的立足点，“既然我们感受不到其它世界，那为什么要引入它们？”，即认为多世界诠释不够简洁。

但是简洁没有统一的标准，从理论结构上来说，多世界诠释只需要薛定谔方程而不需要额外引入坍缩假设，反而是更简洁的。还有人要求多世界诠释“给出不同于量子力学的实验预言”，这就更是跑偏了！多世界诠释是量子力学的诠释，它没有理由“给出不同于量子力学的实验预言”，就像哥本哈根诠释诠释也没有理由“给出不同于量子力学的实验预言”一样。

多世界诠释同样要回答偏好基问题，在早期的版本中是通过一种尚不严格的经典性来回答的：如，由于已知的相互作用都是定域的，那些物体具有明确的位置的分支是“稳定的分支”，这样的分支就是偏好基。你可以把这样的分支写成两种物体位置不确定是分支的叠加，但只有后者分裂为前者的份，没有前者分裂为后者的份。

但什么叫明确的位置呢？在量子力学中对位置的确定在最理想的情况下也不可能小于康普顿波长的量级——再小就会产生新粒子，改变原有的待测系统。即便一开始把位置确定得较为明确，随着时间的推移不确定性也会越来越大。

对此，早期的多世界诠释只能寄希望于世界分支的分裂时间远小于让宏观观察者稳定下来所需的时间，以解释人为什么总是感到在一个经典的世界中，而没有感受过处于世界的叠加中。

而且，之前给出的那种有明确的开启/关闭时间的相互作用只是一种理想模型，现实存在的相互作用都具有一定的“模糊性”，人们所说的短程力也只能指数衰减，两个系统之间不存在一个棱角分明的有/无相互作用的边界，这意味着我们不能把世界分支看成是基本的要素，而只能看成是一种经典近似——还有。

70年代开始，一种被称为退相干（decoherence）的概念出现了，经过80,90年代的发展，它成为了解决测量问题的希望，也为诸多诠释提供了一个可靠的基础——如可以将多世界诠释的“稳定分支”严格化。

环境与退相干

纠缠中的一隅：密度矩阵

既然纠缠态意味着不能分离成两个态矢量直接相乘，那我们也就不再能用态矢量描述处于纠缠之中的子系统的状态了，但我们又想描述，怎么办？为此，冯诺依曼和朗道各自独立地提出了密度矩阵的概念。

我们首先考虑一个两体波函数，，它的模方表示测到粒子在，且粒子在的概率密度，对积分得到总概率：

换言之，把粒子的坐标积掉得到的函数

就代表粒子自己的概率密度。我们还可以进一步改写，定义

为粒子的密度矩阵（density matrix），是行指标，而则是列指标，一个连续化了的矩阵。它的对角元，即取时的

即为刚才提到的粒子自己的概率密度，它再对积分就相当于矩阵求迹（trace）——对角元之和，可见，密度矩阵的迹为。

那时代表什么呢？此时乘——密度矩阵的非对角元，是一个复数，它描述了系统的量子相干性。可以说，对角元对应经典概率，而非对角元才是量子性的所在。

对一开始的两粒子系统同样地有密度矩阵

将这样一个四元函数称为矩阵也许有些奇怪，现在是行指标，而是列指标，你可以理解为在给定的某一行中，还包含着由标号的其它行。

这个两体密度矩阵的迹，即一开始的概率归一：

而求粒子的概率密度时，我们把“粒子的对角元”求和，即取，对积分，与迹相对，把这种将一个粒子“积掉”（“迹掉”）的操作称为偏迹（partial trace），偏迹得到的称为约化密度矩阵（reduced density matrix）。

引入密度矩阵和偏迹允许我们描述纠缠中的子系统的状态。以一个没有纠缠的平庸特例来验证我们的定义是自洽的，没有纠缠则

如果简单粗暴地

则不会得到什么物理上有用的结果。

自旋系统-仪器的密度矩阵

现在让我们看看之前的测量模型中，由两个自旋粒子扮演的系统和仪器的密度矩阵——这下是真正的矩阵了！对测量后的末态

密度矩阵为

其中对每个子系统都由相同的态头碰头构成的为对角元，满足总概率，交叉构成的（相当于）为非对角元，表示相干性。而如果有这样的项：

那么对系统是非对角元，对仪器则是对角元（相当于），不过上面没有这样的项。

不过，这样讨论对角与否的前提是我们涉及到的态，和，和，是相互正交的。

可以对仪器求偏迹，即把和前面的部分加起来，得到描述系统的约化密度矩阵为

系统的密度矩阵是单位矩阵（对仪器也一样）除！单位矩阵是不依赖于基的，无论变换到什么基下都是单位矩阵，无论我们此时测量系统哪个方向的自旋，都有等概率得到两种结果，我们对系统（或仪器）完全没有信息！单位矩阵除称为最大混合态（maximally mixed state）。

如果我们制备另一些系统，通过抛硬币决定是制备到还是（或是任何其它方向的两种态），对系综进行测量，结果和我们对系综中的局部进行重复实验是完全一致的。

可以说，当一个系统要用最大混合态来描述时，就意味着它和其它系统处于最大纠缠中——是的，纠缠有可以度量的大小，而不是有纠缠/没有纠缠二分，纠缠的大小体现在局部和整体的“信息分配”中。最大纠缠中的信息完全由整体所有，局部完全没有信息。

退相干与超选择

现在我们引入缺失的拼图：环境，。什么是环境？环境就是那些我们没有能力获取其信息（或者有能力但单纯没有去做）的自由度的集合。

环境自由度不需要像环境一词所暗示的那样，空间上外在于系统。如考虑一杯水的质心运动、水面形状时，水分子的运动就是环境的一部分，水面振动的能量的一部分最终就耗散到了水分子中。

如果我们要求环境对的相互作用与待测力学量和仪器指针态都对易，那么这个更大的复合系统在相互作用后就会变成

并且环境末态和也正交的话，那么的约化密度矩阵就是

两个交叉项消失了，丢失了描述相干叠加的那部分信息（所幸也只是一部分，否则测量就失败了！），变成了一个部分混合态（再加上和两项才是最大混合态），这就是退相干（decoherence）。

你可能会疑惑，凭什么我们能要求对的相互作用还是和待测力学量对易的？不同于仪器，环境又不是我们设计出来的，我们没法掌控它产生的相互作用是怎样的。

的确！在大多数情况下我们应该反过来想，先有环境的相互作用，然后选出系统中和这种相互作用对易的、能够被严格测量的力学量——总有一个对易的。这就解决了偏好基问题，大自然偏好哪种基？答案是由环境的相互作用筛选出来那那些，这就称为环境诱发的超选择（environment-induced superselection，简称einselection）。不过也有少数情况，我们的实验技术足以在一定范围内控制环境，从而有可能直接探测各种量子效应，如对超导电流的叠加态的观测：Jonathan R. Friedman, et al. Quantum superposition of distinct macroscopic states. Nature,406(6791):43–46, July 2000。

于是，为了测量系统的力学量，我们不仅需要设计具有合适相互作用的仪器，还要了解环境会给出怎样的相互作用，只有那些和环境相互作用对应的系统力学量能够被良好地测量。

现在，系统-仪器不再处于叠加态（相干性转移到了更大的中），而是就像抛硬币一样，要么，要么，这看上去已经比一开始好了很多，从实用的角度看（for all practical purposes），这就解决了测量问题。

但还可以继续追问，要么……要么……，那到底要哪个结果？如果说经典力学原则上可以预言抛硬币的结果，但退相干似乎没有提供一种原则上预言结果的方式，这称为明确结果问题（definite outcome problem）。对退相干过程的具体研究表明，非对角元通常只是指数衰减，而不是严格为零，这显然又带来了一丝模糊性——也有些情况下会在有限时间内严格变为零，称为sudden death（猝死），当环境的相互作用具有所谓的非马尔科夫性（non-Markovian）时相干性甚至还可以在猝死后重生（rebirth）。

在这枚退相干硬币的背后有没有什么机制？还是说我们应该以此为接口，接入多世界诠释（顺便解决了多世界诠释的偏好基问题）？亦或者，这才是人们寻觅的真随机？

现在让我们考虑与经典世界具有更直接关系的位置和动量，人类已知的相互作用都是定域的，对于一个粒子，它和周围的世界是通过位置耦合起来的——其位置和相互作用对易，于是那些粒子的位置不确定性较小的态被超选择出来，成为了较稳定的状态——那些高度非定域的位置叠加态则会退相干。可以计算，对于相距的两个波包的叠加态，退相干时间为：

其中环境相互作用时的弛豫时间（达到宏观平衡所需的时间），为热德布罗意波长，为把（为环境温度，为系统与环境能量交换的特征能量）当做动能求出的德布罗意波长。

退相干的时间相对于宏观物体的时间分辨率往往是很短的，要想抑制退相干，就必须降低温度。尤其值得一提的是神经元的退相干时间尺度在到之间，而神经活动的特征时间最低也只有（由Tegmark给出计算），可见，人类的神经系统是经典的，建立在其基础上的人类心灵不大可能在量子过程中扮演关键的角色。

有人可能对给相互作用的定域性提出约束提出质疑，但就像在多世界诠释的辩护中一样，我们在标准量子力学的一般框架的基础上引入已知的特殊的相互作用来辅助解释是合理的——既然我们熟知的世界是建立在这些已知相互作用的基础上的，我们没有必要要求自己去解释在一个充斥着非定域的相互作用的假想世界中的量子测量问题。从这种意义上说，我们是在建立一个有关现实世界的模型，而不是在单纯地诠释量子力学的框架本身。

隐变量理论

前文的讨论都建立在标准量子力学的基础上，从哥本哈根诠释到多世界诠释，再到更晚近的五花八门的诠释，基本都承认不存在预先确定的力学量取值，或者说力学量取值不具有实在性。

从爱因斯坦对玻尔的发难开始，一些人致力于构建力学量——或者为了加以区分，物理属性（physical property）——始终具有确定的、不以测量为转移的取值的理论，称为隐变量（hidden variable）理论。

我们提到过，隐变量理论既可以是量子态的本体论观点，也可以是量子态的认识论观点。如果一种隐变量取值只能和一种量子态描述相融洽，那就说这种隐变量理论是量子态的本体论观点（可以多对一，但不能一对多）。而如果一种隐变量取值可以和多种量子态描述相融洽，那就说这种隐变量理论量子态的认识论观点。

习惯上用代表隐变量，为了说明的简单起见，我们把当做一个标量，实际上它可以是很多量（包括矢量、张量）的集合。下图说明了隐变量和量子态的几种可能关系。

本体论观点：一种隐变量对应最多一种量子态，量子态对应隐变量的概率分布，不同量子态对应的分布互不重叠：

这就像在经典力学中，系统的状态可以用（广义）坐标和动量来描述——相当于，不同的可以对应同一个能量，但不同的绝不会对应同一个。

最极端的情况下，隐变量和量子态一一对应（概率分布为一点上的尖峰），隐变量就是量子态本身（不存在隐变量）。

认识论观点：一种隐变量可以对应多种量子态，不同量子态对应的分布可以重叠：

如图中隐变量可以和这两种在量子力学看来不等价的描述相融洽。

2012年由Matthew F. Pusey，Jonathan Barret和Terry Rudolph提出的PBR定理表明，量子力学与上面定义的认识论观点不相容，在上面定义的本体论观点的意义上（和能量的关系），量子态是具有实在性（reality）的。

隐变量理论中也可能存在不对应任何量子态的隐变量取值，从而直接给出和与量子力学不同的实验预言。在量子力学的实验检验的死角越来越少的今天，隐变量理论的研究则主要致力于给出与量子力学相同的实验预言。

早期隐变量理论有三个基本假设：

实在性（reality）：实际决定物理的所有隐变量在任意时刻都有确定的取值。
定域性（locality）：隐变量取值只取决于过去光锥内的事件。
语境无关性/非互文性（non-contextuality）：系统的隐变量取值独立于测量仪器的选择（与仪器本身的隐变量无关）。

作为隐变量理论的缘起，实在性是最核心的，而定域性则来自于相对论——现代物理理论的必备特征。语境无关性和实在性一起，反对量子力学中在测量之前（非本征态）上力学量没有取值、而“可能取值的列表”还受测量基矢的选择影响的这点。

我们将看到，对今天的隐变量理论而言，要想与实验结果相符，唯一保得住的只有最初的出发点，实在性。

EPR佯谬与贝尔不等式

EPR佯谬

1935年，爱因斯坦，Podolsky和Rosen（或译波多尔斯基，罗森）发表了一篇在今天被称为EPR佯谬或EPR论证的论文Can Quantum-Mechanical Description of Physical Reality be Considered Complete?——量子力学对物理实在性的描述是完备的吗？

论证用到的态我们已经很熟悉了：

为了紧凑起见略去了，将子系统都写到一个中。论证要用到的是其具有的自旋角动量为零（尽管我不会在此证明，但这一点需要中间是减号，是加号或其它的单位复数则总自旋不为零，再次强调相位的重要性。）这一重要性质。

大卫·玻姆（David J. Bohm）改造后的论证为，设一个静止（平均动量为零）的介子——一种零自旋粒子——衰变为电子和正电子——都是自旋粒子，那么电子和正电子就会处于这样的态。等到电子和正电子（因为具有相反的平均动量）运动到较远——远到在实验期间连光信号也来不及从一边传播到另一边时，测量电子的自旋分量，结果为，则角动量守恒告诉我们正电子自旋分量必然与电子的相反，为，而我们对电子的测量不会对正电子带来任何扰动（定域性），所以应该认为这个是正电子在测量之前就已经拥有了的物理实在的要素（element of reality）。

与一些流行版本的EPR论证中试图通过纠缠确定不相容力学量不同，爱因斯坦本人并不意在反对不确定性关系，他在与薛定谔的通信中表达了这一点，“（对于找到不相容力学量的共同本征态）It's a sausage to me（我不在乎）. ”（见Fine的The Shaky Game: Einstein, Realism and the Quantum Theory）

对爱因斯坦而言，重点在于量子力学无力确定子系统的状态（用我们的话，子系统没有态矢量，只有密度矩阵），而是只能提供一个对整体关联的描述。爱因斯坦认为，空间上分隔开来的系统，应该“你是你，我是我”，具有可分离性（separability），于是两个子系统应该各有自己的状态，而定域性则阻止了它们超距改变对方的状态。

玻尔在对爱因斯坦的回应中也一改一贯的以力学扰动（mechanical）为基础的风格——在他对不确定性、互补性的论证中都贯彻了这种风格，选择引入一种子系统之间的“影响”（influence）：对一个子系统的测量会影响另一个子系统的可能行为列表——与此同时坚持子系统之间没有相互作用。

后来，爱因斯坦也放宽了自己的量子力学的完备性的批判的条件——不再假设可分离性和定域性（毕竟，额外假设越多越容易出现漏洞），转而从薛定谔的猫类型的思想实验——处于爆炸与未爆炸的叠加态的火药桶入手展开批判——不过历史恰恰相反，薛定谔是受爱因斯坦的火药桶的启发，才在1935年9月19日给爱因斯坦的回信中提出了薛定谔的猫思想实验。我们今天所说的“纠缠（entanglement）”一词就是薛定谔在那段时间的通信中提出的。

终其一生，爱因斯坦所致力于实现的都是一个超越量子力学的新理论，而不是像一些人误解的那样试图退守经典力学的舒适区。

贝尔不等式（贝尔定理）

现在让我们继续前进。

1964年约翰·贝尔（John S. Bell）提出了一条关于定域隐变量理论中，对EPR态的测量结果的可能范围的定理，称为贝尔不等式（Bell's inequality）。

贝尔考虑了两个实验者和对EPR纠缠态中的两个粒子分别测量不同方向的自旋的情况，两者各自选择的测量方向可以由两个空间矢量和来表达。先考虑简单的情况，一个人选择沿测量，另一个人也选择沿测量，那么显然，如果一个测量到，另一个就会测量到，两者测量结果的乘积为。那么多次实验（准备很多纠缠粒子对）后的期望值

而如果一个人沿测量，另一个人沿测量（他把上一个实验的结果都颠倒过来），那么期望值为

当两个人选择的方向不是或时，一个人的测量结果就不再能确定另一个人的测量结果，最后的期望值就会在到之间：

对于定域隐变量理论，一处的测量结果，如的结果应该完全取决于选择的方向和系统本来的隐变量：

当两边测量方向相同时，结果相反意味着

于是，假设EPR态对应一个隐变量的概率分布（量子态不能完全确定隐变量），则测量结果乘积的期望值为

即，对每个隐变量取值下的乘积，我们用这个隐变量的概率密度来加权。

这样我们就可以推导贝尔不等式了，推导实际上非常简单！（你也可以先跳过推导，跳到下一小节“用多体纠缠一次性检验量子非定域性”，直接见识定域隐变量理论和量子力学的冲突。）首先用做替换，得到

然后考虑它和另一种组合的结果之差：

既然单次结果只有，那我们可以在任意位置插入而不改变结果，得到

同时取绝对值

而在正负之间，去掉它会让等号右边的绝对值变大，并且，那么

别忘了，是隐变量的概率密度，那么它的积分（在划定的范围内），而剩下的一部分积分就是！

于是我们得到了贝尔不等式，对任意三个方向，定域隐变量理论给出的期望值都满足不等式

与将隐变量与量子态联系起来的概率密度的具体形式无关。

量子力学的计算表明：

只要我们让和垂直，而与两者共平面在和之间处，那么

这就是说，如果量子力学是正确的，那就会出现违反贝尔不等式的情况！即贝尔不等式被违反意味着定域隐变量理论是不可能的。

自1982年Aspect（阿斯派克特）的实验以来，许多实验都验证了贝尔不等式确实被违反了，局域隐变量理论不可能。当然，隐变量理论的支持者（以及善于自我批判的量子力学的支持者）也没有闲着，他们发现早期的贝尔不等式实验并不完善，主要的漏洞有

定域性漏洞（locality loophole）：纠缠粒子的距离不够远/测量进行得不够快，使得粒子之间有可能通过小于等于光速的信号“串通”——根据自己受到的测量来改变另一个粒子的状态。（实际上这是针对1972年Freedman和Clauser的实验。Aspect实验解决了这一漏洞，因而被认为是第一个检验贝尔不等式的实验。）
探测效率漏洞（detection loophole）：早期的实验中，由于仪器的探测效率有限，在大量纠缠样本中只有较小的一部分被探测了，于是实验结果不具有代表性——隐变量理论可能只让那些表现出量子关联的样本被探测到。解决方法自然是提升探测效率，根据相关证明，只要探测效率达到一个下限即可堵死隐变量，对一些实验这个下限相当的低（不需要的效率）。
记忆漏洞（memory loophole）：两边的实验地点不变的情况下，隐变量可能会对之前的实验设置留下“记忆”，以此做出改变来影响未来的测量结果，使得贝尔不等式被违反。解决方法是每次实验都随机改变设置。
重合漏洞（coincidence loophole）：通过粒子被探测到的时间来判断两个粒子是否来自同一个纠缠粒子对，这可能造成误判。这个漏洞相对简单，解决方法是设置一个时间窗口，在每个时间窗口中只允许对来自同一个纠缠粒子对的粒子进行探测。
自由选择漏洞（freedom of choice loophole）：漏洞直接来自于对记忆漏洞的解决方法——用以随机改变实验设置的随机数生成来源可能受隐变量的影响。

2015年，Hensen，Giustina和Shalm三个实验组各自独立地完成了同时解决定域性漏洞、探测效率漏洞和记忆漏洞三大主要漏洞的贝尔不等式检验。

而对于最后的自由选择漏洞，“现实”地说，它已经被2018年Rauch等用几十亿年前发出的来自类星体（quasar）的光进行的实验所解决，还有通过网页游戏收集随机数的大贝尔实验（BIG Bell test）。尽管如此，定域隐变量理论还有一个最终的可能，超决定论（superdeterminism）。

超决定论认为，在被测量的系统和测量仪器之间预先存在着关联——原则上可能追溯到宇宙大爆炸——我们不可能独立于被测系统选择要测量什么，原则上这样可以既确保定域实在性，又能复现量子力学的实验预言。但是，原则上（！）这不可接受，超决定论付出了太大的哲学代价——如果我们不能进行独立实验，那整个自然科学的地基都会崩溃——这大胆的代价没有换来什么与之相称的新结果。

实际上，正是贝尔本人最先讨论了超决定论的可能性。一个能完美复现贝尔不等式被违反这一实验结果的超决定论理论过于“敏感”了，贝尔认为，即便决定实验的随机数生成器本质上是决定论性的，我们在实验中也可以有一种“等效的自由”——这些随机数的起因来自很多与贝尔实验无关的微小因素——其它隐变量，而那些决定贝尔实验结果的隐变量不大可能对这些无关的隐变量也具有完全的敏感性。决定论可以接受，但敏感至此的决定论则不可接受。

至于纠缠和相对论的关系，量子纠缠表现出了非定域性，但又不完全非定域——纠缠体现了一种“软”的统计关联，但不能传递“硬”的作用，微妙地能够和相对论共存。比如，有人可能担心同时性的相对性使得和谁先测量的顺序发生变化，带来麻烦，但是量子态本身并不能直接观测，也没有任何方式得知在自己测量之前是否测过，两者的测量没有因果关系从而顺序可以颠倒，和相对论不矛盾。

纠缠在更极端的相对论场景：相对加速的粒子之间、黑洞附近等中的表现还有很多有待研究之处。

用多体纠缠一次性检验量子非定域性

根本上，贝尔不等式是一个关于统计结果的约束，必须要进行大量且精密的实验才能加以检验。随着对多体纠缠的认识，人们发现了一种可以不依赖统计结果，鲜明地展现量子力学和局域隐变量理论的区别的方式，GHZ实验（Greenberger-Horne-Zeilinger experiment，Zeilinger（蔡林格）于2022年和Aspect（阿斯派克特），Clauser（克劳泽）一起获诺贝尔物理学奖）。

实验采用一种由三个自旋粒子组成的多体纠缠态，态：

态是一个有着真正的三体纠缠（genuine tripartite entanglement）的态，什么意思呢？把任意一个粒子迹掉，都会让相干性消失！关于剩下两个粒子的密度矩阵为

没有非对角元！只有把三个粒子作为一个整体来看才能发现相干性。

现在我们在态上测量自旋的和分量，尽管有不同方向本征态之间的转换公式，但那也未免太麻烦，我们用另一种方式来看待。可以证明，方向自旋算符（准确地说，这里用的是泡利矩阵）对方向本征态的作用为

于是，如果我们将作用到态上，对会得到

对会得到

整体不变，即态是的本征值为的本征态，由轮换对称性，也是和的本征值为的本征态。

如果我们假设粒子在测量之前就具有确定的自旋取值，那么我们就可以用一组取值的普通的数描述处于态的三个粒子（记为）：

根据刚才的计算有

将上式三项相乘得到

（）即，如果我们测量三个粒子的方向自旋，应该会得到，但是

量子力学给出的结果完全相反！可见，定域隐变量理论和量子力学水火不容。

Kochen-Specker定理

现在让我们考虑隐变量理论的另一条承诺：语境无关性。1967年，Simon B. Kochen（西蒙·寇辰）和Ernst Specker（恩斯特·史派克）提出了一条不可行定理（no-go theorem）——不是告诉我们能怎样，而是告诉我们不能怎样（贝尔定理就是一条no-go定理），否决了语境无关的隐变量理论的可能性。

这是什么意思呢？我们需要考虑一个力学量有三种可能的取值的三维的希尔伯特空间——可以认为是自旋为的粒子，每个方向的自旋分量有三种取值，而不是自旋粒子的两种，我们也就不能简单地用两个方向的箭头表示了（一般而言，对于自旋的有质量粒子，分量有种取值）。

假如我们接受语境无关的隐变量理论，那我们就可以在测量之前——语境设定下来之前给自旋的各个分量赋值。我们可以用三个相互正交的三维矢量来表示三种取值对应的状态，如对方向：

量子力学允许我们将系统强制投影到三种态矢量之一，对隐变量理论而言，粒子事先（独立于量子力学的投影）已经有了一种取值，测量只是揭示事先存在的取值而不是“创造取值”。如隐变量使粒子取到，那么当量子力学认为投影到时，隐变量理论会说“有取值”，而当量子力学认为投影到或时，隐变量理论会说“无取值”。我们将有取值标为红色，无取值标为绿色：

除此之外，没有取值的态：和的任意叠加也应该标为绿色。因为在经典力学中，【力学量相乘后的取值】等于【取值的相乘】（毕竟经典力学压根不区分力学量和其取值），而量子力学告诉我们相容力学量相乘得到的新力学量的本征态等于旧力学量本征态的叠加，所以为了符合已有实验，需要“”。

另一方面，对则没有要求。

上面只是最简单的一组三个矢量，量子力学中基矢选择的任意性，为了符合已有实验，隐变量理论对任意的其它组合——只要其中的三个矢量相互正交——都应该给出一种上色方案。如

注意在两组中都出现，上色需要相同。Kochen-Specker定理要说的就是，这种上色规则必然会导致矛盾，总能找到一个矢量既不能上红色也不能上绿色——不存在一种无矛盾的把力学量算符直接变成数的赋值方式。

寇辰和史派克1967年的原始证明需要用到多达个矢量，后来不少人构造了只需更少矢量的证明（但代价是需要增加维度）。我这里要讲述则是Richard D. Gill于2003年提出的一种直观的几何证明。

既然我们考虑的都是长度为的三维矢量，我们可以把它们变成单位球上的点，如对我们选择的第一组，在北极点，而和在赤道上，三个点任意两两之间都差（沿经线或纬线）：

证明只需要考虑北半球，现在取北纬，经度为的一点，称为，我们过这一点做一个大圆（过球心的圆），要求这个大圆和赤道的交点在的东西各，即两个交点的经度相差，则是这个大圆上的最北顶点：

如图所示，将大圆与赤道的其中一个交点称为，而垂直于这个大圆的、位于北纬，经度的点称为，则也构成一个相互正交的三元组。

因为最初的三元组中有两个绿点在赤道上，所以赤道上所有的点都应该是绿色，包括恰好和一个重合的，那么红点就只能在和中选择，先假设绿，红。

我们立刻又获得了一系列绿点！所有在这个大圆上的点都是和的线性叠加，所以都是绿点。我们在大圆上再找一个新的点，以为顶点再做一个大圆，则这个大圆上的点还是夹在和赤道上的点之间，也都是绿点。再在新的大圆上找一个……以此类推。

可以证明，通过这样不断切换大圆，我们可以到达南边的任意一个点，说明南边全是绿点。但我们其实也不需要这么一般的结果，只需要能到达即可。考虑球面上的大圆未免有些考验想象力，我们可以通过投影来让它们变成直线！方法是从球心出发，将北半球投影到和北极点相切的平面上：

如图所示，这样投影后纬线变成了一系列同心圆，而赤道则被投影到无穷远处，经线和大圆则被投影位为直线。实际上，球面上角坐标为的点（为经度，为纬度）被投影到平面上后为

你可以用程序作图验证大圆和平面上的直线确实是一一对应的。

现在事情就很简单了，我们只需要先从第一个大圆出发走一段，再继续做几条线段连到就可以了！

如图所示记为一种可能的路径，其中标出了各条纬线的纬度，而经度的变化为，第一步约，第二到第五步约。

别忘了我们作这些线段的作用！沿着这些线段（对应球面上大圆的一部分）能到达，意味着也应该是绿色，矛盾！这意味着我们一开始假设绿是不行的，应该假设红，而绿。

同样的论证适用于北纬的所有的点，而且我们并没有用到北极点本身的性质，无论一开始把哪个红点当做北极点，上面的论证都表明相应的北纬是红色。所以我们证明了和一个红点相差的所有点也都是红点。

于是，从一开始的三元组的红点出发沿着经线走三步，再沿着赤道走三步，就能先后到达和，三个点都应该是红色——隐变量对这三种测量都应该有取值，矛盾！

我们证明了Kochen-Specker（寇辰-史派克）定理！不存在能无视测量语境预先进行赋值的隐变量理论，如果谁构造这样一个理论，就会得到和量子力学截然不同的实验预言——而实验支持量子力学。

2022年，北京量子信息科学研究院等首次实现了无漏洞的对量子力学的语境性/互文性的实验检验：Pengfei Wang, et al. Significant loophole-free test of Kochen-Specker contextuality using two species of atomic ions. Science Advances, 8, 6, (2022).

Kochen-Specker定理适用于维度大于等于三的情况，对于大于三维的希尔伯特空间，我们则可以在其三维子空间中构造矛盾，进而也不存在自洽的赋值方式——如果一个隐变量理论只能处理二维的自旋，那也没什么用。

结语

至此，我们了解了量子力学的最小硬核：标准量子力学，并在其基础上循着冯诺依曼的思路尝试解释测量过程，认识了哥本哈根诠释、冯诺依曼-魏格纳诠释以及多世界诠释，还有作为偏好基问题的解决方案的环境诱发的退相干。我们还通过贝尔定理和Kochen-Specker定理两条no-go定理触及了量子力学的边界——警示我们如果要越过那条边界，那么不应该做什么。

当然，就像我在上半部分末尾所说的，本文的目的在于营造一个进一步学习和讨论的基础。受篇幅（以及我个人的能力）限制，我们并没有穷尽在学界有一席之地的诠释，而是仅介绍了三个略显古老的诠释，对与它们同样古老的一个非定域、语境依赖的隐变量理论：德布罗意-玻姆理论也没有介绍。

下图给出了主要的量子力学诠释及其特征：

主要的量子力学诠释。内容来自wiki：Interpretations of quantum mechanics。

将来我可能会进一步介绍它们，以弥补本文的缺失。

可以想象，看到这里的读者必然有着不俗的求知欲和耐心，这在如今网络上垃圾信息横行的环境下是非常难得的，希望我的讲述没有让人失望。个人的力量总是有限的——尤其对于刚刚起步的我来说，尝试给别人讲述你学到的东西吧！今后再有人对你说那句“没有人理解量子力学”时，你大可以自信地说“我还是理解那么一点的”。

我们应当始终铭记，科学理论意味着有根据的猜测（educated guess），它需要长期的积累和训练，在这个过程中我们将能够在对概念的习惯（而不是凭空妄想）中拓宽想象力的边界，理解这个量子性的自然。

继续阅读

阅读原文

关键词

薛定谔

粒子

本征

爱因斯坦

量子态

一文读懂量子力学诠释问题（下）