前言

量子力学及其诠释历来是很能引起人们争论的话题，有些时候甚至只有后者——在不了解量子力学的情况下就对它的诠释大抒己见，另一些人则对这样的争论不厌其烦，做起了“闭嘴计算”派。

幸运的是，世面上已经有不少对于量子力学诠释的介绍，在2022年的诺贝尔物理学奖颁给对量子纠缠的研究后更是掀起了一阵热潮（就像所有三分钟热度一样，也逐渐消退）。但不幸的是，这些介绍要么因为预备概念太少而无法实打实地讨论问题，在读者的印象中留下的几乎只有比喻，要么因为预备概念太多又缺乏平缓的引导，在读者的印象中只留下了“不明觉厉”的名词的意义不明的组合。

在这篇文章中我将努力弥补理解的鸿沟——这也需要读者，你，的耐心——这是一篇很长的文章，而且涉及到不少你可能没听说过的概念，一次读不懂是很正常的！读上两三遍，动脑思考，还可以向我提问，我不能保证让你“一次读懂/XX分钟看懂”，但我保证你投入的时间是值得的。

不求甚解和闭嘴计算这两种态度都是不可取的，前者自不必说，对于后者，为什么在经典力学的学习中强调物理图像——实际上就是一种诠释，而到量子力学的学习中却要人闭嘴呢？根据我的经验，闭嘴是不可能做好计算的，不知道各种概念为什么要引入、不清楚自己到底在做什么的状态除了积累无力感之外别无益处。诚然，计算对于理解是不可或缺的，许多人都是在积累了丰富的计算经验后才开始对量子力学产生理解。但影响是双向的，把握诠释有助于少走弯路，更高效地积累经验——学生不会因为讲一点诠释就被搞废！概念混乱、思路不清的讲述才会。

为什么要对量子力学进行诠释？

要讨论量子力学诠释，我们当然要先理解为什么要诠释，搞清楚量子力学说了什么，又没说什么。

概括起来，量子力学是建立在四大基本假设的基础上的。我们说满足这些基本假设的系统就叫量子系统，具有量子性（quantumness）。

量子力学基本假设一：态叠加原理

第一条基本假设告诉我们，可以用态矢量（state vector）来描述量子系统的状态（简称量子态），态矢量的集合称为希尔伯特空间（Hilbert space）。

态叠加原理

量子态可以叠加（superposition），叠加会得到新的量子态。

量子态的这种叠加是线性的，因而我们可以用一种矢量——态矢量来描述量子态，符号为

两个态矢量叠加，得到一个新的态矢量：

一个著名的例子是薛定谔的猫态（Schrödinger's cat state）:

其中和这两个叠加权重是复数，即

你可能听说过，这种复数系数的模长（绝对值）的平方表示概率，如表示猫活的概率。对此我们暂且按下不表，我需要提醒你注意的是模长并不是一切，还要注重相位（phase）。

相位的重要性根植于我们为什么要引入一种可以叠加的状态。

1905年，爱因斯坦通过引入后来被称为光子（photon）的概念成功解释了光电效应的现象，在爱因斯坦的设想中，光存在着与能量与频率有关的量份：

人们将这一观点概括为光具有粒子性。

有两点值得注意，一是这并没有对光子的“形状”提出任何要求，光子并不是点粒子。这里粒子性仅仅是指单一频率的光的能量是一份一份的，就像搭积木一样。

二是这并不意味着光的能量就是离散的。就像积木有不同的种类，光子也有不同的频率，频率是可以连续变化的。任何一束有限的光总是在频率空间上以某个频率为中心有一个宽度

从而光的能量实际上是这个区间上的平均值，包含多种光子。完美的单一频率的光按照傅里叶变换将会充满整个空间！

顺带一提，爱因斯坦和约当（Jordan）等人通过研究电磁场的统计力学解释黑体辐射等问题的努力实际上开启了量子场论，与很多人的印象不同，量子场论并不是等到量子力学成熟后才出现，而是和量子力学差不多同时诞生——只是量子场论更加晚熟。

光子的概念后来启发德布罗意在1924年提出实物粒子的波动性的概念，即以电子为代表的粒子满足德布罗意关系：

其中，称为约化普朗克常量，之所以用它是因为人们后来发现几乎总是和出现。相应地是圆频率（把正弦波用复数表示后，在复平面上的角速度），和频率的关系为。为波矢（圆），和波长的关系为。

人们将光子的概念和德布罗意关系一起总结为波粒二象性（wave-particle duality），在经典力学中波和粒子（质点）都有能量-动量（有些文章说能量-动量就代表粒子，是错误的），而频率和波长却是波独有的——德布罗意关系将其推广到了粒子上。我们后面会讨论波粒二象性这一概念在今天应如何理解。

1926年，薛定谔提出了德布罗意波的非相对论性波动方程，薛定谔方程：

从对薛定谔方程的分析中发现了一种全新的波动形式，它的振动大小不随时间或空间变化，但又不能认为它是常数——还是必须考虑其相位，可以称为相位波，可以表示为复平面上的转动。

在经典力学中，人们可以把正（余）弦波表示为复数，但只是为了计算起来更加方便：

最后还是要转换回正（余）弦波，毕竟，经典波动的振动大小是处处不同的——这样才像波！但到了量子的领域中，人们却不得不面对纯粹的复波动，如一个做一维运动，具有确定的动量的粒子，波函数为：

它的绝对值处处、永远是！如图所示，颜色代表相位：

薛定谔方程作为线性的波动方程，自然允许（粒子自己的）波函数线性叠加，叠加得到的仍然是满足薛定谔方程的新的波函数。从数学上看，只要能线性叠加的就可能看成一种矢量——函数就是分量连续的矢量。

我们可以将矢量的各个分量排成一排，以此来可视化维度任意大的矢量，如图为一个十维的矢量，有十个实数分量。容易想象当点越来越密直至连续化时，就变成了函数。

另一方面，人们在自旋这样更加抽象的量子现象中也意识到了叠加性的存在，对此可以参考我对斯特恩-盖拉赫实验（Stern-Gerlach experiment）的介绍入门量子力学1.1：从斯特恩-盖拉赫实验说起，入门量子力学1.2：级联SG实验与量子叠加态。所以我们才引入了态叠加原理。

有鉴于此，对于复数的叠加系数，比起这种实部-虚部形式，我们最好写成模长-辐角——或者现在该说模长-相位形式：

其中用到欧拉公式，对于一个复数而言，乘以就意味着在复平面上逆时针旋转，几何意义如图所示：

杨振宁在2002年的国际理论物理大会上曾指出，二十世纪理论物理有三大主旋律：量子化、对称性和相位（Thematic Melodies of Twenties Century Theoretical Physics: Quantization, Symmetry and Phase Factor）。这第一条基本假设就将量子化和相位联系了起来。

量子力学基本假设二：力学量算符

单纯地用矢量表示系统的状态并不新奇，在经典力学中我们可以用一对基本力学量——位置和动量的矢量完整地描述一个质点的运动：

我们只需要建立坐标系，如用为坐标基矢的直角坐标系，读出位置和动量矢量的分量即可得知质点的状态。

但是量子力学的态矢量的分量是复数，而且往往也不是三维的，希望把分量直接解释为力学量是肯定会落空的。那我们该怎么从量子态中提取出力学量的信息呢？

量子态可以线性叠加——可以看成矢量这一点启发人们求助于线性代数，具体地说是本征值问题。

原来，我们可以把矢量排成一列或者一行，表示为列向量或行向量，如：

进而可以把对矢量的线性变换表示为矩阵，如三维直角坐标系中绕轴旋转对应的矩阵：

它的作用是这样的：

可见，如果矢量只有分量，就不会被这个旋转所改变，或者说，被旋转作用后的效果是乘以。

我们称只有分量的矢量为的本征值为的本征矢量。一般而言，如果一个线性变换作用到矢量上只是让它放缩了常数倍，我们就说这个矢量是这个变换的本征值为的本征矢量：

到了量子力学中，我们更喜欢将线性变换称为算符（线性），而将本征矢量称为本征态:

（用大写字母表示算符，小写字母表示值）我们可以将这种本征值-本征矢量关系解释为从矢量中提取信息，于是可以寄希望于存在一些算符，能从态矢量中提取力学量的信息，这就是第二条基本假设：

力学量算符

量子系统的力学量由厄米算符表示，力学量的取值为算符作用于本征态得到的本征值。

厄米算符是什么？为什么要用这样的算符？答案是有两点好处：

厄米算符的本征值是实数。
厄米算符的不同本征值对应的本征态相互正交。

首先是第一点，在我们把量子理论搞得满是复数的情况下，一个能保证总提取出实数的算符可以说是救星了。

为什么？实际上我们计量力学量可以概括为比大小，或者说求比值。如人们历史上曾用人体的部位作为长度的单位，如说一个东西有几头高，这个几头就是让待计量的东西和作为单位的头做比，看能装下几个头。而比较大小是实数才有的性质！

第二点同样重要，矢量相互正交（在欧氏空间中即垂直）意味着可以完全区分，既然量子态用态矢量来描述，两个取值不同——具有不同的物理属性的系统当然应该能完全区分，应该是正交的！

薛定谔方程中的就是一种厄米算符，它表示的是粒子的动能。薛定谔用他的方程正确地求出了氢原子的光谱，从那以后的无数实验表明我们对用算符表示力学量寄予的希望没有落空，第二条基本假设是成立的。

但另一方面，这条力学量算符假设也可以说是量子力学诠释问题的万恶之源：一个算符的本征态只是所有可能的态的一部分，那既然力学量算符只能在本征态上得到取值，那当系统处于非本征态，或者说叠加态时会怎么样呢？

实际上，任何一个态总可以用力学量的本征态叠加出来：

其中为力学量的取值为的本征态。叠加系数唯一、完全地决定了这个态，改变系数就会变成别的态。

还可以用别的力学量，如的本征态去叠加出：

这里我们还应当指出一个重要的点，叠加态是相对而言的。线性变换，算符通常是不可交换的，我们称为不对易，反映到矩阵上就是矩阵乘法没有交换律：

不对易意味着一般没有一组共同本征态。反证法，如果的任意本征态也是的本征态，本征值为，那么（算符和普通的数可以交换）

而这和矛盾！

这说明，不对易的力学量互不相容，它们不能同时确定，如位置和动量满足著名的海森堡不确定性关系：

不确定性其实就是标准差！如对上面提到的波函数：

是在位置空间中完全弥散开来，但用傅里叶变换转换到动量空间中则是一个无限窄的尖峰！粒子处于这样的量子态时，动量完全确定——是动量本征态，而位置完全不确定——是位置叠加态。

互不相容的力学量和的取值分布、期望值和标准差，不确定性关系告诉我们，标准差的乘积有一个下限，图中的曲面不能无限缩小。

叠加态是相对而言的，问一个量子态是不是叠加态必须先说明关心哪个力学量，问一个量子态到底是不是叠加态是没有意义的。

这里有些海森堡的矩阵力学的味道，实际上，人们早已证明（最早是薛定谔证明）了波动力学和矩阵力学是等价的，可以纳入同一个框架，不需要再做区分（量子力学的早期有人认为矩阵力学对应粒子，波动力学对应波，这是不正确的）。

量子力学基本假设三：薛定谔方程

有了态矢量和力学量算符，我们可以描述系统在某个时刻的情况了，现在我们想知道系统将来会如何，怎么办呢？诺特定理告诉我们时间平移不变性对应的守恒量是能量（出于某种原因，物理学家更喜欢说哈密顿量）。反过来，我们也可以用能量来得到系统随时间的演化。

薛定谔方程

态矢量的时间演化由哈密顿量（能量）算符生成，遵循如下微分方程：

上文给出的我们熟悉的那个版本的薛定谔方程就是把取为了非相对论的动能加势能（换成相应算符）的形式：

如果我们不局限于这种形式，那么薛定谔方程就是普适的，无论是相对论性粒子的狄拉克方程——取为狄拉克哈密顿量：

还是进一步到量子场论中，系统的时间演化都可以归结为上面给出的态矢量的薛定谔方程。

从对薛定谔方程的分析中人们发现了一个大问题，薛定谔方程会让叠加态永远是叠加态（相对于某个力学量）！

这实际上是态叠加原理的延续，两个态先输入薛定谔方程再叠加，和先叠加再输入薛定谔方程，输出都是一样的，就像两列水波互不干扰地穿过彼此一样。

薛定谔方程并不能弥补力学量用算符表示捅出的窟窿。

量子力学基本假设四：测量投影

任选一个力学量，有很大一部分态是叠加态，在其上根本没有取值可言，但是实验上测量力学量却总要输出一个结果，怎么解决这个矛盾呢？

测量投影

测量力学量时，系统的态矢量会随机地投影到其中一个本征态上，测得相应的本征值。
玻恩定则（Born's rule）：投影到本征态上的概率为用叠加出来时，前的系数的模长的平方。

你可能听说过，位置波函数的模方就是位置的概率密度：

其实，波函数就是用位置本征态去叠加出态时的叠加系数：

只是连续化了，求和变成积分，概率变成概率密度。

投影可以认为是瞬时发生的（在实验的时间分辨能力还很弱的时候这一认定是合理的），它将一般的叠加态强行送入本征值-本征态关系，赋予了可观测的值及其概率，这允许人们计算力学量在态上的期望值：

人们由此得出的预言经受住了无数实验的考验，让量子力学成为了史上最精确的理论体系之一。

一个常见的问题是，测量之后会怎么样？答案是第三条基本假设，薛定谔方程，量子态只会经历两种过程：1.按照薛定谔方程演化；2.投影。由于薛定谔方程是个微分方程，态的演化应该是连续的，如果演化时间较短，末态看起来和初态还是“很像”的。如测量力学量，得到，则系统的量子态投影到：

测量后时隔较短时间（什么叫较短？那就要看你的系统的演化有多快——粗略地说，能量有多大了）再次测量同一个力学量，那么系统“还几乎就是”：

大概率还会测到，以短时间间隔持续测量会让系统的量子态几乎冻结，这称为量子芝诺效应（quantum Zeno effect）。

这还提醒我们，不能把不确定性理解为测量的误差，不确定性不是测不准！如果系统处于的本征态上，那么测量对系统没有任何干扰！

但说到底什么是测量？这条假设并不是解决了问题，而是逃避了问题。它没有谈及测量的物理过程，而是当做一个黑箱，我们可以用玻恩定则预言与输入相应的（概率性的）输出。

上面都是从理论的角度来讨论，从实验的角度看，我们知道以光电倍增管（photomultiplier，PMT，其根植于光电效应）为代表的各种仪器——从粒子物理早期的威尔逊云室到今天高能加速器中的粒子径迹探测器——表现得就像玻恩定则给出的黑箱一样，于是我们可以在不完全清楚测量过程的情况下进行实验。是实验现象倒逼我们提出了测量投影假设以对接理论上的力学量算符和观测值，在实验室里可没有算符！

在量子力学的现代发展做出了重要工作的Asher Peres（曾提出判断任意量子态是否是纠缠态的Peres-Horodecki判据）在其所著教材《量子理论：概念与方法》（Quantum Theory: Concepts and Methods）中的一句话值得我们谨记：

量子现象不是发生在希尔伯特空间中，而是发生在实验室里。
Quantum phenomena do not occur in a Hilbert space. They occur in a laboratory.

我们倒也并非对“玻恩黑箱”一无所知，实际上我们对各自探测器依赖的雪崩二极管（avalanche photodiode，APD）等有着半经典（经典力学-量子力学缝合）的理解，知道它们可以把具有量子性的信号放大为经典信号（注意量子性不等于微观，如引力波探测中使用的反射镜虽然是宏观的，但其运动也表现出量子效应），问题只是在于我们不清楚如何从量子力学的第一性原理出发理解这其中的量子-经典转变（quantum to classical transition）。

不要误会，半经典的理解是不可或缺，即便你是一个强硬的还原论者，也必须承认既然人类生来就“沐浴在经典的阳光中”，那也就不得不先用顶层的模型作为工具来一点点挖掘底层。

现在我们抵达了量子力学诠释问题的入手点。我们将紧紧围绕上述四条基本假设构建的体系称为标准量子力学，它是为了使用量子力学研究各种问题所必需的的最小硬核——一个毛坯房，对量子力学进行诠释就意味着给这个毛坯房进行装修。

具体例子：氢原子

化学上讨论的原子壳层等对应着氢原子不同的能量本征值（在仅考虑库伦作用时），电子轨道等则是考虑了角动量的进一步细分，波函数为：

当有两个电子处于轨道，即电子构型为时，有

即，空间部分波函数直接相乘，而自旋部分处于一个纠缠态（不是直接相乘），称为单重态（singlet），是一种总自旋为零的状态——所谓“电子自旋反平行”的实际含义。这样一个状态整体是反对称的，即交换序号会多出一个负号，这是两个电子的全同性的要求。

注意只有粒子自己的波函数的不同分波才有相加，或者说干涉，两个不同粒子的波函数没法相加，数学上即不同矢量空间的矢量之间的加法没有定义。从我们的视角看，在一些对双缝干涉实验的讲解中强调粒子是“自己和自己干涉”反倒是一种画蛇添足。两个粒子整体看成一个复合系统后整体波函数的分波也可以有干涉，如

为一个电子处于基态而一个电子被激发到的状态，全同性使得我们不能谈论“哪一个电子被激发了”，带来了空间部分波函数的反对称化——一种干涉，而且是发生在六维空间中的干涉，这是经典波动中前所未有的。

氢原子基态中电子既没有确定的位置，也没有确定的动量，但却有完全确定的能量。尤其值得注意的是，基态的轨道角动量为零，无论如何不可能看成是在做行星轨道式运动，在经典力学中，零角动量轨道意味着会一头撞向中心：

这一简单表达式忽略了电子之间的相互作用，只考虑原子核分别对电子的相互作用，否则空间部分也会变得很复杂。但是在很多时候这样就足够进行有用的分析了。更精细的分析还需要考虑原子核本身的运动、原子核的尺寸等，而不是简单地把它当做一个固定的参考点，这些因素对原子光谱精细修正都随着技术进步得到了实验观测——原子能级还被反过来当做测量质子直径的一种方法。

电子在不同轨道间的跃迁是怎么回事呢？实际上，对于一个封闭的原子——对任何封闭系统，能量本征态可以认为不随时间变化，如果电子处于一个轨道上，那它永远都处于那个轨道上。

为了产生跃迁，必须有外界的干扰。可以考虑电磁场对原子的小扰动，运用微扰论计算会知道，在出现扰动后，电子会处于不同轨道的叠加态，使得其有概率出现在不同于初始轨道的轨道上。

跃迁作为一种电子-电磁场耦合的物理过程，需要经历时间，实际上，人们的确实验观测到了跃迁过程，甚至能进行一定限度的调控：Minev, Z., Mundhada, S., Shankar, S. et al. To catch and reverse a quantum jump mid-flight. Nature 570, 200–204 (2019)。

只不过这作为一种开放系统的过程，已经超出了只能处理封闭系统的标准量子力学的范围——但我们总可以找到一个更大的封闭系统，使得原来考虑的开放系统是其一部分，再应用对封闭系统已经成熟的方法进行研究，实际上人们也确实是这样做的。

波粒二象性，粒子与场

标准量子力学

现在让我履行承诺，说明标准量子力学对波粒二象性的看法。

首先让我们讨论像电子这样的有质量粒子。它们可以被赋予位置波函数，波动方程为薛定谔方程，模方则代表在处测到粒子的概率。

在量子力学的早期，一些人（如薛定谔本人）曾认为模方是一种物质波（matter wave），它代表电子像某种流体一样分布在空间中，随时间推进而流动，可以说这是一种纯波动观点。但这一观点存在一些严重的问题。

第一，电子在实验上表现得具有局域性，如对一个自由电子，其波函数应该由很多具有确定动量的平面波（上面给出的那种波函数，改变其中的）叠加而成的波包：

其中为初始时刻粒子的动量波函数，根据玻恩定则，它的模方表示粒子初始时刻的动量概率密度。

这种波包的问题在于，其中各个平面波成分的相对相位需要精准地调节才能叠加出一个空间上局域的波包，但各个成分的能量-动量不一样，进而在时间-空间上的演化趋势不一样，初始时精挑细选的相对相位很快就会乱掉，表现为波包扩散：

但在实验上人们总是会测到一整个的电子而不是“电子流体”的一部分，这意味着这种波包在被测量时必须迅速收缩。

薛定谔为了克服波包扩散做出了诸多努力，最终（其实也在1926年）他在谐振子型势能中发现了一种永不扩散的波包，称为相干态（coherent state）：

相干态波函数如图所示：

另外，当考虑多体时，波函数的空间变量就会超过三个，如对双粒子系统：

是一个六维空间中的波动，对个粒子则为维，我们不再能将其直接想象为空间中的流体。

第二，电子的电荷分散在空间中会伴随着一种不可忽略的相互作用——各部分同性相斥，这种相互作用会显著地影响我们观测到的电子的状态，如影响氢原子光谱，但这种影响从未被观测到过。

第三，在散射实验中这种物质波电子可以被打散，分裂为多个电子，这同样没被观测到过。

实际上，玻恩正是通过对散射实验的研究中得出了它的概率规则，将波函数的模方理解为一种概率波，而不是实体性的物质波。波函数模方对立体角的积分就代表在一个立体角范围内探测到出射粒子的概率——在量子力学的早期发展中，人们并不直接测量粒子的位置，而是测量角分布！

当然，斯特恩-盖拉赫实验等实验揭示的量子干涉效应（简称相干性，coherence）告诉我们复数的叠加系数是有物理意义的，不能直接使用波函数的模方、简单地把量子力学当做某种概率力学，至少也是概率-相位力学。如只保留就会丢失系统动量的信息，可以说，相位编码着不能同时确定的力学量。

人们在介绍量子干涉/相干性的时候通常都会以电子的双缝干涉实验为例，但实际上这种实验直到20世纪60年代才真正出现，在此之前人们都说通过仍粒子射入晶格等手段来展开实验——只在理论分析的时候用较为简单的双缝模型。

而标准量子力学对波动性、粒子性的看法是：

波动性

粒子的状态由波函数描述——力学量完全地编码在波函数中。

波函数不是在实际空间中的波动，而是在构型空间（configuration space，所谓构型就是系统的“模样”）中的波动，只有最简单的单粒子的波函数（只有三个空间变量）的情况，才能将构型空间和实际的空间等同起来，对于个粒子，构型空间为维。

而位置波函数只是波函数的一种——科普中往往只提及这一种，我们已经说过，位置波函数无非就是态和位置本征态相应的叠加系数，换别的力学量的本征态去叠加，则还有动量波函数、能量波函数、角动量波函数等（模方对应动量、能量、角动量等的概率），这些波动就更加抽象了。

而粒子性则是与测量相对接的：

粒子性

粒子性意味着粒子的基本属性，如质量、电荷等总是一整个地被测量到。

实际上，今天人们说波动强或粒子性强常常是指波长的大小，或波函数是局域的波包还是非局域的多波包叠加等，可以说，这都是在波函数框架下的讨论。

量子场，波-粒子数二象性

尽管波粒二象性的提出就是受光子概念的启发，但从现代的眼光看，光子这种无质量的极端相对论性的粒子与我们从电子这样的有质量粒子那里获得的印象有着巨大的不同。

对于光子的严格描述必须使用量子场论——量子场论继承了我们提到的四条基本假设，因而并不改变我们要面对的问题。

你可能听说过，量子场论认为粒子都是量子场的激发，电子、夸克……通通不例外，不同的粒子对应不同的量子场，激发出粒子就是量子场在“能级阶梯”上爬高，这解释了为什么粒子具有全同性——因为它们就是量子场的一份份激发！

对于电子，在低能时我们可以把它当做基本的对象来处理，对它应用量子力学——具体说来，当考虑的尺度远大于电子的康普顿波长时（如果说德布罗意波长衡量了“在什么样的尺度上能暴露出量子力学”，那康普顿波长就衡量了“在什么样的尺度上能暴露出量子场论”）——历史上称之为“一次量子化”，而量子场论的处理称为“二次量子化”。

但对于光子，不存在“一次量子化”描述！我们要么采用量子场论处理量子性的电磁场，要么使用麦克斯韦方程组处理经典性的电磁场，没有中间选项！

让我们说得具体一些，量子化电磁场意味着不再使用经典的场量

而是使用场算符——用量子态来描述电磁场的状态，用场算符提取场值。

人们发现，就像量子力学中粒子的位置和动量不能同时确定一样，量子场的场值（广义位置）和场值的变化率（广义动量）也不能同时确定。

这意味着，当你完全确定某一时刻的量子场在空间上的取值，你就完全不能确定它接下来会变成什么样了！我们可以求场的量子态与某种场本征态（位置本征态的推广）相应的叠加系数，这就是量子场的波函数：

这是

的推广。就代表测到场的取值为的概率密度，鉴于的自变量不是一个数而是一个函数，应该称其为场的波泛函（wave functional），场的波泛函是粒子的波函数的推广——当然也就可以有广义动量/场变化率的波泛函等。

还应当注意，尽管都是线性叠加，但这里是场的量子态的叠加，而不像经典场论中那样是场的取值的矢量叠加。

（【注】这只是一个示意，实际上人们并不直接使用电场强度和磁感应强度进行量子化，而是使用矢势和标势——考虑到相对论，最好说四维矢势。）

尽管波泛函在概念上接近波函数——还遵循推广了的薛定谔方程，但这种波动更加抽象而无法想象——最大的问题是难以计算，而且不是能量-动量本征态，不利于在量子场论的主要应用场景——粒子物理中使用，因而其在历史上发展较为缓慢，直到很晚近的时期才重新得到关注。

人们更喜欢用另一种角度看待量子场论，也正是这个角度和粒子密切相关，即考虑场的能量——粒子数本征态。可以将场的量子态用粒子数本征态叠加出来：

其中最低的零粒子态称为真空态。由于场算符和粒子数算符不对易，真空态是很多场本征态的叠加！系统处于真空态时仍有纷繁不确定的场，真空不空。

一维格点上的玻色场的真空态的可视化：随机采样。纵轴为场的取值，横轴为空间坐标，每条折线表示一种场的构型，亮度表示概率。可见，对真空态，场的取值接近零的概率更高（更亮）。

对于电磁场而言，还要考虑波矢和偏振，每种波矢和偏振都对应一套能级——一套光子数！

光子和电磁场是什么关系？如果这里的电磁场是指量子电磁场（场算符），那光子就是电磁场的激发态；如果这里的电磁场像通常所指的那样指场值，那么答案是光子对应不确定的电磁场。

我们之前提到的薛定谔的相干态虽然并不能解决物质波面临的责难，但却是个意外之喜，经典的电磁场就可以视为是光子的相干态——将谐振子能级改为光子数。所以你问“电磁场中有多少光子？”，答案是不确定！电磁场处于多种光子数本征态的叠加中，有概率测到各种数量的光子。

由于电磁场是一种规范场（gauge field）——一种对应多种可能的（规范选择）以及其它的理由，讨论量子力学意义上的光子的波函数意义不大（依赖于人为的规范选择、光子化学势为零——光子数太容易变化等），所以我们无法像电子那样直接讨论波粒二象性。

但研究表明，量子场的相位也有一个对应的算符，它和粒子数算符不对易，可以说这是一种波-粒（子数）二象性：

综上所述，波粒二象性是一个内涵不够明确的概念，在今天至多是量子力学框架的衍生物，而不应将其作为某种基本要素。

量子力学诠释问题

现在我们终于可以开始讨论量子力学的诠释问题了，什么叫诠释？诠释就是把方程对应为物理过程，在经典力学中由于方程本身直接涉及力学量，人们并不觉得有什么需要诠释的（其实也有，如对问题中为了方便而选取的广义位置和广义动量到底对应什么的诠释），但在量子力学中，力学量变成了算符，系统可以处于前所未见的叠加态，那就不得不进行诠释了。

从我们引入的标准量子力学的体系来看，玻恩定则就是一种最小的诠释，可以称之为系综诠释（ensemble interpretation）：制备很多同样初态的系统——组成一个系综（ensemble）——对它们进行大量实验（毕竟，因为测量投影你没法对同一个系统重复实验！），量子力学给出的可观测量实际上是系综平均值。于是保守地说，我们可以只满足于把量子力学看做一个关于系综的理论，而不是关于单个系统的理论。

但当你追问测量力学量时，系统是怎么从一个一般而言的叠加态转变为一个本征态的，测量投影这个抽象的假设背后到底是什么样的物理过程？那你就超出了最小诠释，进入了量子测量问题。

也可能，投影从未发生？不同的“可能性”都平等地存在着？

还可以进一步质疑：力学量是否必须要用算符表示？态矢量是否是对系统的完备描述？是否存在着底层的，具有确定的取值的量——隐变量（hidden variable）？

甚至我们可以超越量子力学的框架，引入外援来解决问题，如彭罗斯（Penrose）的引力坍缩理论。

实际上，在上面的讨论中有一块丢失的拼图，那就是我们考虑的任何量子系统总是沉浸在环境中，必须被考虑为一个开放系统。

诸多发问的入手点带来了多种多样的量子力学诠释，我无意也没有能力将所有主要诠释都一一加以说明，而是要铺设一个讨论环境，使我们能言之有物地而不是不求甚解或故弄玄虚地讨论问题，沉迷于“恐怖的实验”等噱头。

在下半部分中，我们将从冯诺依曼的测量模型出发，引入退相干（decoherence）这一重要概念，清除围绕着量子力学诠释问题的迷雾，向你展示问题的关键所在。

继续阅读

阅读原文

关键词

方程

薛定谔

波函数

就是

本征

一文读懂量子力学诠释问题（上）

前言