什么是相对论丨曹则贤

关注风云之声

提升思维层次

导读

如果你在物理学里看到了革命，那是因为你知道的少！

撰文 | 曹则贤（中国科学院物理研究所）

本文为中国科学院物理研究所“新年悟理”2021跨年科学演讲的演讲文稿，文章由作者提供。现场照片来源于中科院物理所。

尊敬的各位来宾，远方屏幕前的各位朋友，女士们、先生们，晚上好。这里是中国科学院物理研究所，我是物理所职工曹则贤。感谢您拨冗光临本年度的跨年演讲。

2020年对整个世界来说是一个极为艰难的年头。万幸的是，我们的国家依然欣欣向荣，我们还能在一片祥和的气氛中迎接新年的到来。这一份不幸中的万幸，除了因为我们有坚强的领导和伟大而又自律的人民，还因为我们的社会崇尚科学、热爱科学、相信科学，并且以极大的热情拥抱科技的进步。

人类经历了三次工业革命，每一次工业革命都是因为物理学的革命性进展并带来物理学的革命性进展。中国错过了三次工业革命，但今天的中国已经初步完成了工业化，并且率先呼应工业4.0时代的到来。今天的中国，为世界提供大量的产品，也开始为世界提供新的技术。2020年，北斗系统全面建成并为全球免费提供导航服务；奋斗者号潜水器在马里亚纳海沟坐底，下潜深度为10909米；嫦娥五号月壤采样顺利返回，这些都是让我们无比自豪的技术进步。但是，中华民族是一个勤劳勇敢的民族，她也一直是一个智慧的民族。中国不仅要为世界提供产品和技术，她也要有能力为技术提供科学、为科学提供思想、为思想提供善于创造的头脑。

我们有受教育的权利，我们还有受最深刻教育的愿望，有掌握最高深知识的愿望。作为物理学的高峰，其中有两个是值得我们特别关注的，那就是被称为近代物理两大支柱的量子力学和相对论。今天，就让我们一起以轻松、愉快的心情领略相对论的厚重与美。

相对论三个字似乎人人知道。提起相对论，人们会想起光速不变，孪生子佯谬，“回到未来”之类的电影，还有“一切都是相对论的”哲学梦呓。1923年， 21岁的英国青年狄拉克就对这种浅薄的哲学梦呓不屑一顾。电气工程系毕业的狄拉克开始自学和研究相对论，当然是和量子力学一锅烩的，到了1928年即构造了相对论量子力学方程，。这个方程被称为狄拉克方程，后来写在了狄拉克的墓碑上，成为物理学历史上浓重的一笔。狄拉克方程可以用存在反粒子予以诠释 (不是显然地预言反粒子的存在！)， 1932年，正电子在宇宙射线与原子核作用的过程中被发现。

狄拉克的例子提示我们，面对学问，怀有敬畏心才是正确的打开方式。要学就当真学，要学就学它个底儿掉！本讲座会包含尽可能多、尽可能深的内容，留给真心向学者！

相对论是个什么样的学问呢？大致说来，相对论是关于时空的原理性理论，相对性原理（principle of relativity）是物理理论必须满足的要求（postulate）。相对论的发展是一个长达300余年的思想过程，在爱因斯坦1915年底奠立广义相对论的那一刻达到了顶峰。相对论是纯粹理性思维的胜利，是物理现实的内在和谐与数学表达的形式美学之间完美的相互激励。物理规律的变换不换性是相对论的核心思想。沿着朴素相对论、伽利略相对论经由狭义相对论抵达广义相对论，这一条绵密的思想河流上有最激动人心的关于物理学创造的历史画卷。

关于时空的相对论是物理学的fundamental theory. 物理学的主角就是时间-空间-物质，物质的存在引出空间的概念，（空间位置的）变化引出了时间的概念。时间和空间是靠光(速) 联系的。物质有电荷这个标签，它导致了电磁学和电-动力学；物质有质量这个标签，它导致了引力（gravity，重）问题。如何理解空间-时间-物质，是真正的物理学一定会关注的基本物理问题，我们也就能够理解，为什么那些大物理学家都会有这方面的专著展现他们的思考。比如，Hermann Weyl 有Raum-Zeit-Materie (空间-时间-物质)，Erwin Schrödinger有 Space-time structure (时空结构)，而Roger Penrose有 Spinors and Space-time (旋量与时空)。有人说旋量不好理解，嗯，认真学会一元二次方程就好理解了。

论及时空，首先请记住物理学第零定律：世界是三维的；时间在向前飞逝。一般的R³空间加上R¹时间，写成 (x, y, z; t) 的形式，后来到了狭义相对论，R^3,1 时空 (spacetime) 写成了 (x, y, z; ct) 的形式, 这里 c 是作为时空连接的常数出现的。当然，如果讲究一点，应该写成 (x, y, z; ict) 的形式，这样的量，数学上称为双四元数 (biquaternion)。时空作为几何概念，我们要关注它的一些特征，比如度规 (metric)，亲邻关系 (affinity) ，单位，零点，等等。有了一些基础的代数 (比如Lie algebra, Clifford Algebra) 和几何知识 (比如affine geometry, differential geometry, complex geometry)，就能更多地理解相对论的表示与思想。

现在我们开始。本次讲座会论及朴素相对论 (Primitive relativity)，伽利略相对论 (Galilean relativity)，狭义相对论 (Special relativity，也称 restricted relativity)，非常狭义相对论 (Very special relativity)，广义相对论 (General relativity, 也称 generalized relativity)，整体相对论 (Total relativity)，最后谈谈爱因斯坦其人其事以及其他参与发展相对论的人们。

先谈谈朴素相对论。生活在地球上，我们都熟悉月亮东升的景象 (月亮出来喽喂)，但是在那么长的时光里，没人设想地球从天边升起的景象。如今人类能够进入太空，来到了月亮旁边，还真看到了这一出景象 (地球出来喽喂)。你看，养成换个观点 (point of view) 看世界的习惯，那可不容易。我们自然会想，景象变了，规律不会变吧？你的观点谅不至于影响世界运行的规律！关于这一点，我估计我们大家都服气。

简单地换个观点，会给人类认识自然带来一次跳跃。举个例子。以我们的脚下为参考点，看到的火星在天上划过的轨迹是这个样子的，有八个退行点的一团乱麻。有了观察结果，接下来的任务是，请写出它的方程。这个有点难。直到1600年左右，有个叫开普勒的德国人想到，不是还有太阳在天上运行的数据嘛。把火星的数据，减去大致相应的太阳的数据，那不相当于站在太阳上看到的火星在天上划过的轨迹。结果发现那轨迹近似地像学校操场的跑道，是一条闭合的凸 (convexity，凸性，很重要呃！) 曲线。嗯，这个看起来简单多了。如果你相信，你换了个观点，你看到了不同的世界图像但世界的规律是不变的，你就可以就着这条凸的闭合曲线去思考行星的运动规律了。那个世界的运动规律应该是不依赖于参照点的。

于是，就有了开普勒行星运动三定律。1. （太阳系的）恒星的轨道是绕太阳这个炉子(Focus, 炉子！) 的椭圆；2. 单位时间内行星与太阳的连线扫过的面积相等；3. 轨道周期平方与轨道半长轴立方为一个只依赖于太阳的常数。其实，这个三定律，有bug，但更有深意，可惜这里不能展开讲。提醒大家一下，你见到的三定律表述如果不是错误的，那也是浅薄的。开普勒定律是经典力学的出发点，后来竟然成了量子力学的入口处。

可以想象猜透了行星轨道奥秘的开普勒有多么兴奋。在其全集第18卷有这么一大段，读来很提气，英文译本照录如下：“It is not eighteen months since I first caught a glimpse of the light, three months since the dawn, very few days since the unveiled Sun, most admirable to gaze upon, burst upon me. Nothing can restraint me; I shall indulge in my sacred fury; I shall triumph over mankind (我胜过你们人类) by the honest confession that I have stolen the golden vases of the Egyptians to build up a tabernacle for me God far from the confines of the Egypt. If you forgive me, I rejoice; if you are angry, I can bear it; the die is cast, the book is written, to be read either now or by posterity, I care not which; it may well wait a century for a reader, as God himself has waited six thousand years for someone to behold his work.”

最能表现开普勒之欣喜和傲娇的是这句I shall triumph over mankind by the honest confession… (我若坦诚….那我胜过你们人类)！嗯，胜过你们人类，这比高考弄个省状元大气多了。

朴素相对论指的是世界的运动规律关于时空平移是不变的 (仿射几何)，不，是关于时空参照点的选择是不变的。假设关于世界的规律是这样的，f(r, t; λ)=0 ，则 f(r+r₀, t+t₀; λ)=0 也必然成立。

可以检查一下我们的物理定律，看看是否满足朴素相对论的要求。比如，电子气体系的哈密顿量，，显然满足朴素相对论。谐振子的哈密顿量 H=½m(dx/dt)²+½kx²，乍一看不满足朴素相对论，那是因为这个写法不具有一般性，它是把物理的弹簧状态原点也当成了数学的坐标系原点。改写成 H=½mΔx²+½kΔx²，你看，它自动满足朴素相对论。

r→r'=r+r₀t→t'=t+t₀这样的时空平移对称性，确实被“无去来处”这样的古老智慧所言中。可由此去解读陶渊明的《桃花源记》：“太守即遣人随其往，寻向所志，遂迷，不复得路。” 要是标记都具有平移对称性，那是没什么用的，不迷才怪。

接下来，我们聊聊伽利略相对论。伽利略 (Galileo Galilei, 1564-1642) 是近代科学的开创者。落体公式 h=½at²、单摆公式，惯性的概念，都是伽利略引入的。时间，惯性，引力，落体运动，未来都是广义相对论的主题。在1632年出版的《关于两个主要世界体系的对话》一书中有如下的内容: “ Shut yourself up with some friend in the main cabin below decks on some large ship, and have with you there some flies, butterflies, and other small flying animals. Have a large bowl of water with some fish in it; hang up a bottle that empties drop by drop into a wide vessel beneath it (你和朋友置身船舱，带上几只苍蝇、蝴蝶以及别的能飞的小动物，带上一个大碗盛几条小鱼儿，挂起一个瓶子往下滴水) 。

You will discover not the least change in all the effects named, nor could you tell from any of them whether the ship was moving or standing still (你不会发现有任何异样，你也弄不清船是停是动)。” 同样的说法，也出现在东汉时《尚书纬·考灵曜》中：“地恒动不止而人不知，譬如人在大舟中，闭牖而坐，舟行而不觉也。” 这些反映的是伽利略相对论的内容，当然伽利略相对论的这个概念是到1909年才有的。

伽利略相对论是说，假设关于世界的规律是这样的，g(x, t; λ)=0，则 g(x+v₀t, t; λ)=0 也必然成立。x'=x+v₀t, t'=t 对称性反映在“动静等观”这样的古老智慧中。

可以用伽利略相对论来观照牛顿三定律。牛顿第一定律：任何不受外力影响的物体保持静止或者匀速直线运动。关键词是惯性 ( inertia. 后来 ( 广义相对论修改了惯性运动的定义)。牛顿第二定律：置于外力下的物体，其加速度正比于合力，比例系数为 (惯性) 质量，即 F=md²x/dt²。关键词是惯性质量、加速度。牛顿第三定律：作用 (Action) 总伴随着等量的反作用 (Reaction)。记住action is action, action是一个意义比较广泛的物理学概念，不是什么作用力。这个定律说的是质点间的作用是相互作用。1926年海森堡用exchange interaction 修改了它。

看看牛顿第二定律，，方程左侧的加速度显然满足伽利略相对论，。而右边的力呢？那得看是啥形式。如果是质点间的相互作用相应的力，f(x_i-x_j)，那就满足伽利略相对论。

考察牛顿万有引力，。万有引力下的运动方程为，其中，这样的运动方程就满足伽利略相对论。

那关于经典电磁学呢？伽利略相对论对应的速度变换是 v→v+v₀，而带电荷的粒子，在电磁场下受力是洛伦兹力，则运动方程为。方程的左边不说了，而右边在变换下形式改变了，这个方程不满足伽利略相对论。

至此我们关于时空变换有了一些初步的感觉了。现在我们需要准备一些数学知识了。从前，三维空间和一维时间的变换是这样的，x'=Rx+v₀t+x₀，t+t₀，共有三维空间的3个平移分量，3个平动造成的位移，加上描述转动的R矩阵有3个自由度，外加时间平移，这是一个3+3+3=1=10 个自由参数的变换问题。如果把时间和空间放到一起，变换为

那就是四个维度上的4个平移分量，加上描述转动的矩阵M的6个自由度 (即洛伦兹群的六个生成元)，这是一个6+4=10个自由参数的变换问题。这个问题还可以这么理解，如果是一般意义上的弯曲4维几何体，数学上叫流形 (什么流形？Mannigfaltigkeit, 就是多参数的存在的意思，它也可以就是简单的函数)，我们想把它展开成平直的，类似把皮球的表面摊成平的。2维的球面要在3维平直空间里才能摊平 (谢天谢地，要不我们就没得球玩了。用平面的小块缝制球，那也是一门数学里的学问！)，而弯曲的4维几何体，要在10维平直空间里才能摊平。10个自由参数的变换，是我们为了理解相对论需要习惯的数学。别害怕哈！

提到变换，我们追求变换后不变的那些内容。这是个有趣的物理哲学，研究变化，追求的却是不变性。一方面是变量，变化，变换；另一侧是不变性、等价性、对称性。记住这些概念，这是物理的内涵所在。

相应的数学语言，就是群论 (théorie de groupe)。相对论的理论是用时空对称群描述的，群元素逆的存在保证了相对性。2020年11月，当我意识到这一点的时候，我给自己多买了一个馒头。

关于变换不变性，焗两个栗子吧。比如，柏拉图多面体，可看作是由球形液滴一路变形过来的，变化了，即被变换了，但是有一个东西不变，就是 V-E+F=2 总成立，其中V是顶点数，E是边数，F是面数，你们自己数一数。这个公式就是欧拉定理。又，x²+y²=1是平面内的单位圆，作变换，，结果为 ξ²+ζ²=1，这还是平面内单位圆的方程。看到变换，还能看到不变的内容，有这个能力，就可以谈物理啦。

再焗一个栗子吧，重要的。经典力学里有哈密顿方程，，，如果作变换，，结果为，，就是方程形式完全不变，则这样的变换是正则变换（Canonical transformation）；相应地，方程也被称为正则方程 (Canonical equation)。变换不变性的思想，体现在诺特 (Emmy Noether， 1882-1935) 1918年的“不变的变分问题”一文中，这篇文章把连续对称性和守恒律联系了起来，是理论物理的基础。呃，有必要强调一下，诺特是个文科生。

日常生活中变换不变性的一个活生生的例子就是婚礼誓词。不管是什么语言、什么朝代的婚礼誓词，大意都是天可以变、地可以变、我可以变，但你得对我好这一条不许变。多复习几遍婚礼誓词，你就能 get 到相对论的核心思想了。

狭义相对论的故事开始于麦克斯韦方程组，，。引入电磁势，采用 Ludvig Lorenz 规范，，方程变成了弦振动方程的模样，。这个方程是琴弦的振动方程。麦克斯韦说：“应该有电磁波！” 德国物理学家赫兹说：“好的，我来搞定！”于是，1887年，就用一套交变电路演示了 (可能) 电磁波，这套装置就是电报的原型机。

，

你再好好看这个电磁波方程。它有个速度，可以由参数ε₀ 和 μ₀ 算出来，速度和已知的光速差不多，电磁波好象跟光是一回事儿啊。好吧，光 (受电路打出的火花启发才这么想的？) 就是电磁波。还有，那光的速度是算出来的，好象没有参照物呃。个人认为，这才是光速的致命特征！

一点感慨。电磁波方程的推导，是严谨的推导；而电磁波的演示，是坦诚的验证，不是心里有鬼才去画鬼。从前的物理学家，竟然是诚实的。

有了电磁波方程，或者具体点，，我们就来找它的不变变换。1887年，福格特 (Woldemar Voigt，1850-1919) 就找到了一个，，。这个也是保 ds²=dx²+dy²+dz²-c²dt²不变的变换。这个ds²=dx²+dy²+dz²-c²dt²就是相对论的时空间距（平方）！其实，这个变换就是让球还是球，让球波 (spherical wave) 还是球波的变换。我再强调一遍， spherical wave 是球波不是球面波！

让球波 (spherical wave) 还是球波的变换，Larmor, Heaviside, Lorentz 都研究过相关内容，后来庞加莱于1905年指出这个变换必须构成群，并且把它命名为洛伦兹变换。洛伦兹变换其实比较好推导。1. 要求是线性变换；2. 保抛物型度规，即要求 x'²-y'²=x²-y²；3. 构成群，即若，，则也是变换，。这样的转动变换构成的群就是洛伦兹群；若加上平移的元素，就是庞加莱群。洛伦兹群/庞加莱群是相对论的精髓。

Lorentz变换，不，Voigt变换，可看作是 (x; ict) 坐标间的转动，变换就是平面里的转动。洛伦兹变换具有群的性质，即，意味着有，这就得到了所谓狭义相对论的速度相加公式，。这个公式实际就是正切函数的展开公式，对于 tgθ=iv/c，即有。由速度相加公式，可知对于v＜c，总有。这里的参数c是（有质量）粒子速度的不可达到的极限 (想起压力和温度的零了吗？)。运动物体上的发光过程，对应的是，即爱因斯坦用到的任何运动光源所发出的光，其到达观察者的速度都是常数c。一般地，此处多会谈论光速是上限，光速不变什么的。我想强调一下，光速是个连接时空的常数，光速是个没有参照框架的存在，这才是我们该注意的地方！

关于狭义相对论，Voigt 1887，Larmor 1890, Fitzgerald 1894, Lorentz 1899, Poincaré 1905做出来的，可以说至此内容全有了，没爱因斯坦什么事儿。那么，问题来了，咋创造相对论的功劳都归了爱因斯坦 (1879-1955)了呢？问题出在钟表上。温度计从来不测量温度 (明年聊) ！那钟表能告诉我们时间？注意手表上的那个旋钮，那是调整时间初始值的，因为钟表不同步啊！如何给钟表同步呢？

先考虑两个相对静止的钟表的校准问题。钟表，要靠光 (电报) 建立起联系。设想从甲地钟表处于t₁时刻发出一个光信号，经乙地钟表处反射后于t₂时刻回来再反射返回乙地。乙地钟表于t'₁时刻收到一个光信号，于t'₂时刻收到第二个光信号。如果 t₂-t₁=t'₂-t'₁，这就算是校准了：对同一事件它们能给出相同的持续时间长短。如果 t'₁=(t₂+t₁)/2 ，这两个钟表的读数就完全一致了，完美！关于时间同步 (Synchronization) 的问题，请参阅拙著《物理学咬文嚼字》卷二。

相互运动的钟表之间怎么校准呢？爱因斯坦，这位瑞士联邦专利局三等技术专家，瞄准的是这个问题。关键词，相互运动的钟表怎么校准！

记运动参照系中静止点的坐标 (ξ,η,ζ) ，在静参照系表述的坐标对应(x-vt,y,z)，与是时间无关。那么，时间τ是 (x-vt, y, z;t) 什么函数呢？设起始时两参照系原点重合，考察动参照框架内，从原点于τ₀发出一光信号在τ₁到达另一动参照系里的静止点 (对应x’=x-vt)，于τ₂时刻回到初始点。这就是在静参照系中看（表示）动坐标系中的时间校准过程。在运动体系的校准判据为 ½(τ₀+τ₂)=τ₁，此即。若是个极短的时间过程，这可以改写成微分方程，它的解竟然为洛伦兹变换！你说神奇不神奇？

更神奇的是，运动钟表的校准问题才是此刻相对论的核心，这是爱因斯坦1905年文章的关键，但在诸多的相对论教科书、介绍文献中从未强调这个。可能是我读书太少，没遇到过，哪位朋友手里有论述这一段对狭义相对论和爱因斯坦地位的意义的 (含爱因斯坦校准过程的方程) ，请告诉我。

光是得到洛伦兹变换还不算建立相对论了。爱因斯坦用相对论原理是能做物理的。比如，任何运动光源发出的光到达观察者的速度都是常数c，由此考察原子向相反方向发出两个同样光子的过程。比较原子与你相对静止和相对运动两种情形，自然这过程都遵循能量守恒和动量守恒，方程相减可得，，这相当于原子发光后瘦身了，减少的质量由公式Δmc²=2E_γ 给出，即减少的质量乘上光速平方应该是光的能量。核化学进展表明，原子核裂变后静质量确实少了。后来的相对论标志性公式E=mc² 是普朗克1907年根据电子在电场下加速的过程得到的结果。其实，E=mc²这样的公式，意大利人Olinto De Pretto 1903年的文章里就有。

有了狭义相对论，现在可以开始对力学的改造了。如果谈论狭义相对论，请用4矢量、张量和洛伦兹变换的语言说话。力学常见的4矢量包括时空4-矢量 X=(x, y, z; ct)，动量4-矢量 P=(P_x, P_y, P_z; E/c)，满足洛伦兹变换，，P'_y=P_y，P'_z=P_z。动量4-矢量模平方不变，P·P=E²-p²c²=(mc²)²，这就是相对论的能量公式，E²=p²c²+(mc²)²。对应动量4-矢量有波矢4-矢量，其洛伦兹变换就是多普勒效应。此外，还有二阶张量，M=X∧P，可写成 4x4 矩阵的形式，

其中分量来自3-矢量 L= x∧p 和3-赝矢量 (我建议的写成此形式)，此张量满足二重的洛伦兹变换，，由此可得角动量的洛伦兹变换。

狭义相对论来自电磁学，故电磁学天然地有满足狭义相对论的形式。电磁场张量为 4x4 矩阵

满足二重的洛伦兹变换，展开来，就是电磁场强度的洛伦兹变换，，；B‘_x=B_x，，。一般教科书只知道照抄电场E和磁场B的变换，却不遵循严格的数学，甚至不知道E同B的是不同的数学对象。

基于狭义相对论，回过头来对光速就会有新的认识。光速作为时空连接，出现在(x, y, z; ct) ， (x, y, z;ict)，ds²=dx²+dy²+dz²-c²dt²，和 E=c²m 等表达式中。笔者的理解是，光速没有参照框架，光速不是速度。就算把光速理解为速度，它也不是别的那种速度！光速c 和普朗克常数 h，玻尔兹曼常数k一样，是基本物理常数。也正是在这个意义上，普朗克与爱因斯坦心有戚戚，是普朗克第一个响应爱因斯坦的工作。1929年，普朗克和爱因斯坦一起喜提首届普朗克奖。

在理论物理中我们可以随手写下c=1, ħ=1。至于为什么c=1？Yuri Manin 对这个问题的回答是：因为它就等于1！不明白的读者朋友们，请耐心多读一些经典力学、电动力学、相对论、量子力学、量子电动力学、量子场论、规范场论的书，慢慢地就能理解曼宁的这句话了。

狭义相对论对我们的生活有深刻的影响。首先，同时性的概念被抛弃，授时成为必要并且科学地实现了。光速是时空的连接，是约定的常（整）数，c=299729458 m/s；所以测距经公式 Δl=cΔt 转换为对时间的测量，所以雷达、导航卫星中最核心的部件是高精度时钟！E= c²m 启发了核能的应用。

狭义相对论来自麦克斯韦方程组。麦克斯韦方程组的群是15-参数的 SU(2, 4)群，狭义相对论的时空变换，是10-参数的庞加莱群，不算平移，那也是6个生成元 J_x,J_y, J_z; K_x, K_y, K_z的洛伦兹群，太大，一般的物理问题用不了。实际上选择 T₁=K_x+J_y，T₂=K_y-J_x这构成T(2)群；[T₁, T₂, J_z]构成3-参数的E(2)群； [T₁, T₂, K_z]构成3-参数的HOM(2)群； [T₁, T₂, K_z, J_z] 构成4-参数的SIM(2)群。针对具体的物理问题，这些群就够用了，丝毫不影响相对性，故而有very special relativity之说。

来自麦克斯韦方程组的洛伦兹变换不适用于牛顿引力方程，因为这里的相互作用是瞬时的。怎么办呢？记得从前的库伦作用，考虑到相互作用速度有限的实施，采用了延迟势的策略，即势能改造成的样子。但这一套对引力无效。想想为什么？质量与电荷不是一回事儿！

1907年，在受邀对相对论进行综述的时候，爱因斯坦想到能不能针对所有物理学一揽子考虑时空对称性呢？爱因斯坦决定推广相对论理论。有了推广相对论用于处理引力问题的念头，从前的相对论才是special的，故有狭义相对论。没有广袤就显不出狭隘！狭义相对论这个词儿出现在1907年！！！

推广相对论理论，那相对论有啥？有满足洛伦兹变换的闵可夫斯基时空的时空间距定义，ds²=dx²+dy²+dz²-c²dt²；对于光，ds²=0。闵可夫斯基时空，即平直时空，的时空间距可写为，其中有η_μν=(+, +, +, -)。也有采用 η_μν=(-, -, -, +) 的约定。一般地，4维时空的间距可写为，张量 g_μν就是度规张量，它给出空间的全部几何信息。这里给出一个很重要的信息：物理学是几何学！注意，quanta 这个词第一次就是出现在黎曼的几何学论文的第一句，是关于空间的量子，而后来玻色于1924年推导出黑体辐射谱公式，就在于他吃透了量子化是相空间的几何量子化！扯远了。

考察一个小物体被一个大质量体吸引的牛顿力学问题，如果区分引力质量和惯性质量，运动方程为。如果引入引力质量与惯性质量等价的观念，那方程就能简化为，简单多了。这个方程左侧是加速度，右侧是引力。如果相对于一个匀加速的参照系，那左侧要加上一个常数加速度，右侧也得同时加上同样的项，其在左侧的意义那就是一个均匀的引力势而已。怎么着？参照框架的相对加速度等价于一个均匀引力场？引力和加速度不好区分啊！这引导爱因斯坦把惯性运动的定义给改了：引力之外其它力之合力为零的运动状态是惯性运动。看来，要理解引力，得学会描述加速度 (的数学) ！如何描述加速度呢？

看看关于匀速圆周运动的描述，加速度为，里面的关键是圆（轨道）的曲率半径。一个运动过后，只有运动留下的痕迹 (trace)，它包含着运动所有的信息。一个几何体，一条轨迹也是个几何对象，都要从它自身找到描述，这是Felix Klein的伟大思想！一条轨迹，我们会说，但是时间是从外面赋予它的。如果从轨迹来看它的加速度问题，也许应该采用，其中s是沿着轨迹的弧长。这种描述的方式是，加速度总在轨迹的法向上，它和轨迹的曲率成正比。加速度、曲率，都是二阶微分，可由运动径迹推知。嗯，我们要学会描述曲线的曲率！注意，关于曲率的力学意义，老祖宗早就注意到了，功拉得越弯，其储存的能量就越多！

轨迹要表示为路长s的函数。曲线γ(s)的加速度总是法向加速度，和曲率有关。1729年，16岁的法国少年克莱洛就因研究曲率一举成名，18岁成为Academie Française的院士。我们一般都学过，对于二维平面曲线 y=f(x)，曲率为。对于三维空间曲线，曲率为；用弧长作参数，简化为 k(s)=|γ''(s)|。

爱因斯坦从1907年忙到1912年，尝试了多种推广相对论的方案，进展不顺。到了1912年，算是明白了引力↔加速度↔曲率↔弯曲时空的关系。关于弯曲时空，我们要做的是针对一般的 g_μν，如何描述相应时空的曲率，建立起引力质量体如何产生引力的方程。对非惯性参考框架要求物理定律不变，其实就是要求二阶微分方程形式的物理定律对含二阶微分项的变换的某种不变性，即微分同胚协变性。这注定了理论的非线性本质。这个不变性的要求以及要构造的引力论本质上是几何的理论，决定了张量 (Tensor) 语言是合适的表达工具。

有这样的用于建立弯曲时空中引力理论的数学吗？爱因斯坦的同学Marcel Grossmann在翻了一晚上图书馆后告诉他，有！这个理论是高斯、黎曼开启的，称为黎曼几何，如今的黎曼几何大家有一个是意大利人Levi- Civita, 此人有一本书 absolute differential calculus. 你看看absolute这个词，那就是相对论的特质！Marcel Grossmann介绍爱因斯坦和Levi- Civita认识，Levi- Civita以极大的热情、以通讯的方式、用德文和法文教爱因斯坦这门学问—绝对微分，如今称为张量分析。Levi- Civita教爱因斯坦的严重后果是他自己教成了相对论专家，他的书新版后面两章就是关于相对论的。他1917年发展出的平行移动的概念，是广义相对论、微分几何、规范场论的重要基础。学者啊，你要舍得教别人！

构造广义相对论从一般性的时空间距定义开始，。这个表达式的最简单的例子，就是二维平直空间的情形 ds²=dx²+dy²，就是勾股定理。由 g_μν的微分得到，Christoffel 符号，也叫联络，，进一步协变微分，就得到黎曼张量。将黎曼张量作指标收缩就得到Ricci 张量，。爱因斯坦所要的弯曲时空的曲率表达就有啦。

爱因斯坦开始构造新的引力理论。从质量密度ρ产生的弱静引力场出发，其度规张量的分量 g₀₀，近似地为g₀₀~-(1+2ϕ），其中ϕ是牛顿引力势，▽²φ=4πGρ。由非相对论能量密度T₀₀~ρ，可得 ▽²g₀₀=-8πGT₀₀，爱因斯坦猜测引力场方程的形式为 G_μν=-8πGT_μν(也有符号约定的结果是 G_μν=8πGT_μν)，其中 G_μν=R_μν-½Rg_μν是爱因斯坦张量。R=g^μνR_μν是标量曲率。1917年，爱因斯坦为引力场方程引入宇宙常数项，R_μν-½Rg_μν+Λg_μν=-8πGT_μν，就为了有个静态宇宙 (static universe) 解。

爱因斯坦引力场方程1915.12在普鲁士科学院报告，1916.03正式发表，这之间的插曲是，1916.01 Schwarzschild在德国-俄国前线的战壕里顺手就给出了一个解。他为什么能解爱因斯坦引力场方程呢？因为他会！炮兵上尉Schwarzschild入伍前是哥廷恩大学教授，哥廷恩天文台台长。哥廷恩天文台从前有个吃住在那儿的人叫高斯，大家都知道哈。

爱因斯坦引力场方程 R_μν-½Rg_μν=-8πGT_μν被希尔伯特 (David Hilbert, 1862-1943) 由作用量用变分法作为欧拉-拉格朗日方程得到；如果将作用量改为，则方程为 R_μν-½Rg_μν+Λg_μν=-8πGT_μν。实际上，希尔伯特在1915.12.20日得到引力场方程，比爱因斯坦早。爱因斯坦酸酸地说：“困难不在于找到的广义协变方程-用黎曼张量很容易做到，而在于认识到它是牛顿理论的推广……”后来我们知道，如果用Beltrami 不变量理论来考察这个问题，会发现引力场方程左侧只能是 R_μν-½Rg_μν+Λg_μν的样子。爱因斯坦后来说，场方程的左侧是象牙做的，是几何的、严格的，而右侧是木头做的，是为物理猜测而来的。方程右侧实际上尚无具体内容，保持能量守恒的T_μν形式，好象证明要到1965年才解决。

我的感慨是，“你的累死累活，不过是别人的轻描淡写！”

此刻回顾一下希尔伯特的那句话：“物理，对物理学家来说，太难了！”你得多自信才会觉得人家希尔伯特恶毒。

就数学而言，爱因斯坦的理论有两个先驱值得一提。克里福德 (William Kindon Clifford，1845-1879) 曾云：引力引起空间弯曲, 物质可能只是弯曲空间上的涟漪。“ 这一句后来被一些碰广义相对论瓷的人给用烂了。克利福德辞世后的第11天，爱因斯坦诞生。

另一个人是黎曼，他1854年的“作为几何基础的几个假设” 一文后来发展成了黎曼几何。黎曼是电动力学的缔造者之一。

有了引力方程 R_μν-½Rg_μν+Λg_μν=-8πGT_μν，加上测地线方程。有一种说法，场方程告诉时空怎么弯曲，测地线方程告诉粒子如何在引力场中自由落体，很和谐是不是？错！爱因斯坦自己就知道，时空结构和测地线应该是一体的，由一个方程自洽地决定。可是，爱因斯坦不知道如何解决这个问题。

爱因斯坦的上述想法，来源于对牛顿的水桶实验和马赫关于此实验的思考。回忆一下牛顿的水桶实验，可观察到水面变凹的问题。水面变凹是因为水面转动起来才变凹的。但是，这转动是相对于什么的转动呢？刚开始时，水桶转动而水尚未动时，水面是平的；水桶和水都转动 (相对静止) 时，水面是凹的；等到后来水桶停下来，而水继续转动时，水面保持是凹的。水面是凹的不是因为水相对于水桶的转动！牛顿发现的是，转动物体之间不只有静的万有引力，还有一个拖曳效应 (dragging effect)。

1883年马赫指出：“牛顿的水桶实验告诉我们，水相对于桶壁的转动不会产生可观的向心力，但是相对于地球或者远处其它星体的转动产生了那样的向心力。毕竟，我们不知道如果桶足够厚实、质量足够大时的结果会怎样” (大意)。马赫的这句话是极具洞察力和先见之明的。

转动相对性的问题让人们深入思考参照框架的问题。我们有什么理由认为这两个相互作为参照的流体会有不同的行为呢？爱因斯坦的回答是，原因必然在这个体系之外 (Die Ursache muß also außerhalb dieses Systems liegen)，这两个物体的力学行为完全由远处的质量分布所决定。

这个问题，诺奖得主Wilczek曾以“total relativity”为题加以论述。

有一种说法，预言引力红移和光线弯曲，以及解释水星近日点进动，是广义相对论正确的三大证据。其实猜测引力红移和光线弯曲在给出场方程之前，只有计算水星近日点进动才是在给出场方程之后。关于引力场中光线弯曲的说法，愚以为是不正确的。光线从不弯曲，光走的路径才是物理的直线！就说时空弯曲了好了！

若考虑弯曲空间上的场论，如何在弯曲空间的两点建立联系、能微分是个问题。这就引入了矢量的平行移动概念。这是微分几何的主题。我在写《相对论少年版》想到一个可体会平行移动概念的实验场景。找个山坡上、树林里的弯曲小道，你扛一根长长的竹竿还能顺利前行，就能体会广义相对论的平行移动的深意！——请学学关于它的数学，对，你得学会微分几何！

狭义相对论创立于 1905-1907，广义相对论创立于1915-1916，是天才的头脑风暴产出。数学和物理兼备的头脑，才得做出物理来。在这幅著名的量子力学创造者的照片里 (这样理解似乎不对！) 有一些也是相对论的创造者，包括爱因斯坦、普朗克、泡利、狄拉克等。

二维复矩阵的希尔伯特空间有 4个独立变量，需要4个基，，，，。后三个构成泡利矩阵，是泡利 (Wolfgang Pauli, 1900-1958) 研究原子谱线时提出来的，它们构成李代数，描述转动 (自旋)。但是，3+1维时空可表示为二维复矩阵，，det[X]=c²t²-x²-y²-z² 就是闵可夫斯基时空的时空间距！泡利矩阵还用于构成狄拉克矩阵，，出现在相对论量子力学方程，中。相对论，量子力学，李代数，都在泡利矩阵中。

由相对论能量表示 E=p²c²+m²c⁴，直接套用量子力学算符，，构造出方程，这个方程被命名为Klein-Gordon方程，它描述有质量、自旋为零的粒子，不能描述电子。1928, 狄拉克出场，硬做 z²=x²+y²=(αx+βy)²形式的分解，得到狄拉克方程。这个方程竟然告诉我们世界上有反粒子。1932年，正电子被发现。

在广义相对论中，由度规导出的联络。1918，外尔 (Hermann Weyl, 1885-1955) 出场，他把联络当成是本原的，推广了联络，。对于联络，这意味着电磁是引力的伴随现象？由此开始了规范场论。参阅拙著《云端脚下-从一元二次方程到规范场论》，2021。

最后说说爱因斯坦其人其事吧。1905年，爱因斯坦利用辐射有基本能量单位的假说，成功解释了光电效应，至此光有能量单元尘埃落定！这为爱因斯坦赢得了1921年度诺贝尔物理奖。后来，爱因斯坦还假设光量子有动量，p=hν/c。

1917年，爱因斯坦闲来无事，在辐射~物质相互作用平衡的基础上重新得到普朗克分布，其中重要的时提出了受激辐射的概念。受激辐射概念导致了激光的出现。1924年，爱因斯坦发展玻色的黑体辐射公式推导，进而有了玻色-爱因斯坦统计和玻色-爱因斯坦凝聚。

杨振宁先生曾评价到: Einstein was very independent and extremely stubborn (爱因斯坦时一个特立独行的思想者：无畏，独立，富有创造性并且执着) 。要我说啊，唯有如此，他才能给出一个overall的框架，因为一个人在战斗，他必须对问题有整体的把握，那才是一个自洽的理论能够产生的前提！这让我想起了关于Oppenheimer的一句话“He knew that each one must know the whole thing if he was to be creative.”

回顾相对论的发展，可知科学革命的说法有多么荒唐！马赫说，如果你在物理学里看到了革命，那是因为你知道的少！

革命不是一件容易的事情，尤其是在科学思想领域。哥白尼的日心说看似是对地心说的革命，可是哥白尼的日心说中行星运动的参考点还是地球。毕竟，关于行星的观测数据是从地球上获得的。这体现了思维的惯性。

广义相对论是爱因斯坦一个人的创造，但他生活的环境为他提供了所需的哲学、数学和技术进步。哲学方面有康德，莱布尼兹，马赫……数学方面有：高斯，黎曼，希尔伯特，诺德，格拉斯曼……我的观点是：物理学是一条思想的河流！

我甚至想，相对论是德式严谨 (Kepler, Gauss, Riemann, Mach Einstein, Minkowski) 与意式浪漫 (Galileo, de Pretto, Ricci, Levi-Civita) 的完美结合？

总结一下吧。相对论由如下内容构成，包括：

朴素相对论 (应用~1602；命名2018，曹则贤)

伽利略相对论（阐述~1632；命名1909）

狭义相对论（创立~1905；命名1916）

广义相对论（创立~1915；命名1916）

Very Special Relativity（命名2006, Cohn/Glashow）

Total Relativity（命名2004，Wilczek）

其内容可总结如下

• 相对性原理 (principle of relativity) 是对物理理论的形式要求 (postulate) ；此外，其表述不依赖于坐标 (coordinate-free)；

• 相对论的精髓是对时空 (space-time) 的洛伦兹变换 (洛伦兹群/庞加莱群)；

• 光是时空的连接。光速没有参照框架。我们不理解光；

• 广义相对论是引力理论。加速度同曲率相联系，微分和联络有关。要学点微分几何；

• （狭义）相对论量子力学、量子场论，(广义) 相对论下的规范场论，才见学问；

• 具有四百余年历史的相对论如今该是受教育者的知识标配。

至此我和大家大概浏览了一下相对论的内容。然而，道可道，非常道，靠听这样的讲座是不能够学会相对论的。对一门学问最好的纪念，是学会它从而能从内心深处准确地欣赏它、赞美它。若是能够进而掌握它并为之赋予新的内容，那就……不说啦。欲知相对论，请自己去读爱因斯坦 et al. 选好的文献，文献的层次决定你知识的层次。尊重你自己！

我推荐如下文献作为学习相对论的参考书，并附理由。

Einstein 的论文+The meaning of Relativity，本尊叙述；

Max Born的Einstein’s Relativity，大神级老友的评论；

Hermann Weyl的 Raum-Zeit-Materie ，这是大神的经典，指向规范场论；

Dirac的General theory of Relativity，69页，简练，但全是精髓；

Weinberg的 Gravitation and Cosmology，诺奖得主、宇宙学大拿不是虚的；

Wald 的General Relativity，特别切题的封面，绿苹果上面是一张铺着白桌布的桌子，这是懂引力和微分几何人设计的；

Carroll的Spacetime and Geometry，挺有名的教科书，内容比较靠近数学，还行；

最后，是曹则贤的《相对论~少年版》，274页，内容非常全面，可作为入门的参考书。这是学相对论文献的下限，再低就不成样子了。

预备知识：经典力学，光学，电动力学，线性代数，群论，不变量理论，微分几何……这些多少你都学一点。到学不懂处，你要经常回过头来再学。

扩展阅读：

相对论把球看扁了？图样图森破 | 曹则贤

幸亏我们是生活在三维空间中：空间维度、数学与物理现实的巧合 | 曹则贤

妖精在吃唐僧肉问题上的古怪行为之物理学诠释 | 曹则贤

科学家，到底应该是什么样的人？| 曹则贤

装物理学家很欢乐很沉重 | 曹则贤

背景简介：本文作者曹则贤，现为中国科学院物理研究所研究员，著有《物理学咬文嚼字》 (四卷)，《至美无相》，Thin Film Growth，《一念非凡》, 《惊艳一击》，《量子力学-少年版》，《相对论-少年版》，《云端脚下》等。文章2020年12月31日发表于微信公众号返朴（曹则贤2021跨年科学演讲：什么是相对论丨贤说八道），风云之声获授权转载。
责任编辑：祝阳

继续阅读

阅读原文