数学天才伽罗瓦,20岁时死于一场决斗,结束了他短短的一生,而他思想的精华将永远流淌在历史的长河里。
撰文 Kasper Müller
翻译许钊箐
1832年5月30日清晨,随着一声枪响,只有20岁的埃瓦里斯特·伽罗瓦(Évariste Galois)受伤倒在满是露珠的草地上。历史上最迷人,最神秘的人物之一即将走向生命的终结。
伽罗瓦丨图片来源:Wikimedia Commons
引 言
这是一个关于爱情和数学的故事,和一个非常聪明的年轻人有关。他潦草的手稿开启了数学中最优美、最有趣的领域之一,也引发了一场关于我们如何思考方程的革命。他不仅解决了一个350年悬而未决的问题,他的理论还为几个两千年未解的问题提供了答案。我们稍后会讲到这些。
更具体地说,伽罗瓦考虑了多项式求根的问题。(译者注:多项式的根,也被称为多项式的解,即使得多项式p(x)函数值为零的x的值)
当时数学家已经知道,五次以及五次以上的多项式没有可以求根的通用公式。(对于这里的公式,我们指的是取n次方根并应用四则运算。这个概念也被称为根式可解,本文中简称为可解。)但是,伽罗瓦想理解为什么有的高次多项式是根式可解的,而其他的是不可解的。(译者注:这里读者可以利用二次多项式求根公式为例来理解根式可解这个概念。)
例如方程x5-1=0是可解的,我们称这些解为五次单位根。这些解十分漂亮地均匀分布在复数平面的单位圆上,也是一个正五边形的顶点,即五个五次单位根。
所以一些d阶(其中d≥5)的多项式方程,事实上是可解的!伽罗瓦理论解决的问题正是为什么是这样的,以及哪些方程是根式可解的,而不是仅仅知道一些方程是不可解的。
一些多项式方程不可解的事实是被另一位天才——年轻的挪威数学家尼尔斯·亨利克·阿贝尔(Niels Henrik Abel)所证明的。其实几位大数学家,比如鲁菲尼(Paolo  Ruffini)和柯西(Augustin-Louis Cauchy),也对此有所贡献,但是没人提出接近于伽罗瓦的理论,也没人可以确切地解释原因。
在本文中,我们将首先了解历史概况和伽罗瓦的生平,然后简要地介绍他的英年早逝,年仅20岁的神秘死亡。之后,我们会看到其优美的数学理论的全貌,以及讨论为什么它是如此的优雅。
尽管一篇文章无法涵盖伽罗瓦理论的全部,但我希望可以向你们展示其优雅和美丽的一部分,希望它激励你们自己去学习和探索。
伽罗瓦其人
伽罗瓦出生在1811年10月25日。他很早就对数学感兴趣,在14岁时,他找到了勒让德(Adrien-Marie Legendre)的《几何基础》Éléments de Géométrie一书。据说,他读这本书“像读小说一样”,并在第一次阅读时就掌握了它。
15岁时,他开始阅读拉格朗日的论文,他可能因此受到很大启发。
尽管伽罗瓦在自己的时间里努力学习,但他在课堂上却没有什么动力。
1828和1829年,他被巴黎综合理工学院两次拒之门外,这里有当时法国最负盛名的数学学院。第一次是因为偏科,第二次是因为没有通过口试,据说他把口试搞砸了。(译者注:巴黎综合理工学院被认为是法国最顶尖的工程师大学,被誉为法国精英教育模式的巅峰。)
从这个时刻开始,日月如梭, 1829年伽罗瓦发表了一篇关于连分数的论文,大约在同一时间,他投稿了一些关于多项式方程的论文。审稿人正是当时最伟大的数学家之一:奥古斯丁-路易斯·柯西。
但是,尽管柯西建议伽罗瓦将文章提交到法国科学院以参加学院奖(Grand Prix),但是他并没有发表伽罗瓦的论文。
直到今天,没有人知道为什么柯西没有发表它。有人说,他认识到伽罗瓦思想的重要性,但建议伽罗瓦在出版前进行一些编辑。也有些人说,政治因素起到了一定作用。(显然,柯西和伽罗瓦的政治观点相冲突,这在当时是一件大事。)
1829年7月28日,伽罗瓦的父亲去世了。伽罗瓦和他父亲的关系非常亲密,所以对他来说,这是生命中一次沉重的打击。
1830年,在柯西的建议下,伽罗瓦向另一位数学巨匠——约瑟夫·傅里叶(Joseph Fourier)——提交了关于方程理论的论文。不幸的是,不久之后傅里叶就去世了,伽罗瓦的论文也丢失了。

这对伽罗瓦来说,当然是一个挫折,但他并没有轻言放弃。同年晚些时候,他发表了三篇论文。其中一篇概述了后来被称为伽罗瓦理论的内容,另一篇则首次研究了我们现在称之为有限域(Finite field)的数学概念,它后来在数论领域非常重要。
为了了解伽罗瓦的处境和生活,我们需要了解法国当时发生了什么。那时正值法国七月革命中期,也被称为法国第二次革命,伽罗瓦不仅参与了这场革命,还参加了战斗和辩论。他加入了街头的暴乱,把时间都花在了数学和政治上。
伽罗瓦死亡之谜
在父亲死后的几年里,伽罗瓦变得越来越暴力,他被逮捕了多次。1831年1月,伽罗瓦再次试图发表他的理论,但是伟大的数学家西莫恩·丹尼斯·泊松(Siméon Denis Poisson)认为他的工作是“令人费解的”。
伽罗瓦当时在监狱里,对泊松的拒稿非常愤怒。但不知为何,这次他很认真地对待了批评,并开始整理自己的工作,更仔细地撰写了自己的陈述。
伽罗瓦于1832年4月29日获释。不久之后,他参与了一场决斗。
关于那场著名的决斗,有许多猜测。一封伽罗瓦写于决斗前5天的信表明他恋爱了,而这场决斗正是为了他的爱人。
在决斗的前一天晚上,伽罗瓦确信自己即将死去,他整夜未眠,写下了后来他对数学界贡献最大的一篇论文:写给奥古斯特·谢瓦利埃(Auguste Chevalier)的那封表达自己观点的著名信件,以及三份附呈的手稿。
伽罗瓦手稿的最后一页丨图片来源:Wikimedia Commons
数学家赫尔曼·外尔(Hermann Weyl)在谈到这篇手稿时说,
“如果从这封信所包含思想的新颖性和深刻性来判断,它也许是整个人类文献中最丰富的一篇文章。”
这就是伟人名言。
1832年5月30日清晨,伽罗瓦腹部中枪,随后被对手抛弃。
第二天早上,年仅20岁的伽罗瓦去世了。
之后的故事
在1843年,约瑟夫·刘维尔(Joseph Liouville)审阅了伽罗瓦的手稿,并宣布它是正确的。这篇论文最终在1846年,也就是伽罗瓦死后14年出版。
然而这个理论花了更长的时间才在数学家中流行起来,人们才真正理解它的奥妙。
事实上,刘维尔完全错过了伽罗瓦方法的理论核心——群(Group),直到世纪之交,伽罗瓦理论才被完全理解,并被确立为抽象代数(Abstract algebra)的核心部分。这一理论花了将近一百年才成为代数课程的标准内容。
伽罗瓦手稿中最著名的部分是证明五次多项式的求根公式不存在——也就是说,五次和高次多项式方程通常不能被根式求解。
如上所述,阿贝尔在1824年就已经证明了根式求解的“五次公式”是不可能存在的,但是伽罗瓦进行了更深入的理论研究,提出了现在的伽罗瓦理论。
这一理论可以用来确定任意的一个多项式方程是不是有根式解。
伽罗瓦是第一个创造“群”这个词的人,他使用的定义(几乎)和我们今天在不同的大学和学院使用的定义一样。他提出了正规子群(Normal subgroup)和有限域的概念,我们稍后也将对此进行讨论。
本质上说,伽罗瓦是现代群论和抽象代数领域的开创者之一。
群论是研究对称的数学,在很多数学和物理的学科中有着广泛的应用。而抽象代数也被称为“现代数学的语言
我清晰地记着,当我在学习伽罗瓦理论的课程之前,我已经学习过了多门抽象代数的课程,比如群论(Group Theory),环论以及理想(Ring and Ideal Theory),域论(Field Theory)和模理论(Module Theory,模是指在环上的线性空间,而不是域上的),这一切都非常的抽象。
之后我学到了伽罗瓦理论,很多之前学到的内容,特别是群论和域论,都得到了应用。最后,我可以使用所有的这些抽象的数学对象来证明,为什么一些特定的多项式方程没有根式解,而且这些还不是全部的伽罗瓦理论。
这正是我认为伽罗瓦理论美妙的原因。
伽罗瓦理论
伽罗瓦理论将抽象代数中两个的子领域联系起来——群论和域论。
就像之前提到的,伽罗瓦理论的诞生是由以下这个问题引出的:
对于一个五次或者更高次的多项式方程,是否存在一个公式可以通过使用多项式的系数,常用的代数运算(加,减,乘,除)以及根式(平方根、三次方根等等)将所有的根,也就是方程的所有解表示出来?
尽管阿贝尔-鲁菲尼定理(The Abel-Ruffini theorem)提供了一个反例,证明了存在多项式方程使得这样一个表达式不存在,但是伽罗瓦的理论可以解释为什么有些方程,包括所有四次以及更低次的方程,求根式解是可能的,以及为什么很多五次以及更高次方程是没有根式解公式的,从而为之前的问题提供了一个更完备也更清晰的答案。
现代的伽罗瓦理论使用了群和域的语言,所以我将试着在避免涉及太多其他知识的同时解释伽罗瓦理论,但为了完整性起见,我们将简要地介绍这些数学概念。
群 论
群论是研究对称性的。
想象一个正方形:这个正方形具有一定的对称性——如果旋转90度,它看起来是一样的,旋转180度和270度也是一样的;当然,如果旋转360度后,会回到初始的状态。
为了记录下来,我们可以想象正方形的四个角都被标记了,这样我们就知道是如何变换的。
还有一种反射对称,比如选择一个轴,或者说一条线,穿过正方形中间,将其分割成为两个大小相等的矩形。你可以沿这条线翻转这个正方形,它看起来还是一样的,但是这个变换是和旋转不同的。
最后一种就是平凡对称性(什么都不变)
每一种对称都有一种反对称:比如,顺时针旋转90度之后再逆时针旋转90度,两个变换会相互抵消,最后等价于平凡对称。
这个概念可以用代数的方法进行推广。
一个群G是由满足以下条件的一个集合和一个运算构成:
1. 对于两个群中的元素g, h,运算之后会得到在群中的元素g*h;
2. 存在一个单位元e使得任意一个元素g与其运算之后不变,g*e=e*g=g;
3. 对于任意元素g,存在一个逆元a使得g*a=a*g=e。
在以上的例子中,群中的元素正是变换本身。比如说,旋转90度和上文提到的反射变换都是群中的元素,我们把旋转90度记作σ,把反射变换记作τ。
这个群的运算正是变换的复合。所以我们可以得到σ*τ,也就是先沿着对称轴做一次翻转,再旋转90度。但是我们可以注意到,σ*τ≠τ*σ,所以在群中,元素运算的顺序是很重要的。(译者注:我们这里不妨假设旋转是顺时针旋转的,并且正方形的四个角是有标号的,这样读者可以通过画图验证,先翻转再旋转的结果与先旋转再翻转的结果不同。)
因此群的概念是一种将对称抽象化的方式。事实上,抽象变换的群很多,我们甚至不知道如何将其中的一些群可视化。
但是最简单的群之一是大家耳熟能详的:包含所有整数的集合和加法运算就构成了一个群。
当我们加两个整数时,我们会得到第三个整数(这个集合对于加法来说是稳定的)。单位元是0,因为对任意整数k, 0+k=k+0=k,并且逆元正是-k, k+(-k)=0。
所以,
是一个群。但是整数集合和加法运算的群体现了什么对称性呢?答案是平移对称性。加上一个整数k
可以看成是沿着数轴平移距离k,正负代表方向。
而群G的子群H,一般记作H<G,表示是的一个子集,同时也构成一个群。比如说,偶数的集合是整数加法群的子群,
域 论
在数学中,域是一种特殊的环。你可以认为一个域是一个具有两种运算的集合,运算通常记为加法和乘法,即+和*,这里的加法和乘法可能并不是平常使用的运算,它们取决于域的定义,但是你会看到为什么这个记号是有意义的。其中有一个零元,使得对于任意
中元素a, a+0=0+a。
并且,集合
对于定义的加法+是一个群,集合
\{0}对于定义的乘法*也是一个群。不仅如此,两个运算是满足分配律的,a*(b+c)=a*b+a*c,其中的乘法和加法运算是域中定义的运算。
其他众所周知的性质是,域中存在单位元1以及运算的交换律,a+b=b+a, a*b=b*a。
这两个性质可能看起来很熟悉。确实如此,因为大家熟悉的实数和复数都是域,并且满足这些性质。
如果你了解模运算的话,你会知道整数对任意素数p取模是一个域,(常常记作
),并且是一个有限域!这是伽罗瓦的发现之一。
所以,域是一个包含“数字”的集合,我们可以在域中以通常的规则进行四种运算,而且它们都有逆。(除了零元的乘法逆,因为在域中,除以零仍然是不可能的。)
伽罗瓦理论关注的正是有理数域的扩张(
表示有理数,即可以表示为分子分母都为整数的分数)以及复数域的子域,
,其中
只包含有限多个非有理数。
我们必须向有理数域
中增加至少一个非有理数来得到这样处在中间位置的域。那这些域是什么呢?
我们知道,
不是有理数,因为不能将其写成分子分母为整数的分数。但是,我们可以将其加入到有理数
中。当然,为了得到一个域,我们还需要加入很多其他的元素,比如说-
,也就是它的加法逆元。事实上,我们需要所有形式为a+b
的数,其中a和b为有理数。
我们称这个集合为在
中添加
生成的扩域,或者单扩张域,记为
。可以验证的是,扩域中每一个非零元素都有加法逆和乘法逆。
更一般的,我们可以把
(α) 看成是包含所有有理数以及α的最小的域。如果α是有理数,则又得到了平凡扩张
在讨论伽罗瓦理论美妙之处之前,我们还需要知道分裂域(Splitting feild)是什么。不过这是非常简单的。
考虑一个系数均为有理数的n次多项式f,我们从代数基本定理可知,n次多项式f恰好有n个复数根(根的重数计算在内)
所以我们可以考虑包含多项式f所有根的基于
的域扩张。这个满足条件的最小域就被称为多项式f的分裂域,因为我们可以在这个域中把多项式f因式分解。
最后一个概念是域K的自同构(Automorphism)。这是一个巧妙的词,用来表示在域中保持结构的置换。如果σ是K的自同构,则
σ(x+y)=σ(x)+σ(y), σ(x*y)=σ(x)*σ(y)
并且σ是一个双射,即这个映射是一个单射也是满射。
假设域K是域F的扩张域,也就是说,F是K的子域;我们可以考虑固定域F的K上的自同构σ,对任意域F的元素x,σ(x)=x。
伽罗瓦理论的基本定理
对于一个给定的多项式,不同的代数方程可以将不同的根联系起来。(本文中代数方程指的是有理数系数的多项式方程。)
伽罗瓦理论的主要思想就在于考虑根的置换,使得其在置换后,原本满足的代数方程仍然是成立的。
这些置换形成的群就被称为该多项式的伽罗瓦群。
比如说,我们考虑f(x)=x2-2x-1。这个多项式的两个根,我们记为α=1+
 ,
β=1-
两个根满足的代数方程为,
  • α
    +
    β
    =2
  • α*β=
    -1
不难看出,在两个方程中交换αβ后,仍然成立。事实上,对于αβ的所有代数方程在变换后都是成立的。
一种通俗的理解方式是:在一定意义下,有理数不能分辨1+
1-
的差别。
-
对于有理数来说是同样的异类。”
所以,f的伽罗瓦群有两个元素,平凡置换和交换两个根的置换,也就是把1+
变为1-
,反之亦然,并固定其他的有理数。这正是2阶循环群,同构于
(在高等数学的术语中,这表示“两个群相同”。)
以现代的语言,我们可以考虑f的分裂域K,并假设有相异的根,定义f的伽罗瓦群为所有可以固定有理数
的K的自同构群。
我们一般记这个自同构群为Gal(K/
),其中K/F,这个例子中F=
,表示域扩张K是基于域F的,并且自同构可以固定域F。
或者我们可以换一个说法,这个自同构群包含所有满足以下条件的置换:在置换作用于多项式根之后,原多项式根满足的代数方程仍然成立。
对于之前的例子,我们有这样的同构关系,Gal(
(
)/
)
更一般的说,我们定义基于域F的域扩张K的伽罗瓦群为可以固定域F的K的自同构群。
在这个命名规则下,多项式f的伽罗瓦群指的是其分裂域的伽罗瓦群。(前文提到过,分裂域指的是在基于
下,多项式f所有根的域扩张。)
对于任意域K的并且可以固定域F的自同构σ,(通常记为σ∈Aut(K/F)),任意系数在中的多项式如果有一个根α,则也有一个根是σ(α)。所以,这样的自同构确实将基于域F,对于α的最小多项式的根进行了置换。
另外,用类似的思路,我们可以证明,如果一个复数a+bi是实系数多项式f的一个根,则它的复共轭a-bi也是多项式f的根。
这是因为存在一个自同构
,可以置换i和-i。所以,σ(a+bi)=σ(a)+σ(bi)=a+bσ(i)=a-bi。
将基域设置为
,伽罗瓦理论基本定理是,伽罗瓦群Gal(K/
)的子群和在
与K的中间域是一一对应的。
这个定理其实不仅于此,给定一个中间域,
⊂L⊂K,对应的子群H<Gal(K/
)恰好包含那些固定L的自同构。
可解群
伽罗瓦本人在当时那个著名的手稿中就理解并研究过,考虑一个多项式f,如果f的伽罗瓦群是一个可解群(Solvable group),那么这个多项式就是根式可解的,反之则不是。
当然,我还需要告诉你,可解对于一个群来说意味着什么。
考虑一个群G和其子群H, H<G。如果以下的条件成立:对于H中的元素h,和群G中元素g和其逆元a,元素g*h*a∈H,我们称H是G一个的正规子群。
这意味着,H在群G的作用下,或者说是在群G元素的共轭作用下是不变的。
更一般地说,通过正规子群H以及群G中的元素,我们可以构造一个等价关系。这需要使用陪集(Cosets)的理论,但是我们不假设读者熟悉这些,这不在我们这篇文章的范畴里。因此我们在这里就说,这个等价关系可以构造一个新的群。
当我们对整数模整数n时,通过将所有n的整数倍等同于0,可以构造循环群
;此时就是上述发生的情况。其中
的正规子群,因为
是一个阿贝尔群(a+b=b+a),而一个阿贝尔群的任意子群都是正规子群。
你还可以用一种更抽象的方式理解,考虑任意正规子群H<G,模运算对应的群记作G/H,称作G模H。
更进一步地说,如果群G包含一个嵌套的正规子群链,{e}=H0<H1<H2<…<Hk=G,使得对于任意的指标i∈{0, 1, 2,…, k-1}, Hi+1/Hi,是阿贝尔的,则我们称群G是可解的。
这也就总结出伽罗瓦理论是如何与多项式的可解性联系起来的。
我们可以找到一个有理系数多项式的例子,通过研究其对应的伽罗瓦群来证明它不是根式可解的。
例如多项式f(x)=x5-6x+3,我们可以使用平均值定理以及一些技巧来证明其对应的伽罗瓦群是五个字母的置换群S5。这不是一个可解群,所以f不是根式可解的。
小 结
伽罗瓦理论的美在于我们可以把每一个多项式和保持其根的代数信息的群联系起来。通过研究这个群,我们可以把该代数信息转换到多项式的世界里。
我之前提到我们可以使用这个理论来证明一些非常古老的问题。
作为伽罗瓦理论的副产品,“立方倍积”(Doubling the cube)和“化圆为方”(Squaring the circle)这两个问题最终被证明是不可能的。它们都与之前提到的有理数域的扩张有关。
比如,化圆为方问题等价于表明π是一个有理系数多项式的根,但是这是不可能的。因为π是一个超越数,所以不在任何一个
的有限代数域扩张中。
对于立方倍积也是类似的,但我们需要考虑
加入2的三次方根的域扩张的次数。如果你对这个问题感兴趣的话,可以自己来试试。
埃瓦里斯特·伽罗瓦毫无疑问是一流的天才。时代和环境带给他了很多困难,他的随意也在数学界被认为是非常规的,并且在某种程度上,现在也不被接受,因为数学需要非常准确和小心,避免歧义。数学家常常用“严密性”( rigorousness)来形容这种要求。
但是这不意味着他的理论是不正确的。伽罗瓦理论是正确并优美的!现在,它被应用在很多不同的数学领域,包括安德鲁·怀尔斯(Andrew Wiles)对于费马大定理的证明以及代数数论等领域。
使用群来表示另一个结构的想法是绝妙的。这一思想现在被应用在很多领域,比如在代数拓扑(Algebraic topology)中,我们可以研究一个群来得到拓扑空间的信息;在代数几何(Algebraic geometry)中,可以通过使用环论和理想理论来研究多项式的解集;椭圆曲线上的点构成了一个群,等等。
亲爱的读者,如果你阅读到这里的话,我希望你喜欢这段关于伽罗瓦的旅程。请通过评论告诉我。
感谢阅读。
本文译自Kasper Müller, For the Love of Mathematics,原文地址:https://www.cantorsparadise.com/for-the-love-of-mathematics-84bf86a8ae09
继续阅读
阅读原文