中心极限定理(Central limit theorems, CLT)是概率论和统计学中的一个核心定理。在统计学的实践中,CLT无处不在。CLT表明,在一定条件下,若干随机变量的算术平均值的分布可以用正态分布近似。CLT简洁优美且有普遍适用性。它并不需要明确知道参与求和的随机变量的精确分布,而只要满足一些较弱的条件即可。然而和大数定律(Law of large numbers)不同,CLT并不是那么自然。我们很容易理解硬币正面朝上的频率应该逐渐接近于朝上的概率,而不太容易理解为什么即使每个变量是从偏态分布比如指数分布、卡方分布中抽取的,它们的样本均值都会近似服从正态分布。从1733年De Moivre首次得出了一个特殊版本的CLT到1935年Feller和Levy给出CLT的充要条件,无数伟大的数学家统计学家做出了巨大的贡献,共同谱写了一场跨越两百年的传奇。

1. 法国数学家的贡献

Abraham De Moivre (1667—1754)在1733年给出了CLT的雏形。这也是正态分布的第一次出现。他利用由他和James Stirling共同发展的现今被称为Stirling公式给出了二项分布的正态近似。他的工作是Jakob Bernoulli大数定律的进一步发展。尽管大数定律表明频率和概率很接近,但却无法给出均匀硬币在次抛掷中次正面朝上的概率的更加精细的刻画。然而De Moivre仅仅将这一超越时代的成果看作是二项分布的近似,而并没有意识到CLT的普遍存在。
下一个重大的突破是由Pierre-Simon Laplace (1749-1827)给出的。1812年他发表了重要的《Théorie Analytique des Probabilités》(TAP)一书。他使用由他在1785年引入的特征函数进行了论证。这一证明思路甚至影响到了100年之后的Aleksandr Mikhailovich Lyapunov(1857-1918)。尽管在1785年Laplace已得出了一些初步的结果,但非常奇怪的是直到近40年后他才得到一个较一般化的CLT。Laplace所得出的CLT是第一个一般化的结果。他的结果可应用于有界的随机变量。
Simeon-Denis Poisson(1781-1840)在1824年和1829年发表了两篇文章来讨论CLT。他希望能够对Laplace的结果给出更加严格的论证。他的贡献主要是两个方面:1. 他创造了"choses"这一概念,可以看作是现代观点下的“随机变量”的开端;2. 他给出了一些反例比如Cauchy分布来说明CLT有时并不总是成立。
这一时期的研究主要将CLT看作是个工具而不是数学对象本身。在早期,概率论并不被看作是严格的数学理论而更多的是一种常识。到了19世纪后期,很多数学家希望给出CLT更加严格的证明。这其中包括德国数学家Johann Peter Gustav Lejeune Dirichlet (1805-1859), Friedrich Wilhelm Bessel(1784-1846)和法国数学家Augustin Louis Cauchy(1789-1857)等。
Dirichlet和Bessel在他们的证明中引入了"discontinuity factor",进一步发展和完善了Poisson的证明。Dirichlet还尝试给出正态近似的误差。尽管这一尝试并不是很成功,但这是第一次对近似误差的较深入的研究。Cauchy是第一批认真地将概率论看作是纯粹数学的大数学家之一。在与Irénée-Jules Bienaymé关于最小二乘的讨论中,Cauchy建立了正态近似误差的一个上界。
关于CLT的早期证明往往不够严谨,定理所需的条件并没有清晰地给出,同时一般限定所讨论的变量有界。从1870年到1910年,俄国数学家开始在历史舞台上展露他们的才华。以Pafnuty Lvovich Chebyshev (1821-1894), Andrey Andreyevich Markov (1856-1922)和Aleksandr Mikhailovich Lyapunov (1857-1918)为代表的“St. Petersburg School”在CLT的发展史上写下了重重的笔墨。

2. 俄国数学家的贡献

Chebyshev和Markov采用矩方法进行论证,而Liapounov则采用Laplace的路径基于特征函数进行论证。Chebyshev和Markov更多地是将CLT用来说明它们所提的矩方法。而Liapounov则将CLT本身看作是一个数学对象。第一个现代意义下的严格证明是由Liapounov在1901年给出的。
在1887年,Chebyshev发表了一篇关于CLT的文章。尽管这篇文章的证明并不够完善,但他不仅清晰地陈述了定理所需的条件同时首次将CLT看作是极限定理,而之前的数学家更多地将CLT看作是误差分布的近似。在1898年,Markov指出他的老师Chebyshev的结论实际上还需要一个额外的条件,即参与求和的变量的方差不会趋于0。Chebyshev和Markov论证规范化后的和式的各阶原点矩收敛到标准正态分布对应的原点矩。也就是,他们建立了矩收敛性。
作为Chebyshev的另一个学生,Liapounov并没有延续Chebyshev和Markov的矩方法,而是回到1810年Laplace所引入的特征函数方法。尽管Laplace给出的证明不够完善,但对于他所考虑的情形,给出完整的证明并不非常困难。因而直到接近100年之后才由Liapounov给出严格的论证显得非常地奇特。而法国的大数学家Cauchy,Joseph Bertrand和Jules Henri Poincaré却没能完成这一壮举。在Liapounov条件下,Liapounov论证规范化后的和式的特征函数收敛到标准正态分布的特征函数。和Laplace不同的是,他意识到特征函数和分布函数之间的关联。实际上Levy连续性定理已暗含在他的证明中。由于Liapounov所得CLT结果非常重要,现将其陈述如下:
Liapounov CLT: 假定是一列独立随机变量,期望而方差。令。如果对于某个,下述Liapounov条件成立
则有

3. 中心极限定理历史的第三个篇章

第三个篇章发生在1920-1937。第一次世界大战结束后,概率论变得愈发重要,而CLT也已变成数学领域的一个重要研究对象。匈牙利数学家George Pólya (1887-1985)意识到CLT的重要性和普遍存在性,给出了“central”这一名字。
在1922年,芬兰数学家Jarl Waldemar Lindeberg (1876-1932)给出了CLT的一个新的证明。由于该结果的重要性,现将其陈述如下:
Lindeberg CLT: 假定是一列独立随机变量,期望而方差。令。如果对于任意,下述Lindeberg条件成立
则有
Lindeberg条件一般来讲更弱,但有时不太容易验证。可以证明Liapounov条件可推出Lindeberg条件。从而一般倾向使用Liapounov CLT。
Lindeberg给出了CLT的充分条件,而Poisson已经表明CLT有时并不成立。美国数学家William Feller(1906-1970)在转入概率论的研究不久就对CLT的充要条件进行了回答。他的结果现已被称为Lindeberg-Feller CLT,因为他使用Lindeberg条件。结论如下:
Lindeberg-Feller CLT: 假定是一列独立随机变量,期望而方差。令且满足
那么
当且仅当Lindeberg条件成立
可以论证Lindeberg条件能推出。也就是说:对于独立序列,Lindeberg条件是CLT的充要条件!
在同一年,法国数学家Paul Pierre Lévy (1886-1971)也对CLT的充要条件独立地进行了研究并得出了类似的结果。Levy对于他的工作未被给予足够的肯定表示失望“I shall never have had any luck with the Gaussian distribution”。Feller的工作受到了Levy在1925年的专著Calcul des probabilites的影响,使用特征函数作为分析工具。而Levy反而放弃了他所擅长的特征函数手段而转而采用他所新提出的concentration和dispersion作为分析手段。尽管Levy的工作发表时间晚于Feller,但他的投稿时间要早于Feller。
Feller和Levy的结果需要假定“若两个独立的随机变量的和服从正态分布则它们分别服从正态分布”。在1936年,瑞典数学家Harald Cramér(1893-1985)对这一假定进行了证明。而在1937年,Feller和Levy利用Cramér的结果更新了他们的证明。

4. 总结

我们看到尽管法国数学家尤其是Laplace对正态分布做出了巨大贡献,但这一分布却被冠上了德国大数学家Carolus Fridericus Gauss的大名。而Gauss对CLT并没有做过相关的论证。一方面Gauss关于最小二乘的工作使得正态分布更加为人所知,另一方面则可能是法国数学界对CLT的不够重视。比如法国数学界Émile Borel认为关于CLT所得结果的重要性和为此付出的努力并不相匹配,同时还认为在实际中所需的条件难以验证。
而更多数学家的工作由于通讯的不便使得优先权产生了一定争议。不论如何通过众多伟大数学家的不懈努力,对于独立随机变量序列而言,CLT的大厦终于基本建立了起来!
继续阅读
阅读原文