本文选自《中国统计》2021年第4期文章,原文已获出版社和作者授权。
说到统计学,人们往往想到一堆堆的公式,一套套的理论和方法。但很多人不知道,其实它在我们的日常生活里面一直扮演着重要角色,影响到人们的衣食住行的方方面面,它是一门实实在在活着的学问。这些复杂的理论和公式是如何发挥作用影响人们的生活的?本文将从一个侧面介绍这个鲜活的统计学。
在人们的社会生活中,要经常对各种各样的事物进行计数或度量。很多情况下,要完全精确地计数或度量会很困难,或者花费巨大,这时往往采取统计推断的方法。对同一问题,推断的方法很多,到底采取何种方法,需要有关各方确定下来。最简单的方法就是按照权威机构颁布的标准执行。将一些统计方法,以规范性文件的形式固定下来,并由权威部门颁布, 供人们在生产、贸易以及科学研究等社会活动中加以引用,这就是统计方法的标准化。这些规范性的文件依照成熟程度和重要性被称为条例、规范或者标准。
依照条例、规范或者标准的适用范围的不同,所谓的权威部门也不同。国家标准化管理委员会颁布国家标准,部委相关机构颁布行业标准,军队相关部门颁布军用标准,一些国际标准化组织颁布国际标准。大家最熟悉的国际标准化组织可能是国际标准化委员会(ISO),除此之外还有国际电工委员会(IEC),国际电信联盟(ITU),欧洲标准组织(CEN),国际原子能机构(IAEA),国际民用航空组织(ICAO),北约标准化协议(NATO)和国际空运联合会(IATA)等等组织。
中国国家标准化委员会现有510个技术委员会和8个工作组。其中统计方法直接有关的委员会是编号为TC21的全国统计方法应用标准化技术委员会,以及统计方法较多的编号为TC24的全国电工电子产品可靠性与维修性标准化技术委员会。全国统计方法应用标准化技术委员会目前管理近70个标准。
在人们的生产经营和经济贸易中,经常用到抽样检验标准。这是因为在大宗贸易中,人们不能对所有产品都逐个检验。一个原因是有些产品是一次性使用的,检验是破坏性的,经过一次检验就没有价值了。另一个原因是由于有些产品数量很大,没有足够时间或财力进行全面检验。这种情况下就需要进行抽样检验。根据产品的性质不同,数量不同,采用的抽样检验标准是不一样的。例如按接收质量限检索的逐批检验抽样计划,计数序贯抽样检验程序,不合格品率的计量抽样检验程序,单水平和多水平计数连续抽样检验程序,不合格品率的计量标准型一次抽样检验程序,粒度均匀散料抽样检验通则,产品质量监督计数一次抽样检验程序及抽样方案,产品质量平均值的计量一次监督抽样检验程序及抽样表,孤立批计数抽样检验程序及抽样表,产品质量监督小总体计数一次抽样检验程序及抽样表等等。
除了抽样检验标准外,一些通用的统计方法也被纳入到标准中。例如在成对观测值情形下两个均值的比较,正态分布均值和方差的估计与检验,正态分布均值和方差检验的功效,正态性检验,正态样本离群值的判断和处理,指数分布样本离群值的判断和处理,中位数的估计等等众多基础统计方法都被确定下来成为了国家标准。
还有一些其它学科领域使用统计方法成为该领域的国家标准。例如声学领域中的一些标准,听阈与年龄关系的统计分布,确定和检验机器设备规定的噪声辐射值的统计学方法,单台机器标牌值的确定和检验方法,成批机器标牌值的确定和检验方法,声学道路表面对交通噪声影响的测量等等。还有一些与产品质量可靠性相关的标准。例如维修性评价的统计方法,标准样品定值的一般原则和统计方法,寿命试验和加速寿命试验的图估计法 (用于威布尔分布),寿命试验和加速寿命试验的最好线性无偏估计法(用于威布尔分布),为估计批 (或过程) 平均质量选择样本大小的方法,可靠性测定试验的点估计和区间估计方法 (指数分布)等等。
我们以GB/T4885—2009《正态分布完全样本可靠度置信下限》为例说明国家标准的主要组成部分。首先,标准的字母标志GB/T表示这是一个推荐性使用的国家标准,它的名字显示了标准的内涵。标准一般包括前言、范围、规范性引用文件、术语定义和符号、主要内容和附录等内容。前言主要讲述该标准的编制过程、发展脉络和编制单位等内容。范围表明该标准的适用范围。术语定义和符号要标明主要内容中要使用的重要符号。主要内容就是该标准的核心。在这个标准的主要内容章节里具体给出了正态分布完全样本下单侧和双侧可靠度置信下限的计算方法。在其中给出了理论公式,同时对于不好计算的部分给出了数值表,可方便工程技术和管理人员使用。
我们通常会用一个恰当的位数表示一个测量值。比如我们会说我们的身高为176厘米,但其实我们的实际身高可能是176.35厘米,会根据目的调整给出的数值位数。通常我们会使用四舍五入的方法进行取舍。但四舍五入不是最科学的方法,给出的数值有时不是最接近真值的表示方法。别小看这个舍和入,有时就是这个舍和入会导致较大的纠纷。关于这方面有一个很有意思的标准,就是GB/T8170-2008《数值修约规则与极限数值的表示和判定》。数值修约简单地说就是用一个类似于四舍五入的方法把一个测量值或计算值用合适的位数表示的过程。用该标准里的话说就是“省略原数值的最后若干位数字,调整所保留的末位数字,使得最后所得到的值最接近原数值的过程”。该标准规定了对数值进行修约的规则、数值极限数值的表示和判定,以及将测定值或其计算值与标准规定的极限数值作比较的方法。在该标准中规定若舍弃的数字最左边一位是小于等于4或者大于等于6,则按4舍6入进行。若舍弃的数字最左边一位是5且跟有非零数字则入1,比如12.5003,若保留整数,舍掉的是5003,,5的后面跟有003,则需要入1,最后的数字为13。若舍弃的数字最左边一位是5且后面无非零数字,则要根据前面的一位的奇偶性考虑是舍是入,例如对于12.5,若保留整数位则为12,对于11.50,若保留整数位则需要入1,结果同样为12。另外标准还规定关于两个数值的比较方法以及连续计算的舍入程序。
在进行实际数据分析工作的时候,我们有时会遇到不理想的数据,特别是有个别数据与其它数据相比显得不那么合群,这样的数据我们称之为离群值。比如我们在查看一个企业按月产品产量的时候,若有一个月的产品产量明显比其它月份高几倍,则我们就会认为这个特殊的月份是离群值。如果去掉这些离群值,则分析结果可能会很不一样,我们是否能够随意去掉这些数据呐?这当然是不可以的。去掉或保留这些数据要有根有据,有关这方面有一个很有用的国家标准,这就是GB/T4887-2008《数据的统计处理和解释 正态分布离群值的判定和处理》。在这个标准中规定了几种情形下离群值的判定规则和处理规则。按照这个标准不会轻易剔除一个值,通常要给出一个比较小的犯错误概率。如果一个看似离群值,但通过统计检验发现并不是很显著,则不能剔除这样的值,除非找到更加充分的证据认为这个数据是错误的。标准规定,即使对统计判定检出的离群值,也应尽可能寻找技术上和物理上的原因作为处理依据。若确实找到了产生这个离群值的技术原因则可以剔除或修正,若没有找到技术原因则需要应根据实际问题的性质慎重考虑判定处理错误可能带来的风险。
我们坐火车去旅行,会遇到很多意想不到的人,会看到很多意想不到的风景,我们的日常生活充满了不确定性。为描述解释和分析这种带有不确定性的事物,人们发展了兼具实用性和基础性的统计学。为了更多的人可以运用这些高深繁杂的统计学方法,人们把统计方法进行标准化处理,从而可以运用科学的方法处理大大小小的社会活动和经济活动。统计方法可以深入到各行各业以及社会生活中。我们相信,随着5G通信、特高压、高铁、新能源、大数据、人工智能和工业互联网等新技术领域的进步以及生活方式的变化,未来的统计学会更加鲜活更加灵动。
作者简介
房祥忠教授
在北京大学数学科学学院曾任概率统计系主任,中国现场统计研究会理事长,IMS-China主席。现兼任教育部统计学类教学指导委员会主任委员,中国统计学会副会长,全国应用统计专业学位研究生教育指导委员会委员,北京企业评价协会理事长等职。研究兴趣包括:生存分析,可靠性,纵向数据,基尼系数,时空统计,人工智能中的统计方法等。在《中国科学》《JRSP》《Reliability on IEEE》等期刊发表论文50余篇。曾获国防科技奖二等奖(2011)、北京市科技进步二等奖(2002)和教育部第六届高等教育国家级教学成果二等奖(2012)。
敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。
编辑|赵霖琳
继续阅读
阅读原文