“我的附庸的附庸,不是我的附庸”出自查理·马特改革中的土地分配制度,体现了西方封建制度以土地关系为纽带的封主和与附庸的臣属关系。相似地,凭借我们朴素的直观感受认为:AB比较有意义,BC比较有意义,AC比较一定有意义吗?带着这样的疑问,我们深入下来看看。

上节课,我们详细剖析了定量资料两样本之间的差异分析(戳这里回顾上节内容相信大家一定已经对t检验有了初步了解

现在再简单地复习一下,定量资料是指对观察对象测量指标的数值大小所得的资料,表现为数值大小,上节课我们看过了病毒载量(IU/mL),除此之外常见的定量资料有身高(cm),体重(kg),白细胞计数等等各种实验室指标。

例如上次课我们讨论的治疗组与未治疗组新冠肺炎患者的病毒载量情况,在进行了正态性检验和方差齐性检验后,最终采用了两独立样本t检验。

可是现实情况我们常常需要对两组以上的定量资料进行比较,那么之前所学的t检验将不能再凑效。

现在,我们引入两种新治疗方案BC,欲比较两种治疗方案与金标准治疗方案A三种治疗方案在治疗新冠肺炎患者后病毒载量水平的变化,以此评价药物疗效有无差异,那么应该采用什么方法呢?

这里引入我们的第一个重点,单因素方差分析(One-way ANOVA
在三种治疗方案A,B,C对于新冠肺炎患者病毒载量水平影响的这个例子中,60位患者随机分配至3个组,不同的组间差异仅在于治疗方案的不同,因此为一种完全随机的单因素设(患者随机抽取,处理因素仅为治疗方案不同——单因素)。
有单因素设计,那么自然也会有两因素设计和多因素设计,在此暂不对后两者进行描述
同样地,对于单因素方差分析,我们同样需要满足:1、独立性;2、正态性。3、方差齐性。
现在,我们已经对问题的资料类型(定量资料)和设计类型(完全随机设计)有了了解,并且每位患者接受药物处理的事件本身也是独立的。
因此,当数据满足正态性及方差齐性时,应采用单因素方差分析;当数据不满足方差齐性时,采用welch检验
若数据不满足正态性,则需要直接采用Kruskal-Wallis检验,为秩和检验的一种。
当数据类型为配对设计,即数据之间不互相独立时例如,研究者欲比较在给予治疗方案A,B,C,后组内的60位患者第1天,第3天,7天的病毒载量情况,显然每个病人之间的治疗是互相独立的。
但1,3,7天病毒载量的情况却不是相互独立的,因此在符合正态性检验下应采用单因素重复测量方差分析,若不符合,则应当采用Friedman致和检验,为避免小伙伴们弄晕,已经附上流程图供参考拉~
最后,又来讲到组间比较的重头戏两两比较了。
前边我们对于多组比较各种方式的统计检验,当P<0.05时,我们尚且只能得出结论:多组间的总体均数不全相等
也就是说,在前边的这个例子中,我们只能知道治疗方案A,B,C患者的病毒载量水平不是都一样的,但没法知道究竟是哪组和哪组有差别,这时候就需要进行下一步的两两比较了!
常见的两两比较检验方法有LSD、Bonferroni、Dunnett、Tukey、SNK法等。
每种方法适用的情况略有区别,例如LSD检验常用于探索性研究,α值不需要校正,假阳性率较高;
Bonferroni法应用场景广泛,其校正α值=α/比较次数,当组别超过5组时,因其比较次数较多校正α值低,故其比较保守;
Dunnett法常用于1 个对照组和多个实验组的均数差别的多重比较;
Tukey法则多用于样本数量相同时的组间比较; 
SNK法的灵敏度介于 LSD 法与 Turkey 法之间,等等。
有同学问了,那么为什么不能采用两样本t检验的方法进行比较呢,无非是A vs B,B vs C,A vs C不就可以了吗?答案是否定的。
首先,我们来了解一下I类错误的概念:I 类错误是指拒绝了实际上成立的H0,其概率用α来表示,而II类错误为不拒绝实际上不成立的H0,其概率通常用β表示。
拓展一下,我们通常说的把握度或者检验效能,即为1-β。
我们回到为何不能用两样本t检验来两两比较,一般我们常规对α定义为0.05,大家可以回忆一下之前我们的文章《P值为何如此多娇,引无数医生竞折腰?》,也就是说当组间差异检验的P值<0.05,那么我们就要推翻H0,认为总体的组间差异有统计学意义。
这时候犯I类错误的概率就是0.05(如果总体确实是没有差异的,就因为P<0.05就被我们判定为有差异了),不犯I类错误的概率就是1-0.05=0.95。
如果在三组中进行两两比较,那么每一次检验不犯I类错误的概率都是0.95;那三次都不犯I类错误的概率即为(1-0.05)3=0.8574。
因此犯I类错误的概率为1-0.8574=0.1426。
这个错误概率远大于0.05,是我们不能接受的。
实际上,随着比较次数的增多,I类错误的概率会随之增大,远超过一开始我们所规定的0.05。
这也是为什么我们在进行多组比较时,需要对α进行校正的原因。下面我们再从具体实际操作中体验一下。
数据仍然是A,B,C三个治疗方案一共60位患者,采用了的是上一次推文我们用到的数据并加上了第三组患者的数据。
首先仍然对三个分组的患者进行正态性检验,操作上文已经提到过,这里操作不再赘述,直接po上结果,可见三组患者数据均满足正态性。
在“分析”→“比较平均值”→“单因素ANOVA检验”中,我们分别把“病毒载量”与“分组”纳入“因变量列表”和“因子”中,并在事后比较中选择合适的两两比较方法,“选项”中勾选“描述”,“方差齐性检验”,“韦尔奇”(即Welch)。
最后展示结果:我们能看到,各组间方差齐,因此我们可以沿用我们在事后比较中的两两比较方法。单因素ANOVA检验提示组间存在差异。
在方差不齐时考虑Welch检验的检验结果:
下图“LSD”,“Bonferroni”,“Games-Howell”为两两比较的检验方法,而sig对应其不同分组的两两比较结果,其中“Games-Howell”为方差不齐时所参考结果。
最后,我们得出结论,治疗方案A,B,C(1,2,3)组间差异具有统计学意义(F值64.589,P<0.001)。
两两比较采用LSD检验方法时,治疗方案A,B,C组两两间均有差异(P<0.05)。
回到一开始的问题,由此可见,AB比较有意义,BC比较有意义,AC比较确实不一定有关系,这其中考量的因素不但有抽样误差,变量的分布类型,还有两两比较的方法差异等等。
好的,今天关于定量资料的组间比较就聊到这,下次推文我们再来讲讲分类资料的差异比较,相比于今天的内容就简单多了。
希望大家感受和梳理一下整个定量资料比较的过程,我们将在下一次推文介绍分类资料的组间比较后,再一次回顾不同资料类型的组间比较和常见问题。
END
撰文长歌
审核丨Epione老师
责编丨小张老师
往期推荐
继续阅读
阅读原文