CCouQPvx 发表于 2018-8-23 10:52:47

单因素方差分析

本帖最后由 CCouQPvx 于 2018-8-23 11:05 编辑

方差分析的目的主要是考察某一个因素(或者某几个因素的交互作用)是否对我们关注的变量产生显著的影响。它可被用于分析既定的数据,如考察5个年龄阶段(从15~65岁,每10年划分为一个阶段)人群的舒张血压是否有显著的差异;但多数情况下方差分析被用于先进行严谨的试验设计,通过试验获取的数据。因此首先简介试验设计的基本要素:
研究变量——又称因变量,是试验观察的主要指标。一次试验时可以记录下多个观察指标,相应的方差分析可同时设置多个因变量。
因素和水平——试验的因素可以是品种、人员、方法、时间、地区等,因素所处的状态称为水平。在每一个因素下面可以有若干水平。例如,某工厂的原料来自4个不同地区,检验用不同地区的原料生产的产品质量是否有显著差异,“地区”就是因素,4个地区便是“地区”这一因素的4个水平。当某个主要因素的各个水平间的主要因变量的均值差异有显著的统计学意义时,必要时可进行两两水平间的比较。
因素间的交互作用——多因素的试验设计有时需要分析因素间的交互影响。两个因素间的交互影响称为一级交互影响,如因素A与因素B的一级交互影响可记为A×B,三个因素间的交互影响称为二级交互影响,如因素A与因素B与因素C的二级交互影响可记为A×B×C。当交互影响项呈现统计不显著时,表明各个因素独立;当呈现统计显著时,就需要列出这个交互影响项的效应,以助于做出正确的统计推断。
单因素方差分析按照试验设计时受试对象的抽取或分组的随机程度可分成两类:
完全随机设计——从符合条件的总体中完全随机地抽取所需数目的受试对象,再将全部受试对象完全随机地分配到k 组中去。此时受试对象与试验因素间无直接联系。
组内完全随机设计——按照试验因素的k 个水平将全部受试对象划分成k 个子总体,再分别从k 个子总体中完全随机地抽取所需数目的受试对象。此时试验因素的各个水平决定了受试对象各自应该归属的组别。
设因素A有k 个水平,在每一个水平下考察的指标可以看成一个总体,即k 个水平代表了k 个总体,现假定:
每一总体均服从正态分布;
每一总体的方差相同;
从每一总体中抽取的样本相互独立。
以下检验各总体的均值是否相同,设第i 个总体的均值为μ i ,则:
原假设,备择假设不全相同
设从第i 个总体获得样本量为n i 的样本观察值为,各样本间相互独立。样本观察值y ij 可看成是来自均值为μ i 的总体,这样y ij 就是其均值μ i 与随机误差ε ij 叠加加而产生的。上面我们已经假定在A i 水平下的y ij 服从分布,则有。因此单因素方差分析的统计模型如下:
定义各个μ i 的加权平均为总平均,其中,于是为因素A在第i 水平的主效应,也简称为A i 的效应,同时也表明第i 个总体的均值是一般平均与其效应的叠加。效应间有关系。此时,单因素方差分析的统计模型可改写成:
所要检验的原假设也可改写成:
造成各y ij 间差异的原因可能有两个:一个可能是原假设H 0 不真,即各水平下总体均值μ i (或水平效应a i )不同,因此从各总体中获得的样本观察值也就有差异了;另一个可能是H 0 为真,差异是由于随机误差引起的。为了进一步定量分析这些差异,我们需要把这些差异表达出来。将组内观察值的平均值表述为: ,其中,即组内样本观察值的平均值等于组内总体均值加上组内随机误差的平均值。将所有样本观察值的平均值表述为:,其中,即所有样本观察值的平均值等于总平均(各组均值的加权平均)加上所有随机误差的平均值。于是每一个观察值y ij 与总平均的离差可以分解成两部分:
其中.称为组内离差,即得到:
说明组内离差仅仅反映了随机误差。而称为组间离差,代入得到:
说明第i 组间离差除了反映随机误差外还反映了第i 个水平的效应a i 。
各y ij 间总的差异大小用总离差平方和S T 表示:
由随机误差引起的数据间的差异用组内离差平方和表示,也称误差离差平方和S e :
由于组间离差除了随机误差外,还反映了效应的差异,故由于效应不同引起的数据差异可以用组间离差平方和表示,也称因素A的离差平方和S A :
将总离差平方和进行分解:
其中 。证明了总的差异=组内差异+组间差异。由于
又由χ2 分布的可加性可知:
还可证明,在H 0 为真时,即各组效应a i 都为0时
因此可采用统计量:
来检验假设,当 时,接受原假设;否则,拒绝原假设。
当经过F 检验拒绝原假设,则表明因素A是显著的,即k 个水平对应的指标均值不全相等,但是在因素的不同水平之间不一定存在显著差异。实际上,当方差分析的结论是因素A显著时,还需要我们进一步去确认因素A的哪些水平间的效应值有显著差异。同时比较任意两个水平均值间有无显著性差异称为多重检验,即要以显著性水平α 同时检验以下 个假设:
均值间的多重比较根据所控制误差的类型和大小有许多具体方法,如成组比较t 检验法、Bonforroni t 检验法等,以下具体介绍多重比较检验方法。
t 检验和Bonforroni检验——当考察因素有k 个水平时,对任意两个水平均值间的差异的显著性检验用如下t 统计量:
两两比较的次数共有 ,因此,共有m 个置信水平,每次比较的显著水平:t 检验的方法取α ,完成所有比较后的整体显著水平等于 ,当比较次数m 越大,试验误差就越大;而Bonforroni检验的方法取α /m ,完成所有比较后的整体显著水平等于 ,即最大试验误差率小于α 。
LSD检验——既可以通过两两比较的显著水平的特定限制来控制最终的试验误差率,也可以通过两两比较的绝对差异界限来判别显著性。最容易想到的这个界限就是在两两比较中采用的t 检验法而得到Fisher最小显著差(LSD)为:
当 时,则P ≤α 。
SNK检验和Duncan检验——属于多级检验法,使用多级检验可以获得同时检验的更高效率。多级检验分为步长增加法和步长减少法,SAS系统采用步长减少法。当因素有k 个水平时,即有k 个均值需要比较,检验步骤为:
将均值由大到小排队,即 。比较 与 是否有显著差异,此时跨度a =k 。若两者之间无显著差异,说明其他均值之差比它小的任何两个水平均值之间的差别也不显著,因此比较停止;反之继续进行下一步。比较 与 与 是否有显著差异。此时这两个比较的跨度a =k −1。若两水平效应值差异不显著,则停止比较。若每一步都有不满足停止比较的对比组存在,最后应到达跨度为2,以至所有需要比较的相邻两水平均值全部比较完。多级检验在作每一级比较时,通过控制比较误差率γ a 的显著水平来实现其最终要控制的试验误差率。γ a 在每一级比较时可能是不同的,它是跨度a 和整体试验误差率α 的函数,即 。另外要注意的是,γ a γ其实就是每一级比较时特定统计量分布的显著水平。常用的两种方法是SNK检验和Duncan检验。它们的检验统计量为q :
其中,a 是 之间的跨度值,q 分布的自由度是a 和n −k ,显著水平为γ a 。SNK检验和Duncan检验的区别主要在于γ a 取值:SNK检验γ a =α (注意当比较次数很大时,最大试验误差率将趋向于1);Duncan检验 。
多重比较方法的选择首先要注意每种方法适用的试验设计条件,其次要关心所要控制的误差类型和大小。例如,某因素有10个水平,若采用常规的t 检验进行多重比较,共需要比较的次数为 次,即使每次比较时都把第一类错误α 控制在0.05水平上,但经过45次多重比较后,犯第一类错误的概率上升到 。从中我们可以看到选用t 检验法进行多重比较,仅仅控制了每次比较的显著水平,却大大增加了整体的显著水平。
下面是所要控制的几种误差类型和选用的检验方法:
第一类误差率——即犯第一类错误的概率α 。
比较误差率——即每一次单独比较时,所犯第一类错误的概率,可使用T法、LSD法、DUNCAN法。
试验误差率——即完成全部比较后,整体所犯第一类错误的概率。
完全无效假设下的试验误差率——即在原假设完全无效下的试验误差率,可使用SNK法。
部分无效假设下的试验误差率——即在原假设部分无效下的试验误差率。
最大试验误差率——即在原假设完全或部分无效下,完成全部比较后所犯第一类错误的最大概率,可使用BON法、SIDAK法、SCHEFFE法、TUKEY法、GT2/SMM法、GABRIEL法、REGWQ法、REGWF法、DUNNETT法。
页: [1]
查看完整版本: 单因素方差分析