- 以 SAS 软件为例,正态分布检验常见的是W 检验与 K-S 检验等形式,其检验的流程基本相似,不同的是检验统计量不同。以 W 检验流程为例,正态检验流程见图所示:
当样本空间N<2 000,常用W 检验;当 N≥2 000时候,常用 K-S 检验。当模型符合正态分布,则可后续计算正态分布模型参数,但不符合正态分布模型时,可将数据导成直方图,通过直方图可见,整体拟合不符合正态分布,但是将整体分成两个部分,分离的两个部分初步判断均符合正态分布,称为混合正态分布。 - 混合正态分布模型的参数计算较复杂,可在Matlab中调用mle()函数求解
求解混合正态分布参数的步骤流程如下:
步骤 1:定义随机变量矩阵。
步骤 2:定义混合正态分布函数,以两类为例,定义语句为 mixedpdf=@(x,mu1,mu2,s1,s2,rho)(rho*normpdf(x,mu1,s1)+(1-rho)*normpdf(x,mu2,s2);语句中 x 为变量 X 矩阵中数值,mu1,mu2 为两类正态分布均值,s1,s2 为两类正态分布方差,rho 为第一类的比例。根据随机变量的分布情况,拟定初始均值 mu1, mu2和比例函数 rho,尽量靠近附近,方差较难估计,可人为地根据模型情况,初步拟定比例函数 rho 值,由公式(4)分别计算两个正态分布的均值mu1,mu2 和方差 s1,s2。
步骤 3:调用函数 mle(),将步骤 2 中的 mu1,mu2,s1,s2,rho 值带入程序。
[phat1,pci1]=mle(testdata,′pdf′,mixedpdf,′start′,[mu1,mu2,s1,s2,rho])
步骤 4:当提示函数 mle()未收敛,根据步骤 3 计算出的参数 mu1,mu2,s1,s2,rho,重复步骤 3,直到函数 mle()计算结果收敛。
- 运行SAS 软件,对 113 人机械制图的成绩统计检验,正态分布参数检验结果见表,成绩如图所示。
由表可见,根据正态分布判断,Pr<0.05,不符合正态分布。从直方图显现不符合正态分布,根据其两个峰值,初步判断其为混合正态。因此按照混合正态分布特征分析。采用基于最大似然估算法混合正态分布分析,计算的结果如下表所示,直方图如下图所示
|