CORR过程适用数值型随机变量的相关分析,可计算Pearson相关系数、Spearman秩相关系数、Kendall's tau-b统计量、Hoeffding's独立性分析统计量D 及Spearman、Pearson、Kendall偏相关系数。调用CORR过程进行的相关分析系统默认给出分析变量的描述性统计量分析结果、Pearson相关系数及每个变量对应的零均值检验P 值。 PROC CORR过程的一般使用格式如下: - PROC CORR DATA=SAS数据集;
- VAR 变量列表;
- WITH 变量列表;
- PARTIAL 变量列表;
- WEIGHT 变量;
- FREQ 变量;
- BY 变量列表;
- RUN;
复制代码PROC CORR语句是过程中唯一必须定义的语句,其后主要的控制选项如表所示。 PROCCORR语句后主要控制选项 | 选项 | 意义 | OUTP=SAS数据集 | 新建一个包含Pearson相关系数的SAS数据集 | OUTS=SAS数据集 | 新建一个包含Spearman等级相关系数的SAS数据集 | OUTK=SAS数据集 | 新建一个包含KendallTB相关系数的SAS数据集 | OUTH=SAS数据集 | 新建一个包含HoeffdingD统计量的SAS新数据集 | PEARSON | 计算Pearson相关系数(为系统默认) | HOEFFDING | 计算并输出Hoeffding的D统计量 | KENDALL | 计算并输出KendallTB相关系数 | SPEARMAN | 计算并输出Spearman等级相关系数 | VARDEF=DF|WEIGHT|WGT|WDF | 指定计算方差时的除数:DF(自由度N–1)、WEIGHT或WGT(权重之和)、N(观察数)、WDF(权重之和-1)。默认值为DF | COV | 计算协方差矩阵 | SSCP | 要求输出平方和与交叉积和 | CSSCP | 要求输出离差平方和与交叉积和 | NOPRINT | 关闭所有打印输出 | RANK | 要求按绝对值从高到低的次序对每个变量输出相关系数 | NOMISS | 在计算中去除包含缺失值的观测 | NOSIMPLE | 不输出变量的简单描述性统计量 | PLOTS=MATRIX/SCATTER | 指定输出散点图,如其取值为MATRIX,则输出散点图的矩阵;如其取值为SCATTER,则将输出变量的两两散点图 |
CORR过程中使用的语句含义如下: VAR语句——定义计算相关系数的变量,否则系统将计算数据集中所有数值型变量的两两相关系数。 WITH语句——和VAR语句联合使用定义计算变量间特殊组合的相关系数。VAR语句和WITH语句列出的变量分别在输出相关矩阵的上方和左边。例如,在程序中定义以下语句: 将生成X和A、Y和A、Z和A、X和B、Y和B、Z和B的相关矩阵。 PARTIAL语句——与PEARSON、SPEARMAN、KENDALL等选项一起使用,用来计算净相关系数。目的为在计算VAR、WITH语句定义的变量的相应统计量时排除PARTIAL语句中定义的变量对它们的值的影响。 WEIGHT语句——定义加权变量,仅用于计算Pearson加权相关系数。 FREQ语句——指定频数变量,变量值代表观测重复数或加权值的大小。 BY语句——定义分层变量。
|