|
数据采用《中国统计年鉴2010》中2009年的主要城市10个经济指标
X1:总人口,单位为万人;
X2:地区生产总值,单位为亿元;
X3:地方财政预算内收入,单位为万元;
X4:地方财政预算内支出,单位为万元;
X5:固定资产投资总额,单位为万元;
X6:在岗职工平均工资,单位为元;
X7:社会商品零售总额,单位为万元;
X8:普通高等学校在校学生数,单位为人;
X9:医院、卫生院个数;
X10:三废综合利用产品产值,单位为万元。
编程法:编写程序如下
- /*初步探索分析*/
- ods graphics on;
- proc factor data=chap10.city(drop=city)
- priors=smc
- /*设定取每一变量与其他变量的复相关系数平方值为该变量的共性方差的预估值*/
- plots=(scree); /*绘制碎石图*/
- run;
复制代码 选择Run|Submit命令提交程序,以下分析主要结果输出。
表1为应用SMC方法对每个变量的共性方差的预估计值,如变量X5对应的共性方差预估值为0.83727602。表2为约相关矩阵的特征值信息表:Eigenvalue列为自上而下依次递减的特征值;Difference列为两相邻特征值的差值;Proportion列为特征值的贡献率;Cumulative列为累计贡献率,前两个因子累积贡献率为88.32%。表2的信息也可通过图3直观地显示出来。
因此本例确定选择两个主因子,修改程序如下所示:
- /*精细分析*/
- proc factor data=chap10.city(drop=city)
- priors=smc
- /*设定取每一变量与其他变量的复相关系数平方值为该变量的共性方差的预估值*/
- rotate=promax reorder
- /*进行最优斜交因子旋转, 并将旋转后的因子按从大至小的顺序排列*/
- plots=(scree initloadings preloadings loadings);
- /*绘制碎石图和原始因子旋转前、旋转后的因子载荷图*/
- nfactors=3; /*规定取前两个因子*/
- run;
复制代码
选择Run|Submit命令提交程序,除了输出以上结果外,还将给出因子旋转以后的结果,以下分析主要结果。
表4为旋转之前的两个主因子(Factor1,Factor2)的变量X1~X10上的载荷信息。此信息也可由图5直观地显示出来。
表4 因子载荷矩阵 | Factor Pattern | | Factor1 | Factor2 | X7 | 0.97463 | -0.05053 | X2 | 0.97271 | -0.14544 | X4 | 0.95484 | -0.244 | X3 | 0.94792 | -0.28859 | X6 | 0.87546 | -0.36049 | X5 | 0.86888 | 0.24126 | X1 | 0.86209 | 0.3542 | X9 | 0.85864 | 0.27382 | X10 | 0.15721 | -0.01742 | X8 | 0.51164 | 0.51891 |
表6为主因子Factor1和Factor2解释的原始变量的方差。表7为最终共性方差的值。
表6 主因子解释方差 | Variance ExpIained by Each Factor | Factor1 | Factor2 | 6.994663 | 0.824691 |
以上为因子旋转前提取出的两个主因子的信息,以下分别分析由正交转换法和最优斜交旋转以后的两个主因子信息。
表8为应用正交转换法的旋转矩阵。表9为旋转后两个因子Factor1和Factor2的因子载荷值,此表的信息也可通过图10显示出来。发现经过正交旋转后,两个主因子的载荷值都集中在了坐标的第二象限,则并不方便分别解释两个主因子。
表8 正交转换矩阵 | Orthogonal Transformation Matrix | | 1 | 2 | 1 | 0.81047 | 0.58578 | 2 | -0.58578 | 0.81047 |
表9 转换后因子载荷矩阵 | Rotated Factor Pattern | | Factor1 | Factor2 | X3 | 0.93731 | 0.32137 | X6 | 0.9207 | 0.22065 | X4 | 0.9168 | 0.36157 | X2 | 0.87355 | 0.45192 | X7 | 0.81951 | 0.52997 | X10 | 0.13762 | 0.07797 | X1 | 0.49121 | 0.79206 | X9 | 0.53551 | 0.72489 | X8 | 0.11071 | 0.72027 | X5 | 0.56288 | 0.7045 |
表11为应用最优斜交旋转的旋转矩阵。表12为斜交旋转后Factor1、Factor2和5个变量之间的因子载荷。得到的因子相对正交旋转有较大的改进,主因子1在变量X2、X3、X4、X6、X7上载荷较大,而主因子2在变量X1、X5、X8、X9上载荷较大。此表的信息也可通过图13反映出来。根据此表可得出主因子1的表达式:
表11 斜交旋转矩阵 | Procrustean Transformation Matrix | | 1 | 2 | 1 | 1.11243 | -0.41132 | 2 | -0.40918 | 1.136327 | 表12 旋转后的因子载荷矩阵 | Rotated Factor Pattern(Standardized Regression Coefficients) | | Factor1 | Factor2 | X6 | 1.029984 | -0.13842 | X3 | 1.004907 | -0.02201 | X4 | 0.961601 | 0.03652 | X2 | 0.867776 | 0.166814 | X7 | 0.766256 | 0.286793 | X10 | 0.133649 | 0.034608 | X8 | -0.18921 | 0.836067 | X1 | 0.245212 | 0.755017 | X9 | 0.329864 | 0.652748 | X5 | 0.372652 | 0.615505 |
类似可得到主因子2的表达式。在本例中我们采用了主分量因子分析方法,得到了两个能高度概括原始数据信息的主因子,同时对因子进行了最大方差旋转和斜交旋转,发现斜交旋转都能得到较优的结果,最后可评定第一主因子在地区生产总值(X2)、地方财政预算内收入(X3)、地方财政预算内支出(X4)、在岗职工平均工资(X6)、社会商品零售总额(X7)上载荷较高,可将其概括为财政经济发展水平,第二主因子在总人口(X1)、固定资产投资总额(X5)、普通高校在校人数(X8)和医院、卫生院个数(X9)上载荷较高,可将其概括为城市发展规模因子。
|
|