输入、输出数据集选项 |
选项 | 意义 |
DATA=SAS数据集 | 定义包含进行聚类的观测的输入数据集 |
OUTTREE=SAS数据集 | 新建一个供TREE过程调用输出聚类结果的树状图的数据集 |
聚类方法细节选项 |
选项 | 意义 |
METHOD=算法 | 指定聚类方法: WARD(离差平方和法)、AVERAGE(类平均法)、CENTROID(重心法)、COMPLETE (最长距离法)、SINGLE(最短距离法)、MEDIAN(中间距离法)、DENSITY(密度法)、FLEXIBLE(可变类平均法)、TWOSTAGE(两阶段密度法)、EML(最大似然法)、MCQUITTY(相似分析法) |
STANDARD | 对变量实施标准化 |
NONORM | 阻止距离被正态化成均值为1或均方根为1 |
NOSQUARE | 阻止CANDISC过程在METHOD= AVERAGE、CENTROID、MEDIAN、WARD方法中将距离数据平方 |
MODE=N | 当合并两个类时,规定对被指定的众数类中的每类至少有N个成员。此选项只能与METHOD= DENSITY或 TWOSTAGE联用 |
TRIM=P | 要求从分析中删去那些概率密度估计较小的点。P的有效值为0≤PMETHOD= SINGLE中 |
DIM=N | 当规定METHOD= DENSITY或TWOSTAGE时指定使用的维数。N值必须设置为大于或等于1。如果数据是坐标数据,默认值为变量的个数;如果是距离数据,默认值为1 |
HYBRID | 要求用WONG混合聚类方法,其中密度用K均值法的初始聚类分析中的均值计算得到。这个选项只能在规定METHOD= DENSITY或 TWOSTAGE时使用 |
K=N | 指明K最近邻估计法中近邻的个数。近邻个数N必须大于或等于2且小于观察数 |
R=N | 指明均匀核密度估计法的支撑球半径。N值必须设置为大于0 |
NOTIE | 阻止CLUSTER过程在聚类历史过程中检查每次产生的类间最小距离连接(TIES)的情况。规定这个选项以便减少过程执行的时间和空间 |
打印输出选项 |
选项 | 意义 |
RSQUARE | 输出R 2 和半偏R 2 |
RMSSTD | 输出每一类的均方根标准差 |
CCC | 输出在均匀的原假设下判断聚类分成几类合适的一种立方聚类准则统计量CCC和近似期望值R 2 。同时打印输出选项RSQUARE有关的R 2 和半偏R 2 。此选项不适合于METHOD=SINGLE,因为该方法容易删掉分布的结尾部分 |
PSEUDO | 输出伪F 统计量(标志为PSF)和伪t 2 统计量(标志为PST2)。当分类数目不同时,它们有不同的取值 |
SIMPLE | 打印简单统计量 |
STD | 标准化变量 |