设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2903|回复: 0

FREQ过程

[复制链接]

1

主题

70

金钱

85

积分

新手用户

发表于 2018-8-24 10:31:33 | 显示全部楼层 |阅读模式

SAS系统中的FREQ过程用于列联表分析,即分析包含有一个或多个类别变量的数据集文件。此过程主要功能如下:绘制次数分配表或列联表;计算λ2 统计量、Fisher's精确性检验统计量(Fisher's Exact Test)等。

FREQ语句的一般使用格式为:

  1. PROC FREQ DATA=SAS数据集<选项列表>;
  2. BY变量列表;
  3. WEIGHT变量列表;
  4. EXACT选择统计量</选项列表>;
  5. TABLES要求列表</选项列表>;
  6. OUTPUT<OUT=数据集名>选项列表;
  7. RUN;
复制代码

PROCFREQ语句后的选项如表所示。


PROCFREQ语句后的选项列表
选项意义
FORMCHAR(1,2,7)定义列联表的边缘和中间分割线的形式,如FORMCHAR(1,2,7)=’|-+’代表列表的纵向用“|”表示,列表的横向用“-”表示,交叉处用“+”表示,此为系统默认形式
ORDER=定义某一变量下各类别的输出次序,若定义ORDER=FREQ,则次序先后按类别次数降序排列;若ORDER=DATA,则类别次序即为它们在输入文件内出现的次序;若ORDER=INTERNAL时,类别次序由英文字母先后顺序决定;若ORDER=FOUMATTED,则类别次序由外在格式决定。若此项省略,则系统默认按英文字母先后顺序输出,且缺失数据排在最前面
PAGE每一页打印一张表格
NLEVELS输出所有列表变量的水平数
NOPRINT不打印出结果

FREQ过程中主要使用的语句含义如下:

BY语句——定义分层分析变量,要求分析数据集事先按BY语句指定的变量排序。

WEIGHT语句——定义观测的加权变量(一般每个观测只代表一个数据点)。加权变量的值可包含小数,但必须为正。

EXACT语句——使用EXACT语句需要精确定义指定统计量的检验或置信度,此语句适用于数据量较少的精确计算。其后可以定义的统计量主要如表所示。


EXACT语句可定义的统计量
统计量意义
AGREE对二维列联表的尼曼检验,简单/加权的卡帕参数检验
BINOMAL对一维表格的二项式比例检验
CHISQ对一维表格的λ2拟合检验;对二维列联表的PEARSONλ2检验,似然比λ2检验和MANTEL-HAENSZELλ2检验
FISHERFISHER'S精确检验
JTJonckheere-Terpsta检验
KAPPA简单的KAPPA参数检验
LRCHI似然比λ2检验
MCNEM对2*2维列联表进行MCNEMAR'S检验
MEASURES对2*2维列联表进行PEARSON系数和SPEARMAN系数检验,估计风险比的置信度
MHCHIMANTEL-HAENSZELλ2检验
OR对2*2维列联表估计风险比的置信度
PCHIPEARSONλ2检验
PCORR检验PEARSON相关系数
RISKDIFF对2*2维列联表的比率差的置信度,若估计第一列(第二列)的比率差的置信度可用RISKDIFF1(RISKDIFF2)
SCORRSpearman相关系数检验
TRENDCochran-Armitage趋势检验
WTKAP加权KAPPA系数检验

EXACT语句斜杠(/)后可选的主要控制选项如表所示

EXACT语句后主要的可选项

选项意义
ALPHA=A定义显著性水平
MAXTIME定义FREQ过程每计算一个精确的P值的时间(单位为秒)
MC要求用MONTE-CARLO方法估计每个P值,而非计算精确P值
N=n定义MONTE-CARLO估计的最大次数,必须取整数,系统缺失值为10000
POINT对检验统计量进行点估计
SEED=NUMBER定义随机MONTE-CARLO估计的原始种子,必须取整数

TABLES语句——此语句主要用于设计频数分布表,即安排一元、二分类或多分类变量。

定义时,一般用星号连接各变量,常见定义形式如表所示。


TABLES语句一般定义形式
形式含义
TABLESAB;画次数分布表
TABLESA*B/选项;画二维交叉表,变量A为行,变量B为列
TABLESA*B*C/选项;画三维交叉表,变量A形成表的层,变量B为行,变量C为列

若需定义多个频数分布表,可用括号及两横线(--)简化语句撰写,表8-5列出了几种简化的定义形式。


TABLES语句简化定义形式
简化形式等价形式
TABLESA*(BC)TABLESA*BA*C;
TABLES(AB)*(CD)TABLESA*CA*DB*CB*D;
TABLES(ABC)*DTABLESA*DB*DC*D;
TABLES(A--C)*DTABLESA*DB*DC*D;
TABLES(A--D);TABLESABCD;

若未定义TABLES语句,则FREQ过程对数据集中的每个变量都生成一个一维频数表。在FREQ过程一次可包含多个TABLES语句。

TABLES语句斜杠(/)后可用的主要控制选项如表所示。


TABLES语句后的可选项
选项意义
CHISQ要求对每一层的齐性或独立性进行Λ2检验
MEASURES要求一系列的线性关系指标和它们的标准误
JTJonckheere-Terpsta检验
FISHERFISHER'S精确检验
BINOMAL二项分布比率,置信度,对一维表格的检验
CMH输出Cochran-Mantel-Haenszel相关统计量
ALL要求CHISQ、MEASURES、CMH统计测试及计算关系指标
AGREE要求计算且检验列联表中行变量和列变量的吻合程度
EXPECTED在独立性或齐性的假设下,输出单元频数的期望值
DEVIATION要求输出各单元期待频数和实际频数的差值
CELLCHI2要求输出每一单元对Λ2统计量的贡献
NOFREQ不输出交叉表的单元频数
NOPERCENT不输出交叉表的单元百分数
NOROW/NOCOL不输出单元行或列百分数
SCORE=RANK/TABLE/RIDIT/MODRIDIT指明用何种数据执行CMH统计检验或计算皮尔逊相关系数。若SCORE=TABLE,指分配表上行与列的次数,其他三种用来做非参数分析
ALPHA=定义犯第一类错误的概率
MISSING在计算百分数及其他统计量时包括缺失值
LIST以非交叉表来表示频数结果
NOCUM不输出累计频数和累计百分比

OUTPUT语句——产生一个包含分析结果的输出数据文件,包括TABLES语句中定义的输出统计量、有效和遗漏数据的个数。此选项后可指定的关键字的字符串如表所示。


关键字字符串
关键字意义
_AJCHI_经过连续性校正后的λ2值
_ALL_由选项CHISQ、CMH、MEASURE导出的统计量的值和有效数据的个数
_CHISQ_三个λ2检验统计量的值
_PLCORR_多元相关系数
注意:在界定包含在新数据集中的关键字前,读者必须在TABLES语句中定义其相关选项,否则此关键字的值将缺失。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表