玩控 发表于 2019-3-19 14:32:09

统计软件SAS学习入门的基本细节总结


统计软件SAS学习入门的基本细节总结
1、SAS的数据库术语中,最常用的两个术语是:观测 (observation) 和变量 (variable)。一个研究对象,如一个人,一辆车,被称为观测;而一个人的性别、年龄、身高、体重等,一辆车的颜色、价格、排量等信息,被称为变量。因此,变量也可以理解成是观测所拥有的某些属性性质。

2、一段SAS程序编写,分为DATA步和PROC步,DATA步主要是建立或指明接下来分析的数据集是哪个,同时还可以对数据集进行调整修改等操作。PROC步则是表明接下来的分析操作,采用什么统计方法,结果如何输出等。

3、SAS中的每句语句编写完成后,需要用分号(;)来表示结束,DATA步和PROC步都采用RUN来表示该步完结。

4、SAS程序并不区分大小写,但在结果输出时,会根据你输入字母大小写情况,输出相应的大小写字母。

5、SAS程序编写时,有一类输入语句,称为全局声明 (global statement) 。它不仅作用于你现在编写的那段程序,而且作用于你此次关闭SAS前所有的程序过程,除非你接下来另行修改。

6、在给变量、数据集命名时,注意所有的名字都不能32个字符,而且必须以字母或下划线(_)开头。名称中只允许出现字母、数字和下划线,不允许出现空格、破折号。

7、SAS数据集中的数据,只存在两种类型:字符型 (character) 和数值型 (numeric)。数值型数据在SAS中的默认储存长度是8个字节。

8、DATA步的输入时,通常要采用INPUT语句来指明所需输入的变量名。在输入数值型变量的变量名,如身高、体重等,只需直接输入数据集中对应的变量名(Weight, Height)即可,但如果变量名所包含的是字符型数据,如性别(Male, Female)时,则需在变量名后加上$,如(Sex$)。INPUT语句在输入不同的变量名时,相互之间需间隔一个或者几个空格。

9、SAS语句编写时,有时需要加入一些解释性语言来增进理解,也便于下一次的阅读修改。我们通常星号*开始,用分号;来表示结束。

10、在数据集建立时,我们需要注意缺失数据的表示。在SAS建立的数据集中,我们一般采用空格来表示缺失的字符型数据,用英式句号.来表示缺失的数值型数据。

飞天的猪头 发表于 2019-3-19 16:52:59

感谢分享
页: [1]
查看完整版本: 统计软件SAS学习入门的基本细节总结