变量属性包括:变量名、变量类型、变量标签与值标签以及变量格式等。 (1)变量名。 ●每个变量名都是唯一的,变量名不能复制到其他变量上去。 ●变量名中不可以有空格。 ●变量名允许有64字节长,首写必须是24个英文字母或以下符号之一:@、#或$。 除了首写字符外,随后的字符可以是字母、数字、小数点或其他任意非标点符号的字符。64个字节意味着可以是64个单字节字符,如英文、法文、德文、西班牙文、意大利文、俄文、希腊文等,或者32个双字节字符,如中文、日文、朝鲜文等。●以“#”为首写的变量名特指临时变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。●以“$”为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$”为首写。系统变量存储了SPSS运行时的许多参数信息,例如:系统缺失值、系统读取的记录行数、当前系统时间等。常见系统变量如表所示。 SCASENUM | 当前记录号 | SSYSM1S | 系统缺失值 | SJDATE | 系统日期的数字表示,即与1582年12月14日差 | SDATE | 系统日期,格式:dd-mmm-yy | SDATE11 | 系统日期,格式:dd-mmm-yyyy | STLME | 系统时间 | SLENOTH | 当前页面长度 | SWIDTH | 当前页面宽度 |
●避免以“.”作为变量名结尾。因为英文句点有时会作为命令的结束标志,定义这样的变量容易引起歧义。只能在Syntax语句中定义以英文句点结尾的变量名。 ●避免以“_”作为变量名结尾。因为下划线一般作为由程序或命令自动生成的变量名的结尾,为避免命名冲突,最好不要以下划线作为用户定义变量的结尾。 ●变量名不能与SPSS的保留字相同。SPSS的保留字有ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。如果使用了上述保留字作变量名,系统会自动提示。 ●不区分变量名的大写和小写。 ●设置变量的标签名(VariableLabel)。变量标签可以显示在输出窗口,便于查看结果时理解变量的实际意义。如果变量名不能充分反映它所代表的含义,需要额外说明时,或者有必要使用更长的变量名时,都可以用变量标签代替。
(2)变量类型。 常用变量类型包括数值型、字符型、日期型三种,分别介绍如下。 ①数值型变量。数值型变量的长度指变量值所占的字符数,即用字符个数度量的数字宽度,小数点和其他分界符也计算在内。常用的数值型变量有以下几种写法。 ●数值(Numeric):标准数值型变量,默认长度为8,小数位数为2。 ●逗号(Comma):带逗号的数值型变量,默认长长度为8,小数位数为2。显示时整数部分自左向右每隔3位用逗号作分隔符,用圆点作小数点。 ●点(Dot):圆点数值型变量,默认长度为8,小数位数为2。显示时整数部分自左向右每隔3位用圆点作分隔符,用逗号作小数点。 ●科学计数法(ScientificNotation):默认长度为8,小数位数为2。对于数值很大或很小的变量可以使用科学计数法,输入时表示指数的字母可用E也可用D。下面几种方式都可以被接受:123、1.23E2、1.23D2、1.23E+2、1.23+2。 ●美元(Dollar):带美元符号的数值型变量,默认长度为8,小数位数为2。其值在显示时,有效数字前面带有“$”,输入时可以不输入“$”,显示时系统自动加上“$”和分隔符。 对于上述几种数值型变量,输入的小数位超过规定个数时会自动四舍五入。 ●CustomCurrency:自定义类型。这样的定义只能在命令窗口使用,在有些地方(如生成新变量的对话框)不可用。数值型变量的格式表示及例子如表所示。 格式名 | 描述 | 样本格式 | 样本输出 | 固定输入 | 自由输入 | 格式 | 取值 | 格式 | 取值 | Fw.d | 标准数值型 | F5.0 | 1.234 | F5.0 | 1 234 | F5.0 | 1 234 | 1.234 | 2 | 1 | F5.2 | 1.234 | F6.2 | 12.34 | F6.2 | 1 234.0 | 1.234 | 1.23 | 1.23 | Nw.d | 限制数值型 | F5.0 | 00 123 | F5.0 | 123 | F5.0 | 123 | 123 | . | 123 | F5.2 | 12 345 | F6.2 | 123.45 | F6.2 | 12 345 | 12.34 | . | | Ew.d | 科学计数法 | E8.0 | 1 234E3 | E10.3 | 1.23E+06 | E10.3 | 1.23E+06 | 1 234 | 1.23E+03 | 1.23E+03 |
②字符串型变量。字符串变量在使用时,应注意以下几点。 ●字符串中可以包含数字、字母、特殊字符,最长为32767个字符。 ●SPSS区分长字符串和短字符串,一个短字符串最长8个字节,另一个长字符串大于等于8个字节,且自定义的用户缺失值不能超过8个字节。有些分析过程可以处理短字符串,但不能处理长字符串。 ●系统缺失值不能用于生成字符串变量。 ●当通过转换操作(transformation)或其他过程生成新变量,或者修改了原有变量时,可能产生缺失值或未定义的变量值,这时系统自动赋值为空。变量值以空格表示时,若无特别定义,不能代表缺失值。 ●字符型变量不能参与算术运算。 ●字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意,建议用户使用短字符串变量。 ③日期型变量。SPSS中的日期型变量(Date)既可以表示日期,也可以表示时间,如表所示。 参考表所示的后两列,可以熟悉常用的日期和时间格式。 DATEw | dd-mmim-yy | 28-OCT-90 | dd-mmm-yyyy | 28-OCT-1990 | ADATEw | mm/dd/yy | 10/28/90 | mm/dd/yyyy | 10/28/1990 | EDATEw | dd.mm.yy | 28.10.90 | dd.tnm.yyyy | 28.10.1990 | JDATEw | yyddd | 90301 | yyyydddd | 1990301 | SDATEw | yy/mm/dd | 90/10/28 | yyyy/mm/dd | 1990/10/28 | QYRw | qQyy | 4Q90 | qQyyyy | 4 Q 1990 | MOYRw | mmm yy | OCT 90 | mmm yyyy | OCT 1990 | WKYRw | ww WK yy | 43 WK 90 | ww WK yyyy | 43 WK 1990 | WKDAYw | (name of the day) | SU | MONTHw | (name of the month) | JAN | TIMEw | hh:mm | 01:02 | TIMEw.d | hh:mm:ss.s | 01:02:34.75 | DTlMEw | dd hh:mm | 20 08:03 | DTlMEw.d | dd hh:mm:ss.s | 20 08:03:00 | DATETIMEw | dd-mmro-yyyy hh:mm | 20-JUN-I990 08:03 | DATETlMtw.d | dd-mmm-yyyy hh:mm:ss.s | 20-JUN-I990 08:03:00 |
下面给出关于日期型变量格式的几点说明。 ●“dd”是用两位数来表示的月内日数。 ●“ddd”是用三位数来表示从元月一日算起的日数。 ●“mm”是用数字表示的月份数。 ●“mmm”是用英文月份单词的前三个字母表示的月份。 ●“yy”是用两位数来表示的年份。 ●“yyyy”是用4位数来表示的年份。 ●“hh”表示小时;“mm”表示分钟;“ss”表示秒。 ●“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h与s)之间时表示分钟。指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“-”作为具体日期的分隔符,回车后系统会自动转换成指定的格式。
(3)变量标签与值标签。标签应用于变量名和变量取值的辅助说明,相当方便。 ①变量标签(VariableLabels):变量标签是对变量名的进一步说明,当变量名较短时,自身字符数不足以表明其具体含义,而且当变量比较多时更需要对变量名的含义加以详细解释,变量标签就起到这样的作用。在统计分析的输出结果中,可以在与变量名相对应的位置显示该变量的标签,或者直接以变量标签替代变量名显示,这有助于理解和分析输出结果。如果SPSS运行在非中文平台上,不熟悉外文的用户可以给变量名附加中文标签,这会使统计结果的观察和分析更加方便,例如表所示。 变量标签示例 | 变量名 | 对应变量标签 | h | height | w | weight | g | 性别 | a | 年龄 |
②值标签(ValueLabels):变量值标签是对变量取值所做的进一步说明,分类变量经常需要定义其取值的标签。变量值标签是一个可选择的属性,可以定义,也可以不定义。典型的例子就是性别变量,例如表所示。
(4)变量格式。变量格式所包含的主要设置内容有如下三项。 ①宽度。此处的宽度指在数据编辑窗口中该变量所占的列数。用户需要明确区分定义变量类型时指定的长度与定义格式时的宽度。在定义变量格式的宽度时,要综合考虑变量类型所定义的长度和变量名所占的宽度,选择较大的一个作为该变量的格式宽度,这样才能保证变量名和变量值都可以正常显示。 ②对齐方式。对齐方式有三种:左对齐、右对齐和中间对齐。一般情况下,数值型变量默认的对齐方式为右对齐;字符型变量默认的对齐方式为左对齐;用户可以指定中间对齐方式。 ③缺失值(MissingValue)。在实际工作中常会因为某种原因,出现记录数据失真、没有观测到或没有记录到等数值缺失现象。SPSS允许用户使用默认的缺失值,或定义自己的缺失值标记。 |