愿太阳照亮我 发表于 2019-7-4 14:49:56

spss缺失值填充步骤


缺失值填充是数据预处理最基本的步骤,一般能想到的是固定值填充(均值等统计学方法)、根据与本列有相关关系的列函数表示来填充。这次我用的是em算法进行填充,具体原理后续补充。

主要记录一下步骤:

工具栏:分析 菜单 ---->缺失值分析------>弹出来的对话框:左边是表格中的变量;中间对应定量变量和分类变量。如果要填充的是

连续值,则将要填充的列名通过点击向右的箭头将该列名放入‘定量变量’框中,可以同时把所有要填充的列名都放进去;如果要填充的是分类值,则同样的方法,通过箭头放入‘分类变量’中。(所谓连续值:比如 身高;分类值:比如性别)-------->我们要通过EM算法计算填充值,选中最右边的EM复选框-------->点击确定按钮

这个时候有两种显示填充好结果的效果的方式:

1.点击确定后,在工具栏 点击 转换 菜单------>替换缺失值------->将要替换的所有列名同时选中-----------》通过向右箭头将他们放入'新变量'列表-----------》点击确定即可看到原来打开的数据表新增了要填充的那些列,并且已经填充好值。我们可以另存。

2.在刚才的界面,没有点击确定前,我们点击EM按钮(不是复选框),将‘报存完成的数据’、‘创建新数据集’复选框选中,在‘数据集名称’输入框中输入要保存的文件名。---------->点击继续按钮--------------》确定 按钮

这个时候,spss会新生成一个显示数据的新窗口,我们可以看到,只有被填充数据的那些列。也可以另存。
页: [1]
查看完整版本: spss缺失值填充步骤