|
1.使用SET语句修改数据集
SET语句可以增加新变量、创建子集、修改数据集。SET语句是一次一个变量地,将一个数据集放入数据步中予以分析。基本形式为:
- DATA new_data_set;
- SET data_set;
复制代码
Data语句指定了新数据集名,set指定要读取的老数据集名。如果不想创建新的,则也可以在data中指定老数据集。
样例:
2.使用SET语句堆叠数据
运用set语句可以把一个数据集堆在另一个数据集上,适用于两个变量相同的两个数据集。
基本形式为:
- DATA new_data_set;
- SET data_set_1 data_set_2;
复制代码
首先指定一个新的数据集,然后列出需要合并的旧数据集。如果一个数据集包含了另一个数据集没有的变量,那么合并后,该变量下将会出现缺失值。
样例:
3.使用SET语句插入数据集
前面的堆叠数据,可能把数据顺序打乱,当然可以再用proc sort 再将数据排序。但这可能效率低下。在set语句中使用by语句可以高效率的将数据按顺序合并,基本形式为:
- DATA new_data_set;
- SET data_set_1 data_set_n;
- BY variable_list;
复制代码
BY语句中,可以指定一个或多个变量,让SAS进行排序。注意,在合并几个数据之前,每个数据都要用BY进行排序,如果没有,则要用proc sort 完成。
样例:
|
|