SAS基本指标介绍

levin2008 · 发表于 2018-8-20 10:47:06

描述性统计分析指标基于以下基本统计学概念：

总体：研究对象的全体。

样本：从总体中抽取的个体。

随机抽样：从总体中抽取样本，且每个样本被抽到的机会均等。

例如，为了解某学院大一新生的平均年龄，用计算机产生随机数的方式抽取50名学生的学号，计算出他们的年龄（精确到天）及其平均值。以上随机抽样过程，总体是某学院大一新生的年龄，样本是抽取的50名学生的年龄，样本量即为50，采取了随机抽样方式，即每个学生被抽到的机会均等。

描述性统计指标可被分为描述数据集中位置和离散程度两类，描述数据集中位置的有均值、中位数、众数等；描述数据离散程度的主要有方差、标准差、变异系数等。以下列出了主要描述性统计指标的名称、数学表达式及意义。

MEAN（均值）：计算公式为（n 为样本量N ）。
MODE（众数）：样本中出现次数最多的数据。
MEDIAN（中位数）：指将数据按大小顺序排列起来形成一个数列，居于数列中间位置的数据。若总数为奇数，取中间值；若总数为偶数，取中间两个值的平均值。
Px（分位数）：它将全部观察值分成两个部分，其中有x %个观察值小于Px，（100-x ）％个观察值大于Px。
MAX（最大值）：样本中的最大观察值。
MIN（最小值）：样本中的最小观察值。
SUM（和）：样本观察值的总和。
RANGE（极差）：最大与最小观测值之差。
STD DEV（标准差）：计算公式为（n 为样本量N ）。
VAR（方差）：为标准差的平方，用来衡量相对于均值的分散性和变异性。数据的集中程度高则方差小，反之则大。
STDERR（标准误）：计算公式为。
CV（变异系数）：计算公式为。
USS（加权平方和）：计算公式为，其中w i 代表权重。
CSS（加权离差平方和）：计算公式为。
SKEWNESS（偏度系数）：计算公式为，主要衡量数据的对称性，若其值大于0则表示位于均值右边数据较分散，若小于0则表示均值左边数据较分散。
KURTOSIS（峰度系数）：计算公式为，峰值反映分布的尖锐度或平坦度，正峰值表示相对尖锐的分布，负峰值表示相对平坦的分布。
PROB>|T|：在总体均值是0的假设条件下，学生t 统计量大于临界T的绝对值的概率。

以上指标中较易混淆的是标准差（STD DEV）和标准误（STDERR）。两者的区别在于：标准差衡量样本观察值的离散程度，而标准误衡量根据样本计算的统计量的标准差，如在参数估计时得到的对应的标准误衡量的是参数估计值和实际值的差异。标准差的值越大表示观察值的分布越分散；反之，标准差越小表示观察值的分布越集中。标准误是统计量的标准差。由于统计量是样本观察值的函数，一旦样本改变则统计量的取值也随之改变。在参数估计中，用样本的统计量去估计参数时，统计量的标准误越小，表示抽样误差小、统计量较稳定、与参数较接近。

		自动登录	找回密码
密码			立即注册

SAS基本指标介绍

站长推荐 /1