设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1577|回复: 0

数据类型与数据分析方法

[复制链接]

24

主题

192

金钱

312

积分

入门用户

发表于 2019-7-9 13:30:54 | 显示全部楼层 |阅读模式

1.分类型数据和数值型数据
按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
归属于某一类别的数据称为分类型数据(categorical data),其结果均表现为类别,也称为品质数据(quality data)。
描述现象的数量、大小或多少的数据称为数值型数据(quantitative data),由于定距尺度和定比尺度属于同一测量层次,所以可以把后两种尺度测度的数据看作是同一类数据,统称为定量数据或数值型数据。数值型数据可能是离散的也可能是连续的,在一定区间内可以任意取值的变量叫连续型变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等为连续型变量,其数值只能用测量或计量的方法取得。如果数值只能用自然数或整数单位计算的则为离散型变量。例如,企业个数,职工人数、设备台数等、只能按计量单位数计数、这种变量的数值一般用计数方法取得。
区分测量的层次和数据的类型十分重要,因为对不同类型的数据将采用不同的统计方法来处理和分析。适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。
比如:在描述数据的集中趋势时,对分类型数据通常是计算众数;反之,适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比如,测度数量型数据可以计算平均数,但对于分类型数据则不能计算平均数。
2.截面数据和时间序列数据
截面数据(cross section data)是在同一时间和时点上搜集的数据。截面数据是按照统计单位排列。截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说必须是同一时间截面上的数据。表1-1中的数据是截面数据,因为它描述了上市公司行业分类的多个变量在同一时间上的情况。
时间序列数据(time series data)是在不同时点上搜集的数据。
图1-1是2003-2013年消费价格指数曲线。我们注意到,三项指数在2008年达到最高,表明在当年物价水平上涨较快;2009年急剧下降,物价水平处在低谷。在经济统计和各种出版物中,我们经常可以看到时间序列图形,这些图形帮助人们了解过去发生的情况,分析现象随时间变化的趋势和规律,推测时间序列的未来发展水平。
1.png


描述统计
为了使统计数据更易于理解,一般采取表格、图形或数值的形式汇总数据的统计方法称为描述统计(descriptive statistics)。描述统计是统计研究的基础,它为推断统计、咨询和决策提供了必要的事实依据。
用描述统计的方法对表1-1中部分行业的上市公司平均市盈率数据进行分析,如图1-2是数据集的条形图。通过数据统计图形,使数据更容易分析和解释。从图1-2中,我们很容易获得这样的一些信息,有一些行业平均市盈率相对于公司数量而言是偏高的,而有一些行业偏低,理财顾问和投资者通过这些数据的分析,很容易找到某一个行业那些上市公司估值偏高了,那些公司的估值偏低,进而做出投资决策。
2.jpg


推断统计
在统计研究中,我们需要有关研究对象的全部数据信息,出于对时间、成本和其他因素的考虑,只能搜集到研究对象的一部分数据。在特定研究中我们把从全部总体中搜集的一部分个体称为样本(sample)。而利用样本数据对总体特征进行估计和推断,并做出假设检验的过程被称为推断统计(statistical inference)。统计推断是统计学的基本方法,在统计研究中得到了极为广泛的应用。
作为推断统计的一个例子,我们考察由西门子电气公司所作的一项研究。西门子电气公司生产一种广泛应用于一些电气设备的高亮度灯泡。为了提高灯泡的使用寿命,产品研发部门开发出一种新型灯丝的灯泡。在该项研究中,我们把总体定义为全部的使用新型灯丝生产的灯泡。为了估计新灯丝的优点,抽取了200只新灯丝灯泡组成样本,并进行了测试,记录每只灯泡灯丝被烧断之前的时间,样本数据见表1-2。
3.jpg
假设西门子电气公司希望利用样本数据对全部新型灯泡总体的平均寿命进行推断,以确认所有产品的质量是否合格。基本的思路是将表1-2所有数据相加再除以200,可得到灯泡样本数据的平均使用寿命为76小时。我们同样可以利用这一样本结果估计灯泡总体的平均使用寿命也是76小时。
利用样本数据对我们感兴趣的总体特征进行估计时,还要考虑估计的质量和精确性。以西门子电气为例,研究人员可能指出,新灯泡的平均使用寿命的点估计值是76小时,误差的边际是 6小时,这样,新灯泡的总体平均使用寿命的区间估计是70~82小时,在这个估值区间内,还可以给出有多大的比例包含了总体平均数。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表