设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 944|回复: 1

[其他] 大数据时代,中国统计教育比美国差在哪里?

[复制链接]

227

主题

4749

金钱

8287

积分

高级用户

发表于 2016-11-21 10:58:38 | 显示全部楼层 |阅读模式
导读

2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要对于推进我国统计类本科专业教育改革具有重要借鉴意义。


2013年以前,我国只有一个统计学专业,既可授予经济学学位,也可授予理学学位。从2013年开始,这个专业被拆分为统计学、应用统计学和经济统计学三个本科专业。根据教育部高等学校统计类专业教学指导委员会2013年11月公布的数据,目前全国有194所高校开设了统计学专业,156所高校开设了应用统计学专业,164所高校开设了经济统计学专业。在美国,统计专业的本科毕业生从2003年的673人增长到了2013年的1656,年均增长9.42%。毫无疑问,统计类专业的快速发展与当前的大数据时代背景密切相关。

大数据时代对统计专业的学生提出了更高的要求,他们不仅需要掌握统计理论、统计方法和专业统计软件的应用,还要懂得如何提出问题,如何进行数据操作,如何判断数据质量,如何评价模型和方法的有效性,以及如何准确清晰地呈现分析结论。

2014年11月,美国统计学会发布了统计学本科专业指导性教学纲要,这是在大数据背景下对2000年首次发布的指导性教学纲要进行的一次全面修订和更新,主要强调了四个方面的内容:

(1)数据科学日益重要,统计专业人才不仅需要扎实的数学和统计基础,还要有强大的统计计算和编程能力,可以熟练使用专业统计软件和数据库;
(2)真实数据是统计专业教育的重要组成部分;
(3)更加多样化的统计模型和方法;
(4)通过语言、图表和动画等用户易于理解的方式表达数据分析结论的能力。

以美国统计学会2014年11月公布的统计学本科专业指导性教学纲要为参考依据,检讨我国目前的统计类本科专业教育,无论是在培养目标和课程设置方面,还是在教学内容和教学方法方面,都还存在不小差距。



1、学习目标不易量化观测和评价

在人才培养方案中,首先需要明确学习目标。学习目标设定了统计类专业的本科毕业生应该掌握的基本统计技能。

学习目标的设定应该简洁清晰,能够转化为可以观测和量化的行为。我国统计类专业的培养方案关于学习目标的表述大多比较抽象,不易进行量化观测,所以很难评价毕业生是否达到了培养方案中所设定的最终学习目标。相应地,我们在人才培养过程中比较注重课程层面上的评价,强调学生对每门课程基本内容的掌握,比较轻视专业层面上的总体性评价,缺乏对毕业生专业综合技能的反馈机制。在专业层面上对学生的总体性评价要远远复杂于在课程层面上对学生个体的评价,需要回答诸如“这些课程组合在一起的综合效果是什么”等更加具有挑战性的问题。每门课程的良好效果并不能保证所有课程组合在一起就必然可以实现预定的学习目标,因为某些不同的课程可能仅仅培养了一种相同的技能。

作为参考范例,下面引用加州大学伯克利分校为统计学本科专业所制定的学习目标,一共包括六条:

(1)概率论基本原理;
(2)统计思维和统计推断方法;
(3)统计计算方法;
(4)统计建模方法及其局限性;
(5)通过图示等手段对数据进行描述和解释,并进行探索数据分析的方法;(6)良好的书面和口头表达能力。

我国现在设有三个统计类专业,如何明确设定它们各自的学习目标,既体现统计类专业的共性,又能个性鲜明,避免专业边界模糊不清,是一个亟待研究解决的问题。



2、课程设置存在一定随意性

明确了学习目标以后,就要讨论哪些课程或实践活动可以培养学生的哪些特定技能,然后检查教学方案所制定的课程体系是否可以保证学习目标的最终实现,并建立一种动态的评价和反馈机制,根据学习目标的实现情况调整教学方案。

一个合理的课程体系是为了实现培养方案所制定的最终学习目标而设定的一系列课程,这些课程之间应该相互配合,逻辑关系清晰,避免内容上的重复和遗漏,同时还应该足够灵活,为学生的自主发展预留下宽松的空间。

我国许多高校的统计类专业培养方案由于学习目标不够明确,因此在课程设置上缺乏对总体性学习目标的充分考虑,存在一定的随意性。目前流行的课程体系是按照统计学的各个研究主题设置的,比较强调每门课程在教学内容上的系统性和完整性。这种课程设置方式历史较长,已经积累了丰富的经验,自然有其优点,但也难免存在一些缺陷,譬如不同课程之间的教学内容容易出现交叉和重复,每门课程的教学内容与培养方案所设定的总体学习目标不易完全对接。

统计学是应用型学科,统计类专业的课程设置必须体现其应用型学科的特点,这就要求开设统计类专业的高校能够提供不同应用领域的课程群供学生进行选修,如经济和管理类课程群、生物和医学类课程群。此外,还应该设有一个数学类课程群,主要供那些计划攻读统计学硕士学位或博士学位的学生进行选修。



3、教学内容有待更新

学习目标的实现过程依赖于每门课程的教学内容。大数据时代是以数据为中心的时代,统计类专业的教学内容必须适应这个时代的要求,对传统教学内容进行及时调整和更新。

1. 突出数据的重要性。无论是统计学的初级课程还是高级课程,都有必要引入真实数据的分析,让学生接触来自现实问题中的各种原始数据,引导他们把实际问题转化为统计问题并进行数据分析,培养学生用数据思考的能力。这是一项极具挑战性的教学内容改革,但对提高统计人才的培养质量意义重大。我国统计教育的现状是,大多数学生很难接触到来自实际问题的原始数据,通常使用教科书提供的二手数据进行建模分析。二手数据经过了加工整理,数据背后的实际问题已经被淡化,这种培养模式在一定程度上割裂了实际问题与数据分析之间的联系,不易培养学生的数据思维能力和解决复杂问题的能力,当他们遇到大规模的非结构化数据时可能束手无策。

227

主题

4749

金钱

8287

积分

高级用户

 楼主| 发表于 2016-11-21 10:58:56 | 显示全部楼层
2. 使用专业统计软件。统计的价值在于应用,很难想象统计方法及其应用的学习可以没有专业统计软件的支撑。从理论上讲,只要一款统计软件足够灵活和强大,就可以在教学中使用,但从实践的角度看,推荐使用R或SAS。R是免费开源软件,统计建模、统计计算和可视化功能强大,新用户增长迅速,也是最新统计方法发布的主要平台,非常有利于培养学生的编程能力和知识更新能力。SAS软件被很多公司用于数据管理和数据分析,在实际应用领域具有长期而深远的影响,是数据分析不可或缺的专业统计软件。SAS9.3及其以后的版本还可以自由调用R,实现了SAS与R完美结合,这必将进一步拓展R和SAS的应用领域。当然,教学中也可以尝试使用其他专业统计软件,如Python和Stata等。但无论如何,基于EXCEL讲授统计方法的时代应该尽早结束,这个问题在非统计专业的统计教学中比较严重,因为许多统计学教材就是基于EXCEL编写的。




3. 增加统计模型类课程。统计模型是进行数据分析的主要工具。从目前的情况看,大多数高校为本科生开设的统计模型类课程主要是线性回归模型、时间序列分析和多元统计分析等,远远不能满足数据分析的实际需要,因此在教学内容中很有必要增加一些新的统计模型,如广义线性模型、广义可加模型和线性混合模型等。在学时一定的条件下,增加新内容必然涉及传统内容的删减或压缩问题,需要慎重研究。譬如,可以尝试把广义线性模型的部分内容纳入线性回归模型课程进行讲授。事实上,如果简化了模型的数学推导过程,把注意力集中在模型的思想和应用层面,讲授统计模型所需要的课时完全可以压缩。对于大多数需要直接进入就业市场的本科生而言,统计模型的学习应该更加强调应用层面的问题,如模型设定、模型检验和评价、模型输出结果的解释等,而不是纠缠于模型推导过程的数学细节。




4. 重视统计计算。传统的统计教育比较重视统计思想和统计理论,推崇数学推导过程,而对统计计算的重要性认识不足。统计学的发展虽然以数学为基础,但统计学不同于数学。在许多情况下,用直观的数值模拟代替复杂的数学推导,不仅不会降低精度,而且结论更加容易理解,这对统计专业的本科生而言无疑是非常有效的学习方法。譬如,贝叶斯统计具有理论完善和结论直观的优点,缺点是计算量大,但在计算技术飞速发展的今天,贝叶斯统计过去曾经面临的计算瓶颈正在逐渐消失,基于MCMC的统计方法在数据分析中的强大威力日益显现。因此,在大数据时代,强调统计计算的重要性应是大势所趋。




5. 整合传统教学内容。许多传统的统计方法是基于小样本数据建立的,并不适用于大数据分析的需要。在大数据时代,这些传统教学内容的相对重要性也会发生变化。譬如,在数据量很大的情况下,统计显著性检验的重要性就会明显降低,而如何克服数据中偏差所带来的影响,以及如何发现高维数据中的结构模式和相关关系将显得越来越重要。对传统教学内容进行整合的必要性毋庸置疑,但具体实施的难度很大。美国统计学会在其最新公布的统计学本科专业指导性教学纲要中也没有明确指出哪些统计方法应该是必修内容,哪些是选修内容,哪些可以删减或压缩。这是一个极具争议的话题,需要各个学校在教学实践中不断探索和总结。








4、对非技术性素质的培养重视不够




这里所谓的非技术性素质主要是指学生对统计分析结果的表达能力,以及统计分析过程应该遵守的职业道德。我国目前的统计类专业培养方案对这两种素质的重视程度较低,尤其是对统计职业道德的培养几乎处于空缺状态。




统计分析过程的一个重要环节是把数据分析结论有效地传达给用户,潜在的用户可能是统计专业人士,也可能是非统计专业人士。这就要求毕业生具有良好的口头和书面表达能力,擅长使用图表和动画等工具把数据分析的结论准确直观地呈现给用户。这种能力可以通过课堂讨论和撰写研究报告等方式进行培养。




数据分析包含一定的经验成分在内,难免受分析者个人主观判断的影响,这就必然涉及数据分析的职业道德问题。统计专业的毕业生在实际工作中可能会面临许多职业道德问题,譬如,有意忽略客观环境对采集数据的影响,只报告具有统计显著性的结果,漠视数据分析的假设前提,混淆因果关系与相关关系,隐藏数据分析方法可能存在的缺陷,把统计显著性解释为实际显著性,根据主观需要选择变量和数据等。统计职业道德的培养,一方面可以在专业课程的教学中潜移默化地让学生逐渐养成关心数据质量、科学选择统计方法、客观呈现分析结论的良好习惯,另一方面也可以采用专题讲座的形式,集中讨论数据分析过程应该遵守的职业道德问题。




节选自:孟生旺,袁卫. 大数据时代的统计教育[J]. 统计研究, 2015, 32(4): 3-7.




来源:《统计研究》

作者:孟生旺,袁卫  

编辑:学妹
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表