设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1243|回复: 0

数据挖掘思路

[复制链接]

8

主题

47

金钱

81

积分

新手用户

发表于 2019-9-18 15:49:21 | 显示全部楼层 |阅读模式

1.数据取样标准:可靠性,相关性,有效性。抽取数据的常见方式有:随机抽样,等距抽样,分层抽样,从起始顺序抽样分类抽样。

2.数据探索:异常值分析,缺失值分析,相关性分析和周期性分析等。

3.数据预处理:数据筛选,数据变量转换,缺失值处理,坏数据处理,数据标准化,主成分分析,属性选择,数据规约等。

4.选择构建的模型:分类,聚类,关联规则,时序模式或者智能推荐等。

5.模型评价。

6.常用数据挖掘建模工具:SAS,SPSS Modeler,SQL Server,Python等等,都是几种大家了解的工具。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表