设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2073|回复: 0

数据挖掘领域经典分类算法—C4.5算法(附python实现代码)

[复制链接]

27

主题

156

金钱

268

积分

入门用户

发表于 2019-6-11 14:07:32 | 显示全部楼层 |阅读模式
本帖最后由 一切都要简单化 于 2019-6-11 14:08 编辑

理论介绍
什么是分类
分类属于机器学习中监督学习的一种。模型的学习在被告知每个训练样本属于哪个类的“指导”下进行,新数据使用训练集中得到的规则进行分类。
1.jpg

分类的步骤
2.jpg
3.jpg
4.jpg
5.jpg

什么是决策树
6.jpg

决策树归纳
7.jpg
8.jpg
9.jpg
10.jpg


信息增益
相关理论基础
11.jpg

计算公式
12.jpg

ID3
13.jpg
14.jpg
15.jpg
16.jpg
注:生成的决策树有误,fair对应的应该是yes,excellent对应的应该是no

C4.5
17.jpg


python实现
GitHub地址:https://github.com/Professorchen/Machine-Learning
不足之处:目前只能处理离散值,并且还没有添加从文件中读取数据集的功能。但是基本上算法的大部分都实现了,以后到了具体应用场景时可以继续调整后使用。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表