数据挖掘领域经典分类算法—C4.5算法(附python实现代码)
本帖最后由 一切都要简单化 于 2019-6-11 14:08 编辑理论介绍
什么是分类
分类属于机器学习中监督学习的一种。模型的学习在被告知每个训练样本属于哪个类的“指导”下进行,新数据使用训练集中得到的规则进行分类。
分类的步骤
什么是决策树
决策树归纳
信息增益
相关理论基础
计算公式
ID3
注:生成的决策树有误,fair对应的应该是yes,excellent对应的应该是no
C4.5
python实现
GitHub地址:https://github.com/Professorchen/Machine-Learning
不足之处:目前只能处理离散值,并且还没有添加从文件中读取数据集的功能。但是基本上算法的大部分都实现了,以后到了具体应用场景时可以继续调整后使用。
页:
[1]