一切都要简单化 发表于 2019-6-11 14:07:32

数据挖掘领域经典分类算法—C4.5算法(附python实现代码)

本帖最后由 一切都要简单化 于 2019-6-11 14:08 编辑

理论介绍
什么是分类
分类属于机器学习中监督学习的一种。模型的学习在被告知每个训练样本属于哪个类的“指导”下进行,新数据使用训练集中得到的规则进行分类。


分类的步骤





什么是决策树


决策树归纳






信息增益
相关理论基础


计算公式


ID3




注:生成的决策树有误,fair对应的应该是yes,excellent对应的应该是no

C4.5



python实现
GitHub地址:https://github.com/Professorchen/Machine-Learning
不足之处:目前只能处理离散值,并且还没有添加从文件中读取数据集的功能。但是基本上算法的大部分都实现了,以后到了具体应用场景时可以继续调整后使用。
页: [1]
查看完整版本: 数据挖掘领域经典分类算法—C4.5算法(附python实现代码)