决策树C4.5算法属性取值优化研究-电子发烧友网

　　决策树算法是一种最简单、最直接、最有效的文本分类算法。最早的决策树算法是ID3算法，于1986年由Quinlan提出，该算法是一种基于信息熵的决策树分类算法。由于该算法是以信息熵作为属性选择的标准，偏向于选择属性取值较多的属性，而属性取值较多的属性往往分类的贡献不大。因此，于1993年Quinlan在ID3算法的基础上又提出了一种改进算法，即C4.5算法。该算法采用信息增益率作为属性选择的标准，继承了ID3算法的所有优点，克服了ID3算法中偏向于选择属性取值较多的属性作为测试属性的不足，同时还能对连续属性与未知属性进行处理，在剪枝方面也有很大的改进。

　　C4.5算法作为经典的决策树分类算法，己被广泛的应用到各个领域。但其仍然存在以下不足之处：1）在计算信息增益的过程中（包括：分类所需信息量、信息熵、分割信息量）涉及的复杂的对数运算，计算机每一次计算都需要调用库函数，增大了生成决策树所需的时间开销；2）生成决策树中分支数量过多，部分分支还能进行合并，进一步精简生成决策树的结构。

　　本文针对生成决策树分支数量过多的不足，提出了一种新的属性取值优化方法，并用实例分析验证了该方法的有效性。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

决策树C4.5算法属性取值优化研究

决策树引擎解决方案

自动驾驶决策概况

基于遗传优化决策树的建筑能耗预测模型

关于机器学习的十大经典算法

基于文本挖掘和决策树的中国手游产业分析

基于C4.5决策树的HTTPS协议加密流量分类

基于非均衡数据分类的犹豫模糊决策树

基于XGBoost的树突状细胞算法综述

基于可分辨矩阵的差别信息树属性约简

基于广义正交模糊集结算子的多属性决策

基于遗传算法优化的BP神经网络及其仿真研究

基于虚拟网络功能组合的服务功能链及映射算法

可提高心电信号分类识别准确率的模糊决策树

基于关联规则的隐私保护属性匿名算法

按照特征分组聚类的异常入侵检测系统

面向K近邻分类性能的遗传训练集优化算法

鼠疫传染病优化算法PDO及研究综述

基于ExtraTrees的差分隐私保护算法DiffPETs

智能机器伦理决策设计及其研究综述

基于关键词的GCC抽象语法树消除冗余算法

区块链共识算法的效能优化研究及总结

基于SQAG模型的网络攻击建模优化算法

基于SQAG模型的网络攻击建模优化算法

机器学习的十大经典算法有哪些

如何使用最优二叉决策树分类模型进行奶牛运动行为的识别

如何使用针对不平衡数据进行决策树改进方法资料说明

基于层次聚类和极限学习机的母线短期负荷预测

机器学习教程之机器学习10大经典算法的详细资料讲解

基于改进模糊熵和证据推理的多属性决策方法

如何面向K最近邻分类的遗传实例来选择算法

基于决策树的在轨卫星故障诊断知识挖掘

决策树：技术全解与案例实战

一种基于决策树的飞机级故障诊断建模方法研究

什么是集成学习算法-1

大数据—决策树

机器学习之决策树生成详解

决策树的结构/优缺点/生成

什么是决策树模型，决策树模型的绘制方法

决策树的判断标准及算法

决策树的一般流程及应用

决策树的基本概念/学习步骤/算法/优缺点

使用基尼不纯度拆分决策树的步骤

机器学习中常用的决策树算法技术解析

建立决策树的逻辑

决策树的构成要素及算法

一文知道决策树的优缺点

详谈机器学习的决策树模型

详解机器学习决策树的优缺点

决策树和随机森林模型

什么是决策树?决策树算法思考总结

基于决策树算法的电能表故障预测方法

数据挖掘十大经典算法，你都知道哪些！

决策树的原理和决策树构建的准备工作，机器学习决策树的原理

人工智能之机器学习C4．5算法解析

人工智能之机器学习CART算法解析

深度神经决策树：深度神经网络和树模型结合的新模型

结合深度神经网络和决策树的完美方案

数据挖掘算法：决策树算法如何学习及分裂剪枝

人工智能C4．5算法的概念和优点

带你了解一下人工智能中的决策树(DT)

大神教你怎么用Python抓取婚恋网用户数据，用决策树生成自己择偶观

下载排行榜