如何使用针对不平衡数据进行决策树改进方法资料说明

消耗积分:0 | 格式:rar | 大小:1.03 MB | 2019-03-27

分享资料个

　　针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题，提出了C4.5决策树的三种改进方法一C4.5 +δ、均匀分布熵（ UDE）和改进分布熵函数（IDEF）。首先，推导了C4.5算法中属性选择准则会倾向于选择偏斜划分的属性;然后，分析了偏斜划分使得异常（少数类）检测精度下降的原因;其次，分别通过引入缓和因子、均匀分布熵或替换分布熵函数改进了C4.5算法的属性选择准则一信息增益率;最后，利用WEKA平台和NSL-KDD数据集对改进的决策树进行验证。实验结果表明，三种改进方法均能提高异常检测精度。其中，相比于C4.5，C4.5 +7、UDE和IDEF算法在KDDTest-21数据集上的少数类检测精度（灵敏度）分别提高了3.16、3. 02和3.12个百分点，均优于采用Renyi熵和Tallis熵作为分裂准则的方法。此外，利用三种改进的决策树检测工业控制系统中的异常，不仅可以提高异常的查全率还能减小误报率。

　　异常检测是指从某个系统的日常数据中识别非预期模式，即异常数据。异常通常由恶意行为或违规操作引发，因此异常检测技术广泛应用于网络安全、故障检测等领域。

　　异常检测可以视为一-种特殊的分类问题，即分离目标数据集中的正常数据与异常数据。因此，绝大多数基于机器学习的分类方法，如神经网络、支持向量机、决策树等，都可以应用于异常检测。然而异常检测面临数据不平衡问题，即目标数据集中异常数据与正常数据的分布是不平衡的，其中异常数据一。般远远少于正常数据。数据不平衡问题在医疗诊断、信用卡诈骗检测，银行风险管控、系统故障检测等应用中十分常见。在传统分类问题中，整体准确度由不同类别的准确度加权组成，因此多数类的准确度对整体准确度的影响要远大于少数类。在传统方法中，分类器会倾向于保证多数类的准确度而牺牲少数类的准确度，导致少数类的漏报率较高。然而在很多异常检测的现实应用中将异常（少数类）误判为正常（多数类）的代价要远远高于相反的情况，因此需要尽可能地检测出异常，降低漏报率。例如，在癌症的诊断中，将癌症（少数类）患者误诊为健康（多数类）的危害要远大于将非癌症患者误诊为癌症的危害，所以要保证检测结果为阳性时尽可能地覆盖真正的癌症患者。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

3314A函数发生器维修手册
2024-12-19 31次下载

下载
美的电磁炉维修手册大全
2024-12-24 21次下载

下载
感应笔电路图
2024-12-23 9次下载

下载
使用TL431设计电源
2024-12-16 8次下载

下载
LZC3106G高性能谐振控制器中文手册
2024-12-23 7次下载

下载
SMD LED选型手册贴片灯珠
2024-12-30 5次下载

下载

如何使用针对不平衡数据进行决策树改进方法资料说明

单元不平衡永久故障阈值的单元类型特定设置

决策树引擎解决方案

三相电压不平衡，如何判断与解决？

基于遗传优化决策树的建筑能耗预测模型

基于文本挖掘和决策树的中国手游产业分析

基于非均衡数据分类的犹豫模糊决策树

基于MapReduce的时间序列索引及数据查询

面向二分类不平衡数据的XGBoost改进方法

可提高心电信号分类识别准确率的模糊决策树

利用采样安全系数的多类不平衡过采样算法

基于全局特征金字塔网络的信息融合方法

什么是动平衡？

如何实现无功补偿的解决三相不平衡无功超标的危害和仿真说明

三电平整流器的PFC输入电流的THD受电网不平衡应该如何解决

平衡传输和不平衡传输及差分信号技术的详细资料说明

如何使用最优二叉决策树分类模型进行奶牛运动行为的识别

如何使用生成少数类技术进行深度自动睡眠分期模型设计说明

基于改进模糊熵和证据推理的多属性决策方法

电力系统的三相电压不平衡度的定义公式和计算方法资料概述

电网电压不平衡情况的并网逆变器无交流电压传感器控制策略的详细概述

针对电网不平衡与谐波的锁相环改进设计

基于PR控制器的孤岛微网不平衡负荷下控制策略

永磁直驱机组叶轮质量不平衡故障建模

低风速风电机组不平衡载荷控制方法

网压不平衡下系统控制目标对MMC的影响

基于决策树的在轨卫星故障诊断知识挖掘

基于直接自干扰信号的收发I/O不平衡参数估计与补偿算法

低压配网三相负荷不平衡治理技术

电压不平衡度的加窗FFT快速测量方法

一种双重特征选择的不平衡复杂网络连接分类模型

三相不平衡调节装置 三相不平衡会造成什么后果

三相不平衡最佳解决办法 三相不平衡多少范围内是合理的

决策树：技术全解与案例实战

三相电压不平衡对电路的影响

I/Q不平衡的来源 IQ信道之间的不平衡会造成什么影响呢？

三相电压不平衡是什么原因造成的？三相不平衡会跳闸吗？

三相不平衡是什么意思？三相电压不平衡怎么处理？

电机转子不平衡对电机质量的影响大吗

如何判断三相不平衡？

大数据—决策树

机器学习之决策树生成详解

决策树的结构/优缺点/生成

什么是决策树模型，决策树模型的绘制方法

决策树的判断标准及算法

决策树的基本概念/学习步骤/算法/优缺点

使用基尼不纯度拆分决策树的步骤

建立决策树的逻辑

决策树的构成要素及算法

一文知道决策树的优缺点

如何理解矢量测量中“平衡”与“不平衡

详解机器学习决策树的优缺点

三相不平衡有哪些处理方法

三相电压不平衡产生原因_三相电压不平衡的治理措施

教你如何处理不平衡数据集

决策树和随机森林模型

什么是决策树?决策树算法思考总结

决策树的原理和决策树构建的准备工作，机器学习决策树的原理

数据挖掘算法：决策树算法如何学习及分裂剪枝

带你了解一下人工智能中的决策树(DT)

三相电流不平衡度计算公式_三相电流不平衡度标准及应用

下载排行榜

3314A函数发生器维修手册

美的电磁炉维修手册大全

感应笔电路图

使用TL431设计电源

LZC3106G高性能谐振控制器中文手册

SMD LED选型手册 贴片灯珠

三相不平衡调节装置三相不平衡会造成什么后果

三相不平衡最佳解决办法三相不平衡多少范围内是合理的

SMD LED选型手册贴片灯珠