大数据时代,攻击篡改、设备故障、人为造假等原因导致海量数据中潜藏着许多异常值。准确地检测出数据中的异常点,实现数据清洗,至关重要。文中提出一种结合特征切分与多层级联随杌森林的异常点检测模型( outlier detection modebased on Feature Segmentation and Cascaded Random Forest, FS-CRE)。利用滑动窗口与随机森林对原始特征进行细粒度切分,生成类概率向量,用于训练多层级联的随杌森林;级联层中最后一层的随杋森林投彯决定样本的最终类别。仿真实验结果表明,新方法在基于多个UCⅠ数据集进行的异常分类任务中均获得较高Fl- measure评分;级联结构使新模型相比于经典的随机森林算法进一步提高了泛化能力;在高维数据集上所提方法比梯度提升决策树和ⅪGυBωost拥有更优的性能,且超参数较少,易于调优,具有更好的综合性能。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉