传统的过采样算法在处理多类不平衡问题时容易岀现过度泛化和类别重叠,从而降低了分类性能为了提高多类不平衡学习性能,提出了一种利用采样安全系数的多类不平衡过采样( SSCMIC)算法。首先为了防止过度泛化,采用近邻采样安全系数为那些会造成过度泛化的邻域分配一个较小的权重。然后考虑到样本点的全局特性,采用反向近邻采样安全系数防止新合成的样本点侵入到其他类别区域,减轻类别之间的重叠问题。最后以C45决策树作为基分类器,将 SSCMIO算法与7种典型的过采样算法进行了对比实验。在16个公开的真实数据集上, SSCMIO算法在准确率、召回率、F- measure、MG、MAUC这5个指标上均能取得11个以上的最优值,在5个指标上最大提升分别是0.4818、03053、0.3420、0.2664、0.1307。实验结果表明 SSCMIC算法相比其他7种算法可以取得更好的分类性能。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !