如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术( SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对 SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提髙模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提岀了基于构造性覆盖算法(CCA)的过采样技术 CMOTE。 CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证 CMOTE算法的性能。实验结果表明, CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响増强了模型的泛化能力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !