针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围内精确删除噪声样本,可有效地降低误删率并提高效率,采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择的准确度;最后引进基于均方误差(MSE)的分类精度惩罚函数来计算遗传算法中个体的适应度,提高有效性和稳定性。在20个数据集上,该方法相较于基于预分类的KNN(PRKN)、基于协同进化的实例特征选择算法(IFS-CoCo)K最近邻(KNN),在分类精度上的提升分别为0.07-26.9个百分点0.03~11.8个百分点.0.2~12.64个百分点,在AUC和Kappa的上的提升分别为0.25~18.32个百分点、1.27 ~23.29个百分点.0.04~12.82个百分点。实验结果表明,该方法相较于当前实例选择算法在分类精度和分类效率_上均具有优势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !