×

用于自步学习的无监督属性选择算法资料介绍

消耗积分:0 | 格式:rar | 大小:0.86 MB | 2018-12-07

分享资料个

  针对现有属性选择算法平等地对待每个样本而忽略样本之间的差异性,从而使学习模型无法避免噪声样本影响问题,提出一种融合自步学习理论的无监督属性选择( UFS-SPL)算法。首先自动选取一个重要的样本子集训练得到属性选择的鲁棒性初始模型,然后逐步自动引入次要样本提升模型的泛化能力,最终获得一个能避免噪声干扰而同时具有鲁棒性和泛化性的属性选择模型。在真实数据集上与凸半监督多标签属性选择( CSFS)、正则化自表达( RSR)和无监督属性选择的耦合字典学习方法(CDLFS)相比,UFS-SPL的聚类准确率、互信息和纯度平均提升12.06%、10.54%和10.5%。实验结果表明,UFS-SPL能够有效降低数据集中无关信息的影响。

 

  伴随信息采集技术的不断发展,具有大样本高维度特点的大数据已经普遍应用于模式识别和机器学习等领域中。高维大数据不仅提升了数据处理的成本,而且数据中存在的冗余属性还会影响数据处理的效果,此外还可能造成维度灾难等问题。在高维大数据的研究中,大数据知识挖掘或者数据认知模式建立之前,合理地移除数据中的冗余属性和噪声样本,能够有效提高知识获取的准确性,因此数据降维成为了一个重要的研究领域。属性选择方法。是一种重要的数据降维方法,按照学习方式的不同可分为三类:有监督学习无监督学习和半监督学习。在现实应用中,获取数据的类标签是十分困难的,通常需要消耗大量的人力物力,因此无监督学习更具有实际应用价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !