针对高维的数据中往往存在非线性、低秩形式和属性冗余等问题,提出一种基于核函数的属性自表达无监督属性选择算法——低秩约束的非线性属性选择算法( LRNFS)。首先,将每一维的属性映射到高维的核空间上,通过核空间上的线性属性选择去实现低维空间上的非线性属性选择;然后,对自表达形式引入偏差项并对系数矩阵进行低秩与稀疏处理;最后,引入核矩阵的系数向量的稀疏正则化因子来实现属性选择。所提算法中用核矩阵来体现其非线性关系,低秩考虑数据的全局信息进行子空间学习,自表达形式确定属性的重要程度。实验结果表明,相比于基于重新调整的线性平方回归( RLSR)半监督特征选择算法,所提算法进行属性选择之后作分类的准确率提升了2.34%。所提算法解决了数据在低维特征空间上线性不可分的问题,提升了属性选择的准确率。
图像处理和数据挖掘等领域常用高维的矩阵来存储数据。高维的矩阵在存储大量信息的同时,也会带来属性冗余、占用大量存储空间等问题。为了能够提取这些数据的有效信息,并提升处理效率,需要对这些数据进行预处理。因此属性约简成为了越来越重要的一个研究领域。
属性选择是常见的属性约简方法。它主要是按照某种标准从纷繁杂乱的属性中选出能够最好表示出数据的原始属性的子集。属性选择广泛应用于模式识别、机器学习以及其他领域中。之前的大部分研究都是基于线性条件下的属性选择,然而现实生活中的数据之间往往不是恰好线性的关系,有时需要去更多地考虑数据之间的非线性关系,因此可以引入核函数来实现非线性的属性选择。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !