针对传统的拉普拉斯评分特征选择算法只适应单标记学习,无法直接应用于多标记学习的问题,提出一种应用于多标记任务的拉普拉斯评分特征选择算法。首先,考虑样本在整体标记空间中共同关联和共同不关联的相关性,重新构建样本相似度矩阵;然后,将特征之间的相关性及冗余性判定引入拉普拉斯评分算法中,采用前向贪心搜索策略依次评价候选特征与已选特征的联合作用能力,用于评价特征的重要性;最后,在5个不同评价指标和6个多标记数据集_上实验。实验结果表明:相比基于最大依赖的多标记维数约简方法( MDDM)、基于贝叶斯分类器的多标记特征选择算法(MLNB)及基于多元互信息的多标记分类特征选择算法(PMU),所提算法不仅分类性能最优,且存在显著性优异达65%。
多标记学习是目前机器学习、模式识别和数据挖掘等领域的研究热点之一。多标记学习中每个样本不仅由一 ~组特征向量描述,还可能同时有多个语义,将多个语义设计成多个标记。例如:在图像标注“中, - 幅图同时具有“沙漠”“蓝天”“风景”等几个语义信息;在文本分类学习131中, -篇文档具有“上海世博会”“经济”和“志愿者”等几个主题;在音乐乐曲中,一首乐曲可能同时具有“放松”“幸福”“安静”和“难过”等几个情感语义。多标记学习中多个语义标记并不互斥,因此有别于单标记学习中的多个类别。多标记学习不仅需要了解利用多个标记之间的信息,同时仍然需要解决冗余特征、维数灾难等问题。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !