×

如何使用概率模型进行非均匀数据聚类算法的设计介绍

消耗积分:0 | 格式:rar | 大小:0.98 MB | 2018-12-13

分享资料个

  针对传统K-means型算法的“均匀效应”问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化( EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。

 

  聚类分析作为数据挖掘的一种重要方法,目的是将给定数据划分成多个子集(每个子集为一个簇),使得簇内对象彼此相似,与其他簇对象不相似]。传统的聚类算法可分为层次聚类、基于划分聚类、基于密度和网格聚类,以及其他聚类算法。目前聚类分析已广泛应用在Web搜索、图像处理、模式识别、医疗数据分析等众多领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !