k-means算法自提出50多年来,在聚类分析中得到了广泛应用,但是,k-means算法存在一个突出的问题,即需要预先设定聚类数目。所以,本文针对如何自动获取k-means的聚类数目进行了研究。为了确定聚类数目,许多学者从聚类有效性指数方面进行了研究,该类成果大多数都结合了类内紧凑性和类间分离性这两个因素。一般说来,这些方法用类中对象和类中心距离的平均值及其变形来衡量类内紧凑性,用类中心之间的距离来衡量类间分离性。它们较少考虑类中对象数目的多少以及对象的分布情况,因此在某些情况下不能很好地度量类间的分离情况。本文从类内紧凑性和考虑近邻的类间分离性出发,定义新的分离性指数,并设计了新的有效性指数。
另一方面,k-means算法得到的结果实际上是一种二支决策结果,只考虑了对象与类的两种关系,即:对象要么属于一个类要么不属于一个类。这种聚类结果没有反映某些应用背景下的对象与类的不确定性关系,即对象可能属于某个类。因此,本文提出了三支决策聚类,来进一步表示对象与类的不确定性关系。基于三支决策聚类的思想,笔者相继在基于密度的重叠聚类、不完备数据秉类、重叠区域细分、增量重叠聚类等方面进行了一些研究工作。
因此,本文引入三支决策思想,提出一种基于k-means算法框架的自动三支决策聚类方法,该方法扩展了k-means算法使之适用于不确定性聚类,并能够自动地得到聚类数目。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !