fcm聚类算法优缺点有哪些

留在灵魂尽头 2017-11-03 34082

电子常识

2688人已加入

描述

　　1965年美国加州大学柏克莱分校的扎德教授第一次提出了‘集合’的概念。经过十多年的发展，模糊集合理论渐渐被应用到各个实际应用方面。为克服非此即彼的分类缺点，出现了以模糊集合论为数学基础的聚类分析。用模糊数学的方法进行聚类分析，就是模糊聚类分析。

　　FCM算法是一种以隶属度来确定每个数据点属于某个聚类程度的算法。该聚类算法是传统硬聚类算法的一种改进。

　　 FCM

　　fcm聚类算法流程：

　　（1）标准化数据矩阵；

　　（2）建立模糊相似矩阵，初始化隶属矩阵；

　　（3）算法开始迭代，直到目标函数收敛到极小值；

　　（4）根据迭代结果，由最后的隶属矩阵确定数据所属的类，显示最后的聚类结果。

　　fcm聚类算法优点：

　　相比起前面的”硬聚类“，FCM方法会计算每个样本对所有类的隶属度，这给了我们一个参考该样本分类结果可靠性的计算方法，我们可以这样想，若某样本对某类的隶属度在所有类的隶属度中具有绝对优势，则该样本分到这个类是一个十分保险的做法，反之若该样本在所有类的隶属度相对平均，则我们需要其他辅助手段来进行分类。

　　fcm聚类算法缺点：

　　算法在分类时有个主要的不足是，当样本不平衡时，如一个类的样本容量很大，而其他类样本容量很小时，有可能导致当输入一个新样本时，该样本的K个邻居中大容量类的样本占多数。该算法只计算“最近的”邻居样本，某一类的样本数量很大，那么或者这类样本并不接近目标样本，或者这类样本很靠近目标样本。无论怎样，数量并不能影响运行结果。

　　该方法的另一个不足之处是计算量较大，因为对每一个待分类的文本都要计算它到全体已知样本的距离，才能求得它的K个最近邻点。

打开APP阅读更多精彩内容