模糊聚类算法及应用分析

电子常识

2585人已加入

描述

  聚类分析是从给定的数据集中搜索数据对象之间所存在的有价值的、数据分布模式。其主要解决的问题就是如何在没有得到先验知识的前提下,实现满足这种要求的聚簇聚合。聚类分析被广泛应用于金融数据的分析、空间数据处理、卫星图片分析等。笔者结合本校期中教学检查中对学生所作的问卷调查数据的分析,并根据模糊聚类分析的结果给出教师的教学效果评价[1]。

  1、模糊聚类分析

  模糊聚类中,每个样本不再属于某一类,而是以一定的隶属度属于每一类。即通过模糊聚类分析,得出样本属于各个不确定性程度,建立了样本对于类别的不确定性描述,这样更能准确地反映显示世界。模糊聚类不需要训练样本,可以直接通过机器学习达到自动分类的目的。模糊聚类不但可以从原始数据中直接提取特征,还能对已经得到的特征进行优选和降维操作,以免造成“维数灾难”。常用的模糊聚类算法有:模糊 C-均值算法、基于划分的聚类方法等。

  1.1 标定(建立模糊相似矩阵)

  (1)设样本集合 X= (x1,x2,…,xn),n 为样本数目。设每一个样本 xi 由一组特征数据(xi1, xi2, …,xim)表示。为了使具有不同量纲的实际问题中的不同数据可以进行比较,通常将对实测数据作如下两种变换,将数据压缩到[0,1]区间


  (2)建立模糊相似矩阵 R,主要是确定其相似系数 rij,即:xi 与 xj 的相似程度。求相似系数 rij 的方法很多,常见的有:

  1.2 聚类(对样本集合进行分类)

  首先,定义矩阵的模糊乘法“o”运算规则如下:

  2、模糊聚类分析应用

  2.1 数据收集

  本例源自吉林建筑工程学院计算机学院 2008-2009 学年第一学期学生对教师课堂教学情况的问卷调查资料,参与调查的教师是本学期承担计算机专业课授课的教师,参加此项活动的学生近 500 人次,调查的课程有数字逻辑、多媒体技术、高等数学、计算机微型接口、数学建模、网络安全及计算机组成原理等课程。对教师的授课从教书育人、备课充分程度、讲课知识量、重点突出、课堂互动性、教学内容的新颖性及多媒体技术的使用等方面进行,每一项满分 10 分

  2.2 建立相似矩阵

  通过对学生的调查结果进行统计分析,建立了模糊相似矩阵,本例选用夹角余弦计算法计算相似系数rij[4-6] 。计算相似矩阵见表 1

  2.3 聚类

  采用直接聚类法作出动态聚类图(如图 1 所示)。从该类图可得出样本聚类结果,即将学生评价教师教学情况样本分为3类时的聚类为:

  {1,2,3,5},{6,10},{4,7,8,9}。

  聚类分析的原理为:先聚为一类的样本相似程度高。本例中 rij 是相似系数,从动态聚类过程可以看出,聚成 3 类时,一类样本 1,2,3,5 是严格要求,善于管理,既教书又育人;备课充分,课程内容娴熟,讲课精神饱满;作业批改认真,辅导答疑及时;讲课有吸引力,能激发学生兴趣,课堂气氛活跃比较相似,说明教师的责任心及其个人素质较高;二类样本 6 和 10 是对问题阐述深入浅出,思路清楚,有启发性;能给予学生思考、联想、创新的启迪相似,说明教师的能够在教学环节中引入创新思维方式;三类样本 4、7、8、9 是讲课内容充实,信息量大,重点突出;教学内容能反映或联系学科的新思想,新概念,新成果;因材施教,启发思维,重视培养学生动手能力;能有效利用各种媒体相似。说明任课教师的教学方法和教学环节的管理能力相关。

  3、结论

  聚类分析是数据挖掘中的一种非常有用的技术,在聚类分析过程中,可以给出分类数,但可以不给出分类标准,同时,如果 rij 的计算方法不同,相同的样本也可能会得出不同的聚类结果,因此在实际应用中,应结合问题实际进行聚类分析,从而选择 rij 的计算方法。对教师授课质量的聚类分析,不能给出教师讲课在传统意义上的排序,但它能很好地实现评价的诊断功能,为今后选择评价项目和指标提供依据,充分发挥评价体系的激励作用,促进教师授课质量及整体教学水平的提高.

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 相关推荐

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分