×

Apriori算法简介和聚类分析模型介绍

消耗积分:0 | 格式:rar | 大小:0.1 MB | 2017-09-26

分享资料个

  Apriori 算法的挖掘思想:Apriori 算法采用的是逐层搜素的策略,同时依据其性质压缩搜索空间。而它的性质是说,如果一个项集具有频繁性,则它的所有非空子集也一定是频繁项集。它的基本思想在于,首先,扫描一次事物集合,找出频繁 1 -项集集合 L1,然后基于 L1,产生所有可能的频繁 2 -项集即候选集 C2,接着基于 L1 对 C2 进行必要的剪枝操作。对 C2 的优化完成后,再扫描一次事务集合,找出下一个频繁候选集,如此迭代,直至再也找不出频繁集时退出。

  在实际的应用中,关联规则主要应用于商品购买的关联行为,比如针对一个卖场,可以通过对大数据的关联分析发现面包与牛奶之间的购买行为,从而可以针对性进行促销或是适当调整商场的物品摆放。所以关联分析是大数据分析特别有效的模型,针对性比较强。

  Apriori算法简介和聚类分析模型介绍

  聚类分析模型聚类分析

  模型简介:是指将物理的或抽象的对象的集合分成相似的对象集的过程,最终的结果是同一个簇中的对象具有较高的相似性,而不同簇之间的对象则具有较大的差异性。聚类分析的三要素为相似度测度,聚类准则和聚类算法。相似度测度主要用于衡量同簇对象的类似性和不同簇对象的差异性,而聚类准则则是用于评价聚类结果的好坏,聚类算法用于找出使准则函数取极值的最好聚类结果。目前大数据聚类分析中比较常用的算法主要有划分式聚类算法、基于密度的聚类算法、层次聚类算法、以及基于网格的聚类算法。其中比较比较典型的是划分式聚类算法。

  划分式聚类算法的挖掘思想:划分式聚类算法的其代表是 K 均值算法、K 中心点算法以及它们的一些变种。K 均值聚类算法假定所有的数据对象课分为 K 个簇,每个簇的中心用均值表示,对象间的相似性用距离度量,聚类的准则使用误差平方和准则。它的核心在于首先选定 K 个初始聚类中心,根据最小距离原则将每个数据对象分类到每一簇中。聚类分析模型是一个比较简单的大数据分析模型,但是它可以对大型数据集进行高效地划分,它也是数据挖掘的重要模型之一,在实际工作中已经取得广泛的应用,是众多企业处理大数据不二的选择。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !