×

改进的Eclat 数据挖掘算法的研究

消耗积分:3 | 格式:rar | 大小:197 | 2009-08-18

分享资料个

本文针对两种常用的频集算法Apriori 和FP-growth,指出了它们各自的优缺点。数据
库的表示方法主要有两大类:水平数据表示和垂直数据表示。通常,采用垂直数据表示的算法的性能优于采用水平数据表示的算法。然后在深入分析Eclat 算法的基础上提出了它的一种改进形式的Eclat。改进后的Eclat 的计算性能优于Eclat 和FP-Growth 算法。
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越
多。数据挖掘在最近几年也获得了广泛的关注。本文在数据挖掘背景下展开了关联规则挖掘中Eclat 算法及其改进算法的研究工作。传统的频集挖掘算法包括Apriori、FP-Growth 等。
Apriori 的改进算法主要考虑减少扫描数据库次数以及产生尽可能少的候选集这两个方面。
而FP-Growth 的改进算法则主要考虑减少构建FP 一树的消耗以及尽可能地节省内存。虽然这些改进算法应用在一些数据集中取得了不错的效果,但应用在其它一些数据集可能效率很差。本文主要讨论一种新的算法Eclat,它只需扫描数据库2 次,并且采用交操作来计算支持度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !