时兴频集挖掘算法的辨析

消耗积分:2 | 格式:rar | 大小:555 | 2008-10-24

分享资料个

研究了当前几种时兴的频集挖掘算法（Apriori，DF，FP－growth 和DCI）及其技术特点，并对其分类和界定适用范围。对其算法复杂性及时空执行效率等性能指标进行了定性和定量的综合分析。研究的结果对于在各种应用环境下的
关联挖掘系统的设计具有参考价值。
关键词：　频集挖掘；　Apriori；　DF；　FP－growth；　DCI
种频集挖掘算法及其特点
2．1　Apriori 算法
A priori算法是目前最为著名也是应用最为广泛的一种算法，并且目前许多算法都是在A priori的基础上优化和改进而来的。A priori算法核心思想是：首先扫描一遍数据库D ，产生频繁1 项集L 1，然后产生频繁2 项集L 2，直到有某个r 值使得L r 为空，这时算法停止。在第k 次循环过程中，首先产生候选k－项集的集合C k，C k 中的每一个项集是对2 个只有一个项不同的属于L k－1 的频集做一个（k － 2）连接产生的。C k 是用来产生频集的候选集，为了决定C k 中的元素是否频繁，必须扫描数据库D 计算其支持度，因此频集L k 是C k 的一个子集［1］。C k 中的每个元素需进行验证来决定其是否加入L k ，这里的验证过程是算法性能的一个瓶颈。A priori算法的不足之处在于：1）可能产生大量的候选集。例如，当长度为1 的频集有104 个的时候，长度为2 的候选集个数将会超过107；2）如果要生成一个很长的规则时，要产生的中间元素也是巨量的。
2．2　DF 算法
D F 算法其实是A priori的一种改进算法，最重要的区别在于其采用了深度优先的方法，这也正是其称之为D F（D epth F irst）的原因。D F 算法采用了层次树（trie）来存储频繁项集。因为任何一个频繁集的子集也是频繁的，所以trie 很适合用来存储频繁项集。D F 算法执行如下操作［2］：扫描一遍数据库；计算各个项的支持度；并将频繁项按支持度排序；在主存中建立trie，trie 从根到叶子的每一条路径代表一个唯一的频繁项集；最后，算法输出trie 中的所有路径，即所有的频繁项集。

算法

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

爱华AIWA HS-J202维修手册
2025-12-22 34次下载

下载
PC5502负载均流控制电路数据手册
2025-12-19 22次下载

下载
飞利浦D8714收录机说明书
2025-12-02 12次下载

下载
⼯业电源&模块电源产品⼿册
2025-11-28 6次下载

下载
H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
2025-12-10 6次下载

下载
UWB653Pro USB口测距通信定位模块规格书
2025-12-16 5次下载

下载

时兴频集挖掘算法的辨析

数据挖掘的流程 数据挖掘分类算法

文本挖掘之概率主题模型综述

面向飞行器遥测数据的关联规则挖掘算法

基于粗糙集的低密度人群异常行为识别算法

基于判断聚合模型的数据挖掘分类算法

基于区块挖掘与重组的组合优化算法

基于循环神经网络的电影推荐算法

权重模糊粗糙集的改进规则挖掘算法

面向大规模MIMO系统的信道估计算法

数据挖掘原理与算法

基于CNN的无线电调频广播同频干扰检测算法

基于脉冲神经网络的迁移学习算法

面向K近邻分类性能的遗传训练集优化算法

面向差分数据挖掘隐私保护的随机森林算法

数据挖掘的改进k近邻高维分类算法综述

基于数据挖掘的核医学文本关联规则挖掘方法

基于滑动窗口的宽度优先搜索算法

顶点序下图的支配集算法综述

基于Spark平台的并行化关联规则挖掘方法

集成流挖掘和图挖掘的内网异常检测方法

数据挖掘在恶性肿癌与工业污染之间的应用

一种基于检测器集层次聚类的否定选择算法

一种面向开发集的模糊域自适应算法

如何使用FPGA实现时频二维搜索捕获算法

基于哈希存储与事务加权的Apriori算法

从日志数据挖掘高质量数据的DTS算法

如何使用邻接树的数据结构提高遗传算法的挖掘效率

多普勒频移定位算法的资料免费下载

如何使用阈值自适应忆阻器Hopfield神经网络进行关联规则挖掘算法

数据流频繁模式挖掘的详细资料说明

基于析因设计的大数据相关关系挖掘算法

用树莓派挖掘5种顶级加密货币！

K折交叉验证算法与训练集

数据挖掘的应用领域,并举例说明

充分挖掘SiC FET的性能

机器学习的基本流程和十大算法

基于Python实现随机森林算法

关于数据挖掘的十种算法原理讲解

一文弄懂数据挖掘的十大算法，数据挖掘算法原理讲解

middlebury数据集是什么

机器学习与数据挖掘的区别 机器学习与数据挖掘的关系

数据挖掘和机器学习有什么关系

数据挖掘十大算法

python数据挖掘案例

python数据挖掘与机器学习

人工智能有哪些算法

人工智能的算法有哪些？

人工智能、算法与机器学习辨析

高质量手势识别数据集让手势识别算法更准确

一文解析并查集（Union-Find）算法原理

望繁信速递：一文看懂任务挖掘和流程挖掘的区别

数据挖掘的定义及算法

机器学习算法使用机器来了解给定的数据集

了解数据挖掘的概念和特点

你了解大数据分析模型吗

数据挖掘的四类方法

数据挖掘常用算法

监狱新型劳动：给商业文章打标签，为AI初创公司的算法提供训练数据集

代码实例及详细资料带你入门Python数据挖掘与机器学习

盘点史上最全的Python算法集

教你如何制作最强挖掘机

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

⼯业电源&模块电源产品⼿册

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

UWB653Pro USB口测距通信定位模块规格书

数据挖掘的流程数据挖掘分类算法

机器学习与数据挖掘的区别机器学习与数据挖掘的关系