×

基于哈希存储与事务加权的Apriori算法

消耗积分:0 | 格式:pdf | 大小:1.41 MB | 2021-03-17

分享资料个

Aprior算法能够挖掘事物之间的关联关系,但传统Δ prior算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提岀一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高 Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统 Apriori算法的性能提升越明显,其运行时间与FP- Growth算法相近但避免了Pp- Grow th算法内存占用过大的问题。

基于哈希存储与事务加权的Apriori算法

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !