×

如何在Spark环境下进行犯罪人员时空关联规则挖掘

消耗积分:0 | 格式:rar | 大小:0.79 MB | 2018-12-18

分享资料个

  针对关于潜在犯罪人员的预测、挖掘效果不佳,利用犯罪人员、交通出行和住宿消费等数据,在Spark分布式运算框架下,基于FP-growth的时空关联规则方法,分析犯罪人员数据和其他数据之间的关联规则,挖掘出潜在的犯罪人员。首次提出将关联规则算法用于普通出行消费数据实现潜在犯罪人员的预测。该方法已成功应用于X市警务系统,通过实践检验证明该方法在发现潜在犯罪人员方面的有效性。

  目前,国内外犯罪形势日益严峻,犯罪类型多样,犯罪人员数量增加,危害着人民生命财产安全和社会稳定。公安机关维护公共安全、打击犯罪的任务越来越重,执法要求越来越高。不断产生的犯罪数据要求分析人员挖掘犯罪数据潜藏的规律、分析犯罪数据之间的隐含关系,并且预测犯罪的发生、挖掘潜在的犯罪人员,从而提高公安执法的效率、预防犯罪的发生。

 

  关联规则挖掘(ARM)是数据挖掘领域的一个研究热点,作为数据挖掘中的经典算法之一,被广泛运用到犯罪学研究中。关联规则可以从大量数据和数据项之间的关联规则中挖掘犯罪的相关证据,进一步挖掘不同犯罪之间的犯罪规律、趋势和联系,向警方提供案件侦查和犯罪预防。在探究过去犯罪成因、确定主要嫌疑人、更好地理解系列犯罪方面,关联规则挖掘都能起到很好的效果。不同的关联规则挖掘算法在犯罪分析和犯罪预测领域起着重要作用。在国外的关联规则犯罪挖掘研究中,Ng V 等通过引入时间关联规则,提出一种增量算法,以解决关联规则中包含时间表达式的时间序列处理问题,用于发现香港地区犯罪模式[1]。Buczak 研究了模糊关联规则挖掘在社区犯罪模式中的应用,加速了当地执法工作[2]。Tan 首先分析了FP-Growth 算法在计算机犯罪取证中的作用,指出了FP-Growth 算法能够及时发现最新犯罪和严重犯罪的缺陷,并对FP-Growth 算法和测试进行了一些改进。最后指出了未来的研究方向:多维证据的提取与关联[3]。Joshi 提出FP-Tree 相似算法,用于挖掘经常性犯罪集合,并与Apriori 算法相比较,发现该算法更有效[4]。D. Usha 将Apriori 算法与其他Apriori、Fp-Growth 算法在真实和合成的犯罪数据集中进行测试,发现每种算法都有自身的优势,以便研究人员了解频繁模式挖掘算法在各个领域的应用[5] [6]。Shekhar 在犯罪模式分析(PCA)的基础上探讨了空间频繁模式挖掘(SFPM),并在空间犯罪数据集上验证了该挖掘方法[7]。Isafiade 重新探讨了犯罪模式挖掘的频繁模式增长模型,提出了一种基于四分位数(floor-ceil)函数的描述性统计方法,用于最小支持阈值(MST)选择。修改后的频繁模式增长(RFPG)模型进一步提出了一种模式,用于识别微妙犯罪模式序列的元组或犯罪活动中反复出现的趋势[8]。Asmai基于地理和人口因素,利用关联规则挖掘为犯罪人员制作犯罪映射模型。它检查了特定地点的犯罪发生情况,可以用来分析相对较高的未来犯罪地点,可以改进犯罪预防实施[9]。国内利用关联规则算法进行犯罪挖掘的研究也做了大量工作。以模糊集、Rough 集理论为基础,林和、虞龙江等利用关联规则挖掘对犯罪人员数据库进行定量分析、推断并提取规则,为犯罪预防提供理论指导[10] [11]。在犯罪画像、犯罪取证分析方面,关联规则挖掘引起广泛关注,得到广泛应用[12] [13] [14]。此外,关联规则挖掘被大量运用在犯罪侦查[15]、犯罪嫌疑人分析[16]、犯罪行为分析[17]、重新犯罪[18] [19]等犯罪研究领域。基于犯罪数据的时间和空间属性,许多研究提出改进的关联规则挖掘算法,如时空关联规则[20] [21]、聚类关联规则[22]、基于数据立方体的关联规则[23],其他改进的算法如增量关联规则[24]、改进的Apriori、

  FP-growth 算法也在财产犯罪分析等领域取得不错效果[25]。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !