基于相似度过滤的大数据保序匹配与检索算法

消耗积分:0 | 格式:rar | 大小:1.44 MB | 2017-11-20

分享资料个

　　伴随大数据时代的到来，数据快速保序匹配与检索成为众多大数据应用急需解决的关键问题，通过抽象与归约等措施，数据对象可抽象为具有若干属性的点集或序列，从而将数据匹配问题转化为字符或数字序列匹配问题。提出一种基于相似度过滤的数据保序匹配与检索算法，算法分三步：（l）数据转换，基于幅值变化趋势将原始序列转换为二进制，对序列中任何一个字符，通过判断包括其前后邻居在内的三个点的关系定义二进制序列，准确反映相邻三点之间的凸增长（降低）或凹增长（降低）关系；（2）数据归约，为方便候选序列与模式序列之间的相似度计算，运用基于幅度变化比例的数据归约方法，将候选序列与模式序列均归约到固定区间；（3）相似度计算，为区分不同趋势的凸增长（降低）或凹增长（降低）幅度，通过计算候选序列与模式序列对应点之间的差值绝对值之和作为相似度判断依据，提出基于相似度过滤的快速匹配方法，寻找与模式序列变化趋势一致的子序列集合，并按照相似度大小排序。理论分析与实验结果表明：（1）该算法具有亚线性时间复杂度；（2）该算法能有效解决Chhabra等人算法对数据震荡幅度失控的问题，同时解决数据序列与模式序列分段规律但整体不相似的闸题；（3）解决了Chhabra等人算法中对匹配序列排序造成的匹配结果疏漏问题。该方法不仅能更准确、更多地匹配出变化趋势一致的子字符串，同时将多个候选子串根据与模式之间的相似度进行排序，为进一步的数据精确检索提供判断依据。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

暂无相关数据

基于相似度过滤的大数据保序匹配与检索算法

基于稀疏高维大数据的增量模糊聚类算法

一种新型的自适应混合协同过滤推荐算法

大数据加密算法在数据安全中的应用综述

基于路口相似度的信号配时控制算法

基于机器学习的哈希检索算法综述

基于改进协同过滤算法的时间权重推荐

基于概率运动统计特征匹配的单目视觉SLAM算法

基于矩阵填充与PSO的多标准协同过滤算法

结合本体语义和用户属性的改进协同过滤算法

基于时空分析的交通路口相似度计算方法

基于蒙特卡洛相似度遗传算法的运输求解算法

采用余弦相似度的习俗非负矩阵分解算法

基于运算符信息的数学表达式检索技术

基于改进自适应权重的立体匹配优化算法

基于双峰高斯分布的深度哈希检索算法

融合边缘特征的立体匹配算法Edge-Gray

基于显式反馈的改进协同过滤算法研究

顶点序下图的支配集算法综述

用于实现AI、大数据、和数据科学的十大类算法资料下载

基于哈希算法和近邻算法的缓存数据选择策略

一种基于信任度的匹配拜占庭共识算法

一种融合多种类型上下文信息的协同过滤算法

可解决数据异构性问题的跨模态检索方法

针对协同过滤推荐算法的相似度计算方法

一种用于释义识别的句子相似度算法

一种改进的聚类联合相似度推荐算法

基于匹配理论的用户-子信道双边匹配算法

基于SVDPP算法的新型协同过滤推荐算法

如何使用深度卷积神经网络改进服装图像分类检索算法

使用Spark实现大规模单图上的子图匹配算法SQM的资料说明

如何实现一种针对关系数据库储存过程的空间可视化检索算法

淘宝API+API:图片搜索相似商品利器

软件系统的数据检索设计

相序保护器的工作原理、分类及选型

正序、负序和零序的产生原因

什么是正序电流？什么是负序电流？什么是零序电流？

OpenCV边缘模板匹配算法原理详解

双目影像密集匹配算法的综合分析

机器学习vsm算法

ARM体系结构之内存序与内存屏障

大数据是什么 大数据存储的概念 大数据应用场景有哪些

大数据的4v特征有哪些 大数据技术包括哪些技术

一文读懂经典双目稠密匹配算法SGM

大数据丨独家内部教材，让你掌握前沿技术算法

什么是模板匹配？模板匹配的原理讲解 图像处理与模板匹配算法

基于Hadoop的产品大数据分布式存储优化

每日一课 | 智慧灯杆之大数据采集技术简介

牛奶杂质度过滤机的操作步骤

杂质度过滤机的特点介绍

杂质度过滤机使用注意事项

杂质度过滤机的操作方法

关于遥感图像检索方案的简单说明

关于文本匹配的破城长矛

自然语言任务方案思考：句子相似度和匹配

深度过滤电子邮件里的“垃圾”的AI算法

SparkMLlib GBDT算法工业大数据的实战案例

避免大数据杀熟，先做好算法推荐

健康医疗大数据共享的五大应用价值

Google推出地标实例识别和图像检索人物数据集

保险行业采用大数据是为了什么

如何分析大数据

下载排行榜

大数据是什么大数据存储的概念大数据应用场景有哪些

大数据的4v特征有哪些大数据技术包括哪些技术

什么是模板匹配？模板匹配的原理讲解图像处理与模板匹配算法