如何解决多源数据融合分析过程灵活性差和处理效率低的问题方法说明

消耗积分:0 | 格式:rar | 大小:0.57 MB | 2020-07-31

分享资料个

　　大规模网络环境和大数据相关技术的发展对传统数据融合分析技术提出了新的挑战。针对目前多源数据融合分析过程灵活性差，处理效率低的问题，提出了一种基于相似连接的多源数据并行预处理方法，该方法采用了分治和并行的思想。首先，通过对多源数据中的相似语义进行统一，对个性语义进行保留的预处理方法提高了灵活性;其次，提出了一种改进的并行MapReduce框架，提高了相似连接的效率。实验结果表明，所提方法在保证数据完整性的基础上，使总的数据量减小了32%.与传统的MapReduce框架相比，改进后的框架在耗费时间方面减小了43. 91%，因此该方法可以有效提高多源数据融合分析的效率.

　　多源数据的预处理过程是网络环境进行安全分析的重要环节，根据实际的应用采取相应的具体措施山。一般性地，包括数据清理、数据格式转换、数椐简约等过程。其中数据清洗作为一个重要的环节，通过按照一定规则筛选数据，去除数据中的冗余部分。好的数据清洗方法不仅能够降低系统处理数据所需的时间，并且能够提高数据分析结果的准确度。为了对数据源进行灵活的数据清洗，尽量保留数据源的个性属性，本文采用基于相似连接的数据清洗方法。相似连接在相似对象匹配问题中得到广泛应用，如互联网、数据分析、数据库等，匹配对象也日益多样，如串、图、字符串和集合等。为了适应各种各样的场景和对象，相似连接相关算法也得到了优化和改进。无论是基于单行串行数据还是集合数据，或是基于树结构还是图结构，优化和改进的方案主要以提高效率和灵活性或伸缩性为主。为了解决单行申行的相似连接候选集过多的问题，等提出了一种基于划分的传递性的相似连接，该方法在相似匹配过程中利用传递性没有使用全部子串，从而减少了匹配的候选集数目，提升了匹配的效率。为了提升算法的灵活性与伸缩性，Wang等提出了种快速相似连接算法，该算法既考虑到了相似的准确度，又考虑到了相似连接属性的模糊度，可以进行灵活的筛选;然而随着大数据与云计算等的出现，由于数据量的庞大导致算法效率低，这也是相似连接算法面临的难题之一。

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

STM32国内外发展现状
2024-04-08 14次下载

下载
传感芯片选型指南
2024-04-17 12次下载

下载
储能电源市场分析
2024-04-22 10次下载

下载
ATmega8芯片中文手册
2024-04-14 8次下载

下载
TDK电容器产品指南
2024-04-09 7次下载

下载
2A多电池高效开关充电器AN_SY6912A中文资料规格书
2024-04-14 7次下载

下载

如何解决多源数据融合分析过程灵活性差和处理效率低的问题方法说明

一种螺旋结构和梯度分析的图像融合算法

负载均衡处理器的运算资源分配策略

基于图像增强和神经网络的脑部CT与MRI图像融合

DN127-3V和5V 12位轨对轨微功率DAC集灵活性和性能于一身

DN298-LT1970运算放大器提供飞翔上可调的电流限制，在大电流应用中实现灵活性和负载保护

基于动态加权和卡尔曼滤波的多源雷达信息加权融合方法

西门子S7-400H-PLC的几种故障分析及处理方法

基于特征融合学习的三角网格显著区域检测方法

面向NoSQL数据库的JSON文档异常检测模型

基于比特币交易数据的增量聚类方法

结合多尺度边缘保持分解与PCNN的图像融合方法

融合多尺度与多层级特征的立体匹配方法

一种融合马尔科夫决策过程与信息熵的对话算法

8 通道、同时采样 ADC 实现真正 18 位性能并提供前所未有的灵活性

LTC6103 - 双路 60V 电流检测放大器具快速响应、高精度和灵活性

多特征融合的抑郁倾向识别方法详细说明

实现无线基础设施设备的高集成度和灵活性与低功耗和低成本的方案

如何使用CPLD与USB接口配合并使用MCU和FPGA与DSP进行编程的设计方法

使用相似连接进行多源数据并行预处理的方法概述

Access数据库不能写的问题应该如何解决详细办法说明

51单片机无法烧录程序应该如何解决详细方法说明

数据库教程之数据库的设计过程资料说明

图像融合的新思想和方法资料说明

使用EPWM模块0% - 100%占空比控制

一种基于组合融合策略的遥感影像融合方法

可编程逻辑技术在数字信号处理系统中的应用分析

视频图像处理硬件平台的系统原理和实现方法

基于PC的控制系统提升注塑工艺的灵活性和工件质量

开关电容变换器在能量收集电路中提供了性能和灵活性

利用 Arduino 的处理器灵活性获得更广泛的评估能力

意法半导体推出一款兼备智能功能和设计灵活性的八路高边开关

利用 IO-Link 提高工业 4.0 工厂的灵活性、利用率和效率

4G插卡路由器：无线上网的便利与灵活性

Samtec卓越产品 | SEARAY：最大限度提高设计灵活性和密度

SEARAY：最大限度提高设计灵活性和密度

集成组件为超声系统设计提供了灵活性

数字电源排序设计选择如何影响设计过程后期的灵活性

康瑞电子讲解连接器的设计具备灵活性是关键！

可调参考电压源为电路设计者提供了极大的灵活性

【解决方案】EtherCAT如何保障高效率、高实时性、高灵活性的现场总线通讯

【解决方案】EtherCAT如何保障高效率、高实时性、高灵活性的现场总线通讯

更新固件的灵活性 物联网设备的关键

物联网设备更新固件的灵活性

为什么物联网开发者看重蓝牙技术的灵活性

数据时代，如何重新定义NAS的灵活性？

弹性块存储的灵活性怎么样

传感器融合是怎样的一个过程

工业4.0提供兼具灵活性和连接性的解决方案

ADI研讨会:电路级分析信号调理方案实现传感器性能与灵活性

FPGA SoC通过融合FPGA和ASIC 跨越了灵活性和性能之间的界限

Beyond 100G标准的灵活性和可扩展性

Xilinx 16nm Kintex UltraScale+器件的性能、功耗和灵活性介绍

LoRa终端通信设计中应该考虑的协议灵活性

介绍 LTM9100 的特性及灵活性

介绍了解SoC FPGA可靠性和灵活性（3）

一种将电子配线架灵活性提升到新高度的创新方案

灵活性和高集成度于一身，教你ADC驱动器配置

流体数据体系结构解决数据的灵活性变化

LDS技术为Molex天线提供高柔性及设计灵活性

利用100W的智能功率模块来提升功能集成度、能效和灵活性

下载排行榜

STM32国内外发展现状

传感芯片选型指南

储能电源市场分析

ATmega8芯片中文手册

TDK电容器产品指南

2A多电池高效开关充电器AN_SY6912A中文资料规格书

更新固件的灵活性物联网设备的关键