×

小型Hadoop集群的数据分层调度处理算法分析

消耗积分:0 | 格式:rar | 大小:0.78 MB | 2017-11-03

分享资料个

  随着全球进入互联网时代,数据获取技术的不断发展带来数据量不断激增,数据的抓取调度成为关键信息有效采集的重点问题。与此同时,计算机受物理器件性能的限制,为了满足数据处理的要求,MySQL数据库面对的调度处理的要求也在逐渐提高,仅依靠CPU主频的提升并不能快速的处理大数据带来的压力,快速有效的算法成为目前数据挖掘的主流。本研究致力于数据挖掘分层调度处理,抓取的目标为各数据集的维度特征信息,最终设计并实现一种白配置的Hadoop分布式数据调度算法。因此,为了完成数据集分层调度功能的设计与实现,本系统主要包括两大基本模块:数据集的分层模块和调度模块。采用凝聚层次聚类对数据集进行分层处理,结合小型Hadoop分布式系统实现数据集分层调度。

小型Hadoop集群的数据分层调度处理算法分析

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !