随着时代的不断进步,信息化的气息也遍布在当今各个领域,尤其在计算机行业。随着系统硬件地不断精确化,系统软件更要不断的更新。近年来,研究者面临着接收、处理、分析爆炸式的数据信息的问题,如何使这些数据更加高效的运转成为了当今研究者普遍关心的问题。海量数据既为大量数据,在人们日常生活中,例如水利部门测量的大量数据,气象局不时获得的气象信息等,这些数据均极其庞大,同时这些数据的格式也是千变万化,有声音、文字、图像等。对于一个企业而言,这些数据至关重要,大量的数据统计不仅可发现客户潜在的需求,同时还能够开发出更多满足客服需求的应用。然而,任何事情均有两面性,数据量的增大必然会导致大量数据存储及处理速度的难题,为了解决以上难题就必须要求研究者不断提出更高效的算法,本文提出的算法就是在该问题的前提下研究更加高效的数据处理及分析方法。
目前,硬件系统的性能改善已提高到了有限度的境界。此外,文中可从软件上改善数据处理的方式,目前最流行的技术就是多核技术,该技术的核心为并行技术,即分而治之,本文所要讨论的并行技术为MapReduce技术和并行数据库技术这两种主流技术。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !