在现今不断发展的信息化社会中,企业产生了海量的数据资料。怎样利用和分析这些数据,使得决策人员能够以更简单易懂的方式看到查询结果和数据,为企业提供有利的决策信息,成为企业关注的问题。数据仓库和联机分析处理是现在企业进行数据分析使用的一种方式。目前市场上大多数的OLAP展示工具都需要安装庞大的客户端来支持各种报表的功能,并且价格昂贵,不为多数企业所选用;而对于开源的OLAP展示工具,大部分只能提供简单的分析操作,不具备完整的报表工具,而且多采用关系型数据库存储数据,对数据的结构性要求很好,同时缺少扩展性、伸缩性和对海量数据的处理能力,在企业数据爆炸式增长的情况下不能满足企业数据分析的要求。云平台的出现,为处理海量数据提供了新的出路。
云平台具有处理海量信息的能力,结合这一特点进行研究和分析,将多维数据分析系统架构在云平台上,使用云平台的强大的计算、存储能力以及高可靠性、高扩展性的优势,使用Hive数据仓库处理和分析数据,将结果返回到展示层,然后使用JPivot、ExtJS等相关技术对结果进行处理,形成简洁友好的报表展示。
本文首先分析了OLAP系统在国内外发展的现状,确定了本文以云平台的Hive数据仓库和关系型数据相结合的角度进行分析和研究实现,然后介绍了联机分析处理(OLAP)、Hadoop平台、Hive与关系型数据库转换工具、前台显示技术Jpivot等相关技术,然后进行了云平台上多维数据分析系统的架构设计,分别从关系型数据库部分和Hive数据仓库与关系数据库同步的方面进行系统的详细设计和实现。本系统前台釆用ExJS框架、后台采用关系型数据库和Hive数据仓库结合的形式对多维数据分析进行支持,完成了整个系统的编码工作,最后进行测试。该系统完成了关系型数据库和Hive数据仓库之间数据的同步,完成了报表设计,存储和展示等的功能,同时实现了多维数据的钻取、上卷、切片、切块、旋转等的OLAP操作。在论文的最后,对工作进行了总结和展望。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !