一系列最好的Hadoop书籍,帮助你更轻松的上手这项技术

电子说

1.2w人已加入

描述

很多人都认为大数据应用程序是IT行业的未来,Hadoop是开发大数据应用程序最常用的技术之一。Hadoop 最早诞生于 2006 年,并在2008年成为Apache顶级项目,至今,Hadoop已经走过了12个年头,这对于任何软件的生命周期来说是很长的。

虽然早有唱衰Hadoop的声音,但许多国内外企业的大数据平台用到了非常多的 Hadoop 生态组件,因此,Hadoop技术并非老矣。话说回来,学习Hadoop并使用它并不容易,要掌握这项技术并成为一名成功的开发人员,你可能需要一些好书来助你一臂之力

在本文,我收集了一系列最好的Hadoop书籍,这些书籍可以帮助你更轻松的上手这项技术:

1、《Hadoop: The Definitive Guide》

数据集

本书对于那些需要分析数据集和建立Hadoop集群的程序员来说,绝对是一本理想指南,它将教你如何使用Apache Hadoop构建和维护可靠的、可伸缩的分布式系统。还有一些关于YARN的章节以及与Hadoop相关的几个项目(包括 Parquet, Flume, Crunch, and Spark),你将可以通过本书挖掘Hadoop构建分布式数据集的强大功能。

2、《Hadoop Explained》

数据集

本书主要向读者介绍Hadoop的基本概念,通过本书你将学到的有:

Hadoop组件的基础知识

如何使用MapReduce

Yarn基础知识

使用HDFS Federation

Hadoop的优势

Hadoop如何处理大数据

3、《Programming Hive》

数据集

这是一本全面的指南,通过它你将了解Hive在Hadoop生态系统中的工作方式,并了解如何在你的环境中设置和配置Hive。它还提供了真实的案例研究,帮助你解决大数据相关的疑难杂症。

4、《Modern Big Data Processing with Hadoop》

数据集

本书对Hadoop组件进行了一个全面的解释,使你能够使用Hadoop设计、构建和执行有效的大数据分析。如果你想成为一名Hadoop架构专家,这将是你必读的一本书,通过它你将学到:

企业数据架构原则

Hadoop与Apache Spark、Elasticsearch等多种大数据框架结合使用

使用Apache Ambari设置和部署大数据环境

使用Spark开发大规模数据处理解决方案

理解Hadoop管理和集群部署

5、《Hadoop Security》

数据集

美亚评分4.5。如果你更关注Hadoop的安全性,那么你应该阅读这本书,它展示了在安全漏洞发生时,如何制止攻击者破坏和修改数据的解决办法,从本书你将学到:

如何构建安全的Hadoop集群硬件

了解Kerberos网络身份验证协议

数据提取和客户端访问安全性

6、《Data Analytics with Hadoop》

数据集

美亚评分4.0。本书同样是介绍Hadoop生态圈技术的指南书籍,它向你展示了如何利用Hadoop在大数据集上使用统计和机器学习技术。你将从这本书中学到

理解Hadoop和集群计算的基本概念

使用Spark进行内存计算

使用Apache Hive和HBase执行数据挖掘和存储

使用高级API进行分析

使用Spark的MLlib进行机器学习

7、《Expert Hadoop Administration》

数据集

美亚评分4.3。对于希望在任何环境中创建、配置、保护、管理和优化Hadoop集群的Hadoop管理员来说,本书绝对是一本很棒的书。这本书解释了复杂的Hadoop环境,并向你展示了在管理集群时背后的原理,并对问题和解决方案进行详细的解释。

8、《Architecting Modern Data Platforms》

数据集

美亚评分满分5分。如果你是一位希望构建端到端企业数据平台的企业架构师或数据工程师,那么,这本书将是你的必备指南。这本书将教你如何将Hadoop这样的大数据技术应用到你的大数据应用程序当中去,并学会在本地和云中构建大数据平台

9、《Practical Hive》

数据集

美亚评分满分5分。对于希望将关系数据库迁移到Hadoop的人来说,这本书绝对是必读书籍,本书由数据库专家和大数据专家共同撰写,具体内容包括:Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性,等等。

10、《Hadoop 2.x Administration Cookbook》

数据集

这是一本入门书籍,它将通过示例逐步解释如何将数据导入和导出到Hive,并使用Oozie管理工作流。它还提供了实用的方法来保护Hadoop集群,并使其高度可用。通过它,入门Hadoop应该是没有什么大问题。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分