内容提要

这是一本 Hadoop 实用手册,主要针对实际问题给出相应的解决方案。本书特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS 的概述、Pig 与 Hive 的使用、ETL 和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍 Hadoop 的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。

本书适合各个层次的Hadoop技术人员阅读。通过阅读本书,Hadoop初学者可以使用Hadoop 来进行数据处理,Hadoop 工程师或者数据挖掘工程师可以解决复杂的业务分析, Hadoop系统管理员可以更好地进行日常运维。本书也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。

Get Hadoop实际解决方案手册 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.