Hadoop大数据技术开发实战

Hadoop大数据技术开发实战

评分

★★★★★

ISBN

9787302534020

出版社

清华大学出版社 2019-10-01出版

作者

张伟洋

分类

数据库

内容简介
本书以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解了VMware中CentOS7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。通过阅读本书,读者即使没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书可作为Hadoop新手入门的指导书,也可作为大数据开发人员的随身手册以及大数据从业者的参考用书。
AI简介
这是一本以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术的书籍。全书共16章,第1章讲解了VMware中CentOS 7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。 在书中,作者详细讲解了Hadoop的基本概念与架构原理,包括HDFS的体系结构、MapReduce设计思想、YARN集群的架构和工作流程等。作者还详细介绍了HDFS的体系结构,包括NameNode和DataNode的组成,以及HDFS的存储架构。此外,作者还讲解了MapReduce设计思想,包括MapReduce的任务流程和工作原理。 在讲解Hadoop生态系统时,作者详细介绍了YARN集群
阅读/下载地址