AI简介
这是一本全面介绍Hadoop大数据开发的书籍,全书共11章,分为基础篇和提高篇两部分。基础篇包括第 1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平台。全书内容结构合理,知识点全面,讲解详细,重点难点突出。
在Hadoop概述中,介绍了Hadoop的基本概念、相关项目、来源、发展史、特点以及体系架构。在Hadoop基础环境配置中,详细讲解了如何准备Linux环境、配置Linux、搭建Hadoop环境。在分布式存储HDFS中,介绍了HDFS的概念、体系结构、文件存储机制、Shell介绍、项目创建、RPC通信原理、分布式文件系统操作类。在计算系统MapReduce中,介绍了MapReduce的概念、架构、第一个MapReduce案例、接口类。在计算模型Yarn中,介绍了Yarn概述、执行过程、新旧MapReduce的对比。在数据云