自己动手做大数据系统(第2版)

自己动手做大数据系统(第2版)

评分

★★★★★

ISBN

9787121382024

出版社

电子工业出版社 2020-04-01出版

作者

刘未昕

分类

数据库

内容简介
在第一版的基础上,根据近几年大数据领域最新出现的各种流行组件,逐个进行介绍,并以两个具体的示例,贯穿各个章节,对组件之间的协同工作关系进行剖析。新增大数据平台架构选型及最佳实践案例,大数据治理,流计算开发,flink等流式大数据处理。基于docker的大数据运维部署等部分,书中所使用的示例程序,是基于笔者在进行企业培训时,企业提出的业务需求而展开,示例程序更有代表性。
AI简介
这是一本深度探讨大数据系统构建和管理的实用指南。该书以大数据概述为起点,详细介绍了大数据系统的安装及配置,包括服务器及操作系统的准备,Hadoop及JDK的安装和配置,以及Hive在大数据处理中的角色等内容。书中详细讲解了离线大数据处理的过程,包括使用Python爬虫获取数据,使用Hive在大数据中的角色,使用HBase实现大数据存储,以及使用Spark数据分析引擎等内容。此外,书中还详细介绍了流式大数据处理的过程,包括使用Flume获取网站访问日志,使用Kafka的安装、配置及其与Flume的整合,以及使用Flink简介及其与Kafka的整合等内容。 在介绍大数据系统构建的过程中,书中详细讲解了云平台搭建的过程,包括搭建基于云平台的容器级数据系统,以及飞谷云平台架构及发展历程等内容。书中还详细介绍了基于容器的大数据系统构建的过程,包括云计算平台和容器技术等内容。 在介绍大数据系统管理过程中,书中详细讲解了数据仓库设计的过程,包括事实表、维度表、聚合表等,以及Hive在大数据处理中的角色等内容。书中还详细介绍了大数据的5V特征,包括数据类型多样(Variety)、数据量大(Volu
阅读/下载地址