Hadoop与大数据挖掘(第2版)

Hadoop与大数据挖掘(第2版)

评分

★★★★★

ISBN

9787111709473

出版社

机械工业出版社 2022-07-01出版

分类

人工智能

内容简介
这是一本讲解如何基于Hadoop技术栈进行大数据挖掘和分析的著作。它能带领你零基础快速掌握Hadoop技术栈,以及基于它的大数据挖掘与分析的流程和方法。      全书核心内容分为两部分。      1)Hadoop技术栈:详细讲解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大数据技术的基础、原理、应用,通过这部分内容读者能对Hadoop技术栈有从宏观到微观的了解。      2)Hadoop大数据挖掘:通过3个综合案例,逐步展示了基于Hadoop的大数据挖掘的完整流程和方法。      几位作者在大数据项目研发、教育、咨询等领域有10余年的丰富经验,对教育界和企业界供需两端的了解非常深入,全书的结构和内容围绕这两端的需求尽心设计,能让Hadoop大数据挖掘与分析的教育和学习事半功倍。      本书第1版出版后,获得了教育界和企业界的良好反馈,其中数十家高等院校采用本书作为教材或参考书。第2版在第1版的基础上,在技术适应性、案例实用性等方面做了大量更新,与时俱进,更有竞争力!      为了便于学习和教学,本书配套数据文件、实现代码、课后习题
AI简介
这是一本全面讲解Hadoop技术栈与大数据挖掘分析的书籍。全书分为两部分,一部分详细讲解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大数据技术的基础、原理、应用,让读者对Hadoop技术栈有从宏观到微观的了解。另一部分通过三个综合案例,逐步展示了基于Hadoop的大数据挖掘的完整流程和方法。 书中首先介绍了大数据的概念与特征,让读者对大数据有一个基本的认识。然后深入讲解了数据挖掘的概念与过程,让读者了解如何从大量数据中提取出有价值的信息和知识。接着,详细阐述了Hadoop技术概念与架构,包括Hadoop框架的主要组件、应用场景以及安装配置过程。 在Hadoop技术栈部分,书中进一步介绍了Hive在大数据处理中的应用,包括Hive的基本架构、查询语句、自定义函数等。同时,还讲解了ZooKeeper的安装与部署,以及HBase的安装操作和常用的HBase Shell操作。此外,还介绍了Flume安装与配置,以及Flume采集方案设计。 在大数据挖掘部分,书中通过构建图书热度实时分析系统,展示了如何利用Kafka、Flume和Spark Streaming
阅读/下载地址