内容简介
If you are interested in building efficient business solutions using Hadoop, this is the book for you This book assumes that you have basic knowledge of Hadoop, Java, and any scripting language.
AI简介
这是一本深入讲解Hadoop大数据平台,包括其核心概念和高级应用的书籍。本书详细阐述了Hadoop在大数据处理中的作用,包括其分布式文件系统HDFS和MapReduce编程模型,以及如何在企业级环境中部署和使用Hadoop。
书中首先介绍了Hadoop的起源和发展,以及Hadoop在解决大数据问题中的核心地位。接着,本书深入探讨了MapReduce编程模型,包括其执行模型和YARN架构,以及如何在Hadoop平台上构建和优化MapReduce程序。
此外,本书还详细介绍了Hadoop平台上的数据采集工具,如Sqoop、Flume和Kafka,以及数据访问工具,如Hive、Pig和Hbase。这些工具可以帮助用户更有效地在Hadoop平台上进行数据处理和监控。
本书还深入探讨了如何使用Hadoop构建360度客户视图,以及如何利用Hadoop构建欺诈检测系统和营销活动规划。此外,本书还介绍了如何在移动电信行业中应用客户流失检测,以及如何使用Hadoop分析传感器数据。
本书还详细介绍了Hadoop生态系统的发展趋势,包括Hadoop与其他数据库系统的共存,以及流式分析的需求限制。