内容简介
大数据贵在落实!本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”的指导思想编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数据的背景、概念、特性及关键技术;第二篇为Hadoop大数据平台搭建与基本应用,内容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等;第三篇为大数据处理与项目开发,包括交互式数据处理、协同过滤推荐系统、销售数据分析系统,并就京东的部分销售数据使用大数据进行处理分析。本书适合初学者入门和进阶,也可供希望全面、系统地理解并掌握大数据实际应用的读者参考,对从事大数据项目开发的专业人员也有参考价值。
AI简介
这是一本深入分析大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”的指导思想编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数据的背景、概念、特性及关键技术;第二篇为Hadoop大数据平台搭建与基本应用,内容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等;第三篇为大数据处理与项目开发,包括交互式数据处理、协同过滤推荐系统、销售数据分析系统,并就京东的部分销售数据使用大数据进行处理分析。
在大数据的基本概念和技术中,首先介绍了大数据的时代背景、概念和特征,然后深入讲解了大数据系统的技术支撑体系,以及大数据领域的主要职位及其能力要求。在Hadoop大数据平台搭建与基本应用中,详细介绍了Linux操作系统与集群搭建,HDFS安装与基本应用,MapReduce与Yarn,Hive和HBase的安装与应用,Sqoop和Kafka的安装与应用,以及Spark集群的安装与开发环境的配置。
在大数据处理与项目开发中,首先介绍了交互式数据处理,包括数据预处理、创建数据仓库和数据分析。然后介绍