Hadoop技术内幕:深入解析HadoopCommon和HDFS架构设计与实现原理

Hadoop技术内幕:深入解析HadoopCommon和HDFS架构设计与实现原理

评分

★★★★★

ISBN

9787111417668

出版社

机械工业出版社 2013-06-01出版

作者

蔡斌 陈湘萍

分类

编程设计

内容简介
“Hadoop 技术内幕”共两册,分别从源代码的角度对“Common+HDFS”和MapReduce 的架构设计与实现原理进行了极为详细的分析。本书由腾讯数据平台的资深Hadoop 专家、X-RIME 的作者亲自执笔,对Common 和HDFS 的源代码进行了分析,旨在为Hadoop 的优化、定制和扩展提供原理性的指导。
AI简介
这是一本从源代码的角度对Hadoop的Common和HDFS架构设计与实现原理进行了极为详细的分析的书籍。该书由腾讯数据平台的资深Hadoop专家、X-RIME的作者亲自执笔,对Common和HDFS的源代码进行了分析,旨在为Hadoop的优化、定制和扩展提供原理性的指导。 在数据指数级增长挑战的背景下,Hadoop应运而生。它是一个开源的分布式文件系统,能够处理大规模的数据集。Hadoop的核心组件包括HDFS(分布式文件系统)和MapReduce(分布式计算框架)。HDFS负责存储数据,MapReduce负责处理数据。通过Hadoop,互联网公司可以高效地处理TB级别和PB级别的数据,从而发现哪些网站更受欢迎,哪些商品更具有吸引力,哪些广告更吸引用户。 书中对Hadoop的配置文件进行了详细的介绍。配置文件是复杂软件不可或缺的一部分,在Hadoop各个子项目中发挥着重要的作用。Hadoop配置文件是基于健–值对构成的、结构相对简单的XML配置文件。这种配置文件可以被重启后的进程或者不同的进程使用,使得这些属性可以被重启后的进程或者不同的进程使用。 书中还对Hadoop的远程过
阅读/下载地址