Spark大数据处理:技术、应用与性能优化

Spark大数据处理:技术、应用与性能优化

评分

★★★★★

ISBN

9787111483861

出版社

机械工业出版社 2014-11-01出版

作者

高彦杰

分类

数据库

内容简介
这是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。
AI简介
这是一本全面、深入讲解Spark的书籍。从技术层面,书中讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;从应用角度,书中讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。 首先,书中对Spark在工业界的应用进行了详细的介绍。Spark起源于学术界,发展于工业界,现在已经成为大数据分析不可或缺的计算框架。例如,Yahoo!很早就开始使用Spark,将Spark用于自己的广告平台、商品交易数据分析和推荐系统等数据分析领域。同时Yahoo!也积极回馈社区,与社区形成良好的互动。 其次,书中对配置文件设置方法进行了详细的讲解。配置文件设置方法是一种用于调整Spark应用程序性能的重要手段。在Spark应用程序的开发中,需要根据具体的算法和应用场景选择调优方法,没有万能的解决方案。每一种调优方法对一些方面的性能可以优化,对另一些方面的性能可能会产生损耗。 此外,书中还对调度与分区优化进行了详细的讲解。调度与分区优化是Spark运行过程中的重要环节,它直接影响到Spark程序的执行效率和性能。Spark的调
阅读/下载地址