Spark Cookbook 中文版

Spark Cookbook 中文版

评分

★★★★★

ISBN

9787115429667

出版社

人民邮电出版社 2016-10-01出版

作者

Rishi Yadav

分类

软件学习

内容简介
Spark是一个基于内存计算的开源集群计算系统,它非常小巧玲珑,让数据分析更加快速,已逐渐成为新一代大数据处理平台中的佼佼者。本书内容分为12章,从认识ApacheSpark开始讲解,陆续介绍了Spark的使用、外部数据源、SparkSQL、SparkStreaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。本书适合大数据领域的技术人员,可以帮助他们更好地洞悉大数据,本书也适合想要学习Spark进行大数据处理的人员,它将是一本绝佳的参考教程。
AI简介
这是一本全面介绍Apache Spark使用和开发的实用指南。这本书涵盖了从Spark的安装与配置,到使用Spark开发应用,再到Spark SQL,Spark Streaming,机器学习,监督学习,无监督学习,推荐系统,图像处理,以及优化及调优等各个方面的内容。 书中首先介绍了Spark的安装与配置,包括通过二进制文件安装Spark,通过Maven构建Spark源码,以及在Amazon EC2上部署Spark等。这些内容对于初学者来说非常重要,可以帮助他们快速上手Spark。 接着,书中深入探讨了使用Spark开发应用,包括使用Spark shell,在Eclipse和Intellij IDEA中使用Maven和SBT开发Spark应用等。这些内容可以帮助开发者更好地理解和使用Spark。 书中还详细介绍了外部数据源,包括从本地文件系统加载数据,从HDFS加载数据,从Amazon S3加载数据,从Apache Cassandra加载数据,以及从关系型数据库加载数据等。这些内容可以帮助开发者更好地处理和分析大数据。 此外,书中还讲解了Spark SQL,Spark Strea
阅读/下载地址