AI简介
这是一本以Spark机器学习为核心,结合大数据分析和算法原理的实战指南。全书分为三大部分:基础篇(1-2章)对Spark机器学习进行概述、并通过Spark机器学习开始进行数据分析;算法篇(3-8章)针对分类、聚类、回归、协同过滤、关联规则、降维等算法进行详细讲解,并进行案例支持;综合案例篇(9-12章)重点通过异常检测、用户画像、广告点击率预估、智慧交通大数据4个综合场景,详细讲解基于Spark的大数据机器学习综合应用。
在基础篇中,本书首先对大数据与机器学习的关系进行了阐述,强调了大数据为机器学习提供了丰富的数据资源,而机器学习则利用这些数据资源进行模型训练和预测。接着,对机器学习算法的分类进行了详细的讲解,包括传统机器学习、深度学习和其他机器学习。此外,还介绍了数据分析的概念和重要性,强调了数据分析在商业智能中的关键作用。
在算法篇中,本书详细讲解了分类、聚类、回归、协同过滤、关联规则、降维等算法。例如,在构建分类模型时,书中介绍了分类模型的基本概念,并讲解了如何使用逻辑回归、决策树、支持向量机等传统机器学习算法以及多层神经网络等深度学习算法。在构建聚类模型时,书中介绍了聚类模