内容简介
This book is for Scala developers with a fairly good exposure to and understanding of machine learning techniques, but lack practical implementations with Spark. A solid knowledge of machine learning algorithms is assumed, as well as hands-on experience of implementing ML algorithms with Scala. However, you do not need to be acquainted with the Spark ML libraries and ecosystem.
AI简介
这是一本面向具备Scala编程经验并熟悉机器学习算法的开发者编写的实用指南。该书以Apache Spark 2.x为核心,结合Scala语言,全面探讨了机器学习的各个方面,包括准备事项说明、安装IntelliJ IDEA、机器学习的定义与目标、数据源的重要性、UCI machine learning repository、数据加载与转换、使用Spark 2.0的BinaryClassificationMetrics进行二分类模型评估、MulticlassMetrics对象的使用、内容过滤的定义和原理、矩阵分解技术、Word2Vec简介、使用Latent Semantic Analysis进行文本分析、结构化流处理简介、结构化流文档、SVD的概念和原理、梯度下降算法简介等关键内容点。
书中详细讲解了如何安装IntelliJ IDEA,并指导读者如何准备事项说明,确保读者能够顺利地开始使用Apache Spark进行机器学习开发。同时,书中还深入探讨了机器学习的定义与目标,并详细介绍了数据源的重要性,包括UCI machine learning repository等,帮助读者理解数据在