Hands-On Data Science and Python Machine Learning

Hands-On Data Science and Python Machine Learning

评分

★★★★★

ISBN

9781787280229

出版社

Packt Publishing 2017-07-31出版

作者

Frank Kane

分类

编程设计

内容简介
If you are a budding data scientist or a data analyst who wants to analyze and gain actionable insights from data using Python, this book is for you. Programmers with some experience in Python who want to enter the lucrative world of Data Science will also find this book to be very useful, but you don't need to be an expert Python coder or mathematician to get the most from this book.
AI简介
这是一本专注于数据科学和机器学习领域的实践指南。本书首先介绍了Python基础,包括Python作为一种编程语言的基本特性和运行环境,以及Python丰富的标准库和第三方库。此外,还介绍了使用matplotlib可视化数据的方法,通过matplotlib库来创建各种图形,以帮助我们理解和分析数据。 在本书中,作者详细讲解了计算方差的步骤,包括计算数据的平均值、计算每个数据点与平均值的差、计算差的平方、计算平方差的平均值,最终得到方差。此外,还介绍了回归分析及其形式,包括线性回归、多项式回归和多元回归,以及普通最小二乘法的原理和概念。 本书还深入探讨了决策树的构建过程,包括特征选择、决策树生成和决策树剪枝,以及随机森林工作原理与优势。随机森林是一种集成学习算法,通过构建多个决策树并将它们的预测结果进行投票,从而得到最终预测结果。随机森林具有更好的泛化能力,能够减少过拟合,提高对新数据的预测能力,并且具有较高的预测准确性和稳定性。 此外,本书还介绍了Spark安装与特点,包括Spark的安装过程、主要特点以及其核心数据结构RDDs,还有Spark的机器学习库MLlib,以及Spark
阅读/下载地址