内容简介
You already know you want to understand supervised learning, and a smarter way to do that is to learn by doing. The Supervised Learning Workshop focuses on building up your practical skills so that you can deploy and build solutions that leverage key supervised learning algorithms. You'll learn from real examples that lead to real results.Throughout The Supervised Learning Workshop, you'll take an engaging step-by-step approach to understand supervised learning. You won't have to
AI简介
这是一本专注于监督学习的实践指南,旨在帮助读者通过实际操作来理解并应用监督学习算法。书中通过详细的目录和丰富的内容,引导读者逐步深入监督学习的基础理论,探索数据质量的重要性,并通过数据探索来理解数据集的特征。
本书强调数据质量的重要性,指出数据质量问题可能会导致模型的性能下降,甚至无法正常工作。为了提高数据的质量,书中提供了多种方法,包括在数据清洗过程中避免引入额外噪声,以及对数据集进行全面的了解等。
在探索数据集特征的过程中,书中介绍了如何使用pandas库和matplotlib库等工具进行数据可视化,并通过计算摘要统计量、分析缺失值、探索单变量分布和多变量关系等方法来预处理数据集。
书中还详细介绍了监督学习算法的基础理论,包括线性回归、多项式回归、自回归模型等,并解释了这些算法的工作原理和应用场景。此外,书中还讨论了机器学习的基本概念,包括机器学习是什么,它是如何工作的,以及它与其他形式的学习有何不同。
在模型评估方面,书中强调了模型评估的重要性,并介绍了多种评估指标和方法,如均方误差、均方根误差、平均绝对误差、准确率、精确率、召回率和F1分数等。此外,书中还介绍了如何通过