The Applied Data Science Workshop

The Applied Data Science Workshop

评分

★★★★★

ISBN

9781800207004

出版社

Packt Publishing 2020-07-22出版

作者

Alex Galea

分类

编程设计

内容简介
From banking and manufacturing through to education and entertainment, using data science for business has revolutionized almost every sector in the modern world. It has an important role to play in everything from app development to network security.Taking an interactive approach to learning the fundamentals, this book is ideal for beginners. You’ll learn all the best practices and techniques for applying data science in the context of real-world scenarios and examples.Starting with an introduc
AI简介
这是一本专注于数据科学和机器学习应用的书籍,它通过实际案例和Jupyter Notebook环境,引导读者逐步了解数据科学的基本概念和流程。这本书的内容涵盖了从数据探索到模型优化的各个方面,包括数据清洗、特征工程、模型训练、模型评估和模型部署等。 书中首先介绍了数据探索的基本概念,包括如何使用pandas和seaborn库进行数据处理和可视化。接着,书中深入探讨了计算特征统计量的方法,以及如何通过数据预处理技术将原始数据转化为模型能够处理的格式。此外,书中还详细介绍了支持向量机(SVM) 和k-近邻算法(k-NN) 等分类器的原理和应用。 在模型优化方面,书中详细讲解了模型验证与优化方法,包括如何使用k-fold交叉验证和主成分分析(PCA) 等技术来评估和优化模型性能。书中还介绍了如何通过数据集划分方法来防止过拟合,并使用验证曲线来找到最优的模型复杂度参数。 除了理论讲解,书中还通过实际案例展示了如何应用这些技术和方法来解决实际问题。例如,书中通过分析人力资源数据集,展示了如何构建一个分类模型来预测员工离职概率。此外,书中还介绍了如何使用Web Scraping技术从互联网上获
阅读/下载地址