内容简介
Exploratory Data Analysis (EDA) is an approach to data analysis that involves the application of diverse techniques to gain insights into a dataset. This book will help you gain practical knowledge of the main pillars of EDA - data cleaning, data preparation, data exploration, and data visualization.You’ll start by performing EDA using open source datasets and perform simple to advanced analyses to turn data into meaningful insights. You’ll then learn various descriptive statistical techniques t
AI简介
这是一本深入探讨探索性数据分析(EDA)的实用指南。书中以Python作为数据分析工具,详细介绍了如何从原始数据中提取有价值的信息,并通过数据可视化的方式呈现出来。
本书首先介绍了探索性数据分析的基本概念和目标,然后详细讲解了如何通过数据清洗、数据转换等技术,将原始数据转化为适合分析的格式。书中还详细介绍了统计学的基本概念和作用,如中心趋势度量和离散程度度量等,这些概念对于理解数据的特征和规律至关重要。
在数据可视化方面,书中介绍了多种常用的可视化工具,如matplotlib、seaborn和plotly等,并通过实际案例展示了如何使用这些工具进行数据分析。书中还详细讲解了如何对品质标签进行编码,以及如何划分训练集和测试集,这些都是机器学习项目中的重要步骤。
在模型评估方面,书中介绍了多种常用的评估方法,如准确率、精确率、召回率和F1分数等,并通过实际案例展示了如何使用这些方法来评估模型的性能。书中还详细介绍了如何使用statsmodels库进行假设检验,以及如何使用简单线性回归来描述两个变量之间的关系。