内容简介
While a huge amount of data is readily available to us, it is not useful in its raw form. For data to be meaningful, it must be curated and refined.If you’re a beginner, then The Data Wrangling Workshop will help to break down the process for you. You’ll start with the basics and build your knowledge, progressing from the core aspects behind data wrangling, to using the most popular tools and techniques.This book starts by showing you how to work with data structures using Python. Through exampl
AI简介
这是一本全面探讨数据清洗和整理,以及如何使用Python进行数据分析和可视化的著作。书中不仅详细介绍了数据清洗和整理的重要性,还通过丰富的实例和练习,展示了如何利用Python中的列表、集合和字典等数据结构进行数据清洗和整理。
本书首先介绍了Python数据结构,包括列表、集合和字典的基本概念和特点,以及如何使用这些数据结构进行数据清洗和整理。接着,书中深入探讨了数据可视化方法,包括如何使用Python中的Matplotlib库进行数据可视化,以及如何通过图表和图形展示数据。
书中还详细介绍了NumPy库和Pandas库的基本概念和功能,以及如何使用这些库进行数据分析和可视化。例如,书中讲解了如何使用NumPy库进行数组操作,如何使用Pandas库进行DataFrame操作,以及如何利用Matplotlib库进行数据可视化。
此外,书中还介绍了Web Scraping技术,包括如何使用Python中的requests和BeautifulSoup库从网页中获取数据。同时,书中还探讨了数据问题及其解决方法,包括如何处理缺失值、异常值和重复值,以及如何格式化数据。
在书籍的后半部分,