Python数据分析入门：从数据获取到可视化

评分

★★★★★

ISBN

9787121336539

出版社

电子工业出版社 2018-03-01出版

作者

沈祥壮

分类

数据库

内容简介

本书作为数据分析的入门图书，以Python语言为基础，介绍了数据分析的整个流程。本书内容涵盖数据的获取（即网络爬虫程序的设计）、前期数据的清洗和处理、运用机器学习算法进行建模分析，以及使用可视化的方法展示数据及结果。首先，书中不会涉及过于高级的语法，不过还是希望读者有一定的语法基础，这样可以更好地理解本书的内容。其次，本书重点在于应用Python来完成一些数据分析和数据处理的工作，即如何使用Python来完成工作而非专注于Python语言语法等原理的讲解。本书的目的是让初学者不论对数据分析流程本身还是Python语言，都能有一个十分直观的感受，为以后的深入学习打下基础。最后，读者不必须按顺序通读本书，因为各个章节层次比较分明，可以根据兴趣或者需要来自行安排。例如第5章介绍了一些实战的小项目，有趣且难度不大，大家可以在学习前面内容之余来阅读这部分内容。

AI简介

这是一本以Python语言为基础，全面介绍数据分析流程的书籍。书中内容涵盖数据的获取、数据的存取与清洗、数据分析及可视化，以及Python与生活等多个方面。书中首先介绍了Python集成开发环境搭建，包括在Linux或Windows系统下搭建Python环境，以及安装和配置Anaconda(附带Spyder编辑器)和PyCharm。接着，书中深入讲解了Python基本语法，包括if__name__=='__main__'、列表解析式、装饰器、递归函数、面向对象等。此外，书中还介绍了Python的The Zen of Python，帮助读者理解Python语言的哲学。在数据的获取部分，书中详细介绍了网络爬虫程序的设计，包括请求网页数据、网页解析、数据的存储等。书中还介绍了爬虫进阶的内容，如异常处理、robots.txt、动态UA、代理IP、编码检测、正则表达式入门、模拟登录、验证码问题、动态加载内容的获取、多线程与多进程等。在数据的存取与清洗部分，书中介绍了基本文件操作、CSV文件的存取、JSON文件的存取、XLSX文件的存取、MySQL数据库文件的存取，以及NumPy和pa

推荐影视

阅读/下载地址

微信读书