内容简介
本书面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplotlib可视化模块,用于绘制一些统计图形;第6章主要讲解Flask框架结合ECharts实现可视化效果;第7章主要讲解在机器学习和数据挖掘中sklearn模块的应用。 本书适合作为高等院校大数据专业、人工智能专业的Python教材,也可作为Python相关培训的教材。
AI简介
这是一本面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例的书籍。本书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplotlib可视化模块,用于绘制一些统计图形;第6章主要讲解Flask框架结合ECharts实现可视化效果;第7章主要讲解在机器学习和数据挖掘中sklearn模块的应用。
本书第1章介绍了NumPy数组的操作技巧与运用,包括数组的形状及其相关操作、数组的数据类型操作、读取外部数据创建数组、查看NumPy数组的数据类型以及NumPy数组的创建与保存等。第2章讲解了数据清洗的方法与操作,包括查找所有存在缺失值的行、删除缺失值、填充缺失值、处理重复值以及设置与重置索引等。第3章介绍了JSON数据交换格式,包括JSON的基本概念、特点以及应用。第4章讲解了pymysql的基本使用方法与实例,包括