内容简介
本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,最后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。
AI简介
这是一本全面系统地介绍了如何使用Pandas进行数据导入、处理和输出的书籍。全书共10章,内容涵盖了Pandas数据处理环境搭建、Pandas中数据的存取、NumPy数据处理基石、表格管理技术、数据处理基础、字符串清洗技术、日期和时间处理技术、高级索引技术、数据汇总技术以及表格转换技术等。
书中详细介绍了如何使用Pandas导入Excel数据,并对数据进行整理和分析。例如,书中介绍了如何使用Pandas的read_excel函数来读取Excel文件,并使用DataFrame对象来存储和处理数据。同时,书中还介绍了如何使用Pandas技术对数据进行整理和分析,包括数据的增、删、改、查等常用操作。
此外,书中还介绍了与Pandas底层数据相关的NumPy库,包括数据的运算、分支、遍历等处理。例如,书中介绍了如何使用NumPy的array函数来创建数组,使用sum函数来计算数组中所有元素的和等。
书中还详细介绍了字符串清洗技术,包括正则、拆分、提取、查找和替换等。例如,书中介绍了如何使用正则表达式技术来匹配、查找和替换复杂的文本模式。
书中还详细介绍了日期和时间处理技术,包括时间戳和