AI简介
这是一本以Python 3版本作为数据分析与挖掘实战的应用工具,从Python的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。
全书从数据分析与挖掘的概述与区别出发,让读者对数据分析与挖掘有一个清晰的认识。接着,作者详细讲解了Python在数据分析中的应用,包括数据清洗、数据探索性分析、数据建模和预测等多个方面。在数据清洗方面,作者强调了数据清洗的重要性,并详细介绍了如何处理重复观测、缺失值和异常值。在数据探索性分析方面,作者通过实例展示了如何通过图表来理解数据的分布和关系。在数据建模和预测方面,作者详细介绍了如何使用Python的机器学习模块构建和训练各种模型,并对模型进行预测和评估。
此外,本书还详细介绍了离散型数据的可视化、数值型数据的可视化、预测性或分类性问题的解决步骤、岭回归和LASSO回归的系数求解、决策树的基本概念和特点、随机森林的概念和特点、KNN