AI简介
这是一本以Python语言为主,面向数据科学初学者的实战指南。全书共20章,涵盖了数据科学及其应用的各个方面,引入经典数据集将理论与实践相结合,采用Jupyter等工具,由浅入深地介绍了数据科学及相关学科的基本概念、数据预处理、机器学习及时间序列等内容,并提供了不同的案例研究,以达到学以致用的效果。
全书从数据科学领域概述开始,为读者提供了全面的视角,让我们了解数据科学家的工作、数据科学的定义、数据科学基本概念、数据科学应用实例、案例研究、统计思维以及数据集等方面。然后,详细介绍了如何在Windows、macOS或者Linux系统上安装和配置Anaconda,一个流行的Python数据科学平台。
书中还详细讲解了Python中列表和字典的基本概念和操作,以及如何使用Python的Help()函数来了解函数的详细信息。同时,也介绍了NumPy数组属性,包括数组的创建、类型、访问、连接以及与其他数据结构的比较等方面。
在数据预处理方面,书中详细介绍了如何处理缺失值、如何缩放和归一化数据、如何解析日期、如何应用字符编码、如何清洗不一致的数据等。在机器学习方面,书中详细介绍了监督式、无监