AI简介
这是一本详细阐述数据科学中统计学概念的著作。本书首先介绍了探索性数据分析的起源,并详细解释了结构化数据的定义和分类,包括数值型数据和分类型数据等。书中还详细介绍了箱线图的概念和作用,以及样本均值与总体均值的区别。
书中进一步介绍了中心极限定理的定义和重要性,以及假设检验的概念和目的。同时,还详细介绍了重抽样的概念和目标,以及统计显著性的定义和重要性。此外,书中还详细介绍了多元线性回归的基本概念,以及回归诊断的概念与重要性。
在分类部分,书中详细介绍了朴素贝叶斯算法的基本概念,以及混淆矩阵的定义和计算。同时,还详细介绍了KNN的基本原理与算法流程,以及提升方法简介。在聚类部分,书中详细介绍了层次聚类的定义和特点,以及基于模型的聚类方法概述。