内容简介
统计学习是机器学习的重要分支,本书兼顾了数学上的理论和代码实践,内容主要包括基础知识和统计学习模型。第1章、第2章结合VC维介绍过拟合的本质,并介绍手动特征选择的办法; 第3章、第4章从最简单的线性模型出发经过概率统计的解读而得到分类和回归算法; 第5章讨论不依赖于假设分布的非参数模型; 第6章介绍将核方法作为一种非线性拓展的技巧,介绍如何将该方法应用到很多算法中,并引出了著名的高斯过程; 第7章以混合高斯作为软分配聚类的代表性方法,从而引出著名的EM算法; 第8章讨论了机器学习的集成算法; 第9章介绍的线性和非线性降维方法将会解决维度灾难问题,并且不同于单纯的特征选择; 第10章讨论不依赖于独立同分布假设的时间序列算法。
AI简介
这是一本深度探讨统计学习中的核心问题的书籍。书中以数学和代码实践相结合的方式,详细介绍了统计学习的基础知识和模型。全书内容分为十章,涵盖了从线性模型到非线性模型,从参数模型到非参数模型,从监督学习到无监督学习,从特征选择到降维,从时间序列分析到集成学习等多个方面的内容。
书中首先介绍了过拟合的本质,并通过VC维进行了解释,同时介绍了手动特征选择的方法。接着,从最简单的线性模型出发,通过概率统计的解读,得到了分类和回归算法。书中还讨论了不依赖于假设分布的非参数模型,以及将核方法作为一种非线性拓展的技巧,并将其应用到很多算法中,引出了著名的高斯过程。同时,以混合高斯作为软分配聚类的代表性方法,从而引出著名的EM算法。
此外,书中还讨论了机器学习的集成算法,以及线性和非线性降维方法,这些方法将有助于解决维度灾难问题,并且不同于单纯的特征选择。最后,书中还讨论了不依赖于独立同分布假设的时间序列算法。
书中还详细介绍了各种统计学习模型的原理和应用,包括贝叶斯回归、贝叶斯分类、K近邻算法、高斯过程、Bagging、随机森林、Boosting、模型组合策略、隐马尔可夫模型等。书中通过大量的实例