内容简介
Starting with the basics, Applied Unsupervised Learning with R explains clustering methods, distribution analysis, data encoders, and features of R that enable you to understand your data better and get answers to your most pressing business questions. This book begins with the most important and commonly used method for unsupervised learning - clustering - and explains the three main clustering algorithms - k-means, divisive, and agglomerative. Following this, you'll study market basket an
AI简介
这是一本专注于数据分析和机器学习的书籍,旨在帮助读者理解并掌握无监督学习的重要方法,包括聚类、概率分布、维度 reduction和异常检测等。书中详细介绍了如何使用R语言来实现这些方法,并通过实例展示了如何将这些方法应用于解决实际问题。
本书首先介绍了聚类方法,包括k-means算法、k-medoids算法以及层次聚类和分裂聚类的比较。接着,深入探讨了概率分布的构建和应用,包括生成不同分布的样本、估计概率分布函数以及比较不同样本的分布。书中还详细介绍了维度 reduction 技术,包括市场篮子分析和主成分分析,以及这些技术在数据比较中的应用。
此外,本书还深入探讨了异常检测的方法和应用,包括数据转换在异常检测中的应用、异常检测方法与应用以及市场细分的定义和用途。书中还详细介绍了删除不相关变量进行数据预处理的方法,以及构建概率分布的方法。
书中通过大量的实例和案例,展示了如何使用这些方法来解决实际问题。例如,书中通过分析超市的购买数据,展示了如何使用市场篮子分析来优化商品布局和促销策略。通过分析图像数据,展示了如何使用主成分分析来实现数据可视化、特征提取和降维等任务。通过分析信用