内容简介
With huge amounts of data being generated every moment, businesses need applications that apply complex mathematical calculations to data repeatedly and at speed. With machine learning techniques and R, you can easily develop these kinds of applications in an efficient way.Practical Machine Learning with R begins by helping you grasp the basics of machine learning methods, while also highlighting how and why they work. You will understand how to get these algorithms to work in practice, rather t
AI简介
这是一本专注于机器学习与R语言实践相结合的书籍。本书从数据清洗和预处理入手,逐步深入至特征工程,神经网络,线性回归,无监督学习以及集群分析技术等核心内容,为读者提供了一套完整的机器学习解决方案。
在数据清洗和预处理部分,书中详细阐述了如何处理异常值,缺失值和重复值,并介绍了如何通过多重插补等方法来处理数据集的不平衡问题。同时,书中还详细介绍了数据框的操作,以及如何通过排序,筛选,子集等操作来处理数据。
在特征工程部分,书中深入讲解了特征选择,特征转换和特征生成等技术,并介绍了如何通过时间序列特征,类别变量处理等方法来处理不同类型的特征。同时,书中还介绍了如何通过随机森林和LVQ等方法来评估特征的重要性。
在神经网络部分,书中详细介绍了神经网络在分类问题中的应用,并讲解了如何使用groupdata2包来创建平衡分区,减少数据泄露。同时,书中还介绍了如何使用交叉验证来评估和选择模型。
在线性回归部分,书中详细介绍了线性回归模型的训练,评估与优化,并讲解了如何使用R2指标来评估模型的解释能力,如何使用交叉验证来评估模型的性能。
在无监督学习部分,书中详细介绍了集群分析技术,包括DI