内容简介
本书以R语言简介、数据挖掘基础为开篇,旨在让读者对所用工具及数据挖掘方法有所了解。随后的章节借助实际案例(数据挖掘网站用户行为分析及网页智能推荐、生活服务点评网站客户分群、水冷中央空调系统的优化控制策略、电商评价文本的主题特征词分析、均线投资策略等),从数据预处理、模型选择、算法介绍、R语言实现、结论分析及评价等方面进行详尽的论述,希望读者既可以了解数据分析与挖掘的一般流程及方法,又能对常用的算法及模型有所了解。每个案例分析都是一篇完整的论文,初学者通过它们可以了解数据分析与挖掘的一般流程及方法,有一定基础的读者可以思考算法的优劣与选择。不管是对数据分析与挖掘感兴趣的入门者,还是希望获得实践经验的初学者,都可以从本书中获得支持。
AI简介
这是一本以R语言为工具,深入讲解数据挖掘理论及应用的著作。书中从R语言的下载和安装入手,为读者详细介绍了R语言的基本操作,以及如何使用R语言进行数据分析。接着,作者深入探讨了数据挖掘基础概念,包括数据挖掘的定义、模型、功能以及基本流程,使读者对数据挖掘有一个全面深入的理解。
书中以实际案例为引导,详细阐述了数据挖掘网站用户行为分析及网页智能推荐、生活服务点评网站客户分群、水冷中央空调系统的优化控制策略、电商评价文本的主题特征词分析、均线投资策略等实际问题的分析方法与过程。这些案例既包含了数据预处理、模型选择、算法介绍、R语言实现、结论分析及评价等数据挖掘的一般流程,又包含了常用的算法及模型,使读者既可以了解数据分析与挖掘的一般流程及方法,又能对常用的算法及模型有所了解。
在用户分群分析方法这一章节中,作者详细讲解了如何通过数据预处理和聚类算法对用户进行分群,以及如何根据用户分群的结果,为用户提供有针对性的、个性化的服务。在优化控制策略研究背景这一章节中,作者探讨了水冷中央空调系统的智能控制与节能,并通过实测数据,挖掘空调能耗与可控变量之间的关系,寻求在冷却负载一定的条件下空调的最优