内容简介
This book is for those with a mathematical/statistics background who wish to understand the concepts, techniques, and implementation of predictive analytics to resolve complex analytical issues. Basic familiarity with a programming language of R is expected.
AI简介
这是一本面向具备数学/统计学背景的读者,旨在帮助读者理解预测性分析的概念、技术和实施。本书以R语言作为编程工具,涵盖了从基本的数据探索到复杂的模型构建,以及模型部署和评估的整个过程。书中不仅详细介绍了预测性分析的各个方面,还涉及了一些超越标准回归和分类任务的预测分析技术,如生存分析和市场篮分析。
本书的特色在于其深入和全面的介绍,以及其实用的案例和练习。书中通过大量的案例和练习,帮助读者理解预测性分析的基本概念和技术,并通过实践来掌握这些技术。此外,本书还包含了大量的图表和示例代码,使得读者可以更好地理解预测性分析的过程和结果。
本书的内容分为多个部分,包括预测性分析概述、数据科学中的数据挖掘技术、结构化方法在分析项目中的应用、管理者的职责与模型开发、数据科学团队的组成与分工、回归算法的基本概念、决策树算法的优势、时间序列数据的定义与特点、时间依赖数据概念、SparkR的简介、对未来医疗行业的预测、机器学习在Spark中的应用等。这些部分涵盖了预测性分析的所有重要方面,包括理论、实践、技术、团队管理、行业应用等。