内容简介
在数据为主导的今天,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。《数据分析师养成宝典》共27章,分为业务理解篇(第1~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(第17~19章)和实战进阶篇(第20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以R语言为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。本书可供数据科学相关技术人员阅读,也可作为高等院校数据科学相关专业的教材或培训教材,以及数据分析爱好者的参考读物。
AI简介
这是一本全面、深入、系统地探讨数据分析师职业的书籍。该书以业务理解、指标设计、数据建模、价值展现和实战进阶五个篇章,详细阐述了数据分析师的职业内涵和实际操作技能。
在业务理解篇中,书籍首先阐述了正确的思维观,强调了数据分析师需要具备的业务理解能力,以及用户理解能力。接着,书籍进一步讲解了如何理解数据,包括数据源质量、数据类型、数据集质量、平均水平、数据分布、量变关系、多维交叉等方面。
在指标设计篇中,书籍深入讨论了数据准备的重要性与过程,包括数据探索、数据整理、数据归约和数据变换等步骤。接着,书籍进一步阐述了数据认知的定义和重要性,包括数据的位置特性、分散性、关联性等数字特征和反映数据整体结构的分布特征。
在数据建模篇中,书籍以R语言为计算平台,详细讲解了神经网络、回归分析、聚类分析、关联分析、决策树、随机森林决策树、自适应选择决策树、SVM等多种数据建模技术,并提供了建模指导。
在价值展现篇中,书籍主要讨论了如何撰写有价值的数据分析报告,包括如何写好数据分析报告,如何使用数据可视化,以及如何利用数据分析报告制作工具。
在实战进阶篇中,书籍通过对8个经典案例的分析,使读者能够