内容简介
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者阅读。通过学习本书,读者可以快速了解数据仓库,全面掌握数据仓库相关技术。
AI简介
这是一本以电商企业为背景,详细阐述了数据仓库从需求规划、需求实现到数据可视化的全过程的实战指南。书中以数据仓库概念和特点为起点,逐步深入,通过项目需求分析和系统功能结构两个关键内容点,为读者揭示了数据仓库项目的基本框架。书中还详细介绍了系统流程图的设计方法,让读者对数据仓库项目的运作流程有了直观的认识。
在数据仓库搭建环境准备方面,书中以Linux环境准备与配置为起点,逐步深入到Hadoop环境搭建与配置,最后详细介绍了Presto安装配置及优化,为读者提供了全面的数据仓库搭建指南。
在数据仓库的建模理论方面,书中详细介绍了数据仓库搭建模块,包括数据仓库理论准备和数据仓库建模实践,为读者提供了全面的数据仓库建模指导。
在数据治理各功能模块的实现方面,书中详细介绍了用户行为数据采集模块、业务数据采集模块、集群监控模块、权限管理模块和元数据管理模块,为读者提供了全面的数据治理指导。
在数据可视化方面,书中详细介绍了数据可视化模块,包括Superset部署和Superset使用,为读者提供了全面的数据可视化指导。
在即席查询方面,书中详细介绍了即席查询模块,包括Presto和Kyl