内容简介
If you want to discover one of the latest tools designed to produce stunning Big Data insights, this book features everything you need to get to grips with your data. Whether you are a data architect, developer, or a business strategist, HDInsight adds value in everything from development, administration, and reporting.
AI简介
这是一本深度探讨HDInsight服务和Azure上的大数据分析的书籍。这本书涵盖了Hadoop和HDInsight在云计算中的应用,Azure上的HDInsight服务,以及数据湖的构建和管理等多个方面。
本书首先介绍了HDInsight服务概述,解释了Hadoop概念和HDInsight服务,以及HDInsight服务在Azure上的部署选项。接着,书中深入探讨了传统EDW面临的挑战与局限,以及构建基于Hadoop的现代数据架构。
在数据湖方面,书中详细介绍了HDInsight Service on Azure,Administering Your HDInsight Cluster,Ingest and Organize Data Lake,以及Transform Data in the Data Lake等关键内容。这些内容详细解释了如何在Azure上创建和管理HDInsight集群,以及如何将数据导入和转换到数据湖中。
书中还深入探讨了数据湖数据分析与报告方法,包括如何使用Excel和Power Query等工具进行数据分析和报告。此外,书中还详细介绍了Hive用于ad