Apache Kylin权威指南

Apache Kylin权威指南

评分

★★★★★

ISBN

9787111557012

出版社

机械工业出版社 2017-01-01出版

作者

Apache Kylin

分类

数据库

内容简介
在数据分析领域,大部分的技术都诞生在国外,特别是美国,从最初的数据库,到以Hadoop为首的大数据技术,再到今天各种DL(Deep Learning)、AI,等等。但我国拥有着世界上独一无二的“大”数据,最多的人口、最多的移动设备、最活跃的应用市场、最复杂的网络环境等,应对这些挑战,我们需要有自己的核心技术,特别是在基础领域的突破和研发方面。今天,以Apache Kylin为首的各种来自中国的先进技术不断涌现,甚至在很多方面都大大超越了国外的其他技术,这一点也彰显了中国的技术实力。
AI简介
这是一本详细讲解Apache Kylin的书籍,从Apache Kylin的架构和技术特点,到在Hive中准备数据,再到设计和构建Cube,以及增量构建的概念和必要性,实时数据更新需求,Kylin的查询页面和查询方式,Kylin的查询与可视化方式,维度诅咒与Cuboid剪枝优化,空间与时间的平衡策略,衍生维度与聚合组的应用,Cube优化的策略与实践,Apache Kylin的日常维护,计算引擎和数据源的扩展方法,聚合类型和维度编码的扩展,为什么参与开源,Kafka消息队列的使用等多个方面,都进行了深入的讲解。 书中首先介绍了Apache Kylin的架构和技术特点,包括其技术架构、预计算技术、可扩展架构等。随后,书中详细讲解了在Hive中准备数据的过程,包括数据格式、数据分区、数据倾斜和数据质量等多个方面。接着,书中介绍了设计和构建Cube的过程,包括创建Cube、设计维度、选择构建引擎以及处理增量构建等多个步骤。 书中还深入讲解了增量构建的概念和必要性,以及实时数据更新需求,并详细介绍了Kylin的查询页面和查询方式,以及Kylin的查询与可视化方式。此外,书中还深入讲解了维度诅
阅读/下载地址