内容简介
这是一本从基本操作、架构设计、进阶使用、运维管理、拓展应用、项目实战等多个维度全面讲解Doris的著作,是资深数据仓库专家兼Doris开源项目贡献者实战经验的总结,得到了Apache Doris PMC主席、Select DB创始人兼CEO以及多位Apache Doris PMC的强烈推荐。通过本书,读者不仅能零基础快速掌握Doris的原理和使用,还能获得搭建离线/在线实时数仓的项目实战经验。
全书内容从逻辑上分为四个部分:
基础篇(第1-4章):首先介绍了Doris的功能特点、架构设计、应用场景,然后讲解了Doris的编译、安装、部署、建表等基本操作,以及Doris的数据对象和数据模型。
进阶篇(第5-7章):从执行原理、用法详解、应用举例3个维度详细讲解了Doris的数据导入、数据查询和查询优化,层层递进。
拓展篇(第8-10章):结合目前流行的Flink框架和各种常用外部表讲解了Doris的拓展应用,还讲解了Doris的集群管理。
实战篇(第11-14章):首先从具体应用的角度介绍了离线数据仓库和实时数据仓库搭建的痛点和难点,然后用2个综合项目讲解了如何结合Doris实
AI简介
这是一本从基本操作、架构设计、进阶使用、运维管理、拓展应用、项目实战等多个维度全面讲解Doris的著作。该书首先介绍了Doris的功能特点、架构设计、应用场景,然后讲解了Doris的编译、安装、部署、建表等基本操作,以及Doris的数据对象和数据模型。
书中详细介绍了Doris的集群安装与配置,包括硬件和软件的选择、集群角色的分配、通信端口的配置、集群高可用性的实现、进程的自动恢复、以及数据库访问和用户管理等内容。同时,也对Doris的数据导入实战进行了总结,包括常规的INSERT INTO语句,以及Stream Load、Broker Load、Routine Load、Binlog Load、DataX写入、Spark Load、Flink Connector、Spark Connector、JDBC Connector、ODBC Connector等导入方式。
此外,该书还对Doris的数据模型局限性、执行计划解析与优化、查询优化器工作原理等进行了详细的解析。同时,也介绍了Doris在实时数仓、数据湖以及离线数仓方面的应用,以及Doris应用边界拓展探索等内容。
在项目实战