AI简介
这是一本深度解析实时数据处理引擎Flink的书籍,从理论到实践,全面讲解了流处理 API、批处理 API、机器学习引擎 FlinkML、关系型 API、复杂事件处理,以及指标度量与部署模式。书中不仅深入分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联和关系,还通过丰富的案例和实现,深入分析了多项式曲线拟合、分类算法、推荐算法的理论和 FlinkML实现。
本书首先介绍了Flink在实时数据处理领域的成功,主要归功于其低延迟、高吞吐、统一流处理和批处理的特性。接着,本书详细讲解了流处理 API和批处理 API的基本概念,包括TableEnvironment,Flink,流处理API,以及关系型API等概念。书中还详细介绍了时间特征设置和水印生成器,以及批处理API概述,包括Source,Sink,算子等基本概念。
此外,本书还深入讲解了FlinkML应用编程结构,围绕FlinkML库进行讲解,FlinkML库是Flink大数据处理框架中的一个重要组成部分,它致力于设计一套适用于不同数据规模的可伸缩系统,减少胶水代码以降低不同机器学习组件间的黏合成本。书中还详细讲