内容简介
If you are a Java developer who would like to be equipped with all the tools required to devise an end-to-end practical solution on real-time data streaming, then this book is for you. Basic knowledge of real-time processing would be helpful, and knowing the fundamentals of Maven, Shell, and Eclipse would be great.
AI简介
这是一本面向Java开发者的实用指南,旨在帮助读者掌握实时数据处理和分析所需的全部工具和技术。本书不仅介绍了分布式计算和事件处理技术,还详细阐述了大数据的定义与特点,以及实时分析的神话与现实。
书中首先介绍了实时数据处理和分析技术,包括Apache Spark、Flink、Storm和Kafka等工具,并讨论了它们在金融交易、物联网、社交媒体等场景中的应用。接着,作者深入探讨了大数据的定义与特点,包括大数据的体积、速度、多样性、真实性和价值以及应用和实施等方面。
书中还详细阐述了实时分析——神话与现实,包括大数据基础设施、实时分析的现实与神话、近实时解决方案、分析的多种可能性、IoT的思考和可能性以及云在NRT和IoT中的应用。此外,作者还介绍了数据收集工具的关键特性,包括性能和低延迟、可伸缩性、处理结构化和非结构化数据的能力、数据处理的速度和格式标准化以及数据来源的多样性。
在介绍数据可视化时,作者强调了数据可视化在实时应用程序中的关键作用,并讨论了如何满足观众需求。同时,作者还详细介绍了数据建模的重要性和方法,包括实体关系模型(ER模型)、维度模型和数据仓库模型等。
在介绍