AI简介
这是一本全面、深入探讨大数据处理理论与工程实践的著作。该书以大数据处理的特征为起点,详细解析了基本处理模型,并追溯了工程角度的大数据历史。接着,书中深入探讨了大数据的基本处理框架,并详细描述了大数据的技术实施方法。
在探讨数据方面,该书详细讲解了数据存储、数据寻址、列式存储、键值对高速缓存、持久化的高速缓存以及大数据表等概念和技术。同时,书中还深入探讨了计算资源,包括集群总线、资源调度和资源控制等方面的内容。
在计算模型方面,该书详细讲解了MapReduce、SQL类查询、流式计算以及图计算等模型,并深入分析了这些模型的应用场景和优缺点。
在探讨大数据应用方面,该书详细讲解了搜索信息匹配、搜索信息排名、文档相似性判定、文档主题生成、用户画像、广告投放决策以及基数计算等应用,并深入分析了这些应用的重要性和实现方法。
在探讨数据治理方面,该书详细讲解了元数据管理、主数据管理、数据标准、数据管理成熟度评估、数据资产以及数据治理的组织构架等概念和技术。
在探讨大数据和人工智能的关系方面,该书详细讲解了大数据为人工智能提供的基础,以及人工智能利用大数据进行学习和优化的过程。同时,书中还