AI简介
这是一本全面、深入探讨大数据技术的著作。全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL 数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。
在Hadoop、HDFS、HBase 和MapReduce 等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。在Hadoop的发展历史部分,作者详细介绍了Hadoop的起源、发展、重要特性以及应用现状,使读者对Hadoop有一个全面的了解。在大数据在金融领域的应用部分,作者探讨了大数据如何帮助金融机构进行高频交易、市场情绪分析和信贷风险分析,提高金融服务的效率和质量。
在推荐系统概念与长尾理论关系部分,作者分析了推荐系统如何通过大数据分析,发掘用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户。在大数据在流行病预测方面的应用部分,作者探讨了大数据如何帮助公共卫生管理部门预测和监控流行病的发生和传播,提高公共卫生管理水平。
在协同过滤算法的基本思想