内容简介
本书以管理和应用视角解读大数据,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织。
本书包含十六章,分为四篇:概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台和综述大数据管理与应用的新进展。
本书可作为高等学校大数据管理与应用、信息管理与信息系统、数据科学与大数据技术等管理类、信息类专业本科生教材,还可以作为各行各业的管理者与实践者的培训用书和参考读物。
AI简介
这是一本以管理和应用视角解读大数据的著作,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织。
全书分为四篇,概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台和综述大数据管理与应用的新进展。
本书内容丰富,既有深入浅出的理论阐述,又有具体的实践案例,可以帮助读者更好地理解和应用大数据技术。例如,在线性代数基本定义与运算部分,作者详细讲解了向量、向量空间、线性方程组、矩阵等概念,以及这些概念之间的基本运算方法,为后续深入学习机器学习方法,以及解决实际问题,提供了有力的理论支持和方法指导。
在数据清洗方式部分,作者详细介绍了全人工清洗、全机器清洗、人机同步清洗和人机异步清洗四种方式,并分