内容简介
为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相关工具和应用案例,进而编成本书。 本书是集理论与实践于一体的应用型教材。全书共7章,包括大数据概述、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术。本书在编写中着重介绍基本原理,同时突出工程应用,并以清晰、容易理解的方式展现大数据采集、预处理与可视化的基础知识、基本任务、常用方法、实用场景和主要流程,力图做到基本概念准确、阐述条理清晰、主体内容精练、重点难点突出、理论联系实际。此外,本书还将反映相关领域新技术的发展情况。 本书可作为计算机、人工智能、大数据、电子商务、电气、电子、统计学、会计学等相关专业的大数据技术类课程的教材,也可供相关领域的科技人员参考使用,还可作为数据分析及应用类认证培训课程用书。
AI简介
这是一本面向计算机、人工智能、大数据、电子商务、电气、电子、统计学、会计学等相关专业的大数据技术类课程的教材,同时也适合相关领域的科技人员参考使用,还可作为数据分析及应用类认证培训课程用书。
本书共7章,内容涵盖了大数据的基本概念、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术等。在大数据的基本概念中,本书详细介绍了大数据的定义、发展历程、特征、作用、应用领域及关键技术等方面。在Python程序设计中,本书讲解了Python的安装与运行、数据类型与运算符、程序控制结构、函数与模块、文件等方面的内容。在大数据采集中,本书探讨了大数据采集的概念、数据源、方法、平台以及网络爬虫技术等内容。在大数据预处理技术中,本书讨论了数据预处理的概念、主要任务、常用方法、实用场景和主要流程,包括数据清洗、数据集成、数据变换、数据归约和数据脱敏等方面。在Excel数据获取与预处理中,本书讲解了Excel数据获取、数据清洗与转换的方法。在Python数据预处理中,本书介绍了Python数据预处理基础、数据的分组、分割、合并和变形、缺失值