AI简介
这是一本以Python为核心工具,从数据工程能力、数据分析能力、业务能力三个方面出发,介绍数据分析体系的书籍。本书涵盖了大数据的定义与特性、工作中常用的数据处理工具、数据挖掘的四大类及其概念、数据挖掘实战中常用的算法、卷积神经网络概述、自编码器的定义和作用、Kafka的数据传输组件、HDFS的数据存储组件、Lambda架构概述与准则、信用卡欺诈监测背景及数据介绍、电影票网络自助售卖平台项目设计、项目设计思路与架构实现、深度学习技术的应用实例等多个方面的内容。
本书以Python数据分析能力为主线,介绍了Python在数据处理、数据分析等方面的应用。书中通过具体的案例,讲解了如何使用Python进行数据处理、数据可视化、数据分析等操作。同时,书中还介绍了Python业务能力,强调了数据工程师需要具备对业务的理解能力,从业务的角度出发,运用数据解决问题。
在数据工程能力方面,书中介绍了工作中常用的数据处理工具,如Excel、HBase、Logstash、Spagobi、Kibana等,以及大数据处理架构,如Lambda架构、Kappa架构、ELK架构等。这些内容可以帮助数据工程师高效地