大数据与机器学习:实践方法与行业案例

大数据与机器学习:实践方法与行业案例

评分

★★★★★

ISBN

9787111556800

出版社

机械工业出版社 2017-01-01出版

分类

数据库

内容简介
大数据方面的书籍可谓琳琅满目,有的讲解理论,有的介绍方法,有的传播理念。但是,大数据从业人员(如数据工程师、数据分析师、业务分析师、算法设计师等)应该掌握哪些知识与技能,如何应用数据解决现实的业务问题呢?恐怕最能给出答案的还是实际的数据从业者。为此,三位作者基于近10年的数据分析与应用经验,融合各自在商业银行、互联网金融和电商领域的切身体验,寓理论于实战,选取多个详实的案例,站在企业实际应用的角度介绍数据分析应用过程并公布源代码,并最终形成本书。本书对于读者开展数据分析工作能够提供直接帮助,为有志于在大数据领域发展的读者启航。
AI简介
这是一本从企业实践角度出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节的书籍。该书以数据闭环为核心,详细阐述了数据的基本形态、数据平台的功能与构成、数据闭环的概念与特征、数据预处理的重要性以及数据驱动应用系统的构建等内容。 书中首先介绍了数据科学家与数据仓库开发者的区别,强调了数据科学家在提炼数据价值方面的职责和重要性。接着,作者深入探讨了数据的基本形态,包括生产数据、原始数据和分析数据,以及数据平台的功能与构成,包括HDFS、MapReduce等基础模块,数据环境,数据形态,以及数据平台与应用系统之间的关系。 在数据闭环方面,作者详细阐述了数据闭环的概念与特征,包括数据闭环的松耦合、易扩展特点,以及数据缓冲区、ETL作业和作业调度在构建数据闭环自循环过程中的重要性。此外,作者还介绍了数据预处理的重要性,包括对数据记录的处理和对变量的处理,以及数据可视化工具的选择与使用,包括BI工具、数据缓冲区、ETL、作业调度等。 在数据分析方法和算法的分类方面,作者将最常用的分析方法与算法划归为关联类、预测类和描述类,并详细介绍了决策树类算法的基本原理和随机森林算法的应用。此外
阅读/下载地址