AI简介
这是一本面向Clojure程序员的数据分析和可视化的实用指南。本书涵盖了从数据输入到数据清洗,再到数据可视化和统计分析的方方面面,为读者提供了丰富的实践经验和理论知识。
本书首先介绍了如何使用Incanter库导入和管理各种格式的数据,包括CSV、JSON、Excel、JDBC数据库、XML、HTML表格以及RDF数据。书中还详细讲解了如何使用正则表达式和同义词词典来清洗数据,以及如何维护数据的一致性。
在并发编程方面,本书深入探讨了如何使用agents和STM来管理程序的复杂性,以及如何通过commute函数来提高程序的性能。在并行编程方面,书中介绍了如何使用pmap函数和reducers来并行处理数据,以及如何通过分区来提高pmap的性能。
在分布式数据处理方面,本书讲解了如何使用Cascalog库在Hadoop上进行分布式数据处理,以及如何查询和聚合数据。在数据可视化方面,书中详细介绍了如何使用Incanter库创建各种图表,包括散点图、柱状图、折线图等,以及如何创建交互式图形。
在统计分析方面,书中讲解了如何使用Incanter库进行描述性统计、假设检验、回归分析、聚类