内容简介
This book is aimed at developers who are already productive in Clojure but who are overwhelmed by the breadth and depth of understanding required to be effective in the field of data science. Whether you’re tasked with delivering a specific analytics project or simply suspect that you could be deriving more value from your data, this book will inspire you with the opportunities–and inform you of the risks–that exist in data of all shapes and sizes.
AI简介
这是一本面向那些已经熟悉Clojure编程的开发者,并希望深入理解数据科学领域的著作。这本书的内容涵盖了数据科学的多个方面,包括统计学、推断、相关性、分类、大数据处理、聚类、推荐系统、网络分析、时间序列以及可视化等。
这本书以Clojure的特性与优势为起点,详细介绍了Clojure在数据科学中的应用。Clojure的简洁性、并发性和强大的函数式编程能力使得它在处理大规模数据时具有很大的优势。同时,Clojure的简洁语法和丰富的函数库也使得编写数据科学代码变得更加容易。
在统计学方面,这本书详细介绍了描述性统计分析的步骤,包括计算数值序列的均值、中位数、方差和标准差,理解数据分布的“长尾”和“80/20规则”,以及了解正态分布的概念。此外,这本书还详细介绍了假设检验的原理和应用,置信区间的概念和计算方法,以及多元线性回归的基本概念和应用。
在数据可视化方面,这本书强调了数据可视化的重要性,并介绍了如何使用Quil等工具制作精细、清晰、有吸引力的可视化。此外,这本书还介绍了如何使用reducers进行并行折叠,以及如何使用Tesser计算数学折叠。
在分布式数据处理方面,这本书