内容简介
Principles of Strategic Data Science is created to help you join the dots between mathematics, programming, and business analysis.With a unique approach that bridges the gap between mathematics and computer science, this book takes you through the entire data science pipeline. The book begins by explaining what data science is and how organizations can use it to revolutionize the way they use their data. It then discusses the criteria for the soundness of data products and how to best visualize
AI简介
这是一本结合数学、编程和商业分析,旨在帮助读者理解数据科学在组织中的应用的书籍。本书首先介绍了数据科学的基本概念,解释了数据驱动的组织如何通过数据科学提升决策质量,优化业务流程,以及增强竞争力。接着,本书详细讨论了数据科学的连续体模型,即从数据收集到数据驱动的组织的五个阶段。
在讨论数据科学的连续体模型时,本书强调了领域知识的重要性,并指出领域知识可以帮助数据科学家理解混杂变量对结果的影响,并进行sanity check,确保分析结果的准确性和可靠性。同时,本书也讨论了数学知识的应用,指出数学知识用于将数据转换为可行动的洞察,帮助数据科学家使用各种数学工具,如回归模型、图论、k-means聚类、决策树等,对数据进行深入的分析和挖掘。
本书还讨论了伦理数据科学,强调了在数据科学的应用过程中,我们需要考虑其功能性和伦理性。通过遵循知情同意、避免伤害和做公正的事等基本的伦理原则,我们可以确保数据科学的应用能够更好地服务于社会,同时也能保护参与者的权益。
在讨论数据科学的最佳实践时,本书强调了数据科学的价值创造、可靠性、可复制性、良好的治理以及美观的结果。本书还讨论了数据和信息的质量,强