内容简介
This book is ideal for professionals with a variety of job descriptions across large range of industries, given the rising popularity and accessibility of data science. You'll need some prior experience with Python, with any prior work with libraries like Pandas, Matplotlib and Pandas providing you a useful head start.
AI简介
这是一本面向有一定Python编程基础,希望掌握数据科学基本技能的读者的书籍。书中涵盖了数据预处理、预测分析计划的确定、使用HTTP请求进行数据获取、交互式可视化基础、Jupyter使用简介、Python数据科学库介绍、数据科学技能总结、创建和操作DataFrame、线性模型与多项式模型以及机器学习模型的实践应用与策略等多个方面。
书中首先介绍了Jupyter Notebook的基本功能,包括magic函数和tab补全功能。同时,还介绍了数据科学中常用的Python库,如NumPy、Pandas和Matplotlib。
接着,书中讲解了数据预处理对机器学习的影响,以及如何通过HTTP请求获取数据,并使用Beautiful Soup解析HTML并提取数据。同时,还介绍了如何使用pandas处理数据,并使用Bokeh创建交互式可视化。
书中还详细介绍了线性模型与多项式模型,以及如何通过数据探索和模型选择,选择最适合数据的模型,并使用多项式模型进行预测和分割分析。
在机器学习模型的实践应用与策略部分,书中讲解了如何从策略规划到模型实践应用的整个过程,旨在通过数据驱动的方式,帮助我们更