基于机器学习的数据缺失值填补:理论与方法

基于机器学习的数据缺失值填补:理论与方法

评分

★★★★★

ISBN

9787111663058

出版社

机械工业出版社 2020-09-01出版

分类

人工智能

内容简介
这是一部讲解如何基于机器学习技术实现数据缺失值填补的专著,与传统的基于统计学的缺失值填补方法相比,效率上得到了较大的提升。作者基于多年的研究和实践成果,创新性地提出了基于神经网络的缺失值填补方法和基于TS模型的缺失值填补方法。全书共8章,可分为4个部分。第一部分(第1~3章):首先介绍缺失值填补领域的缺失数据机制、基本概念、性能度量等基础知识,随后详细阐述目前基于统计学、机器学习的缺失值填补理论与方法。第二部分(第4~5章):对目前神经网络在缺失值填补领域的研究成果进行归纳总结,并从网络模型、填补方案角度阐述神经网络填补方法的设计及应用。第三部分(第6~7章):详细介绍面向不完整数据的TS建模过程,随后通过特征选择算法处理TS建模中的特征冗余问题,并从前提参数优化和结论参数优化两个角度改进TS模型。第四部分(第8章):以缺失值填补方法在我国贫困问题研究中的应用为例,展现缺失值填补方法的现实意义。
AI简介
这是一本深入探讨数据缺失问题及其填补方法的专业著作。本书首先从数据缺失机制和基本概念入手,为读者梳理了缺失值填补的研究现状和应用领域。随后,详细阐述了基于统计学的缺失值填补方法和基于机器学习的缺失值填补方法,包括均值填补法、热平台填补法、K最近邻填补法、基于聚类的填补方法、基于线性回归的填补方法、基于非线性回归的填补方法、基于神经网络的填补方法等。 书中还创新性地提出了基于神经网络的缺失值填补方法和基于TS模型的缺失值填补方法,并通过大量的实验验证了这些方法的有效性。在面向不完整数据的神经网络填补方法部分,详细介绍了基于自组织映射网络的填补方法、基于单层感知机的填补方法、基于多层感知机的填补方法、基于自编码器及其变体的填补方法等。而在面向不完整数据的TS建模过程中,则详细阐述了基于模糊数学的TS模型填补方法、基于特征选择的TS模型填补法等。 此外,本书还深入探讨了神经网络填补方法的优化设计,包括面向不完整数据的代价函数、两阶段式填补方案、融合式填补方案等。在基于TS建模的非线性回归填补法部分,详细介绍了模糊数学基础、TS模型基本结构、基于TS模型的填补方法等。在TS模型填补方法的优
阅读/下载地址