内容简介
本书从智能化社会对语音处理提出的新要求出发,按照导论—基础理论—应用实践的顺序,系统地介绍了智能语音处理涉及的基础理论、基本技术、主要方法以及典型的智能语音处理应用。首先概述了智能语音处理的相关背景;接着介绍了智能语音处理涉及的基础理论和相关技术,包括稀疏和压缩感知、隐变量模型、组合模型、人工神经网络和深度学习;然后结合具体算法,介绍了智能语音处理的典型应用,包括语音压缩编码、语音增强、语音转换、说话人识别、骨导语音增强;最后对智能语音处理的未来发展进行了展望。本书内容广泛,重点突出,既有深入浅出的原理阐述,又有创新科研成果的总结凝练,理论与实际结合紧密,可读性强。本书可以作为高等院校人工智能、电子信息工程、物联网工程、数据科学与大数据技术、通信工程等专业高年级本科生以及智能科学与技术、信号与信息处理、网络空间安全、通信与信息系统等学科研究生的参考教材,也可供从事语音处理技术研究与应用的科研及工程技术人员参考。
AI简介
这是一本系统介绍智能语音处理基础理论、基本技术、主要方法以及典型智能语音处理应用的著作。书中首先概述了智能语音处理的相关背景,接着介绍了智能语音处理涉及的基础理论和相关技术,包括稀疏和压缩感知、隐变量模型、组合模型、人工神经网络和深度学习等。然后结合具体算法,介绍了智能语音处理的典型应用,包括语音压缩编码、语音增强、语音转换、说话人识别、骨导语音增强等。最后对智能语音处理的未来发展进行了展望。
本书内容广泛,重点突出,既有深入浅出的原理阐述,又有创新科研成果的总结凝练,理论与实际结合紧密,可读性强。语音信号数字化理论是语音信号处理的基础,它主要研究如何将模拟的语音信号转换成数字信号,以便于进行存储、传输和处理。语音编码技术发展是一个涉及多个领域的复杂过程,它主要研究如何将语音信号转化为数字信号,以便于存储、传输和处理。根据语音采样频率,语音编码可以分为窄带语音编码、宽带语音编码和20kHz的音乐带宽编码。其中,窄带语音编码是最重要的一类,广泛应用于语音通信中。
本书详细介绍了信号稀疏的定义,主要描述的是信号中只有少数元素是非零(或绝对值较大)值,其余元素均为零(或绝对值很小)的现象