语音识别环境失配补偿技术查看源代码讨论查看历史
《语音识别环境失配补偿技术》,何勇军 著,出版社: 科学出版社。
书籍是知识[1]的源泉,只有书籍才能解救人类,只有知识才能使我们变成精神上坚强的、真正的、有理性[2]的人。唯有这种人能真诚地热爱人,尊重人的劳动,衷心地赞赏人类永不停息的伟大劳动所创造的最美好的成果。
内容简介
《语音识别环境失配补偿技术》系统论述了语音识别中的环境失配问题和补偿方法。《语音识别环境失配补偿技术》共8章,内容包括环境失配问题研究的内容和意义以及研究现状;基于隐马尔可夫模型的语音识别;基于形态成分分析的鲁棒语音活动检测;基于稀疏编码的加性噪声补偿;基于语音字典的评价与优化的补偿方法;信道畸变两个子问题的划分与补偿;高斯依赖的信道畸变补偿;基于对数运算线性分段函数的联合补偿。
目录
前言
第1章 绪论 1
1.1 研究的内容和意义 1
1.2 国内外研究现状与分析 4
1.2.1 加性噪声补偿方法 4
1.2.2 信道畸变补偿方法 6
1.2.3 联合补偿方法 8
1.2.4 目前方法存在的问题 11
参考文献 12
第2章 基于隐马尔可夫模型的语音识别 21
2.1 引言 21
2.2 语音识别整体框架 21
2.3 前端处理 23
2.4 声学模型 25
2.5 识别 30
2.5.1 语言模型 31
2.5.2 解码 31
2.6 实验平台和实验数据库 32
2.6.1 实验平台 32
2.6.2 实验数据库 32
2.6.3 评价指标 33
2.7 环境失配与补偿的数学描述 33
2.8 本章小结 35
参考文献 35
第3章 基于形态成分分析的鲁棒语音活动检测 37
3.1 引言 37
3.2 变化的噪声下基于稀疏编码的语音活动检测方法 39
3.2.1 稀疏表示 39
3.2.2 基于稀疏编码的语音活动检测方法 43
3.2.3 实验结果和说明 47
3.3 在线更新噪声字典的基于形态成分分析的语音活动检测 53
3.3.1 基于形态成分分析的语音活动检测 53
3.3.2 实验结果和说明 55
3.4 本章小结 59
参考文献 59
第4章 基于稀疏编码的加性噪声补偿 66
4.1 引言 66
4.2 稀疏编码的数学描述及字典构建 67
4.3 稀疏编码在语音去噪中存在的问题与分析 68
4.4 原子字典的评价准则和优化策略 70
4.4.1 字典评价指标 71
4.4.2 原子字典的优化策略 72
4.5 基于原子重要性的残留噪声去除方法 73
4.6 实验与分析 75
4.6.1 频谱增强与特征提取流程 75
4.6.2 字典评价指标和优化算法的实验分析 76
4.6.3 动态屏蔽算法的实验分析 77
4.7 基于卷积降噪自编码神经网络的语音增强 80
4.7.1 基本原理 81
4.7.2 网络结构 82
4.7.3 实验 83
4.8 本章小结 88
参考文献 89
第5章 基于语音字典的评价与优化的补偿方法 92
5.1 引言 92
5.2 字典评价的指标 94
5.2.1 以信号表示为目标的评价指标 94
5.2.2 以分离为目标的评价指标 95
5.2.3 关于评价数据 96
5.3 字典优化方法 97
5.3.1 去除有害原子 97
5.3.2 关于重要原子选择的评价数据 98
5.4 实验与分析 98
5.4.1 字典和评价数据 98
5.4.2 字典或学习方法的比较 100
5.4.3 在语音去噪或分离中评价字典 102
5.4.4 UAR评价 104
5.4.5 HAR评价 105
5.5 语音字典与噪声字典去噪分析 111
5.6 本章小结 112
参考文献 112
第6章 信道畸变两个子问题的划分与补偿 116
6.1 引言 116
6.2 信道畸变两个子问题的划分 117
6.3 复杂信道环境的畸变模型 119
6.4 带宽检测及残留噪声估计 123
6.5 信道畸变直流分量的估计 125
6.6 信道畸变补偿统一框架 126
6.7 实验与分析 127
6.7.1 实验数据准备 127
6.7.2 实验设置 128
6.7.3 带宽检测测试 129
6.7.4 实验结果 129
6.7.5 讨论与分析 133
6.8 本章小结 135
参考文献 135
第7章 高斯依赖的信道畸变补偿 137
7.1 引言 137
7.2 经典畸变模型的局限性 137
7.3 复杂信道环境下更精确的畸变模型 139
7.4 高斯依赖的频段丢失补偿 141
7.5 高斯依赖的幅值改变补偿 143
7.6 功率谱域均值计算 144
7.7 信道频谱响应估计 145
7.8 实验与分析 147
7.8.1 部分丢失频段的实验分析 147
7.8.2 幅值改变补偿的实验分析 147
7.8.3 集成补偿实验比较 149
7.9 本章小结 150
参考文献 150
第8章 基于对数运算线性分段函数的联合补偿 152
8.1 引言 152
8.2 对数函数的分段线性插值近似 153
8.3 对数运算线性化情况下的畸变模型 154
8.4 线性畸变模型下的声学模型补偿 156
8.5 噪声参数的估计 157
8.6 联合补偿框架 160
8.7 实验与分析 161
8.7.1 实验数据 161
8.7.2 实验设置 162
8.7.3 实验对比 162
8.8 本章小结 165
参考文献 165
彩图
参考文献
- ↑ 什么是知识?,搜狐,2016-08-13
- ↑ 理性,是解决绝大多数问题的关键,搜狐,2017-03-28