268,913
次編輯
變更
线性预测编码
,创建页面,内容为“ '''线性预测编码'''是一个科技名词。 世界三大汉语词典分别是中国大陆的《 汉语大词典<ref>[https://www.sohu.com/a/576642268…”
'''线性预测编码'''是一个科技名词。
世界三大汉语词典分别是[[中国]]大陆的《 汉语大词典<ref>[https://www.sohu.com/a/576642268_121145181 中国汉字博大精深,作为中国人的你知道有多少个嘛?],搜狐,2022-08-14</ref>》(共13册,5.6万词条,37万单词)、中国台湾的《 中文大辞典 》(共10册,5万词条,40万单词)以及日本的《 大汉和辞典 》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字<ref>[https://www.sohu.com/a/500696857_121089534?_trans_=000019_wzwza 汉语的发展史,你了解多少:你真的会说汉语吗?],搜狐,2021-11-12</ref>,它已有六千年左右的[[历史]],是世界上最古老的文字之一。
==名词解释==
线性预测编码(LPC)是主要用于音频信号处理与语音处理中根据线性预测模型的[[信息]]用压缩形式表示数字语音信号谱包络(en:spectral envelope)的工具。它是最有效的语音分析技术之一,也是低位速下编码[[方法]]高[[质量]]语音最有用的方法之一,它能够提供非常精确的语音参数预测。
线性预测编码的基础是假设声音信号(浊音)是音管末端的蜂鸣器产生的,偶尔伴随有嘶嘶声与爆破声(齿擦音与爆破音)。尽管这看起来有些原始,但是这种模式实际上非常接近于真实语音产生过程。声带之间的声门产生不同强度(音量)与频率(音调)的声音,喉咙与嘴组成共鸣声道。嘶嘶声与爆破声通过舌头、嘴唇以及喉咙的作用产生出来。
线性预测编码通过估计共振峰、剔除它们在语音信号中的作用、估计保留的蜂鸣音强度与频率来分析语音信号。剔除共振峰的过程称为逆滤波,经过这个过程剩余的信号称为残余信号(en:residue)。
描述峰鸣强度与频率、共鸣峰、残余信号的数字可以保存、发送到其它地方。线性预测编码通过逆向的过程合成语音信号:使用蜂鸣参数与残余信号生成源信号、使用共振峰生成表示声道的滤波器,源信号经过滤波器的处理就得到语音信号。
由于语音信号随着时间变化,这个过程是在一段段的语音信号帧上进行处理的。通常每秒 30 到 50 帧的速度就能对可理解的信号进行很好的压缩。
原理
一个时间离散线性系统输出的样本可以用其输入样本和过去的输出样本的线性组合,即线性预测值来逼近。通过使实际输出值和线性预测值之间差的均方值最小的方法能够确定唯一的一组预测器系数。这些系数就是线性组合中所用的加权系数。在这一原理中,系统实际上已被模型化了,这一模型就是零极点模型。它有两种特例:①全极点模型,又称自回归模型。这时预测器只根据输出过去的样本进行预测。②全零点模型,又称滑动平均模型。这时预测器只根据输入样本进行预测。迄今为止,最常用的模型还是全极点模型。这有几个原因:―是全极点模型最易计算;二是在多数情况下,不可能知道输入;三是对语音信号,在不考虑鼻音和部分擦音时,声道的传输函数是一个全极点函数。
模型参数的估值在全极点模型下有两种方法,即自关法和协方差法,它们分别适用于平稳信号和非平稳信号。模型参数的基本形式是线性预测系数,但它还有很多等价的表示形式。不同形式的系数在导致的逆滤波器结构,系统稳定性和量化时要求的比特数等方面都有所不同。现在公认的较好形式是反射系数,它所对应的滤波器具有格型结构,稳定性好量化时要求的比特数也少。
线性预测编码的早期历史
根据斯坦福大学 Robert M. Gray 的说法,线性预测编码起源于 1966 年,当时 NTT 的 S. Saito 和 F. Itakura 描述了一种自动音素识别的方法,这种方法第一次使用了针对语音编码的最大似然估计实现。1967 年,John Burg 略述了最大熵的实现方法。1969 年 Itakura 与 Saito 提出了部分相关(en:partial correlation)的概念, May Glen Culler 提议进行实时语音压缩,B. S. Atal 在美国声学协会年会上展示了一个 LPC 语音编码器。1971 年 Philco-Ford 展示了使用 16 位 LPC 硬件的实时 LPC 并且卖出了四个。
1972 年 ARPA 的 Bob Kahn 与 Jim Forgie (en:Lincoln Laboratory, LL) 以及 Dave Walden (BBN Technologies) 开始了语音信息包的第一次开发,这最终带来了 Voice over IP 技术。根据 Lincoln Laboratory 的非正式历史资料记载,1973 年 Ed Hofstetter 实现了第一个 2400 位/秒 的实时 LPC。1974 年,第一个双向实时 LPC 语音包通信在 Culler-Harrison 与 Lincoln Laboratories 之间通过 ARPANET 以 3500 位/秒 的速度实现。1976 年,第一次 LPC 会议通过 ARPANET 使用 Network Voice Protocol 在Culler-Harrison、ISI、SRI 与 LL 之间以 3500 位/秒 的速度实现。最后在 1978 年,BBN 的 Vishwanath et al. 开发了第一个变速 LPC 算法。
==参考文献==
[[Category:800 語言學總論]]