现代语音信号处理笔记 (六)

语音信号的非线性分析

Posted by Pelhans on July 7, 2018

本节针对《现代语音信号处理》这本书的第七章,对语音信号的非线性分析部分。

语音信号的非线性分析

统计信号处理的经典方法建立在线性、平稳及二阶统计量(特别是服从高斯分布)的基础上,在这些很强的约束条件下,经典的线性方法只能得到次优解,还有一些问题完全不能用线性模型描述。因而现代语音信号处理的一个十分重要的问题是非线性、非平稳以及非高斯信号的处理。

语音信号的处理也分为两大类。一类jiyu8确定性的线性系统理论,另一类给予不确定性的非线性系统理论,目前大多数方法属于第一类,即给予几十年来使用的传统语音线性模型(激励-滤波器)。大量的理论与实验研究表明,语音信号是复杂的非线性过程,可认为由具有固有非线性动力学特性的系统产生。非线性处理克服了传统线性方法的一些不足,如混沌、分形、小波、人工神经网络等。

时频分析是分析非平稳信号的有力工具,近年来已经取得很大进展。在雷达、声呐、语音等领域引起广泛重视。时频分析是时间和频率的二维联合函数,反映信号频谱随着时间的变化,即信号包含多少频率分量以及每个分量如何随时间变化,时频表示建立了一种分布,以在时间和频率上同事表示信号的能量或密度

小波分析

小波分析原理

小波分析是一种新兴的时频分析方法,为非平稳信号分析提供了新的途径。原则上凡是使用福利也分析的地方均可以使用小波分析。

傅里叶分析采用三角级数对信号进行分解和重构,较好地描述了信号的频率特性,但对奇异信号重构效果较差。小波分析使信号仍在一组正交基上进行分解,其采用有时域局域化特性小波函数为基底,对低频和高频局部信号均能自动调节时频窗,以适应分析需要。从而就有很强的灵活性,可聚焦到信号时频段的任意细节。已证明其逼近有一维特性奇异性的目标时有最优的性能。

FT的基函数为sin 和cos函数,有唯一性,但小波分析不是,用不同的小波函数可得到不同的结果。同事对STFT,若用滤波器观点解释,其带通滤波器的带宽与中心频率无关。但对于小波变换,带通滤波器的带宽正比于中心频率,即带宽恒定。

小波变换采用面积固定但形状不断改变的分析窗,因而具有多分辨率分析的特点。小波分析对信号具有自适应性,即低频部分有高频率分辨率及低时间分辨率。高频部分具有高时间分辨率和低频率分辨率,从而适合分析非平稳信号,适合检测信号中的突变和反常现象并展示其成分。

设f(t)为有限能量信号,则其连续小波变换(CWT)为:

其中

这里,$ \psi(t)$为小波函数,而$\psi_{a,b}(t)$为$ \psi(t)$生成的依赖于参数(a,b)的连续小波函数,简称小波。a是尺度参数,为非零实数,相当于FT中的频率w,反映频率信息,知识换了一种形式。a大于1时$\psi_{a,b}(t)$有延伸作用,反之则压缩,a越大,则时频单元的频率分辨率增大,反之降低。时间因子b为实数,是定位参数,反映信号的时间信息,用于分析的时间位置(即中心)。$\psi_{a,b}(t)$在t=b附近有明显波动,波动范围取决于a。CTW的连续性是(a,b)可任意取值,a与b变化可得到一簇函数$\psi_{a,b}(t)$。

x小波变换的选择不是唯一的,但也不是任意的。其为有单位能量(归一化)的解析函数。小波要有震荡性和迅速衰减的波。小波是指小得波形,其中小表示衰减性,波指波动性,即小波为幅度正负交替震荡。典型的小波函数有Harr函数、Mexico帽小波、Morlet小波等。

小波分析的应用

语音分解与重构

将语音信号经低通(H)作用得到平滑分量,经高通(G)作用得到细节分量,重复上述过程,对平滑分量再进行小波变换,可以得到其更平滑的分量和一些列细节分量。采用Daubechies紧支撑小波(Db)小波对语音进行分解与重构,盖晓波函数在FIR滤波器中具有最大正则性,小波波形较光滑,时频局部化特性也好。

利用小波变换,语音信号可以表示为其平滑分量和一些列细节分量。由于每次小波分解相当于亚抽样为一个平滑和细节分量,所得系数不变,如果能用较少的比特存储这些系数,就可实现语音编码。

语音去噪

传统的基于滤波器的去噪方法是将带噪声信号通过滤波器,以滤掉噪声频率部分。但对于瞬态信号、非平稳信号、含宽带噪声的信号等有其明显局限。小波去噪的基本思想是:将带噪声信号变换到小波域,根据噪声与信号在各尺度(即各频带)上的小波谱的不同特点,将噪声小波谱占主导地位的那些尺度上的噪声小波谱去掉。使保留的小波谱基本为信号小波谱,再由小波域重构原始信号

语音端点检测

Ref

现代语音信号处理[胡航 电子工业出版社] 第七章 语音信号的非线性分析