全文预览

情感语音识别本科论文

上传者:梦溪 |  格式:doc  |  页数:61 |  大小:0KB

文档介绍
(Pre-emphasis)处理.预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析.预加重可在语音信号数字化时在反混叠滤波器之前进行,这样不仅可以进行预加重,而且可以压缩信号的动态范围,有效地提高信噪比.但预加重一般是在语音情感信号数字化之后,参数分析之前在计算机里用6dB/倍频程的提升高频特性的预加重数字滤波器来实现,它一般是一阶的数字滤波器:Р (2-1)Р其中的值接近于1。Р若时刻的语音采样值为,经预加重处理后的结果为:Р (2-2)Р图2.1给出了预加重滤波器的幅频特性和相频特性;图2.2分别给出了预加重前和预加重之后的一段浊音信号以及频谱。Р图2.1预加重滤波器的幅频特性和相频特性Р图2.2 预加重前和预加重后的一段浊音信号及频谱Р2.2.2语音情感信号的加窗处理Р在预加重数字滤波处理后,需要进行加窗分帧处理。由于人自身的发音器官的运动,语音情感信号是一种典型的非平稳信号。但是相比于声波振动的速度,发音器官的运动就显得非常缓慢了。因此,工程技术人员通常认为10ms-30ms这样长度的时间段中,语音信号是平稳信号。几乎所有的语音情感信号处理方法都是基于这个假设。这样每秒的帧数大约为33-100。分帧虽然可以采用连续分段的方法,但一般要采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移,帧移帧长的比值一般取为0-0.5。分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数来乘,从而形成加窗语音情感信号:Р (2-3)Р在语音信号数字处理中常用的窗函数是矩形窗(Rectangular Window)和汉明窗(Hamming Window)等,矩形窗如式(2-4)所示:Р (2-4)Р汉明窗如式(2-5)所示:Р (2-5)

收藏

分享

举报
下载此文档