全文预览

基于倒谱的大学生语音识别算法研究毕业论文

上传者:相惜 |  格式:doc  |  页数:60 |  大小:2346KB

文档介绍
换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别和说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇容。语音识别是模式识别的一种,它是让机器通过识别和处理过程将语音信号转变成相应的模型参数。一个完整的语音识别系统主要由两部分组成:语音特征提取、声学模型和模式匹配(即识别算法)。。参数是根据声管模型建立的特征参数,主要反映声道响应。参数是基于人的听觉特性利用人听觉的临界带效应,在Mel标度频率域提取出来的倒谱特征参数。参数只反映了语音的静态特性,而它们的差分倒谱参数可以反映语音的动态变化。2.1语音信号的数字化与预处理对模拟语音信号进行量化和采样,获得数字化的语音信号;然后将含噪的语音信号通过去噪处理,得到干净的语音信号后并通过预加重技术滤除低频干扰,尤其是50Hz到60Hz之间的工频干扰,提升语音信号的高频部分,而且它还具有消除直流漂移、抑制随机噪声和提升清音部分能量的作用。降噪后,通过对语音信号的短时能量和短时过零率检测可以剔除掉静默帧、白噪声帧和清音帧,最后保留对求取基音、、等特征参数非常有用的语音信号。预处理:假设输入的音频信号为,预处理过程如下。1)归一化处理:归一化处理的目的是消除不同样本声音大小的差异,将样本幅度值限定在[-1,+1]。2)预加重:预加重一般是用具有6db/倍频程的一阶数字滤波器来实现,如式(2—1)所示:(2-1)其中μ为常数,一般取0.97。3)对音频信号进行重叠分帧:为避免信号间断一般取256点为一帧,帧间重叠为128点。语音信号的数字化一般包括放大及增益控制、预滤波(主要是反混叠滤波)、A/D转换(包含采样过程)及编码(PCM编码)。预处理一般包括预处理、加窗和分帧等。有时在分析处理之前必须把分析的语音信号部分从输入信号中找出来,这就是语音信号的端点检测。图2-1是语音信号数字分析或处理的系统框图。

收藏

分享

举报
下载此文档