通滤波Р该研究以采样频率为8kHz、精度为16 比特的wav 文件作为声源, 以网络录音机录制自己的一段语音。因为语音信号包含非常丰富的谐波分量, 基音频率最低可达80Hz , 最高可达500Hz , 但基音频率大多数分布在100~200Hz 之间。因此,浊音信号可能含有三四十次谐波分量, 而其基波分量往往不是最强的分量。语音信号的第一共振峰通常在300~1000Hz 范围内, 即基音的2~8 次谐波成分比基波分量还要强。为了提高检测的准确度, 算法中引入了一个60~500Hz 带通滤波模块滤除语音帧的高次谐波分量。该算法中用音效编辑软件Cooledit提供的功能直接滤波, 方便快速, 它在保持语音信息的前提下, 可以大大减少谐波成分。Р3.3.2 取样与分帧Р取样模块从以采样频率为8kHz 的语音信号中截取Lengt h (样点数) 长个样点值, 一般取样点数为帧长的整数倍即可, 程序中取了18000 个样点数进行分析。分帧模块主要完成将取样模块中获得的语音样值点分为若干个语音帧, 算法中分析帧长30ms , 即每帧长为240 个样点。然后用短时平均能量判断出浊音帧, 再对浊音帧进行自相关计算, 最后进行基音周期检测。Р3.3.3 短时能量分析Р原始信号及其频谱波形如图3-2所示。Р图3-2 原始信号及其频谱波形Р%原始信号Р[y,fs,nbits]=wavread ('C:\Documents and Settings\Administrator\桌面\yejianglong.wav'); Р%把语音信号进行加载入Matlab 仿真软件平台中Рsound(y,fs,nbits); %回放语音信号Рn = length (y) ; %求出语音信号的长度РY=fft(y,n); %快速傅里叶变换Рsubplot(2,1,1);plot(y);title('原始信号波形');