频谱、倒谱介绍及matlab实现 | 您所在的位置:网站首页 › 语谱图的作用 › 频谱、倒谱介绍及matlab实现 |
一、频谱
原理:傅里叶变换
采样频率:大于原信号频率的2倍 方法:fft和ifft函数(fft点数即为频谱频率范围)fft函数后频率的区间:前面是[0,fs/2],后边是[-fs/2,0] 为了恢复正常频率区间,需要用fftshift函数 截取正频率:fft以后截前半段或者fftshift以后截后半段 能量谱:傅里叶变换的平方 功率谱:针对功率信号,(傅立叶变换的平方)/(区间长度) 或者 自相关函数的傅里叶变换 二、倒谱1、工程定义:信号功率谱对数值进行傅立叶逆变换的结果。 2、实际过程:是实部求逆变换,也叫实倒谱,用于估计语音参数 之所以在分析中用的不是功率谱,可能是因为二者之间差了^2,在后续的ln中变为系数2,关系不大。 虽然是倒频谱,但是横轴不是频率,是时间,也叫二次谱,对数功率谱。 复倒谱:与实倒谱相差一个因子,用于恢复实际波形
时域快变化,对应频域的高频分量;时域的慢变化,对应频域的低频分量。 频域快变化,对应时域的高时分量;频域的慢变化,对应时域的低频分量。(为啥呢?就当是时频变换的逆变换吧)
浊音信号是周期性激励的,所以在倒谱上是周期的冲激,因此可以求得基音周期。一般把倒谱波形中第二个冲激(第一个是包络信息),认为是激励源的基频。 过程:倒谱,峰值检测(在基音周期附近寻找),判断是浊音(峰值大于规定阈值)还是清音(峰值小于规定的阈值)每隔10~20ms计算一次倒谱,因为语音的激励参数是缓慢变化的。 实现框图:matlab程序(待完成) 4、共振峰检测 实质:声道信息,对应的是倒谱的低时部分过程:对倒谱低时部分进行DFT,求其傅里叶变换,得到频谱图,然后即可得到共振峰共振峰表现在频谱上,为频谱上的各个峰值 注:第二个log的作用是为了突出低频信息量,弱化高频信息量。(对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高) 平滑作用:去除一些野点 实现框图:
1、频域特征值提取的MATLAB代码实现(频谱、功率谱、倒频谱) 2、信号频域分析方法的理解(频谱、能量谱、功率谱、倒频谱、小波分析) 3、基于音乐识别的频谱转换算法——CQT 4、语音信号提取声学特征时,MFCC和PLP的区别是什么? 5、语音信号处理(二)—— MFCC详解 6、语音识别第4讲:语音特征参数MFCC 7、AI(I)语音(I):MFCC特征参数提取 8、M. Todisco, H. Delgado, and N. Evans, “A new feature for automatic speaker verification antispoofing: Constant q cepstral coefficients,” Processings of Odyssey 2016, 2016. 9、张雪英.《数字语音处理及MATLAB仿真》(第2版)[M].北京:电子工业出版社,2016 |
CopyRight 2018-2019 实验室设备网 版权所有 |