我想得到一些音频的音色。
为了使用这一点,我将使梅尔倒谱系数算法。
实现看起来很简单(我已经完成了步骤1):1.对一个信号进行傅立叶变换(一个窗口摘录)。2.使用三角形重叠窗口,将上面获得的频谱的功率映射到mel比例。3.获取每个mel频率的功率的对数。4.采用mel对数幂列表的离散余弦变换,就像它是一个信号一样。5. MFCC是结果谱的振幅。
在步骤2中,我知道如何从频率传递到mel尺度,但我不知道三角形重叠窗口是什么意思。
我如何正确地完成这一步?三角形重叠窗口是什么意思?
https://stackoverflow.com/questions/1622062
复制相似问题