python - 如何将梅尔频谱图转换为对数刻度的梅尔频谱图

Question

我正在阅读这篇关于使用卷积神经网络进行环境噪声识别的论文，并希望重现他们的结果。他们将 WAV 文件转换为对数刻度的 mel 频谱图。你怎么做到这一点？我能够将 WAV 文件转换为 mel 频谱图

y, sr = librosa.load('audio/100263-2-0-117.wav',duration=3)
ps = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(ps, y_axis='mel', x_axis='time')

我还可以将其显示为对数比例的频谱图：

librosa.display.specshow(ps, y_axis='log', x_axis='time')

显然，它们看起来不同，但实际的频谱图ps是相同的。使用 librosa，如何将此 melspectrogram 转换为 log 比例的 melspectrogram？此外，对数比例的频谱图比原始频谱图有什么用？是只是为了降低频域的方差，使其与时间轴具有可比性，还是别的什么？

score 3 · Accepted Answer

3

librosa.power_to_db应该这样做，看看那个

于 2018-05-06T03:29:12.657 回答

python - 如何将梅尔频谱图转换为对数刻度的梅尔频谱图

1 回答 1

Related

Reference