librosa 的显示模块生成的某些波形图只是填充整个轴的平线。
我使用原生采样率将一些 wav 文件加载到 librosa 中,我的数据集是立体声和单声道文件的混合。我知道波形图是不正确的,因为它看起来与大胆的相同文件的频率-时间图完全不同。
我尝试过使用图形宽度、高度和 DPI,但是生成的波形图没有任何改进。下面是 Librosa 为这些音频文件之一生成的波形图和大胆的预期波形图。
用于生成绘图的代码来自 librosa 文档:
sound, sr = librosa.load(input_dir, sr=None)
matplotlib.pyplot.figure(figsize=(width, height), dpi=dpi)
librosa.display.waveplot(numpy.array(sound), sr=sr)
matplotlib.pyplot.tight_layout()