5

给定一个人类谈话录音的 wav 文件(单声道 16KHz 采样率),有没有办法只提取声音,从而滤除大部分机械和背景噪音?我正在尝试为此使用librosaPython 3.6 中的包,但无法弄清楚它是如何piptrack工作的(或者是否有更简单的方法)。

当尝试使用 fft/ifft 将频率限制在300-3400 范围内时,产生的声音严重失真。

sr, y = scipy.io.wavfile.read(wav_file_path)
x = np.fft.rfft(y)[0:3400]
x[0:300] = 0
x = np.fft.irfft(x)
4

0 回答 0