python - 蟒蛇 | librosa：如何从音频 wav 文件中提取人声？

翻译自：https://stackoverflow.com/questions/48089911 2018-01-04T06:36:29.823

2084 次

给定一个人类谈话录音的 wav 文件（单声道 16KHz 采样率），有没有办法只提取声音，从而滤除大部分机械和背景噪音？我正在尝试为此使用librosaPython 3.6 中的包，但无法弄清楚它是如何piptrack工作的（或者是否有更简单的方法）。

当尝试使用 fft/ifft 将频率限制在300-3400 范围内时，产生的声音严重失真。

sr, y = scipy.io.wavfile.read(wav_file_path)
x = np.fft.rfft(y)[0:3400]
x[0:300] = 0
x = np.fft.irfft(x)

0 回答 0