python-3.x - 单声道中的 librosa write_wav？

Question

我想重新采样以 40.000 Hz 到 44100 Hz 录制的单声道录音。

下面的代码有效，但 librosa 似乎以立体声保存，使文件大小增加了一倍，这是不需要的，我有很多样本要处理。

所以我需要将结果保存为单声道。

代码：

# resampling a .wav file to a specific sample rate
import os

import librosa
import resampy

# this is the sample reate we want
sr_target = 44100


directory_in_str = '/home/hugo/test/'

directory = os.fsencode(directory_in_str)

for file in os.listdir(directory):
    filename = os.fsdecode(file)
    if filename.endswith(".wav"):
        file_path = os.path.join(directory_in_str, filename)
        print(file_path)
        # Load in librosa's example audio file at its native sampling rate
        x, sr_orig = librosa.load(file_path, mono=True, sr=None)

        print("Original sample rate is : ", sr_orig)
        # x is now a 1-d numpy array, with `sr_orig` audio samples per second

        # We can resample this to any sampling rate we like, say 16000 Hz
        y = resampy.resample(x, sr_orig, sr_target)

        file_path_new = os.path.join(directory_in_str+'new/', filename)


        # write it back
        librosa.output.write_wav(file_path_new, y, sr_target)

        continue
    else:
        continue

问题：我想以单声道保存重新采样的文件，我得到立体声并且没有选项只能保存单声道...

score 1 · Accepted Answer

输出是单声道还是立体声取决于y. 如果y形状为 (n,)，则输出为单声道；如果y具有 (2,n) 的形状，则输出为立体声。librosa.output.write_wav不会自动将单声道信号转为立体声。

从您的代码中，您的输出音频看起来像是立体声音频。两倍大小的文件并不意味着它是立体声的。这可能是由于输入和输出音频的数据类型不同造成的。

python-3.x - 单声道中的 librosa write_wav？

1 回答 1

Related

Reference