python - 如何在特定声音后提取音频？

Question

假设我有一些很长的音频文件（例如，无线电录音）。我需要从每个文件中提取特定声音（例如，广告开始声音）后 5 秒。每个文件可能包含 3-5 个这样的声音，所以我应该得到 *(3-5)个源文件结果文件。

我找到了 librosa和scipy python 库，但不确定它们是否有帮助。我应该从什么开始？

score 0 · Accepted Answer

您可以从计算信号与特定声音的相关性开始。不确定 librosa 是否提供此功能。我会从scipy.signal.correlate或scipy.signal.convolve开始。

不知道你的背景是什么。如果您需要一些理论，请从这里开始。

基本上，如果音频与您的特定信号匹配或非常相似，则相关性会很高。确定这些位置后，您可以选择它们周围的区域。

1 回答 1