问题标签 [librosa]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
647 浏览

audio - 直接加载带有 librosa 的音频文件(以 dB 为单位)

有没有办法直接加载带有 librosa 的音频文件,而不是通过以下方式获得的振幅:

0 投票
2 回答
3501 浏览

python - 从 python 读取 wav 文件并将帧转换为 RAW s16le 字符串

我正在使用 librosa、wave 或 soundfile 库在 Python 中读取文件,我需要将块(任何大小)推送到 HTTP 流。根据规范,流字符串输入要求我将帧转换为 RAW s16le 格式。

我尝试了多种选择,包括:

但这只会创建一个空的音频流。我究竟做错了什么?

0 投票
1 回答
1030 浏览

audio - 带有 librosa 的音频缓冲区

在以下代码中,我创建了一个缓冲区,该缓冲区在每次循环迭代中保存 10 帧音频文件。

在缓冲区之外,我需要使用 librosa 获取一个表示每个采样点的音频幅度的 numpy 数组。任何想法?

0 投票
1 回答
175 浏览

python - 如何使用 librosa 获取音乐信号整个时间段的频谱?

我决定使用librosa来分析音乐信号并提取所需的特征。目前,我一直在尝试可视化音乐的频谱。我在库中找到了这种执行 STFT 并返回频谱的方法。但是一个返回矩阵,其中为特定帧计算频谱,而不是所有时间。

是否可以使用这个库来计算整个时间的光谱,也许以某种方式处理给定的矩阵,或者 librosa 中有一种特殊的方法用于此目的?

如果没有 - 你能推荐另一个图书馆吗?

先感谢您。

0 投票
0 回答
158 浏览

python-3.x - 对于某些音频声音,Librosa 生成的波图是平坦的

librosa 的显示模块生成的某些波形图只是填充整个轴的平线。

我使用原生采样率将一些 wav 文件加载到 librosa 中,我的数据集是立体声和单声道文件的混合。我知道波形图是不正确的,因为它看起来与大胆的相同文件的频率-时间图完全不同。

我尝试过使用图形宽度、高度和 DPI,但是生成的波形图没有任何改进。下面是 Librosa 为这些音频文件之一生成的波形图和大胆的预期波形图。

Librosa 波形图

大胆的波图

用于生成绘图的代码来自 librosa 文档:

0 投票
5 回答
11318 浏览

python - 在树莓派 3 上运行 librosa 和 numba

我正在尝试在我的树莓派 3 上运行 librosa。经过数小时的互联网搜索后,我终于能够安装它,但是当我尝试导入它时它仍然会引发错误。首先,我在安装依赖项时遇到了问题llvmlite。我终于用下面的代码安装了它:conda install -c numba llvmlite. 我使用带有 miniconda 的 python 3.4 构建。

安装 llvmlite 后,我能够安装 librosa pip(无法使用 conda)

显然 librosa 已安装。

尝试导入 librosa 会引发以下错误:

尝试导入 numba 会引发以下错误:

有谁知道问题可能是什么?我很感激任何提示或提示。谢谢!!!!!

0 投票
1 回答
223 浏览

python - Librosa 停止 matplotlib 工作

我有这个简单的 python 3 示例:

但是,一旦我发现librosa.load(...)程序崩溃并显示以下错误消息:

该情节仍然打开了一个新窗口,但它完全是空的。

0 投票
0 回答
211 浏览

audio - 使用不同库的 mfcc 提取结果不同的原因

我找到了两个用于音频信号处理的库( librosatarsosDSP )。他们都有提取mfcc的方法。

在同一个.wav文件上运行一个简单的例子后,他们给出了完全不同的结果:

在此处输入图像描述

蓝色来自 librosa,橙色来自 tarsosDSP。橙色线几乎与y=x * -3/5蓝色线完全相同。

他们如此不同的原因是什么?我完全使用了示例代码,所以我认为原因不是我用不同的输入调用它们,而是它们如何在内部计算结果。

0 投票
4 回答
2923 浏览

audio - 是否有可能从 tensorflow mfcc 和 librosa mfcc 获得完全相同的结果?

我试图让 tensorflow mfcc 给我与 python lybrosa mfcc 相同的结果我试图匹配 librosa 在我的 tensorflow 代码中使用的所有默认参数并得到不同的结果

这是我使用的张量流代码:

librosa 中的等价物: libr_mfcc = librosa.feature.mfcc(wav, 16000)

以下是结果图表: 张量流 mfcc 结果

librosa mfcc 结果

0 投票
1 回答
127 浏览

python - Error in the simple Tensorflow code in Python

I have a deep learning code written in python (Anaconda3, Ubuntu 16.04). It basically does ad detection for a given video based on a trained model, must return if the video is ad or not (we assume it is only a single-shot video). My colleague who is unavailable right now wrote this.

The original file had a loop somewhere (for multiple shot) iterating over the list of the shots, and now that loop is removed assuming the video is a single shot. But looks some array sizes are messed up, hence the error. How to fix the problem?

I'm not familiar with python and deep learning, and it should be general python programming issues, not the semantics because it worked fine just before.

Here is the error:

So it should run when calling video_audio_extractor(video_name). Here is the code. Right now final_label_list must contain if it is video or ad. And I guess since it is only a single shot, it must contain only one element.

Below is the original video_audio_extractor function for which contains the for loop: