问题标签 [librosa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
audio - 直接加载带有 librosa 的音频文件(以 dB 为单位)
有没有办法直接加载带有 librosa 的音频文件,而不是通过以下方式获得的振幅:
python - 从 python 读取 wav 文件并将帧转换为 RAW s16le 字符串
我正在使用 librosa、wave 或 soundfile 库在 Python 中读取文件,我需要将块(任何大小)推送到 HTTP 流。根据规范,流字符串输入要求我将帧转换为 RAW s16le 格式。
我尝试了多种选择,包括:
但这只会创建一个空的音频流。我究竟做错了什么?
audio - 带有 librosa 的音频缓冲区
在以下代码中,我创建了一个缓冲区,该缓冲区在每次循环迭代中保存 10 帧音频文件。
在缓冲区之外,我需要使用 librosa 获取一个表示每个采样点的音频幅度的 numpy 数组。任何想法?
python-3.x - 对于某些音频声音,Librosa 生成的波图是平坦的
librosa 的显示模块生成的某些波形图只是填充整个轴的平线。
我使用原生采样率将一些 wav 文件加载到 librosa 中,我的数据集是立体声和单声道文件的混合。我知道波形图是不正确的,因为它看起来与大胆的相同文件的频率-时间图完全不同。
我尝试过使用图形宽度、高度和 DPI,但是生成的波形图没有任何改进。下面是 Librosa 为这些音频文件之一生成的波形图和大胆的预期波形图。
用于生成绘图的代码来自 librosa 文档:
python - 在树莓派 3 上运行 librosa 和 numba
我正在尝试在我的树莓派 3 上运行 librosa。经过数小时的互联网搜索后,我终于能够安装它,但是当我尝试导入它时它仍然会引发错误。首先,我在安装依赖项时遇到了问题llvmlite
。我终于用下面的代码安装了它:conda install -c numba llvmlite
. 我使用带有 miniconda 的 python 3.4 构建。
安装 llvmlite 后,我能够安装 librosa pip
(无法使用 conda)
显然 librosa 已安装。
尝试导入 librosa 会引发以下错误:
尝试导入 numba 会引发以下错误:
有谁知道问题可能是什么?我很感激任何提示或提示。谢谢!!!!!
python - Librosa 停止 matplotlib 工作
我有这个简单的 python 3 示例:
但是,一旦我发现librosa.load(...)
程序崩溃并显示以下错误消息:
该情节仍然打开了一个新窗口,但它完全是空的。
audio - 是否有可能从 tensorflow mfcc 和 librosa mfcc 获得完全相同的结果?
我试图让 tensorflow mfcc 给我与 python lybrosa mfcc 相同的结果我试图匹配 librosa 在我的 tensorflow 代码中使用的所有默认参数并得到不同的结果
这是我使用的张量流代码:
librosa 中的等价物: libr_mfcc = librosa.feature.mfcc(wav, 16000)
以下是结果图表:
python - Error in the simple Tensorflow code in Python
I have a deep learning code written in python (Anaconda3, Ubuntu 16.04). It basically does ad detection for a given video based on a trained model, must return if the video is ad or not (we assume it is only a single-shot video). My colleague who is unavailable right now wrote this.
The original file had a loop somewhere (for multiple shot) iterating over the list of the shots, and now that loop is removed assuming the video is a single shot. But looks some array sizes are messed up, hence the error. How to fix the problem?
I'm not familiar with python and deep learning, and it should be general python programming issues, not the semantics because it worked fine just before.
Here is the error:
So it should run when calling video_audio_extractor(video_name)
. Here is the code. Right now final_label_list
must contain if it is video or ad. And I guess since it is only a single shot, it must contain only one element.
Below is the original video_audio_extractor
function for which contains the for loop: