0

这些天来,我正在使用 librosa,它是一种音频处理库。作为加载音频文件的基本步骤,可以使用以下功能。

librosa.core.load()
  1. 然后将音频文件表示为音频时间序列。我认为时间序列的每个值都是音频的幅度。但是,我想知道幅度的单位是什么。
  2. 此外,幅度、功率、dB 和能量之间的关系是什么?
4

2 回答 2

1

librosa.load返回一个 numpy 类型的数组float32,其值介于-1.0和之间1.0。这些值在现实世界中对应于什么物理量(或者如果它们确实如此)是未知的。所以就其本身而言,它是无单位的。

如果他们的文件是用麦克风记录的,则这些值与气压的变化呈线性关系。如果您知道记录时的气压(平均值和最小值/最大值),您可以将这些值映射回压力(单位:帕斯卡)。

于 2018-07-15T18:53:04.520 回答
0

Librosa 的文档中没有定义振幅的单位。但是,您可以使用以下命令将幅度转换为分贝单位:librosa.amplitude_to_db(S, ref=1.0, amin=1e-05, top_db=80.0)

Librosa 幅度函数的文档可以在这里找到:https ://librosa.org/doc/main/core.html#magnitude-scaling

于 2021-05-13T17:37:16.787 回答