这些天来,我正在使用 librosa,它是一种音频处理库。作为加载音频文件的基本步骤,可以使用以下功能。
librosa.core.load()
- 然后将音频文件表示为音频时间序列。我认为时间序列的每个值都是音频的幅度。但是,我想知道幅度的单位是什么。
- 此外,幅度、功率、dB 和能量之间的关系是什么?
这些天来,我正在使用 librosa,它是一种音频处理库。作为加载音频文件的基本步骤,可以使用以下功能。
librosa.core.load()
librosa.load
返回一个 numpy 类型的数组float32
,其值介于-1.0
和之间1.0
。这些值在现实世界中对应于什么物理量(或者如果它们确实如此)是未知的。所以就其本身而言,它是无单位的。
如果他们的文件是用麦克风记录的,则这些值与气压的变化呈线性关系。如果您知道记录时的气压(平均值和最小值/最大值),您可以将这些值映射回压力(单位:帕斯卡)。
Librosa 的文档中没有定义振幅的单位。但是,您可以使用以下命令将幅度转换为分贝单位:librosa.amplitude_to_db(S, ref=1.0, amin=1e-05, top_db=80.0)
Librosa 幅度函数的文档可以在这里找到:https ://librosa.org/doc/main/core.html#magnitude-scaling