0

我在将我显示为 numpy ndarays 的图像保存时遇到了一些问题。

例子:

这段代码:

librosa.display.specshow(static.T,sr=16000,x_axis='frames',y_axis='mel',hop_length=160,cmap=cm.jet)
plt.title("log mel power spectrum of " + name)
plt.colorbar(format='%+02.0f dB')
plt.tight_layout()
plt.savefig(plot+"/"+name+"_plot_static_conv.png")
plt.show()

将显示如下图像:

在此处输入图像描述

但是当我将图像存储到一个 numpy ndarray 中,然后尝试绘制它时,我得到了这样的东西..

convert = plt.get_cmap(cm.jet)
numpy_output_static = convert(static.T)
plt.imshow(numpy_output_static)
plt.show()
raw_input("sadas")

给我看一张图片:

在此处输入图像描述

发生了什么事?.. 为什么我不能存储相同的图像,并以相同的方式查看它?

最小的工作示例:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib
from PIL import Image
import librosa
import librosa.display
from matplotlib import cm


fig = plt.figure(figsize=(12,4))
min = -1.828067
max = 22.70058
data =  np.random.uniform(low=min, high=max, size=(474,40))
librosa.display.specshow(data.T,sr=16000,x_axis='frames',y_axis='mel',hop_length=160,cmap=cm.jet)
plt.show()
raw_input("sadas")

convert = plt.get_cmap(cm.jet)
numpy_output_static = convert(data.T)
plt.imshow(numpy_output_static, aspect = 'auto')
plt.show()
raw_input("asds")

第一个情节是:

在此处输入图像描述

第二个情节是:

在此处输入图像描述

规范化数据集并不能修复第二张图像。

4

1 回答 1

0

您的问题与您的使用方式有关imshow(请参阅下面的说明)。

解决方案

我已将您的输入数据从随机数据转换为常规数据,以便比较更直接。使用下面的实现,我得到了一个很好的匹配结果:

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm
import librosa
import librosa.display

data = np.linspace(-1.828067,22.70058,474*40).reshape(474,40)

fig = plt.figure(figsize=(12,8))

ax1 = fig.add_subplot(2,1,1)
librosa.display.specshow(data.T,sr=16000,x_axis='frames',y_axis='mel',hop_length=160,cmap=cm.jet)

ax2 = fig.add_subplot(2,1,2)
extent = (0,474,0,9325.7)
plt.imshow(data.T,cmap='jet',extent=extent)
ax2.set_aspect(abs((extent[1]-extent[0])/(extent[3]-extent[2]))/4.)

plt.show()

结果:

在此处输入图像描述

解释

现在,出了什么问题?你用过

convert = plt.get_cmap(cm.jet)

最好将结果convert视为具有256个 RGBA 颜色条目的列表:

>>> convert(0)
(0.0, 0.0, 0.5, 1.0)

>>> convert(1)
(0.0, 0.0, 0.517825311942959, 1.0)

>>> convert(2)
(0.0, 0.0, 0.535650623885918, 1.0)

...

>>> convert(254)
(0.517825311942959, 0.0, 0.0, 1.0)

>>> convert(255)
(0.5, 0.0, 0.0, 1.0)

现在的诀窍是它是一个“特殊”列表,它只会在超出范围时返回最大值:

>>> convert(256)
(0.5, 0.0, 0.0, 1.0)

>>> convert(257)
(0.5, 0.0, 0.0, 1.0)

... 

>>> convert(1000)
(0.5, 0.0, 0.0, 1.0)

这正是发生在你身上的事情。因此,您的图表几乎全是红色(“喷射”的最后一种颜色)。

相反,在我提供的代码中,数据被映射到 256 种颜色(分配了最小值convert(0)、最大值convert(255),或更一般地说:(value-min_val)*255/(max_val-min_val).

参考

于 2017-05-13T13:27:40.983 回答