17

如何使用 PyTables 将 numpy 多维数组放入 HDF5 文件中?

据我所知,我不能将数组字段放入 pytables 表中。

我还需要存储一些关于这个数组的信息,并能够对其进行数学计算。

有什么建议么?

4

1 回答 1

33

可能有一种更简单的方法,但据我所知,这就是你要做的事情:

import numpy as np
import tables

# Generate some data
x = np.random.random((100,100,100))

# Store "x" in a chunked array...
f = tables.open_file('test.hdf', 'w')
atom = tables.Atom.from_dtype(x.dtype)
ds = f.createCArray(f.root, 'somename', atom, x.shape)
ds[:] = x
f.close()

如果要指定要使用的压缩,请查看tables.Filters. 例如

import numpy as np
import tables

# Generate some data
x = np.random.random((100,100,100))

# Store "x" in a chunked array with level 5 BLOSC compression...
f = tables.open_file('test.hdf', 'w')
atom = tables.Atom.from_dtype(x.dtype)
filters = tables.Filters(complib='blosc', complevel=5)
ds = f.createCArray(f.root, 'somename', atom, x.shape, filters=filters)
ds[:] = x
f.close()

对于很多这种情况,可能有一种更简单的方法......我pytables很长一段时间没有使用除了表格数据之外的任何东西。

注意:在 pytables 3.0 中,f.createCArray已重命名为f.create_carray. 它也可以直接接受数组,无需指定atom,

f.create_carray('/', 'somename', obj=x, filters=filters)
于 2012-01-12T22:45:58.857 回答