我正在寻找与pyTables提供的类似的 Scala 帮助。PyTables 是一个用于管理分层数据集的包,旨在高效、轻松地处理大量数据。
有什么建议么?
我快速浏览了 pyTables,我认为在 Scalaland(或者实际上是 Javaland)中没有任何类似的东西,但是如果你想投入时间,我们有一些必要的成分使它成为可能:
PyTables 是 HDF5 的 Python 实现,增加了一些细节,让您以 Python 方式处理它,并获得良好的索引支持。我不确定在 Scala 中是否有以类似方式实现的包,但您可以使用 Java 中的 HDF5 实现使用相同的基于 HFD5 的分层数据存储:HDF Java