我有一个镶木地板文件,它有一个带有几列的简单文件架构。我使用下面的代码将它读入 python
from fastparquet import ParquetFile
pf = ParquetFile('inout_files.parquet')
这运行良好,但是当我使用下面的代码将其转换为 pandas 时,出现以下错误:
df = pf.to_pandas()
错误是:
NotImplementedError: Encoding 4
为了找到错误的来源,我分别df=pf.to_pandas(columns=col_to_retrieve)
添加了列,并注意到错误是从具有字符串列表(例如(“a”、“b”、“c”))作为每个单元格的值的列之一引发的列。
你知道如何将它转换为 Pandas,知道有类型为 set(string) 的列吗?