0

我正在尝试使用以下命令创建空的 Koalas DataFrame

df = ks.from_pandas(pd.DataFrame(columns=['A', 'B', 'C']))

但我收到以下错误

ValueError: can not infer schema from empty or null dataset

我也尝试了以下命令,但发现了类似的错误

df = ks.DataFrame(columns=['col1', 'col2'])

如果有人可以帮助我,我将不胜感激。

4

2 回答 2

1

不能创建一个空的 Koalas DataFrame,因为PySpark默认情况下会尝试从给定数据推断类型。因此,PySpark如果 DataFrame 或列中没有数据,则无法推断 DataFrame 的数据类型。

为了便于理解,Koalas DataFrame 没有允许None像 Pandas ( objecttype) 这样的类型的数据类型。

所以,如果你仍然想要一个空的 DataFrame,我建议你初始化一个 DataFramePandas并在需要时将其转换为KoalasDataFrame。

于 2020-08-24T12:08:12.960 回答
0

试试这个:

ks.DataFrame({}, index=list('abc')).empty

参考

于 2021-04-08T21:23:53.420 回答