我知道如何使用 pyspark 读取 csv,但我在以正确格式加载它时遇到了很多问题。我的 csv 有 3 列,其中第一列和第二列是字符串,但第三列是字典列表。我无法加载最后一列。
我试过了
schema = StructType([
StructField("_id", StringType()),
StructField("text", StringType()),
StructField("links", ArrayType(elementType=MapType(StringType(), StringType())))
])
但它引发了一个错误。对于 Inferschema,它都不起作用。