我有一个像这样的 pyspark 数据框,其中包含“zodiac”的行和“nonzodiac”的行
spark.createDataFrame(
[
(1, '1234ESPNnonzodiac'),
(2, '1234ESPNzodiac'),
(3, '963CNNnonzodiac'),
(4, '963CNNzodiac'),
],
['id', 'col1']
)
我可以像这样得到所有非黄道带行:
nonzodiac_rows = df.where(f.col("col1").rlike("nonzodiac"))
但我无法只返回带有“zodiac”的行,因为做类似的事情会同时返回 zodiac 和 nonzodiac 行
zodiac_rows = df.where(f.col("col1").rlike("zodiac"))