我想使用数据集而不是数据框。
我正在阅读镶木地板文件并想直接推断类型:
val df: Dataset[Row] = spark.read.parquet(path)
我不想要Dataset[Row]
一个Dataset
.
我知道我可以做类似的事情:
val df= spark.read.parquet(path).as[myCaseClass]
但是,我的数据有很多列!所以,如果我可以避免编写案例类,那就太好了!
我想使用数据集而不是数据框。
我正在阅读镶木地板文件并想直接推断类型:
val df: Dataset[Row] = spark.read.parquet(path)
我不想要Dataset[Row]
一个Dataset
.
我知道我可以做类似的事情:
val df= spark.read.parquet(path).as[myCaseClass]
但是,我的数据有很多列!所以,如果我可以避免编写案例类,那就太好了!