数据 :
1,Coke
1,Beans
1,paper
2,Beans
2,Pen
2,Sheets
2,Banana
预期输出:
+---+------------------------+
| 1|Coke,Beans,Paper |
| 2|Beans,Pen,Sheets,Banana |
+---+------------------------+
我可以通过编写 sql 查询来实现这一点。
val df = sparkSession.read.csv("file_location")
df.registerTempTable("data")
val result = sparkSession
.sql("select _c0 ,concat_ws(',', collect_list(_c1)) as product from data group by _c0")
result.show
请帮助我使用dataframe/Dataset
函数(select、groupby、agg 等)实现相同的结果