我正在尝试创建一个DataFrame
using RDD
.
首先,我正在RDD
使用以下代码创建一个 -
val account = sc.parallelize(Seq(
(1, null, 2,"F"),
(2, 2, 4, "F"),
(3, 3, 6, "N"),
(4,null,8,"F")))
它工作正常 -
帐户:org.apache.spark.rdd.RDD[(Int, Any, Int, String)] = ParallelCollectionRDD[0] at parallelize at :27
但是当尝试使用以下代码创建DataFrame
时RDD
account.toDF("ACCT_ID", "M_CD", "C_CD","IND")
我得到以下错误
java.lang.UnsupportedOperationException:不支持 Any 类型的架构
我分析说,每当我投入null
价值时,Seq
只有我得到了错误。
有没有办法添加空值?