假设我有一个 Array[Double] 的 RDD,有 n 列。我想在最后一列上应用过滤器(例如,值 > 某个常量)。
- Scala/Apache Spark 中的语法是什么?
- 如果我有一个向量的 RDD,是否可以做同样的事情?
- 如果我可以选择其中一个(即 Array[Double] 的 RDD 和 Vectors 的 RDD),我应该选择哪一个才能获得更高效/更快的代码?
假设我有一个 Array[Double] 的 RDD,有 n 列。我想在最后一列上应用过滤器(例如,值 > 某个常量)。