我正在尝试通过从另一个数据集中获取间隔来创建一个新数据集,例如,将 dataset1 作为输入,将 dataset2 作为输出:
dataset1 = [1, 2, 3, 4, 5, 6]
dataset2 = [1, 2, 2, 3, 3, 4, 4, 5, 5, 6]
我设法使用数组来做到这一点,但对于 mlib,需要一个数据集。
我的数组代码:
def generateSeries(values: Array[Double], n: Int): Seq[Array[Float]] = {
var res: Array[Array[Float]] = new Array[Array[Float]](m)
for(i <- 0 to m-n){
res :+ values(i to i + n)
}
return res
}
FlatMap 似乎是要走的路,但函数如何在数据集中搜索下一个值?