我目前正在使用 Apache Flink 的 SVM-Class 来预测一些文本数据。
该类提供了一个预测函数,它将 DataSet[Vector] 作为输入并给我一个 DataSet[Prediction] 作为结果。到目前为止,一切都很好。
我的问题是,我没有预测属于哪个文本的上下文,并且我无法在 predict() 函数中插入文本以便之后拥有它。
代码:
val tweets: DataSet[(SparseVector, String)] =
source.flatMap(new SelectEnglishTweetWithCreatedAtFlatMapper)
.map(tweet => (featureVectorService.transform(tweet._2))
model.predict(tweets).print
result example:
(SparseVector((462,8.73165920153676), (10844,8.508515650222549), (15656,2.931052542245018)),-1.0)
有没有办法将其他数据保留在预测旁边以将所有内容放在一起?因为没有上下文,预测对我没有帮助。
或者也许有一种方法可以只预测一个向量而不是数据集,我可以在上面的 map 函数中调用该函数。