2

训练完 mllib 模型后,我是否必须将在线系统中的每个传入项目转换为 DataFrame 才能在其上调用类似预测/转换的方法?看起来有点矫枉过正,很容易出现与时间/内存相关的问题。

我可以以某种方式构建/转换/预测一行,或者类似的东西吗?(Scala 中的解决方案更可取)

我找到了一个文本,作者说他们为此实现了自己的一些东西:https ://www.oreilly.com/ideas/training-and-serving-nlp-models-using-spark-mllib

4

0 回答 0