不知道把它放在标题中最好。
这就是我想要做的:我正在使用GridSearch
apipeline
来训练分类器。我想看看最好vocabulary_.items()
的CountVectorizer
估算器使用的。
现在,我正在这样做,运行后GridSearch
:
classifier = gs_clf.best_estimator_
vect = classifier.named_steps["vec"]
data = vect.fit_transform(x_train)
vocab = = vect.vocabulary_.items()
有什么方法可以直接获取词汇项,而不需要fit_transform
再次使用CountVectorizer
?