如果我已经调用过vectorizer.fit_transform(corpus)
,那么以后打印文档术语矩阵以vectorizer.fit_transform(corpus)
再次调用的唯一方法是什么?
from sklearn.feature_extraction.text import CountVectorizer
corpus = ['the', 'quick','brown','fox']
vectorizer = CountVectorizer(stop_words='english')
vectorizer.fit_transform(corpus) # Returns the document-term matrix
我的理解是通过上述操作,我现在已将术语保存到vectorizer
对象中。我假设这是因为我现在可以调用而无需再次vectorizer.vocabulary_
传入。corpus
所以我想知道为什么没有类似的方法.document_term_matrix
?
corpus
如果数据现在已经存储在vectorizer
对象中,我必须再次传入似乎很奇怪。但根据文档,只有.fit
, .transform
, 和.fit_transform
返回矩阵。
其他信息:
我正在使用 Anaconda 和 Jupyter Notebook。