0

我想从存储在许多文件夹中的文档列表中构造Document x Word矩阵。矩阵中的特定条目x表示word_j在document_i中出现x次。Vocabulary.txt 文件中给出了要考虑的单词列表。 是否有任何现有的软件包可以逐一扫描文档,删除停用词并构建文档向量?

4

0 回答 0