Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在为一个项目修改胡萝卜的源代码。会计。对于 LINGO 算法,它首先生成最可能的标签并构建最适合标签的集群,对吗?那么,我可以将我自己的一组标签输入到胡萝卜中,看看它是如何将文档聚集在它们周围的吗?
不幸的是,您不能提供自己的标签来使用 Lingo 进行聚类。
另一方面,Lingo 中的 label-to-document assignment 算法非常简单——如果文档包含 label 的单词,则将其分配给 label。因此,您可以通过例如在 Lucene 中对文档进行索引,然后使用您拥有的预定义标签查询索引来实现相同的效果。