-1

我已经计算了文档 1 和文档 2 的术语的 tf-idf 值..现在我不知道如何使用这些 tf-idf 值...基本上我想找到两个文档之间的相似性(在我的例子中是网页)。 . 任何人都可以告诉如何实现余弦相似度,jaccard 系数来找到相似度...c# 代码将不胜感激..请帮助...谢谢

4

1 回答 1

0

我建议访问 Apache Mahout。它为此提供了一整套工具。即使您不想使用它们,您也可以通过查看现有实现来获得这些问题的答案。

于 2010-05-16T17:38:48.567 回答