-1

我将句子存储为从文档中提取的字符串。我想将标准余弦相似度应用于句子。我该怎么做呢?

4

2 回答 2

0

好吧,您已经在 wikipedia 上找到了公式。每一个Ai都是一个词,所以首先你需要计算文档中词的频率。您需要能够创建单词出现的地图。然后你用一个词向量来表示每个句子,然后你就可以应用这个公式了。

于 2012-02-06T11:10:52.670 回答
0

首先,阅读Term-Document 矩阵

然后,使用余弦相似度计算器进行余弦计算

如果您对文本挖掘感兴趣,请选择SVD,最后选择潜在语义分析

于 2012-02-07T05:31:16.220 回答