我将句子存储为从文档中提取的字符串。我想将标准余弦相似度应用于句子。我该怎么做呢?
2 回答
0
好吧,您已经在 wikipedia 上找到了公式。每一个Ai
都是一个词,所以首先你需要计算文档中词的频率。您需要能够创建单词出现的地图。然后你用一个词向量来表示每个句子,然后你就可以应用这个公式了。
于 2012-02-06T11:10:52.670 回答
0
于 2012-02-07T05:31:16.220 回答