Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
逆文档频率在信息检索中没有用的情况有哪些?
如果在您的系统中,您可能不想使用 IDF,您不希望对稀有词条的权重比对频繁出现的词条的权重更大。此外,计算 idf 是一项昂贵的操作。从以下事实可以看出这一点:在最常用的评分方案(即 lnc.ltc)中,我们不计算文档中出现的术语的 idf 分数。
此外,如果您的搜索引擎只处理一个单词查询,那么使用 idf 是没有用的,好像每个文档都一样。希望能帮助到你