0

我有以下问题,我需要为标记的文章建立 lucene 索引。

这是简化的数据结构和 lucene 提议:

article_id -> unindexed
article_title -> UnStored
article_content -> UnStored
article_tags -> ????? (here is the problem)

所以文章可以有多个标签。假设我们有一篇文章 A,它具有以下标签:T1、T2、T3。问题是 T1,T2,T3 由 ID(数字)表示,我不能将其作为文本表示形式存储在索引中,因为它可以更改(然后我需要重建索引搜索所有带有已更改标签的文章删除并将它们再次添加到索引中)。然后我需要在带有 T1 和 T2 标签的文章中进行搜索。分配给文章的标签数量是无限的(关系 1-n)。是否有可能搜索具有某些标签(标签 ID)的文章?

希望我清楚。有人对这个问题有有效的解决方案吗?

提前致谢。

4

1 回答 1

0

你可以用 Lucene 做到这一点。一种方法是为每个标签-文章对创建一个文档,并使用 AND 搜索标签。

你应该使用Lucene吗?我不确定。在您的描述中,您没有使用任何全文搜索功能。为什么不使用数据库?我建议您阅读Search Engine vs DBMS并根据那里定义的标准进行选择。

于 2010-01-27T07:14:47.270 回答