我有以下问题,我需要为标记的文章建立 lucene 索引。
这是简化的数据结构和 lucene 提议:
article_id -> unindexed
article_title -> UnStored
article_content -> UnStored
article_tags -> ????? (here is the problem)
所以文章可以有多个标签。假设我们有一篇文章 A,它具有以下标签:T1、T2、T3。问题是 T1,T2,T3 由 ID(数字)表示,我不能将其作为文本表示形式存储在索引中,因为它可以更改(然后我需要重建索引搜索所有带有已更改标签的文章删除并将它们再次添加到索引中)。然后我需要在带有 T1 和 T2 标签的文章中进行搜索。分配给文章的标签数量是无限的(关系 1-n)。是否有可能搜索具有某些标签(标签 ID)的文章?
希望我清楚。有人对这个问题有有效的解决方案吗?
提前致谢。