我正在尝试编写一些代码来制作一个用于从文件中搜索文本的小型应用程序。
应该抓取文件,我需要放置一个倒排索引来促进搜索。
我的问题是我对解析器的样子有一些想法。我愿意在查询中实现 AND、NOT 或 OR。
然而,我无法弄清楚我的索引应该如何......我从未创建过倒排索引,所以如果有人能提出一种可行的方法来做到这一点,我将非常感激。我在理论上知道它是如何工作的,但我的问题是我完全不知道如何在 MySql 中实现。我也需要给被索引的关键字一个权重。
我正在尝试编写一些代码来制作一个用于从文件中搜索文本的小型应用程序。
应该抓取文件,我需要放置一个倒排索引来促进搜索。
我的问题是我对解析器的样子有一些想法。我愿意在查询中实现 AND、NOT 或 OR。
然而,我无法弄清楚我的索引应该如何......我从未创建过倒排索引,所以如果有人能提出一种可行的方法来做到这一点,我将非常感激。我在理论上知道它是如何工作的,但我的问题是我完全不知道如何在 MySql 中实现。我也需要给被索引的关键字一个权重。
这是一个简单的实现。 http://rosettacode.org/wiki/Inverted_Index
选择 1:Apache Solr/Lucene。选择2:mysql的全文索引支持。