这无疑类似于(但不重复)全文搜索引擎的比较 - Lucene、Sphinx、Postgresql、MySQL?,但是我正在寻找的是具体的、受支持的、受益于多个可用系统的经验的建议(似乎有很多:“我使用过 lucene,但没有使用 sphinx”,反之亦然反之亦然)。
设置:标准 LAMP(Mysql 5.0,PHP 5)。
MySQL:表使用 InnoDB 引擎进行外键约束
我们正在查看索引数据,而不是页面。要索引的数据可以是多种语言(utf-8 字符集)
我遇到的一些比较(如http://blog.evanweaver.com/articles/2008/03/17/rails-search-benchmarks/)要么不完全适用(ferret 是一个 lucene 端口,但不是与 Zend_Search_Lucene 相同)或者他们正在推动他们自己的系统/实现(并非完全无偏见)。
我遇到的其他一些(例如http://whatstheplot.com/blog/tag/lucene/和http://pagetracer.com/2008/02/15/sphinx-and-lucene-search-engines-first -impressions/ ) 为两个系统的性能提供了非常不同的结果。
此外,在我读过的大部分内容中几乎被忽略的是Xapian。这也值得考虑吗?
所以......我希望你们中的一些人对这个问题有一些经验,可以帮助提出一些建议或为我指明正确的方向。