作为狮身人面像的新手,请原谅任何错误或滥用的术语。
Sphinx 正在一个基于网络的应用程序中使用,该应用程序具有数百万条记录的数据库,以提供全文搜索功能。
对于存储在数据库中的英文内容,搜索结果是“准确的”并且与搜索关键字相关。非拉丁字符不会发生同样的事情。我查看了形态配置设置,但希腊语不可用。因此,对于希腊关键词,搜索结果并不总是与搜索关键词相关,如英语中的关键词。
sphinx 对希腊内容的文本分析和索引是否与对英语内容的方式相同?
任何信息(链接、评论、答案)都会有所帮助。
谢谢,
作为狮身人面像的新手,请原谅任何错误或滥用的术语。
Sphinx 正在一个基于网络的应用程序中使用,该应用程序具有数百万条记录的数据库,以提供全文搜索功能。
对于存储在数据库中的英文内容,搜索结果是“准确的”并且与搜索关键字相关。非拉丁字符不会发生同样的事情。我查看了形态配置设置,但希腊语不可用。因此,对于希腊关键词,搜索结果并不总是与搜索关键词相关,如英语中的关键词。
sphinx 对希腊内容的文本分析和索引是否与对英语内容的方式相同?
任何信息(链接、评论、答案)都会有所帮助。
谢谢,
这很可能受 charset_type 和 charset_table 配置的影响。
http://sphinxsearch.com/docs/current.html#conf-charset-type
http://sphinxsearch.com/docs/current.html#conf-charset-table
开箱即用的 sphinx 仅适用于英语和俄语(主要 Sphinx 开发人员碰巧说的语言 :)
因此,您需要启用 utf8 模式,并将所需的希腊字符添加到 charset_table。
sphinx wiki http://sphinxsearch.com/wiki/doku.php?id=charset_tables 有一组可以复制/粘贴的希腊配置选项。