问题标签 [luke]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 从 WinXP 启动 Luke(Java App) 时出错
我从http://code.google.com/p/luke/downloads/list下载了 luke-1.0.1.jar(没有任何依赖关系的 Luke 1.0.1 二进制文件)。
我有 WinXP,从 Oracle/Sun 网站下载了最新的 Java 6。
我运行命令行:“java -jar luke-1.0.1.jar”并尝试启动 Luke,但出现以下错误:
有什么线索,我该怎么办?我完全不了解Java。
谢谢
哈代
lucene - 用于 lucene 索引的 Solr 查询解析器?
我创建了一个存储文本消息的索引(使用 Lucene 2.9)。(文档还包含其他一些未编入索引的元数据,只是存储)我使用 StandardAnalyzer 来解析这些消息。我正在尝试使用 Solr 对此索引运行一些测试(我用我的索引替换了示例应用程序索引),以查看我从各种查询中得到了什么样的结果。
当我尝试以下查询时,我得到了 0 个结果
但是,将其更改为"text:happiness*"
给我一些结果。它们都包含诸如"happiness,", "happiness."
etc 之类的术语。所以我认为这是索引创建期间的标记化问题,但是,当我使用 Luke(一个 lucene 索引调试工具)运行相同的查询(text:happiness)
时,我得到了完全相同的结果。来自 Solr 的快乐*,这让我相信问题不在于索引,而在于我指定 Solr 查询的方式。我查看了 solrconfig.xml,注意到它有以下行(已注释),我尝试取消注释它,然后修改我的查询以在原始查询之外使用“defType=lucene”,但得到了相同的结果。
我对 Solr 的经验很少,因此非常感谢任何帮助:)
c# - Luke Lucene BooleanQuery
在 Luke 中,以下搜索表达式返回 23 个结果:
如果我通过以下实现将相同的表达式传递到我的 C# Lucene.NET 应用程序中:
我得到 0 个结果
Luke 正在使用 StandardAnalyzer,这就是解释结构窗口的样子:
BooleanClause
我必须为我搜索的每个字段手动创建对象,为每个字段指定Should
然后将它们添加到BooleanQuery
对象中.Add()
吗?我以为QueryParser
会为我做这件事。我错过了什么?
编辑:
简化一点,docfile:Tomatoes*
在 Luke 返回 23 个文档,但在我的应用程序中返回 0 个。根据 Gene 的建议,我已从更改MUST
为SHOULD
:
parsedQuery 很简单docfile:tomatoes*
编辑2:
我想我终于找到了根本问题:
在第二行中,query
是"docfile:Tomatoes*"
,但是parsedQuery
是{docfile:tomatoes*}
。注意到区别了吗?已解析查询中的小写“t”。我以前从未注意到这一点。如果我将 IDE 中的值更改为“T”,则返回 23 个结果。
我已经验证了StandardAnalyzer
在索引和读取索引时正在使用它。我如何强制queryParser
保持值的大小写query
?
Edit3: 哇,多么令人沮丧。根据文档,我可以通过以下方式完成此操作:
parser.setLowercaseExpandedTerms(false);
通配符、前缀、模糊和范围查询的术语是否自动小写。默认为真。
我不会争论这是否是一个明智的默认设置。我想应该使用 SimpleAnalyzer 将索引内外的所有内容小写。令人沮丧的是,至少在我使用的版本中,卢克默认的是另一种方式!至少我了解了更多关于 Lucene 的知识。
lucene - Luke Lucene QueryParser 区分大小写
在 Luke 中,如果我输入搜索表达式docfile:Tomatoes.jpg*
,则解析后的查询是docfile:Tomatoes.jpg*
. 当搜索表达式为docfile:Tomatoes.jpg
,(无星号 *)时,解析后的查询docfile:tomatoes.jpg
带有小写的 't'。
- 为什么?
- 我怎样才能改变这个?
顺便说一句,使用 org.apache.lucene.analysis.standard.StandardAnalyzer。
solr - 将 solr 1.4 索引升级到 solr 3.3?
我有一个使用 apache solr 1.4 的现有索引构建。
我想在 3.3 版中使用这个现有的索引。如您所知,索引格式在 3.x 之后发生了变化,那么如何做到这一点呢?
我已经使用 Luke 将现有索引(即 1.4 版本)导出到 XML。
lucene - 寻找 Lucene 索引版本
当我使用 Luke V3.3.0 时,它告诉我我打开的 Lucene 索引是:
- 索引版本:13172b074a7
- 索引格式:-11(Lucene 3.1)
我正在使用 Solr 3.3,我之前删除了我的文件夹 /var/data/solr/myrepository 在索引之前。我希望版本是 Lucene 3.3。Lucene 3.1 和 Lucene 3.3 之间没有索引变化?归根结底,我只想确保我的索引是使用 Lucene 3.3 创建的。我正在寻找任何获得 Lucene 索引版本的简单方法。
字段折叠也有效,所以如果索引发生变化,我的索引版本是正确的。我也没有从 Solr 管理页面看到此信息。
谢谢你。
java - 如何获取搜索结果中出现的一组术语?
给定 solr 中索引文档的 id/url,我可以获得该文档包含/索引的一组术语吗?
这是由 Luke 完成的,所以我怀疑http://wiki.apache.org/solr/LukeRequestHandler可能会有所帮助,但我很确定该怎么做。
lucene - 无法打开 lucene 索引(Java 堆空间)
我想从 lucene 索引文件中获取一些数据。但我无法阅读。
我尝试使用Luke
,但它总是与java.lang.OutOfMemoryError: Java heap space
. 注意-Xmx
不能帮助我。我尝试 -Xmx512、-Xmx1024 甚至 -Xmx2048。
我也尝试使用Solr
,但也得到java.lang.OutOfMemoryError: Java heap space
了。
有什么想法可以从 Lucene 中提取一些数据吗?
PS我使用lucene 2.3.0。我的索引文件大小为 1.8 Gb。
apache - Apache Solr topTerms (LukeRequestHandler) 没有给出正确的令牌计数
我正在使用几天前的 Solr 4 主干构建。
根据 LukeRequestHandler 的 Wiki 页面(第一个示例输出),我们应该获取每个或任何指定字段的令牌计数。我想用它来计算我所有文档中每个单词出现的次数。例如,如果单词“is”出现在两个 MS Word 文档中,第一个出现两次,第二个出现 3 次,我会得到如下输出:
这是因为“is”这个词在两个文档中总共出现了五次。但是我实际得到的是<int name="is">2</int>
. 我认为这是因为它明显地(按文档)总共发生了两次。
但同样,根据 Wiki,我们应该得到一个总计数,将所有文档相加,这正是我真正想要的。
如何获得所有索引文档中每个单词出现的总次数?
参考:
java - 如何在休眠搜索中实现对 int 值的搜索?
我正在尝试搜索整数值。我已经用@Field 注释了参数,如下所示:
然后我用卢克执行范围搜索:
我回来的结果是空的。然后我尝试:
结果是:
所以我的问题是:为什么我会得到这个回复,我该如何解决?我使用休眠搜索 3.0.1.GA