问题标签 [luke]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1025 浏览

java - 从 WinXP 启动 Luke(Java App) 时出错

我从http://code.google.com/p/luke/downloads/list下载了 luke-1.0.1.jar(没有任何依赖关系的 Luke 1.0.1 二进制文件)。

我有 WinXP,从 Oracle/Sun 网站下载了最新的 Java 6。

我运行命令行:“java -jar luke-1.0.1.jar”并尝试启动 Luke,但出现以下错误:

有什么线索,我该怎么办?我完全不了解Java。

谢谢

哈代

0 投票
1 回答
768 浏览

lucene - 用于 lucene 索引的 Solr 查询解析器?

我创建了一个存储文本消息的索引(使用 Lucene 2.9)。(文档还包含其他一些未编入索引的元数据,只是存储)我使用 StandardAnalyzer 来解析这些消息。我正在尝试使用 Solr 对此索引运行一些测试(我用我的索引替换了示例应用程序索引),以查看我从各种查询中得到了什么样的结果。

当我尝试以下查询时,我得到了 0 个结果

但是,将其更改为"text:happiness*"给我一些结果。它们都包含诸如"happiness,", "happiness."etc 之类的术语。所以我认为这是索引创建期间的标记化问题,但是,当我使用 Luke(一个 lucene 索引调试工具)运行相同的查询(text:happiness)时,我得到了完全相同的结果。来自 Solr 的快乐*,这让我相信问题不在于索引,而在于我指定 Solr 查询的方式。我查看了 solrconfig.xml,注意到它有以下行(已注释),我尝试取消注释它,然后修改我的查询以在原始查询之外使用“defType=lucene”,但得到了相同的结果。

我对 Solr 的经验很少,因此非常感谢任何帮助:)

0 投票
2 回答
2353 浏览

c# - Luke Lucene BooleanQuery

在 Luke 中,以下搜索表达式返回 23 个结果:

如果我通过以下实现将相同的表达式传递到我的 C# Lucene.NET 应用程序中:

我得到 0 个结果

Luke 正在使用 StandardAnalyzer,这就是解释结构窗口的样子: 卢克查询结构

BooleanClause我必须为我搜索的每个字段手动创建对象,为每个字段指定Should然后将它们添加到BooleanQuery对象中.Add()吗?我以为QueryParser会为我做这件事。我错过了什么?

编辑: 简化一点,docfile:Tomatoes*在 Luke 返回 23 个文档,但在我的应用程序中返回 0 个。根据 Gene 的建议,我已从更改MUSTSHOULD

parsedQuery 很简单docfile:tomatoes*

编辑2:

我想我终于找到了根本问题:

在第二行中,query"docfile:Tomatoes*",但是parsedQuery{docfile:tomatoes*}。注意到区别了吗?已解析查询中的小写“t”。我以前从未注意到这一点。如果我将 IDE 中的值更改为“T”,则返回 23 个结果。

我已经验证了StandardAnalyzer在索引和读取索引时正在使用它。我如何强制queryParser保持值的大小写query

Edit3: 哇,多么令人沮丧。根据文档,我可以通过以下方式完成此操作:

parser.setLowercaseExpandedTerms(false);

通配符、前缀、模糊和范围查询的术语是否自动小写。默认为真。

我不会争论这是否是一个明智的默认设置。我想应该使用 SimpleAnalyzer 将索引内外的所有内容小写。令人沮丧的是,至少在我使用的版本中,卢克默认的是另一种方式!至少我了解了更多关于 Lucene 的知识。

0 投票
2 回答
3735 浏览

lucene - Luke Lucene QueryParser 区分大小写

在 Luke 中,如果我输入搜索表达式docfile:Tomatoes.jpg*,则解析后的查询是docfile:Tomatoes.jpg*. 当搜索表达式为docfile:Tomatoes.jpg,(无星号 *)时,解析后的查询docfile:tomatoes.jpg带有小写的 't'。

  1. 为什么?
  2. 我怎样才能改变这个?

顺便说一句,使用 org.apache.lucene.analysis.standard.StandardAnalyzer。

0 投票
2 回答
3246 浏览

solr - 将 solr 1.4 索引升级到 solr 3.3?

我有一个使用 apache solr 1.4 的现有索引构建。

我想在 3.3 版中使用这个现有的索引。如您所知,索引格式在 3.x 之后发生了变化,那么如何做到这一点呢?

我已经使用 Luke 将现有索引(即 1.4 版本)导出到 XML。

0 投票
2 回答
3509 浏览

lucene - 寻找 Lucene 索引版本

当我使用 Luke V3.3.0 时,它告诉我我打开的 Lucene 索引是:

  • 索引版本:13172b074a7
  • 索引格式:-11(Lucene 3.1)

我正在使用 Solr 3.3,我之前删除了我的文件夹 /var/data/solr/myrepository 在索引之前。我希望版本是 Lucene 3.3。Lucene 3.1 和 Lucene 3.3 之间没有索引变化?归根结底,我只想确保我的索引是使用 Lucene 3.3 创建的。我正在寻找任何获得 Lucene 索引版本的简单方法。

字段折叠也有效,所以如果索引发生变化,我的索引版本是正确的。我也没有从 Solr 管理页面看到此信息。

谢谢你。

0 投票
1 回答
185 浏览

java - 如何获取搜索结果中出现的一组术语?

给定 solr 中索引文档的 id/url,我可以获得该文档包含/索引的一组术语吗?

这是由 Luke 完成的,所以我怀疑http://wiki.apache.org/solr/LukeRequestHandler可能会有所帮助,但我很确定该怎么做。

0 投票
2 回答
632 浏览

lucene - 无法打开 lucene 索引(Java 堆空间)

我想从 lucene 索引文件中获取一些数据。但我无法阅读。

我尝试使用Luke,但它总是与java.lang.OutOfMemoryError: Java heap space. 注意-Xmx不能帮助我。我尝试 -Xmx512、-Xmx1024 甚至 -Xmx2048。

我也尝试使用Solr,但也得到java.lang.OutOfMemoryError: Java heap space了。

有什么想法可以从 Lucene 中提取一些数据吗?

PS我使用lucene 2.3.0。我的索引文件大小为 1.8 Gb。

0 投票
1 回答
603 浏览

apache - Apache Solr topTerms (LukeRequestHandler) 没有给出正确的令牌计数

我正在使用几天前的 Solr 4 主干构建。

根据 LukeRequestHandler 的 Wiki 页面(第一个示例输出),我们应该获取每个或任何指定字段的令牌计数。我想用它来计算我所有文档中每个单词出现的次数。例如,如果单词“is”出现在两个 MS Word 文档中,第一个出现两次,第二个出现 3 次,我会得到如下输出:

这是因为“is”这个词在两​​个文档中总共出现了五次。但是我实际得到的是<int name="is">2</int>. 我认为这是因为它明显地(按文档)总共发生了两次。

但同样,根据 Wiki,我们应该得到一个总计数,将所有文档相加,这正是我真正想要的。


如何获得所有索引文档中每个单词出现的总次数


参考:

http://wiki.apache.org/solr/LukeRequestHandler

0 投票
3 回答
3365 浏览

java - 如何在休眠搜索中实现对 int 值的搜索?

我正在尝试搜索整数值。我已经用@Field 注释了参数,如下所示:

然后我用卢克执行范围搜索:

我回来的结果是空的。然后我尝试:

结果是:

所以我的问题是:为什么我会得到这个回复,我该如何解决?我使用休眠搜索 3.0.1.GA