问题标签 [luke]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr 管理员什么也没显示(nutch)
我已经成功创建了一个 Solr 索引,它使用 nutch 抓取了几页。使用 Luke 查询索引我得到了预期的结果(默认字段“内容”)。但是,当我尝试使用 solr/admin 界面时,我使用 q= 得到所有内容:如预期的那样:
但在查询特定字符串时绝对没有:
在 Solr 管理界面它说:
在 schema.xml 中,“内容”是默认搜索字段。
任何帮助都感激不尽!
solr - Solr - LukeRequestHandler - 需要索引状态
我正在尝试在我的应用程序中向管理员显示 Solr Index 的状态。该片段将包含:
- 索引最后更新日期
- 索引当前状态(空闲 | 索引 | 错误)
- 按需触发索引的按钮
注意:我正在使用 DataImportHandler 来刷新我的索引。
我正在使用 Luke 请求处理程序来获取索引的最后更新时间: http ://server.dev/solr/core/admin/luke?numTerms=0&fl=0
我可以使用 dataimporthandler 的“status”命令来获取索引状态。
我想知道是否有办法在单个请求中获取这些参数?
solr - 无法通过 Luke 编辑 Solr 字段
我正在使用 Luke 浏览一些 Solr 索引,当我尝试“重建和编辑”文档中的浮点字段,然后“删除旧的并添加”时,出现异常:
没有其他消息说明我为什么会收到 NullPointerException。我正在针对使用 Solr 3.4 创建的一些索引运行最新的 Luke 3.5。任何想法还有什么可能是错的......?
为了安全起见,我已经停止了 Tomcat,并确保可以从运行 Luke 的用户那里编辑索引文件(试图排除问题可能是索引文件上的用户权限问题的情况)
java - 向 Luke 添加自定义分析器
这个问题已经在 Stack Overflow 上被问过了,顺便说一句,即使在阅读了提供的答案之后,我也没有设法添加MyOwnAnalyzer,所以我可以直接从 Luke使用它。
请有人可以帮助我以正确的方式做事,那就是如何以及如何做才能使MyOwnAnalyzer可以直接从 Luke 中使用?
我可以这样做(它不起作用,可能是我包含的 jar 不完整?):
(MyOwnAnalyzer.jar是从 Eclipse 构建的,包含:子目录 com.MyCompany 中的MyOwnAnalyzer.java、MyOwnTokenizer.java 和MyOwnToken.java ... Eclipse 为我添加了META-INF和manifest.mf)
也许我在命令行中添加类路径和 MyOwnAnalyzer.jar 是错误的?
或者我必须从源代码构建 Luke,包括其目录中某处的 MyOwnAnalyzer?
或者是否还有其他内容要包含/编写,以便我的分析器可以使用并从 Luke 导入?(看起来有一种机制可以检测所有类的子类 Analyzer - MyOwnAnalyzer 已经声明为“ extends Analyzer
”)
顺便说一句,即使它不是真正相同的问题,但仍然在使用来自 Luke 的自定义分析器的同一主题中......我在使用我得到的选项卡分析器工具Error analyzing:com/google/common/io/CharStreams
时出现错误,这个库包含在一个 jar 中,我包括一个进行样本分析以检查的主体,单独使用时一切正常。如果我按照 JPountz 的解释使用它,来自 Luke,我可以从所有 Luke 选项卡中看到 MyOwnAnalyzer,但它不起作用!
从卢克代码源,我认为抛出异常的原因位于方法分析内部的某个地方。
注意:调用CharStreams.toString(input);
是将Reader
输入转换为内部的字符串MyOwnTokenizer
。
lucene - Luke 揭示了索引中数字字段的未知术语值
我们使用 Lucene.net 进行索引。我们索引的字段之一是一个数值字段,其值为 1 到 6,9999 表示未设置。
在使用Luke探索索引时,我们会看到我们不认识的术语。该索引共包含 38673 个文档,Luke 显示了该领域的以下排名靠前的术语:
我们发现其他数字字段的模式相同。
未知值从何而来?
lucene - Lucene.net - 索引期间崩溃
我使用 Lucene 的索引器在编写了大约 16GB 大小的索引文件后,在索引操作期间似乎崩溃了。
由于我不知道的原因,写入控制台的堆栈跟踪重复了三遍。为简洁起见,我只提供了重复的单个部分。这是 Lucene 写入控制台的堆栈跟踪:
当我使用 Luke 的 Java 版本打开生成的日志时,索引被删除(可能是因为它已损坏,例如“write.lock”文件仍然存在),尽管这可能是 Luke 的错误或配置错误。
创建这个索引大约需要 36 小时,我不想第三次再做一次(这不是第一次发生)。
我不知道是什么原因造成的。我能做些什么?
我使用的是 Lucene.net 2.9.2,因为它是为 .NET 3.5 构建的最后一个版本。
lucene - 卢森·卢克。上次搜索时间是多少?
Luke 显示如下结果:
最后搜索时间:67999 us
什么是“我们”?如何将其转换为ms?
lucene - 如何运行 Luke(Lucene 工具)?
我在http://code.google.com/p/luke/downloads/list上下载了“Lukeall-3.5.0” 这是一个 JAR 文件,但我不知道如何让它工作?有人可以告诉我运行卢克的详细步骤吗?谢谢!
lucene - Luke(4.0.0-ALPHA)为什么打不开Lucene4.0的索引文件?
我使用Lucene4.0制作索引文件:
但是 lukeall-4.0.0-ALPHA.jar (http://code.google.com/p/luke/downloads/list) 无法打开这些索引文件,出现错误:不支持格式版本(资源:SimpleFSIndexInput (path="D:\myProjectPro\Java\createIndex\product_0.tvx")):1(需要在 0 和 0 之间)。
有任何想法吗?提前致谢。
lucene - 显示 Lucene 索引的内容
我正在尝试在 Lucene 中调试索引文档,并且我需要查看索引的内容,以便准确了解文档是如何被索引的。据称卢克这样做了,但是没有任何文档,当我将它指向索引目录时(在其中任何一个,虽然我不知道为什么它无法自行判断哪个是正确的) ,我什么都得不到。当然有一些简单的方法可以做到这一点?