问题标签 [solrj]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
122 浏览

solr - 使用 solr 索引后从内存中自动删除

由于内存不足,我想强制 solr 将索引写入硬空间并且不在内存中保持文件打开,我该如何在 solrj 中做到这一点?我在每个被索引的文档之后添加 solr.commit() 但它不起作用

0 投票
0 回答
376 浏览

solr - solr 的内存管理和 JVM 设置

我有一个大的数据存储(大约 500GB pdf 和视频文件),我的机器有 4GB 的 RAM 容量,我想用 solrj API 索引这些文件,solrconfig 和 JVM 忽略堆大小问题和其他的必要设置是什么索引期间内存崩溃?是否有任何配置强制垃圾收集器在索引期间释放内存?

谢谢

0 投票
2 回答
2583 浏览

mysql - 仅 Solr 与 Solr/MySQL 解决方案

目前我有一个完全基于 Solr 的系统。这意味着,我将所有数据存储在 Solr(使用 SolrJ)中,不涉及其他数据存储。现在的问题是,我遇到了一些性能问题。我认为,将数据存储在 MySQL 中然后使用例如DataImportHandler将数据与 Solr 同步可能是有意义的。这样我就有了对 Solr 索引的读取操作和 MySQL 中的主要写入操作,然后有时在与 Solr 同步时只有 Solr-Writing 操作。

问题是我预计应该存储数亿个文档,如果 MySQL/Solr 有意义,我现在真的不知道。

还有其他更好的解决方案吗?也许 Master-Solr 用于写作和 Solr-slave 用于阅读?

更新:我忘了说的是,在 schema.xml 更改的情况下,我认为“在 MySQL 中存储数据”解决方案可能很有用,因为这样我就可以重新提交所有数据而无需关心 Solr 的自我- 存储的数据。

0 投票
5 回答
5537 浏览

solr - 使用 solrj 更新文档字段

我想编辑在 solr 中归档的文档,例如编辑作者姓名,所以我在 solrj 中使用以下代码:

但是作者 multivalued="true" 在架构中并且因为“anaconde”不会替换为它以前的名称并添加到作者姓名的末尾,如果我省略了多值字段或将其设置为 false 错误请求异常使用新的作者字段重新索引文件时发生,我该如何解决这个问题并删除或修改 solrj 中的先前文档字段?还是我在架构中错过了任何配置?谢谢

0 投票
1 回答
1010 浏览

java - 将多个可搜索文件添加到一个 Solr-index-document

有没有一种方法或最佳实践可以使用提取处理程序将多个文件(例如 2 个 pdf 和 1 个文档)添加到一个 solr-index-doc 中?查询时的结果应该是这样的:

在我的 java 应用程序中,我将文件添加到 Solr-Index,就像只添加一个文件一样:

0 投票
1 回答
2465 浏览

java - Solr:确定文档是否存在

我是 SolrJ 初学者,想了解确定是否存在具有唯一 ID 的文档的最快方法是什么?我不需要该文档,我只想找出它是否已经在索引中。

现在我在 SolrJ 中尝试这样的事情:

我认为会有更好(更快?)不需要得分等的方法......

0 投票
2 回答
554 浏览

solr - 有序邻近搜索

有序我的意思是 term1 在文档中总是在 term2 之前。

我有两个文件: 1.“按顺序表示 term1 在文档中总是出现在 term2 之前” 2.“按顺序表示 term2 在文档中总是出现在 term1 之前”

如果我进行查询:

我的结果是:2个文件

如何查询得到一个结果(仅当 term1 出现在 term2 之前):“按顺序排列,我的意思是 term1 在文档中总是出现在 term2 之前”

有任何想法吗?

0 投票
2 回答
5923 浏览

solr - SolrJ 上有很好的教程或资源吗?

我在工作中一直在使用 SolrJ,它是 Apache Solr 服务器的 Java 客户端。但令人沮丧的是,网上几乎没有任何可用的资源。甚至父站点上的 wiki 也是一种“菜鸟”指南!

很少有像这样的博客可以让您开始使用 SolrJ,但没有高级的东西。

我很想看看是否有人与 SolrJ 合作过,并且可以通过提供一些指向它周围有价值资源的指针来帮助我。

0 投票
1 回答
1053 浏览

java - 发送大字符串时 ContentStreamUpdateRequest 套接字写入错误

使用 SolrJ 的 ContentStreamUpdateRequest 向 solr 发送数据时出现以下异常

该异常的原因是,我将文档的二进制数据发送到 solr。如果我删除它,应用程序将成功运行。我正在使用以下代码发送请求

我认为 String base64encodedFile 对于 HTTP 请求来说太长了,但我不知道该问题的解决方案。据我所知,Solr 无法通过配置存储文档。

0 投票
1 回答
2926 浏览

java - 如何将 solrj 与 DismaxRequestHandler 一起使用?

由于缺乏适当的文档,我无法弄清楚如何将 dismaxRequestHandler 与 SolrJ 一起使用。

另一方面,标准请求处理程序是 SolrJ 实现中的默认值吗?