问题标签 [elasticsearch-py]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - 映射以限制 Elasticsearch 中 Array 数据类型的长度
我正在尝试创建一个弹性搜索映射,它将数组数据类型的长度限制为 x 个项目。
在这种情况下,如何将“pages”数组设置为最多包含 1,000 个列表项?另外,当达到这个限制时,有没有办法“忽略”由 ES 触发的插入错误?
multithreading - 具有多线程的 ElasticSearch Scroll API
首先,我想让你们知道,我知道 ElasticSearch Scroll API 是如何工作的基本工作逻辑。要使用Scroll API,首先,我们需要使用一些滚动值(如1m )调用search方法,然后它将返回一个_scroll_id ,该 _scroll_id将用于 Scroll 的下一次连续调用,直到所有 doc 在循环内返回。但问题是我只想在多线程的基础上使用相同的进程,而不是串行的。例如:
如果我有 300000 个文档,那么我想以这种方式处理/获取文档
- 第一个线程将处理最初的100000 个文档
- 第二个线程将处理接下来的100000 个文档
- 第三个线程将处理剩余的100000 个文档
所以我的问题是,因为我没有找到任何方法来设置滚动 API 上的from值,我如何才能通过线程加快滚动过程。不以序列化方式处理文件。
我的示例 python 代码
amazon-web-services - 通过 HTTPS 从 Lambda 连接到 VPC 内的 AWS Elasticsearch
我有一个用 Python 编写的 Lambda,它将一些数据写入 AWS 上托管的 Elasticsearch。ES 服务位于 VPC 内,因此我尝试使用 ES 的内部 DNS 连接到它。这是我的代码:
但是,我得到了这个例外:
我不想使用公共主机名,因为它会不断变化。如何使用其内部 DNS 连接到 ES 服务?
====== 更新 =======
我可以通过以下代码使用 HTTP 连接到 ES 域:
但是如何通过 HTTPS 连接?
python - 提高 elasticsearch-py 扫描的速度
我正在寻找一种方法来提高对我的弹性搜索数据的滚动扫描速度。
以下 python 代码扫描多个索引并将结果输出到控制台和位于某处的文件。
我的测试得出结论,这种方法效率极低,并且需要大量时间(10 个事件/秒?)。我猜这是由一些内部默认值或限制引起的。
有没有办法设计它以实现更好的性能?
谢谢你调查这个:)
elasticsearch - 如何使用 elasticsearch-py 追加到 Elasticsearch 中的数组
使用官方ElasticSearch Python 库( Docs )
我创建一个索引:
我想每次都将项目附加到历史记录中,而不是覆盖它们:
我必须在第二个代码片段中进行哪些更改才能使其附加到历史数组/列表而不是每次都覆盖它?
elasticsearch - Elasticsearch:在指定的时间范围之间滚动
我在弹性搜索中有一些数据。如图所示
我使用下面的链接示例进行滚动
https://gist.github.com/drorata/146ce50807d16fd4a6aa
目前我的要求是我想滚动但想指定开始时间戳和结束时间戳需要帮助如何使用滚动来做到这一点。
python - 使用带有布尔数据类型的python在ElasticSearch中添加一个字段?
如何使用 python 在 Elasticsearch 中添加特定数据类型(布尔值)的新字段。这个查询正确吗?
elasticsearch - 使用 Elastic Search Python API 的字段最大值
您好,我正在尝试使用其 Python API 从 Elasticsearch 获取字段“UID”的最大值。当我使用下面的代码尝试它时,我得到一个错误。
elasticsearch.exceptions.RequestError: TransportError(400, u'parsing_exception', u'no [query] registered for [aggregations]')
我有一个适用于相同请求的 curl 命令,但是当我在正文中对 Python API 使用查询时,它会出现上述错误。
这是 curl 请求,它有效并给了我预期的结果。如何在 Elasticsearch Python API 中使用它是我面临的问题。
非常感谢您对此的任何帮助。谢谢。
elasticsearch - Kibana 开发工具和 elasticsearch-py 客户端得到不同的输出
我有一个 ELK 部署来收集日志。现在我需要提取所有包含一个特定字符串的日志。但是我遇到了一个有趣的问题,即我在 Kibana 的开发工具和 elasticsearch python 客户端中得到了不同的输出。
这是 Kibana 中的查询:
下面是开发工具的输出:
但是当我查询时使用 elasticsearch python 客户端。它什么也没给我:
我什么都没有:
我想知道代码中是否有任何问题?请帮助。谢谢
python - 如何使用python在elasticsearch中存储对象/字典
我正在尝试使用 python 中的 elasticsearch 库将对象保存在弹性内部。下面是我正在使用的课程
下面是我的弹性映射
如果我将类型更改为“对象”并在 python 代码中检索文档,则会出现以下错误。
如果我将类型更改为“InnerDoc”,我可以检索文档,但无法将其保存为弹性文件。
我假设我的映射是错误的,但不是很确定。任何形式的帮助/见解将不胜感激。提前致谢