问题标签 [pyelasticsearch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
22753 浏览

python - elasticsearch使用python客户端滚动

在弹性搜索中滚动时,在每次滚动时提供最新的很重要scroll_id

初始搜索请求和每个后续滚动请求都会返回一个新的 scroll_id — 只应使用最近的 scroll_id。

以下示例(取自此处)使我感到困惑。一、滚动初始化:

然后循环:

它有效,但我看不到在哪里sid更新......我相信它发生在内部,在 python 客户端中;但我不明白它是如何工作的......

0 投票
1 回答
305 浏览

python-3.x - '*' 是字段的弹性搜索问题

所以,我应该先说我理解 * 是一个特殊字符,应该为弹性搜索查询转义。这是我面临的设置和麻烦。基本问题归结为我无法搜索仅包含“*”的字段。

如何让第一个项目出现在搜索中?尽管各种搜索方法之间存在不一致,但他们似乎都同意我不允许返回“*”,但为什么呢?此外,转义 * 似乎会使问题变得更糟,这有点不寻常。(我假设库中可能存在一些自动转义,但这并不能真正解释直接 ES 查询)。

编辑:我应该提到它肯定是索引的。

不过,它可能已被存储,据我所知,这对于弹性搜索来说是一件特别的事情?

Edit2: ElasticSearch 文档谈论转义一些

0 投票
2 回答
1574 浏览

json - Elasticsearch 中的父/子关系 - 返回我想要的结果

我正在建立一个 Elasticsearch 索引,并希望它以某种方式运行(返回结果)。我已经建立了父/子关系。

我已经用一些“父”文档和一堆“子”文档填充了它,它们的父设置正确。

当我使用普通搜索查询搜索内容时,我当然会取回所有匹配的文档。父子文件,但两者之间没有联系。如果我使用 has_child 过滤器搜索内容,它会正确搜索子文档并将匹配的父文档返回给我:

问题是,我想搜索孩子并在一个文档中取回父母和孩子。有没有办法做到这一点?是不是亲子关系搞错了?

0 投票
1 回答
4004 浏览

function - 如何使用 ElasticSearch 进一步提高 field_value_factor 给出的分数?

我对使用field_value_factorElasticSearch 有疑问。

我想实现的功能是

alpha = 1.0,使用 的脚本field_value_factor由下式给出

如此链接所示:

但是,当 时alpha != 1.0,我们如何使用 来给出权重(即 alpha)field_value_factor

你对此有什么想法吗?

0 投票
1 回答
7525 浏览

python - 使用python脚本连接ES

我正在尝试从 ES 引擎连接和检索数据。

我正在使用以下脚本:

但是我收到了以下消息,而不是返回。

我正在尝试连接并返回索引 cuevents-2014.34 中的文档数

0 投票
2 回答
11133 浏览

python - elasticsearch python 批量 api (elasticsearch-py)

我对 py-elasticsearch bulk @Diolor 解决方案的工作感到困惑 https://stackoverflow.com/questions/20288770/how-to-use-bulk-api-to-store-the-keywords-in-es-by-using -python,但我想使用普通的 es.bulk()

我的代码:

错误是:

为 POST 调用生成的 url 是

/logstash-test/test/_bulk

POST 正文是:

{"host":"logsqa","path":"/logs","message":"test test","@timestamp":"2014-10-02T10:11:25.980256","tags":["多行","mydate_0.005"]}

所以我用手做了che curl:这个curl不起作用:

所以错误部分是好的,但我确实希望 elasticsearch.bulk() 能够正确管理输入参数。

pythonf函数是:

0 投票
1 回答
4054 浏览

elasticsearch - elasticsearch 动态查询 - 为返回的每个文档添加另一个字段

我需要的东西非常简单,但我无法在 Elasticsearch 中找到如何去做,可能是因为需要做的事情很复杂。

输入(两个示例 JSON 文档)

我想要的回报是,当我触发搜索查询时,它会返回带有额外字段的文档,该字段inventory定义为汽车和自行车数量的总和。并按排序顺序。

样本输出:

有可能在elasticsearch中做这样的事情吗?(我假设使用动态脚本)

0 投票
2 回答
2109 浏览

django - 自动将数据索引到 elasticsearch

我有一个模型,其流程如下

CMS --> Postgres --> Elasticsearch --> 从 Elasticsearch 查询 --> 最终结果

每天,CMS 中都会添加新字段,然后将数据推送到 Elasticsearch。但是,考虑到大量数据,这会占用大量时间。

有没有办法让每次向 CMS 添加新条目时,它同时被推送到 Elasticsearch,而无需手动提示应用程序这样做?

我想自动化将数据从 CMS 推送到 Elasticsearch 的过程。欢迎任何意见。

另外,我使用 elasticsearch-py 作为框架。

0 投票
5 回答
13247 浏览

python - Elasticsearch python API:通过查询删除文档

我看到以下 API 将通过 Elasticsearch 中的查询删除 - http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/docs-delete-by-query.html

但是我想对弹性搜索批量 API 做同样的事情,即使我可以使用批量上传文档

我不确定如何使用用于弹性搜索的 python 批量 API 通过查询调用删除。

0 投票
3 回答
1119 浏览

python - 使用 python 代码启动 elasticsearch 服务器

我想用python编写一个脚本,在localhost 9200创建一个elasticsearch服务器。我在网上找到的所有示例都连接到在localhost 9200运行的现有elasticsearch实例。我的动机是我不想必须使用命令行运行或关闭服务器。

基本上替换这一行

用python中的东西。

更新:我尝试了以下

但是,我收到错误“AttributeError:'module'对象没有属性'popen'”

我的 application.py 文件将运行 elasticsearch 服务,然后创建另一个服务,我可以使用它来调用 elasticsearch 服务器。

谁能提供我将如何以编程方式创建弹性搜索实例的代码片段?是否有任何现有的项目可以做到这一点?提前感谢您的帮助。