问题标签 [elasticsearch-bulk-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
59 浏览

node.js - 如何在弹性搜索中使用批量运算符

我正在使用弹性搜索客户端。

我有 JSON 对象可以说

我的目标是批量插入。我试过但没有工作。

0 投票
1 回答
109 浏览

python - 得到 [ERROR] '必须为字段 [vector] 指定 [dims] 属性。' 尽管在映射中设置

我正在尝试将密集向量上传到 Elasticsearch 端点。

  1. 创建索引,映射如下:

收到的回复:

  1. 创建了一个使用批量 api 上传向量的函数,如下所示:模型是一个 python 字典,以单词为键,关联向量为值。

使用 helpers.bulk() 调用函数 gendata() 时出现错误

注意:在映射中设置了暗淡,然后为什么它给出了必须指定暗淡的错误。

0 投票
1 回答
280 浏览

elasticsearch - 将数据索引到弹性搜索中时出现批量 API 错误

我想使用批量 API 将一些数据导入弹性搜索。这是我使用 Kibana 开发工具创建的映射:

这是我的批量数据:

但是当我想发布数据时,我收到了这个错误:

问题是什么?我在 Kibana 开发工具中同时使用了 PowerShell 和 POST 方法,但两者都收到相同的错误。

0 投票
1 回答
618 浏览

elasticsearch - Elasticsearch 多个 JSON 插入批量

我正在尝试在弹性搜索中插入多个 JSON 文档。我已将单个文档作为以下 curl 示例

当我尝试将批量 JSON 数组插入为以下 CURL

我收到以下错误

0 投票
0 回答
90 浏览

elasticsearch - Elasticsearch 批量操作:如果不存在则插入,否则更新或添加嵌套元素

在弹性搜索7.11.0中,我有描述的产品。

我已经通过批量index操作添加了这个产品。如果存在,它将更新它,如果不存在,它将创建它。

我收到来自多个商家的产品。一种产品可以存在于一个或多个商家中。这就是为什么我有嵌套元素merchants

作为操作想要做的事情bulk如下:

导入运行:

  • 产品不存在:Create a new product with a nested merchant
  • 产品存在:Check if the merchant exists. If not, create a new nested element, otherwise update the nested elements

我可以一个一个地做,但是由于产品的数量,它不是很方便。我正在使用elasticsearch PHP package.

0 投票
1 回答
378 浏览

python - Elasticsearch 批量 API 如何与线程池一起工作

在尝试使用 python 的批量 API 索引大约 20000 条记录(每条记录的大小约为 100kb)时,我看到消耗的最大写入队列大小为 6。我对批量索引的以下理解是否正确(默认配置为 500 块和 100 mb块大小)?

  1. Bulk API 将向 ES 发送 40 个请求(20000/500)。
  2. 每个批量请求都以原子方式持久化,即全部 500 个块或没有。
  3. 如果活动线程忙,则批量请求将作为一个整体对象汇集在写入队列中。
0 投票
1 回答
127 浏览

c# - 如何在 ElasticSearch NEST 7.13.2 中的一个 BulkAll 方法中编写多个更新

在 Visual Studio 2019 中使用 ElasticSearch NEST .Net 包 7.13.2

对于产品列表,我目前正在使用以下代码更新我的产品索引中的现有文档:

我为超过 10000 种产品执行此操作,大约需要 2 个小时。我知道我可以使用批量 API插入新文档。我可以使用BulkAll方法进行更新吗?

像这样的东西:

我应该如何构造myBulkAllRequest

任何帮助深表感谢。

0 投票
0 回答
23 浏览

python-3.x - Elasticsearch使用批量api python索引多个csv

如何使用 python 中的批量 api 将 1 个索引中的多个 csv 文件的相似类型索引到 Elasticsearch。例如 file1.csv file2.csv file3.csv

索引名称 File_Data

谢谢

0 投票
1 回答
78 浏览

elasticsearch - 弹性搜索 | 使用批量 API 映射排除字段

我正在使用批量 api 创建索引和存储数据字段。我还想设置映射以从源中排除字段“field1”。我知道这可以使用“创建索引 API”参考来完成:https ://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-source-field.html但我使用的是批量 API。以下是示例 API 调用:

POST _bulk

有没有办法在批量索引时添加映射设置,类似于下面的代码:

如何使用批量 API 进行映射?

0 投票
0 回答
38 浏览

python - 在 Elasticsearch 中使用 python 批量更新或批量更新(丰富)文档

我有两个索引“type1”和“type2”。我能够丰富在两个索引中包含相同“MSGID”字段的一对一文档,因为我们有数千个文档,丰富过程非常缓慢。

我尝试了批量导入的选项,但不知道如何将它应用到现有脚本中,该脚本在两个索引的 1 对 1 文档浓缩上工作正常。

谢谢你。

蟒蛇脚本-

注意 - 我不是在这里寻找丰富处理器作为数据丰富的选项。