3

这是示例文档。

{
"_index": "mqtt-index-2018.01.23",
"_type": "iot_data",
"_id": "AWEjA7LNRU4cTUO-Lyj4",
"_score": null,
"_source": {
"message": "{\"datastream_name\": \"roshni\", \"value\": 12, 
\"context\": {\"latitude\": 0, \"elevation\": 0, \"longitude\": 0}, 
\"device_id\": 31}",
"@version": "1",
"@timestamp": "2018-01-23T12:34:59.687Z",
"host": "iot-elk",
"topic": "telemetry/f2a55827ef554475a41c3c96369957f0/roshni",
"datastream_name": "roshni",
"value": 12,
"context": {
  "latitude": 0,
  "elevation": 0,
  "longitude": 0
},
"device_id": 31,
"tstamp": "2018-01-23T12:34:59.687Z"
},
"fields": {
"tstamp": [
  1516710899687
],
"@timestamp": [
  1516710899687
]
},
"sort": [
 1516710899687
]
}

我想使用 device_id 字段删除文档。如何使用 API 调用或使用 python 客户端删除它?我已经尝试使用 Document _id 和特定索引,但我想通过使用 device_id 字段或其他字段来删除它。

4

4 回答 4

1

使用以下 DELETE API 调用从弹性搜索中的多个索引中删除文档。

curl -XDELETE 'http://localhost:9200/mqtt-index-*/logs/_query' -d '{
"query" : {
    "match" : {"device_id": 31}
}
}' -i
于 2018-01-24T09:55:15.597 回答
0

您还可以删除具有匹配多个字段的文档。

curl -XDELETE 'http://localhost:9200/mqtt-index-*/logs/_query' -d '{
"query" : {
    "bool": {
        "must":[
    {"match" : {"device_id":31}}, 
    {"match":  {"datastream_name": "test"}}
    ]
}
}' -i
于 2018-01-24T09:58:40.567 回答
0

没有示例代码的简短回答:

  • 将 json 转换为 dict(请参阅Converting JSON String to Dictionary Not List
  • 如果您有许多这些数据结构,如果它们符合您的搜索条件(例如if data["parsed_message"]["device_id"] not in list_of_forbidden_ids):) ,则构建它们的列表
于 2018-01-23T05:57:11.013 回答
0

在使用原始 API 方面,我相信这就是您正在寻找的

根据您使用的 python 库,在 python 中它实际上更容易。我使用elasticesearch-dsl-py, 在其中构建查询对象。您可以对这些查询对象调用删除

关于跨越多个索引,ElasticSearch 确实支持这一点,或者使用通配符*,或者用逗号分隔索引。

于 2018-01-23T13:48:46.697 回答