我已经elasticsearch使用elasticsearch-hadoop来自elastic.
我需要获取唯一帐号的计数。我用hql和编写了以下查询queryDSL,但它们返回不同的计数。
蜂巢查询:
select count(distinct account) from <tableName> where capacity="550";
// Returns --> 71132
同样,在 Elasticsearch 中,查询看起来像这样:
{
"query": {
"bool": {
"must": [
{"match": { "capacity": "550"}}
]
}
},
"aggs": {
"unique_account": {
"cardinality": {
"field": "account"
}
}
}
}
// Returns --> 71607
难道我做错了什么?我该怎么做才能匹配这两个查询?
Note:hive 和 elasticsearch 中的记录数完全相同。