我在 RethinkDB 表中有以下 json 记录。
[{
"pid": 12,
"sk": [
{
"sid": 30,
"et": 3
},
{
"sid": 22,
"et": 10
},
{
"sid": 30,
"et": 8
}
],
"wc": [
{
"wid": 7,
"et": 8
},
{
"wid": 3,
"et": 6
},
{
"wid": 9,
"et": 7
}
]
}]
像这个一样,我的表中有数百万行。我想要实现的是根据 {sid,et} 的输入集过滤这个 json
我在 python 中使用下面的代码(skObj 是输入)::
skObj=[{'sid': 1, 'et': 9},{'sid': 27, 'et': 6}]
cursor2=r.table('cube7').filter(lambda row: r.expr(skObj).set_difference(row['sk']).is_empty())['pid'].run(t)
cur_list2 = list(cursor2)
上面的查询根据 sk 的输入集正确过滤了我在 RethinkDB 中的 cube7 表。skObj 最多可以包含 10 个集合。
我想看到的是每个输入集
skObj=[{'sid': 22, 'et': 10},{'sid': 30, 'et': 8}]
我想用这个条件过滤表:
(sid=22 & et>=10) and (sid=30 & et>=8)
但目前它只做等于
(sid=22 & et=10) and (sid=30 & et=8)
如何在我的 lambda 表达式中为每组 (sid,et) 的 et 值使用大于?
如何从下面创建通用表达式 - 这适用于原始数据
lambda x: (x['sid'] == 22) & (x['et'] >= 10)