我只是想将 RethinkDB 表中的所有选定字段读入内存,以从中构造一个 pandas DataFrame。该表由整数主键索引,并且数据库仅在一台机器上运行一个。读取数据的代码是:
res = []
for doc in r.db(db_name).table(table).pluck(keys).run(conn):
res.append(doc)
return pd.DataFrame(res).set_index(pk).sort_index()
该表只有 150k 个文档,每个文档大约有 250 个值,10 列,一列是 240 个值的数组。
数据库似乎停滞不前,几分钟内什么也没发生,然后发生了“突发”读取。
怎么了?