我想将来自包“fstpackage”的 fst_table 函数用于大型数据集:https ://github.com/fstpackage/fsttable 。
devtools::install_github("fstpackage/fsttable")
library(fsttable)
nr_of_rows <- 1e6
x <- data.table::data.table(X = 1:nr_of_rows, Y = LETTERS[1 + (1:nr_of_rows) %% 26])
fst::write_fst(x, "1.fst")
ft <- fst_table("1.fst")
我可以提取创建文件的行和列,但是,是否可以执行以下操作:
ft[X == 1,]
就像在标准数据表中一样?或者我可以创建这个 data.table 的键以进行快速序列化吗?我的目标是使用列的值提取数据,而不将所有数据集加载到内存中。