我目前正在处理一个大数据集(n> 1000 万)。我发现 fixst 包对于快速运行 logit 固定效应模型(feglm)非常有帮助。
f1 <- feglm(result ~ log(rate1) +
sex +
age +
development +
pop +
acad +
size | state, se= "standard", family=c("logit"), lean =TRUE, mem.clean = TRUE, data=total)
最初的问题是我的模型太大了。我试过用lean=TRUE
and瘦身mem.clean=TRUE
。我还必须消除模型的线性预测变量和工作残差组件,如下所示:
f1$linear.predictors <- NULL
f1$working_residuals <- NULL
通过完成所有这些步骤,我设法减少了很多脂肪。该模型最初为 1.2 GB,但我设法将其压缩到 ~200kb
print(object.size(f1), units = "auto")
218.3 Kb
当我尝试将模型保存为 rda 文件时出现问题。保存操作需要一瞬间。相反,它需要几分钟并将模型保存为一个臃肿的 300 MB 文件。
我究竟做错了什么?我想将 fixst 对象保持在 220 Kb 的小尺寸中。
谢谢