我有来自野生猩猩的活动预算数据,我正在调查它们在森林火灾事件之前和火灾事件之后进食、休息和旅行的时间是否存在差异。我正在运行一个线性混合效应模型,其中在特定日期花费的时间作为我的响应变量(猩猩醒来的分钟数作为偏移量)。火期和年龄/性别类别是固定效应,猩猩 ID 是随机效应。我有 2 个级别的 fire_time 因子('pre' 和 'post'),4 个级别的 Age_Sex 因子('SAF','FM','UFM','Adolescent'),47 只猩猩随机效应和一个该数据集中共有 817 个数据点。
我的数据框如下所示:
head(F)
Follow_num Ou_name Date Month fire_time Age_Sex Primary_Act AP_obs minutesin24hr Perc_of_waking_day Perc_of_24hr
1 2029 Teresia 2011-10-04 Oct-11 pre SAF Feeding 625 310 49.60 21.53
5 2030 Teresia 2011-10-05 Oct-11 pre SAF Feeding 610 285 46.72 19.79
9 2032 Teresia 2011-10-09 Oct-11 pre SAF Feeding 620 340 54.84 23.61
13 2034 Teresia 2011-10-11 Oct-11 pre SAF Feeding 670 405 60.45 28.13
17 2038 Victor 2011-10-27 Oct-11 pre FM Feeding 675 155 22.96 10.76
21 2040 Nero 2011-11-03 Nov-11 pre FM Feeding 640 295 46.09 20.49
我的模型的代码如下:
library(lme4)
lmer(minutesin24hr ~ Age_Sex + fire_time + (1|Ou_name), data = F, offset = AP_obs, REML = TRUE, na.action = "na.fail")
当我使用包运行这个模型lmerTest
来检查自由度和 p 值时,我似乎对重要的水平有非常大的自由度(参见 Age_SexSAF 和 fire_timepre)。
lmerTestmodel <- lmerTest::lmer(minutesin24hr ~ Age_Sex + fire_time + (1|Ou_name), data = F, offset = AP_obs, REML = TRUE, na.action = "na.fail")
REML criterion at convergence: 9370.7
Scaled residuals:
Min 1Q Median 3Q Max
-3.8955 -0.6304 0.1006 0.7141 2.3109
Random effects:
Groups Name Variance Std.Dev.
Ou_name (Intercept) 1636 40.44
Residual 5460 73.89
Number of obs: 817, groups: Ou_name, 47
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
(Intercept) -188.614 14.711 26.765 -12.821 6.14e-13 ***
Age_SexFM -20.297 17.978 24.696 -1.129 0.2698
Age_SexSAF -25.670 11.799 318.473 -2.176 0.0303 *
Age_SexUFM 12.925 22.806 27.319 0.567 0.5755
fire_timepre -29.558 6.214 709.117 -4.757 2.38e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Correlation of Fixed Effects:
(Intr) Ag_SFM A_SSAF A_SUFM
Age_SexFM -0.741
Age_SexSAF -0.505 0.374
Age_SexUFM -0.598 0.480 0.302
fire_timepr -0.298 -0.015 0.149 0.034
我想这些大的自由度使 p 值很重要,所以我对模型持怀疑态度。为什么我在这两个层面上就获得了如此大的自由度?Age_SexSAF 和 fire_timepre 级别中有更多数据,但对我来说似乎并不正常。我计划在我的论文中报告估计值、置信区间和 p 值,但我担心报告这些自由度是否错误。
抱歉,如果这可能是一个幼稚的问题,这是我第一次冒险进入混合效果模型。非常感谢任何建议,谢谢!