在“使用 R 进行实验的设计和分析”一书中,作者使用以下数据(第 118 页)来解释分析完全随机区组 (CRB) 设计的方法:
Rat d0 d0.5 d1 d1.5 d2
1 0.6 0.8 0.82 0.81 0.5
2 0.51 0.61 0.79 0.78 0.77
3 0.62 0.82 0.83 0.8 0.52
4 0.6 0.95 0.91 0.95 0.7
5 0.92 0.82 1.04 1.13 1.03
6 0.63 0.93 1.02 0.96 0.63
7 0.84 0.74 0.98 0.98 1
8 0.96 1.24 1.27 1.2 1.06
9 1.01 1.23 1.3 1.25 1.24
10 0.95 1.2 1.18 1.23 1.05
有 10 只大鼠(块),每只大鼠按随机顺序接受 5 剂(d0 到 d2)的药物(治疗因子)。反应是每只大鼠在接受每次剂量后按水平的频率。
笔者首先进行了如下分析:
library(daewr)
> mod1 <- aov( rate ~ rat + dose, data = drug )
> summary(mod1)
结果如下:
由于发现了剂量(治疗因素)的显着影响,作者进一步指出“要解释治疗因素水平的差异,应进行均值比较”。然后,使用以下代码:
> contrasts(drug$dose) <- contr.poly(5)
> mod2 <- aov( rate ~ rat + dose, data = drug)
> summary.aov(mod2,split = list(dose = list("Linear" = 1,
"Quadratic" = 2,"Cubic" = 3, "Quartic" = 4) ) )
结果如下所示:
作者说“这里使用了summary.aov 中的拆分选项,而不是2.8 节中使用的summary.lm 函数,因为我们只需要查看模型中剂量因子的单自由度分区。 "
虽然作者没有建议,但我还是> summary.lm(mod2)
自己尝试了,想看看结果和上面有什么不同。结果如下:
尽管如此,线性和二次分量仍然很重要。
我的问题是:
为什么在有显着剂量效应的情况下作者需要查看多项式分量(6.53e-07)?换句话说,在知道剂量很重要之后,知道高阶项的重要性有什么额外的好处?作者似乎将原因解释为“均值比较”,但我没有看到任何基于多项式项分析的“比较”。
在研究多项式项时,为什么作者说“我们只需要看到模型中剂量因子的单自由度划分”。在解释多项式项的重要性方面,带有拆分参数的 summary.aov 函数和 summary.lm 函数的输出有什么区别?
谢谢!