1

这是我的数据头(两者):

 season  gender age   prog     grade 
    fall    woman  old  FRIST       B
    fall    woman  old  FRIST       A 
    spring  woman  old  FRIST       E 
    spring    man  old  NMATK       C 
    spring  woman  old  NFYSK       A 
    fall    woman  old  FRIST       E 

我想做逻辑回归,其中成绩是响应变量。我想让其中四个是独立的。

这里:

E/A+B+C+D=alpha_1+beta^x_1+beta^y_1+...

D+E/A+B+C=alpha_2+beta^x_2+beta^y_2+...

C+D+E/A+B=alpha_3+beta^x_3+beta^y_3+...

B+C+D+E/A=alpha_4+beta^x_4+beta^y_4+...

我做了什么:

    library(MASS)
y <- factor(both$betyg)
mod.fit <- polr(y ~ prog + gender + age + season, data=both, Hess=TRUE)
summary(mod.fit) 

然后我收到这条消息:

警告信息:在 polr(y ~ prog + gender + age + season, data = both, Hess = TRUE) 中:设计似乎排名不足,因此删除了一些系数

我知道这不是一个错误,只是一个警告。我不知道如何解释它或采取不同的措施来避免此消息?

4

1 回答 1

1

由于您的结果是有序的,因此您可能会使用序数做得更好,但可能需要检查比例赔率假设。您所描述的模型几乎就是什么polr,尽管它们并不像您所说的那样独立。UCLA 对此有很好的教程。

至于确定哪种模型最好,在处理此类根本不同类型的模型时,我建议使用交叉验证。预测准确性不会说谎,任何伪 R^2 指标在不同模型的解释上都会有所不同。

此外,由于这个问题比 R 编码/实现更关注统计数据,我建议 CrossValidated(stats StackExchange 站点)。

于 2015-03-29T23:59:30.647 回答