在 R 中运行多元回归后,回归摘要用星标指示显着变量。在我正在处理的数据集中,有近 2000 个变量,R 识别的重要变量包括 50 多个变量。有什么方法可以让我从回归摘要中单独获得重要变量的列表。
最佳答案
这个例子说明了为什么您不应该按照您的要求去做:
randf <- as.data.frame(matrix(rnorm(800*400), 800, 400))
names(randf)[1] <- "Y"
big.mod <- lm(Y ~ ., data=randf)
sum( summary(big.mod)$coefficients[ ,4] < 0.05 )
#[1] 22
所以我们得到 22 个显着系数(其中一些“非常显着”)只是将 400 个随机变量与另一个随机变量进行回归。
https://stackoverflow.com/questions/10423604/