我有一些 csv 格式的数据,我想将其用于预测建模。我读取 R 中的数据并应用一些简单的预处理(省略 NA 等)。在我想训练 SVM 分类器之前,我想使用 scale(x) 函数缩放数据。问题是我的标签列是数据集的一部分。我怎样才能告诉 R 忽略那些列?或者这里的最佳做法是什么?
label, X1, X2, X3, ..., Xn
Y, 34, 74, 29, ..., 47
N, 88, 46, 95, ..., 33
N, 58, 78, 25, ..., 68
Y, 33, 56, 61, ..., 13
如果我尝试:
x <- scale(trouble[,-c(1)])
trouble <- x
summary(trouble)
rm(x);
第一列被删除并永久消失。
最佳答案
你可以做部分赋值:
trouble[, -c(1)] <- scale(trouble[, -c(1)])
https://stackoverflow.com/questions/8120984/