我正在尝试对测试和训练数据进行一些特征工程。我很熟悉 python,但对 R 很陌生。
#Row binding train & test set for feature engineering
train_test = rbind(train, test)
看来我的训练数据和测试数据的列数不同。如何解决这个问题,以便保留两个数据框中唯一共有的列?
Error in rbind(deparse.level, ...) :
numbers of columns of arguments do not match
我会找出两个数据框的列名称,获取它们的交集(通用名称),然后从两个数据框中选择这些列:
train_names <- colnames(train)
test_names <- colnames(test)
common_names <- intersect(train_names, test_names)
train_test <- rbind(train[common_names], test[common_names])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)