我正在处理一些 RNA-seq 计数数据,其中大约有 60,000 列包含基因名称,24 行包含样本名称。当我进行一些基因名称转换时,我留下了一堆名为NA
。我知道 R 可以处理NA
与典型的列名称不同,我的问题是如何删除这些列。这是我的数据的示例。
"Gene1" "Gene2" "Gene3" NA "Gene4"
1 10 11 12 10 15
2 13 12 50 40 30
3 34 23 23 21 22
我希望它最终像
"Gene1" "Gene2" "Gene3" "Gene4"
1 10 11 12 15
2 13 12 50 30
3 34 23 23 22
我确实发现了一些对其他人有效但对我无效的 R 代码
df<-df[, grep("^(NA)", names(df), value = TRUE, invert = TRUE)]
看起来你有一个实际的NA
以你的名义,而不是"NA"
。前者代表缺失值,后者是一个字符串,看起来像代表缺失值的符号。使用:
df <- df[!is.na(names(df))]
插图与iris
:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> names(iris)[2:3] <- NA
> head(iris)
Sepal.Length NA NA Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> head(iris[!is.na(names(iris))])
Sepal.Length Petal.Width Species
1 5.1 0.2 setosa
2 4.9 0.2 setosa
3 4.7 0.2 setosa
4 4.6 0.2 setosa
5 5.0 0.2 setosa
6 5.4 0.4 setosa
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)