我是一名 R 新手,面临一些挑战。我正在处理一个从 csv 文件中读取的大型数据框。我的数值向量包含 NA,这阻止我进行分析。如何摆脱这些 NA,以便我可以真正利用我的数据做一些事情?
- 对于特定变量:
x[!is.na(x)]
, or na.omit
(see apropos("^na\\.")
对于所有可用的na.
功能),
- 在函数内,传递
na.rm = TRUE
作为一个论点,例如sapply(dtf, sd,
na.rm = TRUE)
,
- 设置全局 NA 操作:
options(na.action = "na.omit")
这是默认设置的,但很多
函数不依赖于全局
定义的 NA 动作 (mean
为了
实例),而有些人则这样做(现在我
无法举出例子),
- 当然,如果你有很多
不适用,你应该考虑变量
插补,有一个对SO提出的问题 https://stackoverflow.com/questions/2613420/handling-missing-incomplete-data-in-r-is-there-function-to-mask-but-not-remove-n/2994546这可能会有帮助。
长话短说,处理 NA 是一个非常广泛的问题,尝试将其具体化一点并给我们一个简洁的问题。我相信 SOers 中的某个人可以帮助您!
干杯,小伙子!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)