我正在尝试读入 R 一个包含政治捐款信息的 csv 文件。据我了解,默认情况下,列会作为因子导入,但我需要将金额列(数据集中的“CTRIB_AMT”)作为数字列导入,这样我就可以运行各种不适用于的函数因素。该列的格式为带有“$”作为前缀的货币。
我最初使用了一个简单的读取命令来导入文件:
contribs <- read.csv('path/to/file')
然后尝试将 CTRIB_AMT 从货币转换为数字:
as.numeric(as.character(sub("$","",contribs$CTRIB_AMT, fixed=TRUE)))
但这没有用。我尝试用于 CTRIB_AMT 列的函数是:
vals<-sort(unique(dfr$CTRIB_AMT))
sums<-tapply( dfr$CTRIB_AMT, dfr$CTRIB_AMT, sum)
counts<-tapply( dfr$CTRIB_AMT, dfr$CTRIB_AMT, length)
查看相关问题here https://stackoverflow.com/questions/7329733/bubble-chart-in-r-with-of-occurrences-sums-of-values.
关于如何最初导入文件以使列为数字或导入后如何转换它有什么想法?