在R中读取csv文件,其中货币列为数字

2024-01-02

我正在尝试读入 R 一个包含政治捐款信息的 csv 文件。据我了解,默认情况下,列会作为因子导入,但我需要将金额列(数据集中的“CTRIB_AMT”)作为数字列导入,这样我就可以运行各种不适用于的函数因素。该列的格式为带有“$”作为前缀的货币。

我最初使用了一个简单的读取命令来导入文件:

contribs <- read.csv('path/to/file')

然后尝试将 CTRIB_AMT 从货币转换为数字:

as.numeric(as.character(sub("$","",contribs$CTRIB_AMT, fixed=TRUE)))

但这没有用。我尝试用于 CTRIB_AMT 列的函数是:

vals<-sort(unique(dfr$CTRIB_AMT))
sums<-tapply( dfr$CTRIB_AMT, dfr$CTRIB_AMT, sum)
counts<-tapply( dfr$CTRIB_AMT, dfr$CTRIB_AMT, length)

查看相关问题here https://stackoverflow.com/questions/7329733/bubble-chart-in-r-with-of-occurrences-sums-of-values.

关于如何最初导入文件以使列为数字或导入后如何转换它有什么想法?


我不知道如何直接读取它,但是您可以在读取后对其进行修改:

> A <- read.csv("~/Desktop/data.csv")
> A
  id   desc price
1  0  apple $1.00
2  1 banana $2.25
3  2 grapes $1.97
> A$price <- as.numeric(sub("\\$","", A$price))
> A
  id   desc price
1  0  apple  1.00
2  1 banana  2.25
3  2 grapes  1.97
> str(A)
'data.frame':   3 obs. of  3 variables:
 $ id   : int  0 1 2
 $ desc : Factor w/ 3 levels "apple","banana",..: 1 2 3
 $ price: num  1 2.25 1.97

我认为这可能只是你的潜水艇中错过的逃生机会。 $ 在正则表达式中表示行尾。 \$ 是美元符号。但接下来你就必须逃离……

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在R中读取csv文件,其中货币列为数字 的相关文章

  • 按名称包含在单个对象中的多个列对 data.frame 进行排序?

    我想排序一个data frame由多列组成 理想情况下使用基础 R 无需任何外部包 尽管如果有必要 就这样吧 读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
  • SparkR 和 Sparklyr 之间导入 parquet 文件所需的时间差异

    我正在使用 databricks 导入镶木地板文件SparkR and sparklyr data1 SparkR read df dbfs data202007 source parquet header TRUE inferSchema
  • 从 leafletProxy() 返回渲染的传单地图

    是否可以在渲染后在 Shiny 中检索传单地图 下面是一个代码示例 展示了如何生成地图leaflet 与返回的不同leafletProxy 即使它们在渲染时看起来完全相同 是否有一个功能可能不同于leafletProxy 获取实际的 htm
  • 在 R 中计算大矩阵的零空间

    我找不到任何函数或包来计算 a 的零空间或 QR 分解 bigmatrix from library bigmemory 在 R 中 例如 library bigmemory a lt big matrix 1000000 1000 typ
  • data.table 查找值并翻译

    像许多人一样 我是 R 新手 我有一个大数据集 500M 行 我已将其读取到 data table 中logStats其中有如下数据 head logStats 15 time pid mean 1 2014 03 10 00 00 00
  • e_facet 在 echarts4r 问题中使用分组数据

    我真的很喜欢这个包提供的可能性 并且想在一个闪亮的应用程序中使用它 然而我正在努力重新创建从 ggplot 到 echarts4r 的情节 library tidyverse library echarts4r data tibble ti
  • R 子集 XTS 工作日

    如何对 xts 对象进行子集化以仅包含工作日 周一至周五 周六和周日除外 这就是我要做的 library xts data sample matrix sample xts lt as xts sample matrix descr my
  • Rcpp 包不包含 Rcpp_precious_remove

    我一直在尝试创建数据库并安装 DBI 包 但仍然遇到此错误 我重新安装了 DBI 和 RSQLite 软件包 但它们似乎不起作用 library DBI con lt dbConnect RSQLite SQLite dbname memo
  • 是否可以创建根据输入对象名称自行命名的列表?

    能够创建 R 列表对象而无需指定每个元素的名称对我来说非常有帮助 例如 a1 lt 1 a2 lt 20 a3 lt 1 20 b lt list a1 a2 a3 inherit name TRUE gt b a1 1 1 a2 1 20
  • 使用栅格包下载 SRTM 数据?

    我正在尝试使用 获取 SRTM 数据 raster R 中的包 但一旦我选择SRTM在 getData 命令中 我会收到以下错误 library raster srtm lt getData SRTM lon 16 lat 48 tryin
  • 如何自动替换多个文件的文本内容中的字符?

    我有一个文件夹 myfolder包含许多乳胶表 我需要替换其中每个字符 即替换任何minus sign by an en dash 只是为了确定 我们正在替换连字符INSIDE该文件夹中的所有 tex 文件 我不关心 tex 文件名 手动执
  • 有什么方法可以禁用 PDF/Postscript 输出中的“减号破解”吗?

    在 R 中 将绘图保存到 PDF 或 Postscript 文件时 轴标签中的连字符会变成减号 显然 这是设计使然 根据 postscript 设备的文档 正常编码规则 有一个例外 字符 45 始终设置为负号 其在 Adob e ISOLa
  • 消除垂直线ggplot

    这个问题以前曾被问过 但答案并不总是明确或很复杂 我希望 ggplot2 的新版本能够带来更简单的解决方案 如何仅消除 ggplot 的垂直线而不消除轴刻度线或标签 这对于条形图来说确实很好 因为它可以消除图形中一些不必要的干扰 这里有一些
  • 更快地评估从右到左的矩阵乘法

    我注意到以二次形式评估矩阵运算右到左明显快于左到右在 R 中 取决于括号的放置方式 显然它们都执行相同的计算量 我想知道为什么会这样 这与内存分配有什么关系吗 A 5000 5000 B 5000 2 A matrix runif 5000
  • R闪亮:在渲染表格时显示“正在加载...”消息

    在 Rstudio Shiny 中 我得到了一些renderDataTable通过 RMySQL 从数据库获取信息的调用 有些查询可能需要几秒钟才能完成 我想添加一条 正在加载 消息 其中表格将在等待时最终呈现 这个问题与这个问题类似 R闪
  • r 闪亮下载过滤数据表(DT)

    我正在尝试做一个shiny应用程序下载过滤后的Datatable 过滤与search 通过删除行进行过滤delete button 下载部分按预期工作 问题 当我第一次使用数据表中的搜索区域进行过滤时 如果我使用按钮删除一行 它会重置第一个
  • 如何计算由离散数据定义的表面下的体积?

    我需要确定由离散数据点表示的一系列表面下方的体积 在我的数据中 每个样本都作为数据帧列表中的单独数据帧存储 这是一些 小 示例数据 df1 lt data frame x c 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 y
  • 非等值连接 - 比较 R 中的两个数据帧

    我想根据第二个数据框中存在的值过滤数据框 例如 匹配第一个数据帧中 BP 列中高于 start pos 列的第一个值且小于 end pos 列或仅小于第二个数据中的 end pos 的行框架 我需要对第二个数据框中的所有值重复此过程 目前
  • Caret 和 GBM:任务 1 失败 - “参数意味着行数不同”

    我正在尝试使用以下代码运行带插入符号的 GBM library caret library doParallel detectCores registerDoParallel detectCores 1 set seed 668 in tr
  • tm 包本身是否提供了组合文档术语矩阵的内置方法?

    tm 包本身是否提供了组合文档术语矩阵的内置方法 我在同一语料库上生成了 4 个文档术语矩阵 每个矩阵为 1 2 3 4 克 它们都非常大 200k 10k 因此将它们转换为数据帧然后绑定它们是毫无疑问的 我知道我可以编写一个程序来记录每个

随机推荐

  • 最小的音频文件:MP3、Ogg 还是 Wav?

    我正在寻找最小类型的音频文件 以便某些 JavaScript 能够更流畅地工作 在这三个人中 Ogg通常会小于MP3 两者都会比未压缩的小得多WAV 当然 可能还有其他因素对您的网站产生影响 例如质量 对于大多数用途来说没有太大的明显差异
  • Catch 动态地将参数传递给测试用例

    我有一个 C 项目 正在使用它进行测试捕获 cpp https github com philsquared Catch 我编译并运行以下文件来运行我的测试 define CATCH CONFIG MAIN include catch hp
  • 如何分离多机集群配置的各个阶段?

    假设我有 4 个 Vagrant 盒子 3 种是相同配置的变体 例如 Consul 而一种具有完全不同的配置 例如数据库 我需要在三个配置相似的 Consul VM 上运行一个略有不同的配置步骤 然后 我需要针对其中 1 个 Vault V
  • 在 cygwin 上安装 uwsgi

    有人设法在 cygwin python 2 7 上安装 uwsgi 吗 uwsgi 2 0 11 2 python setup py install running install using profile buildconf defau
  • 有没有 Maven 睡眠功能?

    我设置了 Maven 配置文件用于测试 在预集成测试中 maven 启动两个 jetty 服务器 然后启动测试 我偶然发现的问题是在服务器中 测试开始时它们没有完全加载 看来问题是通过在测试中添加 5 秒睡眠时间来解决的 但我希望将其添加到
  • Makefile 中是否可以依赖符号链接?

    我的项目中需要几个符号链接 From src openlayers 文件夹img and theme必须符号链接在contrib openlayers The contrib openlayers文件夹也应该自动创建 PHONY run r
  • 如果所有者将我从 CloudKit 上的 CKShare 中删除,如何收到通知

    假设某张唱片的所有者与我分享了该唱片 我收到一个共享链接 我打开它并接受共享 如下所示 let operation CKAcceptSharesOperation shareMetadatas metadata operation acce
  • 使用 VBScript 遍历 XML 文件中的所有节点

    我编写了一个 VBScript 它应该遍历 XML 文件中的所有节点 无论树的深度如何 这一点做得很好except不显示 2 级或以上深度的节点的节点名称 我需要节点名称和值 以便获得名称 值对以供其他程序进一步处理 任何人都可以帮我显示丢
  • 使用 Hibernate JPA (JPQL) 进行非多态查询

    我发布这个问题 答案作为扩展如何在 Hibernate 中执行非多态 HQL 查询 https stackoverflow com questions 2093025 how to perform a non polymorphic hql
  • 条件 Java 编译

    我是一名资深 C 程序员 刚接触 Java 我正在 Eclipse 中开发 Java Blackberry 项目 问题 有没有办法在项目中引入不同的配置集 然后根据这些配置集编译略有不同的代码 在Visual Studio中 我们有项目配置
  • 通过 FIFO 重定向 stdin

    我正在 GNU Linux 下运行一个服务器应用程序 用 Java 编写 它接收输入 我猜是来自标准输入 并解释它以运行一些命令 我不想在终端窗口内运行应用程序 我想运行守护程序 但我仍然希望能够随时输入命令 我想我也许可以使用 fifos
  • 使用相同的标记和偏移位访问和更新 2 路关联缓存

    我对如何在双向关联缓存上访问数据感到困惑 例如 C ABS C 32KB A 2 B 32bits S 256 offset lg B 5 index lg S 8 tag 32 offset index 19 假设我有以下地址 tag i
  • 如何根据关系获取一条记录的多条记录?

    我有两个表组织和员工具有一对多关系 即一个组织可以有多名员工 现在我想选择特定组织的所有信息以及该组织所有员工的名字 最好的方法是什么 我可以在单个记录集中获取所有这些内容吗 或者我将不得不根据否获取多行 员工人数 这是我想要的一些图形演示
  • 使用 24 小时制数据创建圆形图的方法是什么?

    我正在尝试使用围绕中心点绘制的一组数据的方式创建一个圆形图 我在网上找到的代码可以做到这一点 但是 Y 轴太大 以至于图形没有用 我想将 Y 轴限制为 95 120 但当我使用Y scale continuous limit c 95 12
  • 在 Ember.js 应用程序中显示在线和离线(例如飞机)模式

    Ember 应用程序可以了解网络状态吗 如果是 如果应用程序可以访问互联网 我如何获取信息 我想根据网络可访问性切换 GUI 元素 索引 html app js App Ember Application create
  • ASP.NET Core 流式传输 - 将块写入请求

    这是更新的问题 我的代码中曾经存在错误 我希望能够将数据块发送给客户端 任何事情都会受到赞赏 有没有办法为 ASP NET Core 提供对数据流传输方式的更多控制 我担心下面的代码如何扩展 有人可以建议如何通过 asp net core
  • 内部测试人员如何下载“Android”预发布的App版本?

    有人可以告诉我 内部测试人员如何下载 Android 预发布的应用程序版本吗 因为现在 TestFlight 仅适用于苹果收购的iOS 解决方案是否是将 Android 预发布应用程序上传到 Google Play 并邀请内部测试人员下载
  • 尝试使用 jQuery 模式弹出窗口通过 iframe 查看 pdf 文件

    我正在尝试使用 jQuery 模式弹出窗口通过 iframe 显示 pdf 文件 但是 它要求用户在页面加载时下载该文件 而不是在模式对话框打开时将 pdf 文件嵌入到 iframe 中 我该如何解决这个问题 我使用 MVC 输出 pdf
  • Android System.err 突然出现

    运行我的应用程序时 LogCat 突然显示一系列橙色消息 警告 这些消息似乎与我的应用程序完全无关 当然not具有相同的 pid 05 01 12 00 03 732 WARN System err 1836 java io FileNot
  • 在R中读取csv文件,其中货币列为数字

    我正在尝试读入 R 一个包含政治捐款信息的 csv 文件 据我了解 默认情况下 列会作为因子导入 但我需要将金额列 数据集中的 CTRIB AMT 作为数字列导入 这样我就可以运行各种不适用于的函数因素 该列的格式为带有 作为前缀的货币 我