用 R 删除某个单词之前的字符串

2023-12-01

我有一个需要清理的字符向量。具体来说,我想删除“投票”一词之前的数字。请注意,该数字用逗号分隔千位,因此更容易将其视为字符串。

我知道 gsub("*.Votes","", text) 会删除所有内容,但如何删除数字?另外,如何将重复的空格折叠成一个空格?

感谢您可能提供的任何帮助!

示例数据:

text <- "STATE QUESTION NO. 1                       Amendment to Title 15 of the Nevada Revised Statutes Shall Chapter 202 of the Nevada Revised Statutes be amended to prohibit, except in certain circumstances, a person from selling or transferring a firearm to another person unless a federally-licensed dealer first conducts a federal background check on the potential buyer or transferee?                    558,586 Votes"

您可以使用

text <- "STATE QUESTION NO. 1                       Amendment to Title 15 of the Nevada Revised Statutes Shall Chapter 202 of the Nevada Revised Statutes be amended to prohibit, except in certain circumstances, a person from selling or transferring a firearm to another person unless a federally-licensed dealer first conducts a federal background check on the potential buyer or transferee?                    558,586 Votes"
trimws(gsub("(\\s){2,}|\\d[0-9,]*\\s*(Votes)", "\\1\\2", text))
# => [1] "STATE QUESTION NO. 1 Amendment to Title 15 of the Nevada Revised Statutes Shall Chapter 202 of the Nevada Revised Statutes be amended to prohibit, except in certain circumstances, a person from selling or transferring a firearm to another person unless a federally-licensed dealer first conducts a federal background check on the potential buyer or transferee? Votes"

See the 在线 R 演示在线正则表达式演示.

Details

  • (\\s){2,}- 匹配 2 个或更多空白字符,同时捕获将使用重新插入的最后一个匹配项\1替换模式中的占位符
  • | - or
  • \\d- 一个数字
  • [0-9,]*- 0个或多个数字或逗号
  • \\s*- 0+ 空白字符
  • (Votes)- 第 2 组(将使用\2占位符):aVotes子串。

注意trimws将删除任何前导/尾随空格。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用 R 删除某个单词之前的字符串 的相关文章

随机推荐

  • 我的代码与 strtotime 的奇怪行为

    我对 PHP 中的日期感到有些头疼 我正在从表单中获取一些数据 并尝试通过 ajax 调用 提交 它 以更新网络而不重新加载页面 我有一个日期选择器 它允许选择一系列日期 因此 我做了一个脏函数来分隔开始日期和结束日期 并将其单独发布到 P
  • Javascript 正则表达式:验证双精度型/浮点型

    这是我正在研究的模式 var re d 1 2 d 1 2 我希望它返回的是一位或两位数字 永远不会大于 24 因为它是一个时间管理应用程序 后面可能会或可能不会带有一个或两个小数点尾随数字 但不超过两位 我不确定与前瞻混合的括号子字符串匹
  • PyQt5/pyqt4 是否已经支持具有手写识别功能的 QtVirtualKeyboard?

    我正在使用 pyqt5 开发桌面应用程序 并且我想使用具有手写识别功能的虚拟键盘 我看到Qt QtVirtualKeyboard已经支持它了 Here s a link 我在 QtCreator 上运行了 C Qt 示例代码 但是使用 py
  • Mitmproxy 在一个脚本中篡改 GET 和 POST 请求/响应

    发送到特定 URL 的 POST 请求 http test com 看起来像这样 messageType OK city Name Paris Views 1231 id 4234 enableView false Views 5447 8
  • 从 Visual Studio 中的自定义 C# 编译器登录时克服 MSBuild 冗长的问题

    我在 Visual Studio 2017 项目的构建步骤中添加了一个自定义编译器 使用
  • MySQL 返回连续相同结果的第一条和最后一条记录

    我正在使用 MySQL 并有一个名为 结果 的表 该表存储监视器的结果 该监视器确定服务在特定时间是启动还是关闭 result id service id time stamp result 1 1 0000 00 00 00 01 00
  • 从 JavaScript 字符串中读取字节

    我有一个包含 JavaScript 中的二进制数据的字符串 现在我想从中读取一个整数 所以我得到前 4 个字符 使用charCodeAt 进行一些移位等以获得整数 问题是 JavaScript 中的字符串是 UTF 16 而不是 ASCII
  • MongoDB:批量操作是否作为一个整体写入oplog?

    当我在 MongoDB 3 中发出有序批量操作时 批量操作是否会作为一个整体写入 oplog 以便在服务器崩溃后可以作为一个整体重播 这个问题的理由如下 我知道没有真正的交易 但我可以使用 isolated关键字具有一定的读取一致性 在某些
  • Javascript 书签从一个页面获取信息并将其提交到另一页面上的表单

    现在我发现我无法在一个页面内编写 JavaScript 来在另一个外部页面上输入表单数据 我想使用基于浏览器的书签来完成此操作 我可以使用以下书签代码片段访问原始页面上的数据 javascript var 20thecode documen
  • Firebase 规则正则表达式问题

    d 1 2 d d 1 3 d 我试图使用上面的正则表达式来确认数据是有效的坐标 我无法使其与 Firebase 规则一起使用 当我在在线正则表达式测试器中运行正则表达式时 它工作正常 但 Firebase 规则似乎不接受它 这是我的 fi
  • PHP DOMDocument:按类删除元素

    我试图删除具有给定类的每个节点 要查找我使用的元素 xpath new DOMXPath dom foreach xpath gt query div contains attribute class foo as e Delete thi
  • 查找 Swift 数组中的最小值/最大值

    给定一个 Swift 数值数组 如何找到最小值和最大值 到目前为止 我有一个简单 但可能昂贵 的方法 var myMax sort myArray gt 0 以及我在学校是如何被教导的 var myMax 0 for i in 0 myAr
  • 检查测试编译而不运行它们或创建二进制文件

    如何使用 Go 检查我的测试是否编译而不创建任何二进制文件或执行测试 测试等效于go build 它执行此操作但忽略测试 使用任何不匹配的正则表达式作为运行标志 例如 go test run NONE or set count 0 go t
  • 圆圈进度查看类似活动应用程序

    我正在尝试创建一个动画径向图表 看起来像苹果创建的活动应用程序 我提供了一张图片来显示我想要的结果 你知道如何获得这个结果吗 如果您有什么想法 请重点关注以下几点 在每个圆圈内创建渐变 在圆的头上创建阴影 预先非常感谢您 查看我的自定义控件
  • 可以部分应用不带关键字参数的函数的第二个参数吗?

    以内置的python为例pow 功能 xs 1 2 3 4 5 6 7 8 from functools import partial list map partial pow 2 xs gt gt gt 2 4 8 16 32 128 2
  • 检测 iOS 应用程序是否在调试器中运行

    我将应用程序设置为将调试输出发送到控制台或日志文件 现在 我想在代码中决定是否 它在调试器 或模拟器 中运行 因此有一个控制台窗口 我想在其中直接读取输出 或者如果 没有控制台窗口 因此输出应重定向到文件 有没有办法确定应用程序是否在调试器
  • 将 windows8.1 应用程序部署到我的设备时出现意外错误:-2147483638

    我目前正在从事Windows8 1 Phone应用程序开发工作 应用程序在模拟器上运行良好 但当我尝试将其部署在我的 Lumia 535 上时 它给出了这个奇怪的错误消息 快照 选择 使用 ARM 进行调试 并且我的设备已连接并解锁 Hyp
  • 对字典中每个键的多个值求和?

    我有一个Python字典 看起来像这样 item1 1 2 3 4 5 6 item2 2 3 1 item n 4 2 4 3 2 现在我的要求是我想添加这个字典的数值并将其显示为 item1 21 item2 6 item n 15 我
  • 如何保留 geom_tile ggplot 中图块的顺序

    我尝试制作 geom tile 图 但很难保持图块的顺序 这是一个示例数据集 head data2 2 wt mt up GO ont 1285 10 692307 proline transport BP 784 10 319457 sa
  • 用 R 删除某个单词之前的字符串

    我有一个需要清理的字符向量 具体来说 我想删除 投票 一词之前的数字 请注意 该数字用逗号分隔千位 因此更容易将其视为字符串 我知道 gsub Votes text 会删除所有内容 但如何删除数字 另外 如何将重复的空格折叠成一个空格 感谢