查找每个逗号后的第二个空格

2024-04-11

This is a follow up to this question: Concatenate previous and latter words to a word that match a condition in R https://stackoverflow.com/questions/58551389/concatenate-previous-and-latter-words-to-a-word-that-match-a-condition-in-r

我正在寻找一个正则表达式,它可以在逗号之后的第二个空格处分割字符串。看下面的例子:

vector <- c("Paulsen", "Kehr,", "Diego", 
            "Schalper", "Sepúlveda,", "Alejandro",
             "Von Housen", "Kush,", "Terry")

X <- paste(vector, collapse = " ")
X

## this is the string I am looking to split:
"Paulsen Kehr, Diego Schalper Sepúlveda, Diego Von Housen Kush, Terry"

每个逗号后的第二个空格是我的标准regex /questions/tagged/regex。所以,我的输出将是:

"Paulsen Kehr, Diego"
"Schalper Sepúlveda, Alejandro"
"Von Housen Kush, Terry"

我想出了一个模式,但不太有效。

[^ ]+ [^ ]+, [^ ]+( )

与它一起使用strsplit删除所有单词而不是在 group-1 处拆分(即[^ ]+ [^ ]+, [^ ]+(group-1)) 仅有的。我想我只需要排除完整的匹配项并仅与后面的空格匹配。 --正则表达式演示 https://regex101.com/r/z383ig/17

strsplit(X, "[^ ]+ [^ ]+, [^ ]+( )")

# [1] "" [2] "" [3] "Von Housen Kush, Terry"

谁能想到一个regex /questions/tagged/regex为了找到每个逗号后的第二个空格?


您可以使用

> strsplit(X, ",\\s+\\S+\\K\\s+", perl=TRUE)
[[1]]
[1] "Paulsen Kehr, Diego"           "Schalper Sepúlveda, Alejandro" "Von Housen Kush, Terry"

See the 正则表达式演示 https://regex101.com/r/1BRzKj/1

Details

  • ,- 一个逗号
  • \s+- 1+ 空格
  • \S+- 1+ 个非空格
  • \K- 匹配重置运算符丢弃迄今为止匹配的所有文本
  • \s+- 1+ 空格
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

查找每个逗号后的第二个空格 的相关文章

  • 在 R 中导入 csv 文件时如何保留前导零?

    当我写一个 csv来自 R 的文件 其中我的组名称以前导零值开头 前导零被保留 但是当我导入 csv前导零被删除 组名称被转换为整数 当我导入一个组时 如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
  • 删除缺失的数据值

    我删除了原始帖子 以便能够发布更大版本的数据集 实际上总共有 418 行 这是我正在进行的生存分析的数据 第一列是 ID 号 其他列标记为 V2 V20 有很多缺失的数据 用 表示 我用coxph 函数来获取以下内容 Saves survi
  • R:ifelse 中的字符串列表

    我正在寻找与 MySQL 中的 where var in 语句类似的东西 我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
  • 删除匹配前的一个单词和一个单词

    匹配之前的一个单词可以是一组任何符号 例如 D E F 我有一个正则表达式 s w s XXX 输入示例 This is KKK M D D xXx PPP输出示例 This is KKK PPP 所以我需要删除 XXX 之前的 1 个单词
  • 正则表达式验证字符串是否包含三个非空白字符

    我使用欧芹 js 来验证输入 并且使用 data parsley pattern 它允许我传递正则表达式 我正在尝试验证该字符串以确保它至少包含三个非空白字符 下面是应该无效或有效的字符串 valid 1 2 b invalid 1 b s
  • PHP URL 验证

    我知道有无数的线程问这个问题 但我一直无法找到一个可以帮助我解决这个问题的线程 我基本上试图解析大约 10 000 000 个 URL 的列表 确保它们根据以下标准有效 然后获取根域 URL 此列表包含您能想象到的几乎所有内容 包括类似的内
  • 如何在 jQuery 中将标题转换为 URL slug?

    我正在 CodeIgniter 中开发一个应用程序 我试图在表单上创建一个字段来动态生成URL slug 我想做的是删除标点符号 将其转换为小写 然后用连字符替换空格 例如 Shane s Rib Shack 将变成 shanes rib
  • 按组计算连续行中的值之间的差异

    这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异 所以 我需要一个结果 group value diff 1 10 NA because the
  • 为正则表达式编写解析器

    即使经过多年的编程 我很羞愧地说我从未真正完全掌握正则表达式 一般来说 当问题需要正则表达式时 我通常可以 在一堆引用语法之后 想出一个合适的正则表达式 但我发现自己越来越频繁地使用这种技术 所以 自学并理解正则表达式properly 我决
  • R data.table fwrite 到 fread 空间分隔符并清空

    我在使用 fread 以 作为分隔符和散布的空白值时遇到问题 例如 这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd
  • 如何确定 R 包的作者?

    如何确定包的作者是谁 鉴于我们拥有这个广泛使用的代码库 我认为参考我在分析中使用的软件是合适的 有没有办法以编程方式检索作者和任何其他相关信息 在伪代码中 我想执行以下操作 references base 我怎样才能做到这一点 为了能够引用
  • 按不规则时间间隔对数据进行分组求和(R语言)

    我正在看这里的 stackoverflow 帖子 R 计算一组内的观察次数 https stackoverflow com questions 65366412 r count number of observations within a
  • 使用 posix shell 测试字符串中的正则表达式

    如何测试字符串是否与特定字符串匹配正则表达式与基本 无 bash 或任何其他 posix shell 脚本 在 if 语句中 您可以使用expr在 POSIX shell 中计算正则表达式的命令 s Abc expr s alpha 3 e
  • 更快的 %in% 运算符

    The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配 例如在循环中 set seed 1 library fastma
  • 从正则表达式对象中提取允许字符串的最大长度

    一旦加载到 C 中 是否可以从正则表达式模式中提取允许的字符串的最大长度Regex object 如果我有一个正则表达式字符串定义为 A Z0 9 0 20 我可以使用字符串操作来获取最大允许长度20 但是 有没有一种方法可以更轻松地实现这
  • 手动设置scale_fill_distiller()的比例

    我正在尝试制作一系列图表进行比较 举例来说 我想使用iris数据集来制作这样的图 其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
  • 按特定样本前缀对列名称向量进行子集化

    假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
  • grep 两个分隔符之间的子字符串

    我有很多bash使用的脚本perl内的表达式grep为了提取两个分隔符之间的子字符串 例子 echo BeginMiddleEnd grep oP lt Begin End 问题是 当我将这些脚本移植到运行的平台时busybox 融合的 g
  • 从 R 中的方差分析 (glm) 中提取残余偏差

    我在 R 中安装了一个 glm 模型并采用了方差分析表 我需要提取 残余偏差 列 但它会产生错误 以下是代码 创建数据 counts lt c 18 17 15 20 10 20 25 13 12 outcome lt gl 3 1 9 t
  • Pure Bash 替换捕获组

    我有这个示例字符串 test string 13A6 该字符 数字可以是从 0 到 9 以及从 A 到 F 我想要这个输出 1 3 A 6 我有这个工作 result echo test string sed s g 我想在没有 sed 的

随机推荐

  • Laravel 错误:请提供有效的缓存路径

    我克隆了一个 Laravel 5 2 项目 当我执行composer install时 出现错误 InvalidArgumentException Please provide a valid cache path 这些文件夹存在 stor
  • 有用的二进制差异工具(除了 msdn[apatch 和 mpatch]、xdelta、bsdiff、vbindiff 和 winmerge)[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我需要一个二进制 diff 工具 它可以从比较的 8MB 文件 dat 压缩文件 生成补丁文件 并且可以将生成的补丁文件合并到旧的 dat
  • 返回“System.Byte[]”而不是实际数据

    此代码旨在计算并打印桌面上文件的 MD5 哈希值 但是 在编译时 写入控制台窗口的所有内容都是 System Byte 放置 ToString 也没有解决问题 MD5 a MD5 Create Console Write a Compute
  • 使用 -fopenmp 和 -lgomp 链接 OpenMP 之间的区别

    最近几天我一直在努力解决一个奇怪的问题 我们使用 GCC 4 8 创建一些库 静态链接它们的一些依赖项 例如 log4cplus 或 boost 对于这些库 我们使用 boost python 创建了 Python 绑定 每次这样的库使用
  • 如何绘制这样的自定义颤动边框?

    我想要有关如何实现自定义边框的想法 如下图所示 我制造了一个CustomPainter绘制形状 class MyPainter extends CustomPainter Color color MyPainter required thi
  • Go 中 int 到 string 的转换是如何工作的?

    我今天才开始使用 Go 所以这可能是显而易见的 但我找不到任何内容 什么是var x uint64 0x12345678 y string x give y I know var x uint8 65 y string x 会给y字节 65
  • 在 Android 中使用共享首选项与捆绑包

    我正在制作的应用程序从数据库中的表中检索 1 到 2 打记录 以便在应用程序期间可以使用某些数据 该表有 6 个字段 它不需要永久存储在设备上 共享首选项是否用于类似的事情 或者我应该使用捆绑包 您可以只查询数据库并获取所需的数据并将其以正
  • 如何关闭所有 pyplot 窗口(包括之前脚本执行的窗口)?

    所以我有一些 python 代码 使用 pyplot 绘制一些图表 每次运行脚本时都会创建新的绘图窗口 我必须手动关闭该窗口 如何在脚本开始时关闭所有打开的 pyplot 窗口 IE 关闭先前执行脚本期间打开的窗口 在 MatLab 中 这
  • if (x==0||7||14||21||-7||-14) {y=星期四;} [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 你能像这样
  • 使用 Google Analytics 跟踪 XML Web 服务上的点击次数

    我有一个 xml Web 服务 我想使用 Google Analytics 进行跟踪 由于它使用小型客户端 JavaScript 来进行跟踪 因此这是一个问题 是否可以在不运行 javascript 客户端服务器端的情况下解决此问题 也许这
  • Sails.js 如何修改路由以解释逗号分隔的 id 列表

    根据一些 JSON API 规范 例如http jsonapi org format urls individual resources http jsonapi org format urls individual resources 服
  • Bash:执行存储在变量中的命令[重复]

    这个问题在这里已经有答案了 我正在编写一个脚本 其中一部分没有按我的预期工作 为了简单起见 我在一个简单的例子中分解了这一部分 echo echo gt tmp while read cmd do cmd done 在这里 我希望 cmd
  • mongodb有路径通配符吗?

    我有一个 mongodb 集合 其中每个文档都有一个树结构 第一个级别是国家 地区代码 第二个级别是操作系统 第三个级别是处理器类型 最后的值是性能分数 AU OSX x86 64 17 4 RU Android A9 14 2 x86 7
  • 如何从Excel中读取数据并逐行写入文本文件?

    我想编写代码从 Excel 获取数据并将其写入文本文件 这是我的代码 import xlrd import os path wb xlrd open workbook os path join D TRB 2014 Data SPS1 de
  • 为什么 std::string 不是 std::vector 的特化? [复制]

    这个问题在这里已经有答案了 将字符串视为字符向量似乎是显而易见的 那么为什么 string 有它自己的特殊实现 它看起来与向量类有很大不同呢 只是为了说明这一点 这里有两个课程的一些片段 以表明所需的工作非常相似 例如两者都使用分配器来管理
  • 页面刷新期间的 selenium.common.exceptions.StaleElementReferenceException

    页面包含一些数据 行数很少的表 有 刷新 按钮 可以重新加载和重新绘制页面上的某些元素 而无需重新加载静态数据 ajax 我正在尝试为该页面创建适当的测试 但有时会出现 StaleElementReferenceException 我的代码
  • 多元二分法

    我需要一种算法来执行二维二分法来解决 2x2 非线性问题 示例 两个方程f x y 0 and g x y 0我想同时解决这个问题 我非常熟悉一维二分 以及其他数值方法 假设我已经知道解决方案位于界限之间x1 lt x lt x2 and
  • 在 Android 上的活动之间保持蓝牙连接 [重复]

    这个问题在这里已经有答案了 可能的重复 Android 如何将蓝牙连接传递给另一个活动 https stackoverflow com questions 6872970 android how to pass a bluetooth co
  • 默认情况下,PHPUnit 模拟对象从未期望过

    如果没有正式定义的期望 有没有办法告诉 phpunit 模拟对象永远不要期望方法调用 在我看来 不要对每种方法都抱有期望是没有道理的 所以 phpunit 没有任何功能 仅当您想完全确保某些方法不会被调用时 才应使用 从不 期望 无论如何
  • 查找每个逗号后的第二个空格

    This is a follow up to this question Concatenate previous and latter words to a word that match a condition in R https s