通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列

2023-11-24

我试图将一个相当混乱的列分成两列，其中包含period and 描述。我的数据类似于下面的摘录：

set.seed(1)
dta <- data.frame(indicator=c("someindicator2001", "someindicator2011",
                              "some text 20022008", "another indicator 2003"),
                  values = runif(n = 4))

期望的结果

期望的结果应该是这样的：

          indicator   period    values
1     someindicator     2001 0.2655087
2     someindicator     2011 0.3721239
3         some text 20022008 0.5728534
4 another indicator     2003 0.9082078

特征

指标描述在一列中
数值（从第一个数字开始计数with第一个数字在第二列）

Code

require(dplyr); require(tidyr); require(magrittr)
dta %<>%
  separate(col = indicator, into = c("indicator", "period"),
           sep = "^[^\\d]*(2+)", remove = TRUE)

这自然是行不通的：

> head(dta, 2)
  indicator period    values
1              001 0.2655087
2              011 0.3721239

其他尝试

我也尝试过默认的分离方法sep = "[^[:alnum:]]"但它将该列分解为太多列，因为它似乎匹配所有可用数字。
The sep = "2*"也不起作用，因为有时有太多 2（例子：20032006).

我想做的归结为：

识别字符串中的第一个数字
根据该章程分居。事实上，我也很乐意保留这个特殊的性格。

我想这可能会做到。

library(tidyr)
separate(dta, indicator, c("indicator", "period"), "(?<=[a-z]) ?(?=[0-9])")
#           indicator   period    values
# 1     someindicator     2001 0.2655087
# 2     someindicator     2011 0.3721239
# 3         some text 20022008 0.5728534
# 4 another indicator     2003 0.9082078

以下是正则表达式的解释，由regex101.

(?<=[a-z])是一个积极的回顾 - 它断言[a-z]（匹配a和z之间范围内存在的单个字符（区分大小写））可以匹配
?从字面上匹配前面的空格字符，在零到一次之间，尽可能多次，根据需要返回
(?=[0-9])是一个积极的前瞻 - 它断言[0-9]（匹配 0 到 9 范围内的单个字符）可以匹配

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

r

string

dplyr

tidyr

通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列的相关文章

将整个单词与特殊字符匹配的正则表达式不起作用？ [复制]

这个问题在这里已经有答案了我正在经历这个问题C Regex Match 整个单词 https stackoverflow com q 1209049 443568 它说要匹配整个单词使用 b模式 b 这对于匹配没有任何特殊字符的整个单词效
使用 PHP 将 HTML 片段包裹在 div 中（并从 HTML 标签生成目录）

我原来的 HTML 看起来像这样 h1 Page Title h1 h2 Title of segment one h2 img src img jpg alt An image of segment one p Paragraph one
将 RMarkdown 文档编织为 Word 时方程式和引用丢失

我不确定这个问题是否更适合LaTeX论坛我将其发布在这里是因为我怀疑问题更多是关于knitr和 RMarkdown 相比于 LaTeX 我在 RStudio 中有以下 RMarkdown 文档 title Capricious Behav
如何使用正则表达式（php）匹配这个单词

我有这个关键词3D DL1 现在我想从用户提交的数据中搜索 3D DL1 关键字该规则是只要句子中出现 3D 和 DL1 它就有效不区分大小写例如 BLASDHSDHD 3D 8qw9e08e2323 DL1 有效的 BLASDHSD
R中的预测和预测函数之间的区别

两者之间有什么区别吗predict and forecast R 中的函数如果是在哪些具体情况下应该使用它们 Intro predict 适用于多种 R 对象模型基础库的一部分 forecast 对于时间序列预测包的一部分参见示
捕获长字符串上的特定字段[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有点卡在这里我正在努力解析一些如下所示的信息 CouchDB 数据库内容 rows id AGO key AGO value re
如何禁用“保存工作区图像？” R 中的提示？

当我退出交互式 R shell 时它每次都会显示一个烦人的提示 gt gt Save workspace image y n c n 我总是对此回答不因为如果我想保存我的工作我就会这么做before试图退出如何去掉这个提示呢 No
在 R 中根据时间序列数据制作 3D 曲面

我有一个大型数据集我想从中制作 3D 表面我希望 x 轴为日期 y 轴为时间 24 小时 z 轴高度为我的值我是 R 初学者所以越简单越好 http www quantmod com examples chartSeries3d
spplot 的图例范围和颜色分布问题

我的绘图和图例中的颜色范围是否正确存在问题这是我使用的代码 data ch4 lt read csv2 v42 CH4 1970 TOT txt skip 3 stringsAsFactors FALSE header F num dat
在自记录 f 字符串中的等号后插入换行符[重复]

这个问题在这里已经有答案了在python3 8中一个新特性是自记录格式字符串 https docs python org 3 whatsnew 3 8 html f strings support for self documentin
根据用户输入将 n 个反应式单选按钮添加到闪亮的应用程序

我正在尝试创建一个闪亮的应用程序用户可以在其中从数据框中选择变量以便对数据进行子集化输出最终将是包含用户子集的数据表我需要根据用户为子集选择的变量数量创建 n 个输入框理想情况下输入框将是动态单选按钮用于子集因子我还没有开
如何在 Python 中只替换一次正则表达式？

所以现在 re sub做这个 gt gt gt re sub DELETE THIS I want to DELETE THIS472 go to DON T DELETE THIS847 the supermarket I want to
使用shinyjs通过javascript在闪亮的应用程序中操作现有的Leaflet地图

我有一个闪亮的应用程序其中包含现有的传单地图我希望能够在渲染后使用自定义 javascript 通过shinyjs包裹一个最小的例子如下 app R packages library dplyr library leaflet lib
替换因子列中的

我想更换
有什么方法可以访问 makeActiveBinding 安装的函数吗？

标题基本上说明了一切如果我这样做 makeActiveBinding x function runif 2 GlobalEnv x 1 0 7332872 0 4707796 x 1 0 5500310 0 5013099 那我有什么办法
拆分并保存在新的 data.frames 中

我有一个大 data frame 144 列我想将其分成每组 3 列子文件或子 data frame 然后将子 data frame 保存在单独的文件中换句话说 file1 将包含从 1 到 3 的列 file2 将包含从 6 到 9
使用正则表达式匹配以“Id”结尾的单词？

如何组合一个正则表达式来匹配以 Id 结尾的单词并进行区分大小写的匹配试试这个正则表达式 w Id b w 允许前面的单词字符Id和 b确保Id位于单词末尾 b是字边界断言
在字符串内打印单引号

我想输出 XYZ s ABC 我在Python IDLE中尝试了以下3条语句第一条和第二条语句输出 a before 带打印功能的第三条语句不输出 before 作为 Python 新手我想了解为什么之前输出在第 1 条和第 2 条
是否有 R 函数可以将这些数据从长形重塑为宽形？

数据现在看起来如何 Coach ID Student score 1 A 8 1 B 3 2 A 5 2 B 4 2 C 7 看起来像这样 Coach ID Student score student 2 score 2 student 3
dplyr::mutate 添加多个值

网上有几个与此相关的问题dplyr Github 存储库 https github com hadley dplyr已经并且至少有一个相关的问题但没有一个问题完全涵盖了我的问题我认为在 dplyr mutate 调用中添加多列 ht

随机推荐

手动获取 AuthenticationManager 实例

我正在尝试实现以下内容但我的authenticationManager 实例抛出以下异常并且未自动装配如何从 Spring 手动获取它的实例我没有使用 Spring 控制器而是使用 JSF 请求作用域 bean 当容器尝试自动装配a
在 Play 2 路由中处理自由格式 GET URL 参数

假设我有一个可以选择接受两个参数的操作 def foo name String age Integer Action name age can both be null if not passed 我如何设置我的route文件以使用以下任何
Seaborn 箱线图：类型错误：/ 不支持的操作数类型：“str”和“int”

我尝试像这样制作垂直的seaborn箱线图 import pandas as pd df pd DataFrame a a b b a b 5 6 4 3 import seaborn as sns import matplotlib py
聚合、关联和组合[重复]

这个问题在这里已经有答案了我有一个这样简单的例子 public class Order private ArrayList
关于 iPhone 中的环境光传感器

提前致谢我从以下网站获得了有关 iphone 传感器的信息http ipod about com od ipodiphonehardwareterms qt iphone sensors htm 但我没有得到有关如何在 iPhone 中使
解码 WAV 文件头

我正在尝试理解 WAV 文件的标头我打开了一个示例文件并得到了这个 5249 4646 e857 1400 5741 5645 666d 7420 1000 0000 0100 0200 44ac 0000 10b1 0200 0400
在Android中保存之前处理首选项的值？

我需要先加密我的密码然后再将其保存到本地 Android 数据库没有加密一切都工作正常我有preferences xml等等我怎样才能调用一个函数after我更改首选项值例如密码这是我的代码 public class Prefe
自动映射器映射到可为空的 DateTime 属性

使用 Automapper 3 1 1 我无法编译此地图 Mapper CreateMap
省略号用于截断长文本

我正在使用省略号概念来截断 HTML 中的长文本我已成功截断该句子但不会出现在我的 HTML 中我将以下内容用于CSS 输出似乎很好即对于测试测试测试测试测试测试测试测试输出是测试测试测试当我真的想要它作为测试测试测试时 d
从 Hyperledger Fabric Node SDK 中的 InvokeChaincode() 函数获取链码调用方 ID

我们假设以下网络架构 A gt 链码1 gt fabcar A是应用程序链码1是 Go 中的链码fabcar是 Nodejs 中的链代码他们在同一频道 mychannel 何时执行操作APIstub InvokeChaincode来自链
保存到用户图库/从用户图库获取 JPEG，无需重新压缩

我正在尝试找到一种方法来读取 JPEG 图像并将其写入用户图库相机胶卷而无需 iOS 重新压缩它们 UIImage 似乎是这里的瓶颈我发现的保存到用户图库的唯一方法是 UIImageWriteToSavedPhotosAlbum 有没
如何使用向量或数据帧在 RNeo4j 中创建节点

流行的图数据库Neo4j可以在以下范围内使用R感谢包驱动程序RNeo4j https github com nicolewhite Rneo4j 包作者妮可怀特提供several 很好的例子其使用情况GitHub 对我来说不幸的是
如何使用 JavaScript 读取和写入文件？

有人可以提供一些使用 JavaScript 读写文件的示例代码吗为了完整起见 OP 没有声明他希望在浏览器中执行此操作如果他是如前所述通常是不可能的然而 javascript 本身确实允许这样做可以使用服务器端 javascri
QueryDSL 注释处理器和 gradle 插件

无法理解如何配置 build gradle 以在没有任何 jpa jdo mongo 的情况下使用 querydsl 注释处理器我想使用 QueryEntity 注释来生成 Q 类这样我就能够使用 DSL 支持编写动态 SQL 查询然
在 .NET 3.5 SP1 上使用 EF 4

我在 Visual Studio 2010 RC 中使用最新的 EF 4 位并爱上了它但是我必须使用 NET 3 5 SP1 VS 2008 开发一个小型 Web 应用程序我想知道是否可以以某种方式在 NET 3 5 SP1 VS 2
std::array 中的大括号省略

我正在编译使用g 对于 C 17 我有以下内容 std array
NotificationListenerService：getActiveNotifications 上出现 NullPointerException

我正在尝试根据本教程在我的应用程序中实现NotificationListenerService http www kpbird com 2013 07 android notificationlistenerservice html 但我在
历史流量数据API？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案有人知道历史流量数据的公共 API 吗一些快速谷歌搜索从雅虎提取了一个提供实时数据的API 但我很好奇是否有人托管历史数据服务即严重性雅虎A
BeautifulSoup 和按类别搜索[重复]

这个问题在这里已经有答案了可能的重复如果对象还有其他类 Beautiful Soup 也找不到 CSS 类我正在使用 BeautifulSoup 来查找tables在 HTML 中我目前遇到的问题是使用空格class属性如果我的
通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列

我试图将一个相当混乱的列分成两列其中包含period and 描述我的数据类似于下面的摘录 set seed 1 dta lt data frame indicator c someindicator2001 someindicator

通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列

期望的结果

特征

Code

其他尝试

通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列 的相关文章

随机推荐

热门标签

通过 dplyr 在第一个遇到的数字上使用分离 (tidyr) 来分隔列的相关文章