删除字符串末尾的下划线和数字

2023-12-19

我正在使用一个包含带有一些下划线的列的数据集。有一个图案，但它们是不同的图案，如下所示

  ID     Col1
  1029   ap_analog
  2334   critical_1_mm_1
  2334   transpose_2_mm_2
  9877   public_1_yes_0_no_1
  9877   public_1_yes_0_no_2
  1333   Lateral_mm
  1333   Lateral_mm_1
  1333   Lateral_mm_2
  1333   Lateral_mm_3
  1333   ap_mm_axial
  1333   ap_mm_axial_1
  1333   ap_mm_axial_2
  1333   ap_mm_axial_3
  9876   central_star_six_mm
  9876   central_star_six_mm_1
  9876   central_star_six_mm_2
  9876   central_star_six_mm_3

我只是想用这样的最终数据集将数字与字符串分开

  ID     Col1                     Index
  1029   ap_analog                0
  2334   critical_1_mm            1
  2334   transpose_2_mm           2
  9877   public_1_yes_0_no        1
  9877   public_1_yes_0_no        2
  1333   Lateral_mm               0
  1333   Lateral_mm               1
  1333   Lateral_mm               2  
  1333   Lateral_mm               3
  1333   ap_mm_axial              0
  1333   ap_mm_axial              1
  1333   ap_mm_axial              2
  1333   ap_mm_axial              3
  9876   central_star_six_mm      0
  9876   central_star_six_mm      1
  9876   central_star_six_mm      2
  9876   central_star_six_mm      3

现在我做这件事效率很低。像这样的东西

df1$index <- df1$Col1

for(i in 1:3) {
  df1$index <-  regmatches(df1$index,gregexpr("(?<=_).*",df1$index,perl=TRUE))
}

df1$index[ which(df1$index == "character(0)")] <- 0

如果有任何改进的建议，我将不胜感激。

一种方式使用dplyr and stringr :

我们可以提取Indexvalue 是末尾的数字Col1，更换NA值为 0。我们可以删除最后一位数字Col1.

library(dplyr)
library(stringr)

library(dplyr)
df %>%
  mutate(Index = str_extract(Col1, '\\d+$'), 
         Index = replace(Index, is.na(Index), 0), 
         Col1 = sub('_\\d+$', '', Col1))

#    ID                Col1 Index
#1  1029           ap_analog     0
#2  2334       critical_1_mm     1
#3  2334      transpose_2_mm     2
#4  9877   public_1_yes_0_no     1
#5  9877   public_1_yes_0_no     2
#6  1333          Lateral_mm     0
#7  1333          Lateral_mm     1
#8  1333          Lateral_mm     2
#9  1333          Lateral_mm     3
#10 1333         ap_mm_axial     0
#11 1333         ap_mm_axial     1
#12 1333         ap_mm_axial     2
#13 1333         ap_mm_axial     3
#14 9876 central_star_six_mm     0
#15 9876 central_star_six_mm     1
#16 9876 central_star_six_mm     2
#17 9876 central_star_six_mm     3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

regex

string

datacleaning

删除字符串末尾的下划线和数字的相关文章

用表达式分割轴标签

我有一个带有包含表达式的长标签的图我想将其分成两行在表达式中添加 n 结果不符合预期 ylabel lt expression A very long label with text and n expression alpha bet
使用大矩阵操作

我必须使用 big matrix 对象并且无法计算某些函数让我们考虑以下大矩阵 create big matrix object x lt as big matrix matrix sample 1 10 20 replace TRUE
融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
用于字数计算的 Swift String 中的字数

我想做一个程序来找出字符串中有多少个单词用空格逗号或其他字符分隔然后把总数加起来我正在制作一个平均计算器所以我想要数据总数然后将所有单词相加 update Xcode 10 2 x Swift 5 或更高版本使用基础方法enu
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
正则表达式最多匹配五个单词

我有一个正则表达式 a zA Z 0 9 1 5 它验证该单词包含字母数字字符和少数特殊字符并且长度不应超过5人物如何使此正则表达式接受最多五个与上述正则表达式匹配的单词 a zA Z 0 9 1 5 s a zA Z 0 9 1 5
Word通配符搜索的正则表达式查找包含至少3个连续数字的括号

在以下示例中 airspeed AS user 104A 104B device 101 vehicles 105A C 搜索应该找到 104A 104B 101 and 105A C 但不是 AS 我尝试使用 0 9 0 9 0 9 但这
Rust 编程竞赛中最快的惯用 I/O 例程？

我的问题已部分得到解答因此我根据从评论和其他实验中学到的知识对其进行了修改总之我想要一个用于编程竞赛的快速 I O 例程其中使用单个文件解决问题无需外部包它应该从一个以空格分隔的标记序列中读取BufRead 标准输入或文件标记
Golang中按长度分割字符串

有谁知道如何在 Golang 中按长度分割字符串例如每 3 个字符分割 helloworld 那么理想情况下它应该返回一个 hel low orl d 数组或者一个可能的解决方案是在每 3 个字符后附加一个换行符所有的想法都非常感
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
正则表达式获取字符串中的第一个数字和其他字符

我是正则表达式的新手想知道如何才能只获取字符串中的第一个数字例如100 2011 10 20 14 28 55 在这种情况下我希望它返回100 但该数字也可以更短或更长我在想类似的事情 0 9 但它单独获取每个数字 100 2001
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
Perl 正则表达式图灵完备吗？

我见过 Ruby 和 Perl 程序员做了一些事情复杂的代码挑战 https codegolf stackexchange com questions 3596 regex validating regex完全用正则表达式这前瞻和后瞻 h
警告消息 - 来自 dummies 包的 dummy

我正在使用 dummies 包为分类变量生成虚拟变量其中一些变量具有两个以上类别 testdf lt data frame A as factor c 1 2 2 3 3 1 B c A B A B C C C c D D E D D E
扩展 RegExp 以获取文件扩展名

我知道已经有很多基于 RegExp 的解决方案但是我找不到适合我需求的解决方案我有以下函数来获取 URL 的各个部分但我还需要文件扩展名 var getPathParts function url var m url match w
XSL字符串多重替换功能

如何让这个函数进行多重替换经验替换aaa with 111并替换bbb with 222 etc
绘制 Cox 回归的 Kaplan-Meier 图

我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率添加协变量 A B 和 C 只是为了避免混淆即年龄性别种族但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t

随机推荐

C++ 中有“byte”数据类型吗？

如果存在是否需要包含头文件此代码会导致编译错误 int main byte b 2 error 不没有所谓的类型 byte 在 C 中你想要的是unsigned char 或者如果您正好需要 8 位 uint8 t from
从 Fortran 中读取 C++“Hello World”

我正在尝试验证一个用 c 编写的简单的 hello world 函数可以从 FORTRAN 脚本 gfortran 4 9 20 调用我对 c 和 FORTRAN 都没什么经验所以我认为这是我应该开始的 code cpp include
使用 ImageView 快速连续显示多张图像

我有一个应用程序在一个窗口中有一个 NSImageView 用户应该能够将任何文件文件夹不仅仅是图像拖放到图像视图中因此我对 NSImageView 类进行了子类化以添加对这些类型的支持我选择 NSImageView 而不是普
如何使用 Unix join 获取外连接中的所有字段？

假设我有两个文件 en csv and sp csv 每个包含恰好两个逗号分隔的记录 en csv 1 dog red car 3 cat white boat sp csv 2 conejo gris tren 3 gato blanco
如何将一个文档中的数组值映射到另一个文档并显示在结果中

我是 Couchbase 的新手已经尝试了几个小时了已查看文档但无法找到这个特定场景我的存储桶中有文档 type order order id 1 products product id 1 qty 10 product id 2 q
返回具有最大子文档的文档

我试图根据日期值返回一个包含最大子文档的文档到目前为止我能够创建正确的对象但是查询返回所有子文档而不是具有最大日期的子文档例如我的数据存储为 value 1 id 5cb9ea0c75c61525e0176f96 name Tes
如何在django中故意返回404页面

我在 django 中制作了自定义 404 页面我正在尝试故意获取 404 错误页面 myproject urls py from website views import customhandler404 customhandler50
HttpClient 4 - 如何捕获最后的重定向 URL

我有相当简单的 HttpClient 4 代码它调用 HttpGet 来获取 HTML 输出 HTML 返回脚本和图像位置均设置为本地例如 img src images foo jpg 所以我需要调用 URL 将它们变成绝对 img
如何更改清理作业的 cdc 保留值？

我正在 asp net mvc2 应用程序上实现日志记录功能该应用程序使用 SqlServer2008 作为数据库使用实体框架作为数据模型我启用了 Sql Server 的 CDC 功能其日志记录更改得很好但我刚刚注意到一些旧的日
在 OSX Mavericks 上的 R 中安装 rjags

我正在尝试在 R 中安装包 rjags 但遇到以下错误 Loading required package rjags Error onLoad failed in loadNamespace for rjags details call d
Square 随机数代表什么？

我正在尝试向 Square 提交付款但不确定该付款是什么card nonce代表完整的 API 文档在这里 https docs connect squareup com api connect v2 endpoint createcu
反转 DataFrame 列顺序

我想简单地反转给定 DataFrame 的列顺序我的数据框 data year 2010 2011 2012 2011 2012 2010 2011 2012 team Bears Bears Bears Packers Packers
使用 spring-hateoas 反序列化包含（_links 和 _embedded）的 JSON

我正在尝试调用非常简单的 json Web 服务返回这种形式的数据 embedded users identifier 1 firstName John lastName Doe links self href http localhos
Mongodb类型参考节点

我正在尝试引用节点模型中的另一个对象 User new Schema username type String index unique true Idea new Schema Creator type User 但我收到这个错误Unde
无法从按钮 onclick 事件 ASP.NET 4 调用 Javascript 函数

每当我调用 JavaScript 函数时asp button onclick事件我收到此错误消息 HTML
Android：如何将一个菜单 xml 包含在另一个菜单 xml 中？

简单的问题我有我的子项目菜单 menu menu
权限问题：如何在 docker for windows 上设置权限以与 Wordpress 一起使用

问题 I m trying to setup my developing environment using Docker for Windows for use with Wordpress I m using docker compos
如何在所有测试文件之前运行 Jasmine

我正在使用 Nodejs 为我们的 API 创建端到端测试套件在每个测试运行之前我需要插入该测试的数据库记录许多有问题的表不使用本机自动增量类型字段作为其主键我知道数据库设计不好但我无法控制相反他们使用 postgresql
在二叉树中查找共同祖先

在一次采访中有人问我这个问题我有一个二叉树我必须在给定该树的两个随机节点的情况下找到共同祖先父级我还得到了一个指向根节点的指针我的回答是分别遍历树的两个节点直到到达预期的节点并行遍历时将元素和下一个地址存储在链表中那么我们
删除字符串末尾的下划线和数字

我正在使用一个包含带有一些下划线的列的数据集有一个图案但它们是不同的图案如下所示 ID Col1 1029 ap analog 2334 critical 1 mm 1 2334 transpose 2 mm 2 9877 publi

删除字符串末尾的下划线和数字

删除字符串末尾的下划线和数字 的相关文章

随机推荐

热门标签

删除字符串末尾的下划线和数字的相关文章