使用正则表达式拆分列中的值

2023-12-07

我的 data.frame 有两列，如下所示

dat

    ID                             Details                         
    id_1        box1_homodomain gn=box1 os=homo sapiens p=4 se=1   
    id_2        sox2_plurinet gn=plu os=mus musculus p=5 se=3

我想将“详细信息”列中的“os=xxx”和 gn="yyy" 拆分为所有 ID，并按如下方式打印：

    Id   Description        gn      os               
   Îd_1  box1_homodomain    box1    homo sapiens   
   Id_2  sox2_plurinet      plu     mouse musculus

我尝试在 R 中使用 gsub 方法，但无法将 os=homo sapiens 和 gn=box1 拆分到各自的列中。我使用的以下 R 代码

dat$gn=gsub('^[gn=][A-z][A-z]`,dat$Details)
dat$os=gsub('^[os=][A-z][A-z]`,dat$Details)

谁能告诉我出了什么问题以及如何纠正。请帮助我。

提前致谢

这是 tidyr 的一个选项：

library(tidyr)
# specify the new column names:
vars <- c("Description", "gn", "os")
# then separate the "Details" column according to regex and drop extra columns:
separate(dat, Details, into = vars, sep = "[A-Za-z]+=", extra = "drop")
#    ID      Description    gn            os
#1 id_1 box1_homodomain  box1  homo sapiens 
#2 id_2   sox2_plurinet   plu  mus musculus

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

r

split

gsub

使用正则表达式拆分列中的值的相关文章

dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
R中IF函数的使用

我正在短跑ifR 中的函数但收到以下警告消息 In if runif 50 0 1 lt 0 69 the condition has length gt 1 and only the first element will be used
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
ggplot：如何限制条形图中的输出，以便仅显示最频繁出现的情况？

我几个小时以来一直在寻找这个简单的东西但没有结果我有一个数据框其中一列为变量国家地区我想要两件事以下绘制最常见的国家地区最常见的位于顶部找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的
R：如何将字符/数字转为1，NA转为0？

有没有一种简单的方法可以将列的字符数字变为 1 将 NA 变为 0 这里有一些示例数据我想将其应用于 3 4 structure list Item Code c 176L 187L 191L 201L 217L 220L Item x
使用基于 DFA（线性时间）正则表达式捕获组：可能吗？

是否可以使用基于 DFA 的正则表达式实现捕获组同时保持相对于输入长度的线性时间复杂度直觉上我认为不是因为子集构造过程不知道它可能落在哪个捕获组内但这是我第一次意识到这可能是一个潜在的问题所以我不知道是否可以使用基于 DFA 的
如何通过保持目录结构完整来同步路径中匹配模式的文件？

我想将所有文件从服务器 A 复制到服务器 B 这些文件在不同级别的文件系统层次结构中具有相同的父目录名称例如 var lib data sub1 sub2 commonname filetobecopied foo var lib dat
扩展数据框以使其具有与原始行中两列的范围一样多的行[重复]

这个问题在这里已经有答案了我有一个数据框如下 structure list symbol c u n v i a start c 9L 6L 10L 8L 7L end c 14L 15L 12L 13L 11L Names c symb
如何将旋转的 NetCDF 转换回正常的纬度/经度网格？

我有一个带有旋转坐标的 NetCDF 文件我需要将其转换为正常的纬度经度坐标经度为 180到180 纬度为 90到90 library ncdf4 nc open dat nf 对于尺寸它显示 1 5 variables exclu
R 改变构面的顺序

我正在尝试将方面的顺序从 BA SLG 更改为 SLG BA 我发现了与此类似的问题但我认为我的解决方案可能不起作用因为我已经在Excel中汇总了数据因此我的数据框可能会有所不同无论如何我尝试实现这个但无济于事 df2 lt f
R：单纯形错误：在下标赋值中不允许使用 NA

对于以下具有目标函数和约束的最小化 boot simplex返回错误 Error in tab pr lt tab pr tab pr pc pv o tab pr NAs are not allowed in subscripted as
使用正则表达式模式查找 -name 并使用 cp 替换文件名

目前我正在使用该命令cron复制 data从源到目标路径 find source path name data exec cp target path 源码结构为 source path category1 001 data source
HTTR GET 新错误：SSL 证书问题：证书已过期

我已经运行这段代码几个月了没有出现任何问题今天我突然开始在我的两台 AWS 服务器上收到以下错误消息错误 curl curl fetch memory url handle handle SSL证书问题证书已过期当尝试运行以下代码
如何将参数从 Excel/VBA 传递到 Rstudio 中的脚本

我正在尝试使用 Rstudio 从 VBA 打开 R 脚本同时将参数传递给 R 脚本然后我可以使用 commandArgs 访问该脚本该问题与此处描述的问题非常相似 WScript Shell 用于运行路径中包含空格且来自 VBA 的
获取包含矩阵行内最大值的列名称，该矩阵在数组内包含单独的最大值

例如给出 dim1 lt c P PO C T dim2 lt c LL RR R Y dim3 lt c Jerry1 Jerry2 Jerry3 Q lt array 1 48 c 4 4 3 dimnames list dim1 di
将整个包传递给雪簇

我正在尝试并行化使用snow parLapply 一些依赖于包即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群而不必显式命名每个函数包括用户函数调用的
Oracle REGEXP_INSTR() 和“a-z”字符范围与预期不匹配

我想用REGEXP INSTR 在 oracle 数据库中检查小写大写字符我知道 upper and lower POSIX 字符类但我选择了a z这给了我非常奇怪的结果我不明白有人可以解释一下吗 SELECT REGEXP IN
更改绘图区域背景颜色

我想使用我们公司的颜色在 R 中制作一个图表这意味着所有图表的背景应为浅蓝色但绘图区域应为白色我正在寻找答案发现绘制一个矩形就可以完成这项工作几乎然而绘图区域现在是白色的并且图形不再可见这可能吗 getSymbols SP
如何在 javascript 正则表达式中匹配平衡分隔符？

我原以为这个问题是不可能的据我所知 Javascript 的正则表达式既没有递归插值也没有漂亮的 NET 平衡组功能但问题就在那里如问题 12 所示正则表达式 alf nu http regex alf nu 匹配平衡对 lt an

随机推荐

C++ 未声明的标识符错误

我得到一个未声明的标识符错误我不知道为什么我什至重写了完整的内容以确保我没有犯错有人能告诉我为什么会出现这个错误吗我的文件是连接 hpp pragma once include LogicSimulator hpp include
如何使用 thymeleaf 递归渲染菜单

我想使用 ul li 列表呈现 HTML 菜单我有这个类结构 public class MenuItem private String name private MenuItem parent private List
ASP.NET MVC：出现空 ActionLink

我使用默认路由因此不需要指定控制器 routes MapRoute Default action id new controller Home action Index id UrlParameter Optional 有了这个我可以创
在 C 中传递二维指针数组

对于我的程序我需要将一个二维指针数组传递给单独文件中的函数我在下面编写了一个类似语法的文件 include
使用 py2exe 捆绑时导入错误

我使用 py2exe 捆绑了一个用 python 编写的小脚本该脚本使用了许多包其中之一是reportlab 使用 py2exe 捆绑后我尝试运行可执行文件但它返回以下错误 C Python26 dist gt DELchek ex
在Python中调用C函数并返回2个值

我试图弄清楚如何从我在 python 中调用的 C 函数返回 2 个值我已阅读在线材料并使用 struct 输出这两个变量当我在同一个 C 文件中调用此函数时我能够输出变量然而当我尝试在 python 中调用它时它仍然只返回一个
外部存储上应用程序特定文件夹的权限

有人可以解释一下应用程序特定文件夹的权限吗 Android data lt package name gt files 如此处所述http developer android com guide topics data data stora
处理字母数字字符时 ksort 会产生错误的结果
是否可以从获取的 url 而不是规范的 url 中提取元数据？

我有一个像这样的 Facebook 链接到我没有完全控制权的页面我可以修改但不是页面的因此我尝试在我拥有完全控制权的新页面上设置 like 按钮的链接在此页面上设置opengraph元标记并设置一个链接到原始页面的og url 但
如何捕获全局异常？

有没有办法捕捉global代码中的崩溃应用程序异常例如 objc exception throw EXC ARITHMETIC 等我需要它因为我想在应用程序被系统杀死之前做一些事情您可以使用以下方法为任何未捕获的异常设置处理程序
MySQL查询从一个表中获取最佳排名并用另一个表更新结果

我有一个排名板列出了每种性别男性和女性的前 100 个最佳博客我有一个博客表 PRIMARY blogs id users id blogs score blogs score time gender 1 11 2852 2015
如何使用天蓝色连接字符串覆盖本地连接字符串

我在 Net core 项目中使用 appsettings json 作为连接字符串我的连接字符串是 ConnectionStrings OT DB Connection Data Source 108 Initial Catalog O
运行 Composer Laravel 8 时出现 Symfony 进程错误

突然在我的 Laravel 8 项目中我运行了 Composer 来卸载一个依赖项我想重新安装该依赖项只是为了顺序并从头开始我开始抛出这个与 Symfony Process 有关的错误 PHP 致命错误未捕获的类型错误 fclos
如何将每个 DStream 保存/插入到永久表中

我一直面临着 Spark Streaming 的问题关于将输出 Dstream 插入到永恒的SQL 表我想将每个输出 DStream 来自 Spark 处理的单个批次插入到一个唯一的表中我一直在使用 Python 和 Spark 版
在Java中禁用键盘/鼠标

我正在开发一个程序它允许用户锁定计算机这样其他人就不能使用它无论如何我可以禁用鼠标和键盘上的特定键吗谢谢不但是您可以创建让程序锁定屏幕然后使用 MouseMovementListener 以便每次鼠标移动时您都以编程方式将
使用 Javascript 选定单词的索引

如何使用 Javascript 获取 HTML 中选定文本的索引例如在一个 HTML 文件中有如下段落我住在印度印度是一个非常美丽的国家现在如果用户选择India在第一句话中应该有一个alert 5如果用户选择India第二行然
C# lambda 编译成什么？堆栈框架，匿名类型的实例，还是？

C lambda 编译成什么堆栈框架匿名类型的实例还是我读过这个question 这主要回答了为什么在使用隐式类型功能时不能使用 lambda 但是这个问题旨在回答编译器生成什么构造来实际执行 lambda 代码它是匿名类型
使用 Telnet 从 Gmail 发送电子邮件

我正在 Windows 上工作并且启用了 telnet 客户端在cmd提示符下 telnet smtp gmail com 587 220 mx google com ESMTP dk3sm50678627pbc 32 gsmtp He
gulp：如何在不刷新的情况下更新浏览器（仅适用于 css 更改）

我已经设置了 gulp 以便在进行更改时浏览器会重新加载但是对于 css 更改我希望浏览器无需刷新即可更新但我不知道如何执行此操作对于我当前的设置我使用了this教程 var debug require gulp debug c
使用正则表达式拆分列中的值

我的 data frame 有两列如下所示 dat ID Details id 1 box1 homodomain gn box1 os homo sapiens p 4 se 1 id 2 sox2 plurinet gn plu os

使用正则表达式拆分列中的值

使用正则表达式拆分列中的值 的相关文章

随机推荐

热门标签

使用正则表达式拆分列中的值的相关文章