仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它

2024-02-28

我正在将一系列调查导入为 .csv 文件并组合成一个数据集。问题在于七个文件之一的某些变量的导入略有不同。数据集很大，我想找到一种方法来编写一个函数来运行给我带来麻烦的数据集。

在某些变量中，应该有点的时候却有下划线。并非所有变量都具有相同的格式，但不正确的变量是，因为下划线始终是列名的第六个元素。

我希望 R 查找第 6 个元素，如果它是下划线，则将其替换为点。下面是一个虚构的例子。

col_names <- c("s1.help_needed",
               "s1.Q2_im_stuck",
               "s1.Q2.im_stuck",
               "s1.Q3.regex",
               "s1.Q3_regex",
               "s2.Q1.is_confusing",
               "s2.Q2.answer_please",
               "s2.Q2_answer_please",
               "s2.someone_knows_the answer",
               "s3.appreciate_the_help")

我认为这个问题有一个正则表达式的答案，但我正在努力寻找一个。也许还有一个 tidyr 答案？

正如 @thelatemail 指出的，您的数据实际上没有在第五个位置有下划线，但有些数据在第六个位置有下划线（其他数据有点）。基本 R 方法是使用gsub():

result <- gsub("^(.{5})_", "\\1.", col_names)

> result
 [1] "s1.help_needed"              "s1.Q2.im_stuck"             
 [3] "s1.Q2.im_stuck"              "s1.Q3.regex"                
 [5] "s1.Q3.regex"                 "s2.Q1.is_confusing"         
 [7] "s2.Q2.answer_please"         "s2.Q2.answer_please"        
 [9] "s2.someone_knows_the answer" "s3.appreciate_the_help"

这是正则表达式的解释：

^         from the start of the string
(.{5})    match AND capture any five characters
_         followed by an underscore

括号中的数量称为capture组并可以通过以下方式用于替换\\1。因此，正则表达式表示将前六个字符替换为我们捕获的五个字符，但使用点作为第六个字符。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

regex

string

tidyr

仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它的相关文章

stat_function 从函数生成平线

我有以下代码 library ggplot2 f lt function x if x gt 2 1 x 0 3 else 0 graph lt ggplot data frame x c 0 10 aes x graph lt graph
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
如何有效地将多个光栅 (.tif) 文件导入 R

我是 R 新手尤其是在空间数据方面我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中所有文件都存储在同一文件夹中不确定这是否重要但请注意在我的 Mac 和 Windows 并行 VM 上的文件夹
正则表达式将单词的开头和结尾与元音匹配

我正在尝试以下操作Regex aeiou aeiou 但它不起作用我测试了 abcda 并且不匹配它应该只是 aeiou aeiou 额外的您需要第二个字符是一个文字点例如 a hello 但由于您的测试用例 abcda 不包含这样
将所有分号替换为空格 pt2

我尝试对 2000 多行关键字的列表运行文本分析但它们的列出方式如下战略管理风格组织所以当我使用 tm 删除标点符号时它就变成了组织的战略管理风格我认为这在某种程度上破坏了我常用术语的分析我尝试过使用 vector lt
如何使用 PHP 从内容中查找 URL？

需要一个简单的 preg match 它将在内容中查找 c aspx 不带引号如果找到它将返回整个 url 举个例子 content div 4 a href m c aspx mt 01 9310ba801f1255e02e411d8
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
在`rmarkdown`中，如何在句子中添加图标？

In rmarkdown 如何在句子中添加图标例如如下如何添加markdown icon单词 Markdown 和 is 之间有一个很好的 R 包可以轻松下载 RMarkdown 文档并将图标添加到其中 icons https gi
从另一列的子字符串创建列

我有一个 Pandas 数据框对象我想从现有列的子字符串创建新列我的数据如下所示 Date variable want1 want2 want3 0 02 01 08 Australia Sydney A Australia Sydne
匹配括号内任何字符的正则表达式

尝试创建一个与括号内的任何字符匹配的正则表达式我的正则表达式模式是这样的 preg match listanswer answer 括号内的所有字符串都是匹配模式但问题是当我尝试匹配例如 this word sample data 它
如何在基数 R 中进行分组

我想使用以下 SQL 查询来表达base R 没有任何特定的包 select month day count as count avg dep delay as avg delay from flights group by month d
测量两个字符串之间相似性的有效方法是什么？（编辑距离使堆栈太深）

所以我从这个开始 http en wikibooks org wiki Algorithm Implementation Strings Levenshtein distance Ruby http en wikibooks org wi
十六进制字符串的运行长度编码（包括换行符）

我正在使用以下方法实现游程长度编码GZipStreamC winforms 应用程序中的类数据以一系列由换行符分隔的字符串形式提供如下所示 FFFFFFFF FFFFFEFF FDFFFFFF 00FFFFFF 在压缩之前我将字符串转
修改linux下的路径

虽然我认为我已经接近 Linux 专业人士但显然我仍然是一个初学者当我登录服务器时我需要使用最新版本的R 统计软件 R 安装在 2 个地方当我运行以下命令时 which R I get usr bin R 进而 R version
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
REGEXP_REPLACE - 仅当包含在 () 中时才从字符串中删除逗号

我在 oracle 论坛网站找到了一个例子输入字符串 a b c x y z a xx yy zz x WITH t AS SELECT a b c x y z a xx yy zz x col1 FROM dual SELECT t c
通过 Shiny 中的串扰将 Plotly 与 DT 结合使用

我正在编写一个应用程序来将 csv 文件读取为闪亮的并将散点图与 DT 表链接起来我几乎遵循了 Plotly 网站上 DT 数据表上的示例 https plot ly r datatable https plot ly r datatab
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p

随机推荐

如何更改 Android 中 Activity 的标题？

我在用 Window w getWindow w setTitle My title 更改我当前活动的标题但它似乎不起作用谁能指导我如何改变这个尝试单独使用 setTitle 如下所示 setTitle Hello StackOver
将 OSGi 包分组以形成一致的“应用程序”的最佳方式是什么

OSGi 方式是开发包含离散的连贯的功能块的单独的包有时这些包包含实用程序类有时它们依赖于实用程序类并设置自己的 OSGi 服务另一方面用户不太可能接触到捆绑包他们更关心的是应用一个执行任务或解决问题的软件通常应用程序将
如何获取 LINQPad 中列出的 SQL Express 数据库的连接字符串？

有没有一种简单的方法可以获取 LINQPad 连接窗口中列出的数据库的连接字符串除了使用 Visual Studio 的对象资源管理器 Making sgmoore https stackoverflow com users 125759
重新绘制留下的痕迹

我知道这不是第一次问这个问题但回答对我没有多大帮助所以我正在帮助我终于得到答案我制作了这个小游戏让汽车绕着轨道行驶必须使用矩形当我使用repaint 方法代表汽车的矩形在新位置重新绘制但留下一条痕迹我有这个代码 import
如何使用python在hadoop中保存文件

问题我开始学习hadoop 但是我需要使用python将很多文件保存到其中我似乎无法弄清楚我做错了什么谁能帮我这个下面是我的代码我觉得HDFS PATH是正确的因为我在安装时没有在设置中更改它这pythonfile txt在
什么是覆盖事务超时的注释？

EE 新手尝试重新配置 Weblogic 的默认超时 30 秒而不必编写 weblogic ejb jar xml 文件我现在只使用了注释但我看到的唯一内容是在 DD 中
jQuery 从选定的下拉列表中获取 html id [重复]

这个问题在这里已经有答案了由于我的表单中有多个下拉菜单我想从选定的下拉菜单之一检索 HTML id 我的更改下拉菜单有以下代码 select name product type change function 使用时console lo
Rplotly - 绘制分组线

我正在从 ggplot2 迁移到plotly 以便利用它们提供的交互功能我确实意识到plotly库有一个ggplotly函数我可以用它来封装本机ggplot命令但我想学习如何使用本机plotly命令绘制类似的图形我的问题是我似乎无法
自定义 RES 屏幕和 RES 图标已替换为默认的 Cordova 屏幕和图标

我正在使用适用于 Apache Cordova 的 Visual Studio 工具我已经测试了 CLI 6 4 0 不幸的是 RES 屏幕和 RES 图标存在错误如果我使用 CLI 6 3 1 这个问题就会消失为了演示它我从头开始
有没有可以阅读 ePub 书籍的 API？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在尝试为 WP7 创建电子书阅读器到目前为止我还没有找到任何 API 来阅读 ePub 书籍谢谢扎因对于基于 DRM fre
列的数据被截断？

更改 MySql 列的数据类型以存储后Twilio 通话 https www twilio com docs api rest call ids 34 个字符字符串我尝试使用以下命令手动更改该列中的数据 update calls set
如何在带有 View Holder 的自定义 ListView 中使用 Button OnClick

我需要一些帮助我正在使用视图保持器从动态数组适配器显示我有列表视图每行包含标题文本视图副标题 TextView 进度条下载按钮按钮我想在单击下载按钮时显示进度栏并隐藏下载按钮单击第一行的下载按钮时会显示第一个进度条但
如何在glmnet中指定日志链接？

我正在使用 R 中的 glmnet 和 caret 包在广义线性模型上运行弹性网络我的响应变量是成本其中成本 gt 0 因此我想为我的 GLM 指定一个带有日志链接的高斯族然而 glmnet 似乎不允许我指定 link log 如下
freeglut 与 glew 的区别？

我最近开始学习 OpenGL gt 3 3 并且我注意到很多示例和教程都使用 freeglut 和 glew 但根本没有真正解释其中的区别在谷歌搜索和阅读令人作呕的内容之后我发现的最好的描述是这样的OpenGL相关工具包和API htt
无法使用本地 hadoop 连接 azure blob 存储

在尝试连接时本地hadoop与AZURE BLOB存储即使用作为 HDFS 的 Blob 存储和 Hadoop 版本 2 7 1 它抛出异常这里我已经通过设置属性成功形成了本地集群
我可以更新 INT 值 + 1 并返回新值吗？

MySQL PHP 是否可以在一次查询中增加 INT 值并返回新值 sql mysql query UPDATE table SET number number 1 WHERE id uniqid updated number 或者我需要发
SQL Azure 和 Azure 表存储如何比较？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何检查 Ubuntu 上是否正在运行一个我不知道名称的服务

我不知道该服务的名称但想通过检查其状态来停止该服务例如如果我想检查是否PostgreSQL http en wikipedia org wiki PostgreSQL服务是否正在运行但我不知道服务的名称那么如何检查其状态如果服务
如何在 Swift 中分配/释放不安全指针？

在 Beta 4 中我的代码运行良好 var red green blue alpha UnsafePointer
仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它

我正在将一系列调查导入为 csv 文件并组合成一个数据集问题在于七个文件之一的某些变量的导入略有不同数据集很大我想找到一种方法来编写一个函数来运行给我带来麻烦的数据集在某些变量中应该有点的时候却有下划线并非所有变量都具有相同的格

仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它

仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它 的相关文章

随机推荐

热门标签

仅当字符串中的第 n 个字符是 R 中的特定字符时才替换它的相关文章