根据特定值创建新变量

2024-01-11

我阅读了正则表达式和 Hadley Wickham 的stringr and dplyr包，但不知道如何让它工作。

我在数据框中保存了图书馆流通数据，索书号作为字符变量。我想将最初的大写字母作为一个新变量，并将字母和句点之间的数字作为第二个新变量。

Call_Num
HV5822.H4 C47 Circulating Collection, 3rd Floor
QE511.4 .G53 1982 Circulating Collection, 3rd Floor
TL515 .M63 Circulating Collection, 3rd Floor
D753 .F4 Circulating Collection, 3rd Floor
DB89.F7 D4 Circulating Collection, 3rd Floor

使用stringi包，这将是一种选择。由于你的目标停留在字符串的开头，stri_extract_first()会工作得很好。[:alpha:]{1,}表示包含多个字母的字母序列。和stri_extract_first()，您可以识别第一个字母序列。同样，您可以使用以下命令找到第一个数字序列stri_extract_first(x, regex = "\\d{1,}").

x <- c("HV5822.H4 C47 Circulating Collection, 3rd Floor",
       "QE511.4 .G53 1982 Circulating Collection, 3rd Floor",
       "TL515 .M63 Circulating Collection, 3rd Floor",
       "D753 .F4 Circulating Collection, 3rd Floor",
       "DB89.F7 D4 Circulating Collection, 3rd Floor")

library(stringi)

data.frame(alpha = stri_extract_first(x, regex = "[:alpha:]{1,}"), 
           number = stri_extract_first(x, regex = "\\d{1,}"))

#  alpha number
#1    HV   5822
#2    QE    511
#3    TL    515
#4     D    753
#5    DB     89

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

r

dplyr

stringr

根据特定值创建新变量的相关文章

R中具有特定条件的多列变异

我有这个数据 M1 M2 M3 UCL 1 2 3 1 5 我想在这种情况下创建新列如果M1大于UCL MM1将为 UP 否则为 NULL 如果M2大于UCL MM2将为 UP 否则为 NULL 如果M3大于UCL MM3将为 UP 否则
如何对范围内的行进行分组并考虑第三列？

我有一个遗传数据集我想对基因组中物理上靠近的遗传变异行进行分组我想对每条染色体基因组中某些点范围内的基因进行分组 chrom 我的点数据集包含变体行需要在一定范围内的位置如下所示 chrom low high 1 500 17
正则表达式 - 从行首和行尾修剪空格[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions Link
R ggplot2 分面保持比率但覆盖/定义输出图大小

我目前正在使用 ggplot2 来比较不同组的统计数据每个组属于不同的区域这是通过运行 R 脚本的 Web 应用程序 tikiwiki CMS 插件 R 完成的每个区域我可以有 2 到 30 个或更多组相同的 R 脚本针对唯一网页中
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
Matlab 中是否有相当于 R 的 dput() 的函数？

Matlab 中是否有相当于 R 的 dput 的函数 dput 将 R 对象的 ASCII 文本表示形式写入文件或连接 UPDATE 1 添加了递归和对单元格的支持 UPDATE 2 添加了对结构的支持 UPDATE 3 增加了对逻辑整
是否可以使用 Eclipse 的正则表达式搜索和替换转换为小写？

我已经尝试过 L 但它似乎不是其语法的一部分并且它的帮助没有提及任何可用的转换我知道我可以并且知道如何从命令行执行此操作但是是否可以使用 Eclipse 的正则表达式搜索和替换进行大小写转换您可以分两步完成首先插入小写字母那么
如何构建印度尼西亚电话号码正则表达式

这些是一些印度尼西亚的电话号码 08xxxxxxxxx 至少包含 11 个字符长度 08xxxxxxxxxxx 始终以 08 开头我发现这个很有用 Regex regex new Regex 08 0 9 0 9 0 9 0 9 0 9
SparkR 和 Sparklyr 之间导入 parquet 文件所需的时间差异

我正在使用 databricks 导入镶木地板文件SparkR and sparklyr data1 SparkR read df dbfs data202007 source parquet header TRUE inferSchema
如何使用 Perl 和正则表达式将 SQL 文档转换为 ColdFusion 脚本？

我需要将 SQL 语句文档转换为 ColdFusion 文档我对正则表达式只有一点经验而且我是 Perl 超级新手我昨天刚刚自学了它的基础知识所以我可以完成这项任务我正在尝试用 Perl 编写的脚本匹配和替换模式该脚本保存为 B
如何在R中安装pivot_long()和pivot_wide()

如果您想尝试这些新功能 pivot wide and pivot long 需要安装开发版tidyr devtools install github tidyverse tidyr 但我还没有实现它我安装了一系列库除了一个之外 vctr
R 中舍入到下一个数量级的算法

如果标题不清楚我很抱歉但我无法简洁地解释它给定一个浓度向量我想将最大值四舍五入到下一个数量级即 345 到 1000 另外我想将最小值四舍五入到较低的数量级即 3 2 到 1 这些浓度也可能低于 1 因此例如 0 034 需要
如何在有条件的情况下获得R中多列的中位数（根据另一列）

我是 R 初学者我想知道如何完成以下任务我想用数据集所有列的中位数替换数据集的缺失值但是对于每一列我想要某个类别的中位数取决于另一列我的数据集如下 structure list Country structure 1 5 La
除了使用正则表达式之外，在 Swift 中解析 HTML

下面是我想在 Swift 中解析的 HTML 代码 td class pinyin a href rsc audio voice pinyin pz yi1 mp3 span class mpt1 y span a a href rsc a
Rcpp 包不包含 Rcpp_precious_remove

我一直在尝试创建数据库并安装 DBI 包但仍然遇到此错误我重新安装了 DBI 和 RSQLite 软件包但它们似乎不起作用 library DBI con lt dbConnect RSQLite SQLite dbname memo
xtable 中的 Cox 回归输出 - 选择行/列并添加置信区间

我不想将 cox 回归的输出导出到一个表中然后将其放入我的文章中我想最好的方法是使用 xtable library survival data pbc fit pbc lt coxph Surv time status 2 age ed
R ggplot：加权 CDF

我想使用绘制加权 CDFggplot 一些旧的非 SO 讨论例如this https stat ethz ch pipermail r help 2012 October 337288 html从 2012 年起建议这是不可能的但我想
在 jQuery 选择器上使用正则表达式查找基于 ids 的所有元素

我有几个具有唯一 id 的元素如下所示 div div div div div div 我希望使用 jQuery 可以实现以下功能 item top each function this hide 我对正则表达式没有很好的掌握希望得到一
R 中的 aov() 错误术语：bw Error(id) 和 Error(id/timevar) 规范有什么区别？

两者有什么区别aov depvar timevar Error id 和aov depvar timevar Error id timevar 配方规格这两种变体产生略有不同的结果同样的问题曾经在这里被问过 https stats st
消除垂直线ggplot

这个问题以前曾被问过但答案并不总是明确或很复杂我希望 ggplot2 的新版本能够带来更简单的解决方案如何仅消除 ggplot 的垂直线而不消除轴刻度线或标签这对于条形图来说确实很好因为它可以消除图形中一些不必要的干扰这里有一些

随机推荐

如何抓取受 cloudflare 保护的网站

所以我正在努力刮https craft co tesla https craft co tesla 当我从浏览器访问时它可以正确打开但是当我使用 scrapy 时它会获取该网站但是当我查看响应时 view response 它显示
何时使用 Javascript 对象文字

何时应该在 javascript 中使用对象文字有时我会感到困惑因为我试图将 oop 概念和模式应用到该语言中我尝试不仅仅使用过程编程概念因为我知道该语言具有惊人的功能对象字面量最常用作一种关联数组和一种将多个参数传递给函数
Angular2获取被点击的元素id

我有这样的点击事件
Firebase 响应太慢

大家好我正在使用 Firebase 实时数据库为我的 React js Web 应用程序获取一些数据有一个useState called Corr User应该存储正确用户名的值我有一个function从 Firebase 获取用户名
变量值列表的 Tensorflow 特征列

从 TensorFlow 文档中可以清楚地了解如何使用tf feature column categorical column with vocabulary list创建一个特征列它将一些字符串作为输入并输出一个单热向量例如 voca
将对象从 Fragment 传递到 Activity

问题如何将对象从片段传递到活动根据活动的请求背景我正在使用 Android Studio 并通过新建 Android 活动向导设置了一个新的选项卡式活动然后我定义了 5 个片段每个片段包含不同的输入集编辑文本等然后每个
链接到适用于 Android 的工作 webRTC 库

Google Play 最近几天有一个关于我使用的 WebRTC 库的新错误警告我使用这个库将近一年了 google webrtc 1 0 32006 aar 我的应用程序仍然可用但他们要求更新库这通常意味着他们将来会阻止使用该库的
如何清除实体框架 ICollection 中的所有元素？

我在使用 Clear 从实体框架中的集合中删除所有元素时遇到问题考虑经常使用的博客和帖子示例 public class Blog public int Id get set public string Name get set publi
无法在 asp.net 母版页文件中放置断点

我有一个 MVC Web 应用程序我在下面的第 16 行中收到对象引用未设置为对象实例错误这是一个母版页文件当我尝试在该行或文件中的任何位置放置断点时出现这不是断点的有效位置错误我已经单击了每一行但无法放置一个断点我确
StudentSubmissions.Patch UpdateMask 错误

尝试在 Google Apps 脚本中使用 Classroom API 的 StudentSubmissions Patch 部分并继续运行时遇到此错误 updateMask updateMask 只能包含 draftGrade 或指定等
如何将 include/lib 目录添加到 MSVC 2015 解决方案中的所有项目？

我有一个很大的解决方案在每个项目中添加更改包含目录非常繁琐是否可以一步为所有项目设置公共包含文件夹 Thanx 不直观的第一步是在解决方案资源管理器窗口中选择多个项目如有必要请先折叠项目节点单击第一个项目然后按住 Shif
svn错误413请求实体太大的原因是什么？

有时我在更新 svn 存储库时收到错误 413 请求实体太大一旦收到此错误每次我尝试更新本地工作副本时都会继续出现此错误新的结账方式可以解决问题但是很不方便该项目超过 30 GB SVN 存储库托管在外部过去这种情况在多台不
MySQL 表中的最大列数[重复]

这个问题在这里已经有答案了我对 MySQL 还很陌生我有几个问题 1 有多少最多个可以在 MySQL 表中创建列 2 有多少最大数量可以在 MySQL 数据库中创建许多表 1 每个表大约有 4 096 列 2 mySQL有数
如何在android中显示欢迎屏幕？

您好我想要一个带有我的徽标的屏幕该屏幕应显示 2 3 秒然后应进入主程序我怎样才能实现这个这是一个简单的splashScreen实现 public class SplashScreen extends Activity priva
x86/x64 添加位移寻址

我正在为 x86 x64 CPU 指令编写一个编译器但我似乎无法弄清楚人们所说的位移地址是什么意思例如添加指令详细信息如下 http www c jump com CIS77 CPU x86 X77 0150 encoding a
动画搜索栏进度

我的屏幕有 4 个搜索栏如下图所示如果用户移动 B C 或 D 我计算三者的平均值并将 A 的进度设置为平均值这是最容易的部分我想做的是为进度条 A 设置动画使其不会一次性跳跃例如从 25 75 为 A 制作动画的推荐方法是什么
如何使用异步方法对 ViewModel 进行单元测试。

我不知道从哪里开始但让我简要介绍一下我现在的处境以及我想要实现的目标我对 MVVM 上的单元测试相当陌生并且在测试使用 PRISM 委托命令属性公开的命令时遇到困难我的委托命令调用必须等待的异步方法以便我可以获得实际结果下面是我
无法获取httpResponse内容

我没有设法从 android 模拟器查询 Web 服务之前我有一个 UnresolvedHostException 但这没关系现在我可以更进一步了我在 HttpResponse 的实体中没有返回任何内容长度为 1 String ur
从 pandas 数据框索引创建列

我有一个数据框我想将索引第一级中的数据转换为列实际上我的 df 看起来像这样 col1 CoI AK 0 1 1 31 2 NaN BB 0 5 1 31 2 NaN 我想把它变成这样 col1 CoI 0 1 AK 1 31 AK
根据特定值创建新变量

我阅读了正则表达式和 Hadley Wickham 的stringr and dplyr包但不知道如何让它工作我在数据框中保存了图书馆流通数据索书号作为字符变量我想将最初的大写字母作为一个新变量并将字母和句点之间的数字作为第二个新

根据特定值创建新变量

根据特定值创建新变量 的相关文章

随机推荐

热门标签

根据特定值创建新变量的相关文章