stringr、str_extract：如何进行正向后查找？

2024-01-16

很简单的问题。我只需要使用正则表达式正向查找捕获一些字符串，但我没有找到一种方法来做到这一点。

这是一个例子，假设我有一些字符串：

library(stringr)
myStrings <- c("MFG: acme", "something else", "MFG: initech")

我想提取前缀为“MFG:”的单词

> result_1  <- str_extract(myStrings,"MFG\\s*:\\s*\\w+")
>
> result_1
[1] "MFG: acme"    NA             "MFG: initech"

That almost这样做，但我不想包含“MFG：”部分，所以这就是“积极的向后查找”的用途：

> result_2  <- str_extract(myStrings,"(?<=MFG\\s*:\\s*)\\w+")
Error in stri_extract_first_regex(string, pattern, opts_regex = attr(pattern,  : 
  Look-Behind pattern matches must have a bounded maximum length. (U_REGEX_LOOK_BEHIND_LIMIT)
>

它抱怨需要“有限的最大长度”，但我不知道在哪里指定。如何进行积极的事后工作？确切地说，我可以在哪里指定这个“有界最大长度”？

你需要使用str_match因为“lookbehind”的模式是文字，并且您只是不知道空格的数量：

> result_1  <- str_match(myStrings,"MFG\\s*:\\s*(\\w+)")
> result_1[,2]
##[1] "acme"    NA        "initech"

您需要的结果将在第二列中。

请注意str_extract不能在这里使用，因为该函数会删除捕获的值。

还有一个好处：lookbehind 不是无限宽度，但它是宽度受限在 ICU 正则表达式中。所以，这也将起作用：

> result_1  <- str_extract(myStrings,"(?<=MFG\\s{0,100}:\\s{0,100})\\w+")
> result_1
[1] "acme"    NA        "initech"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

r

lookbehind

stringr

stringr、str_extract：如何进行正向后查找？的相关文章

分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
C# 正则表达式用于查找中具有特定结尾的链接

我需要一个正则表达式模式来查找字符串带有 HTML 代码中的链接以获取文件结尾如 gif 或 png 的链接示例字符串 a href site com folder picture png target blank picture
在ggplotly散点图中添加自定义数据标签

我想显示Species对于每个数据点当光标位于该点上方而不是 x 和 y 值时我用iris数据集另外我希望能够单击数据点以使标签持久存在并且当我在图中选择新位置时标签不会消失如果可能的话最基本的是标签持久性问题是一个优点这
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
Shiny可以识别用鼠标选择的文本（突出显示的文本）吗？

我需要用户将文本片段分配给 Shiny 中的类别或代码基本上我希望用户突出显示输出中的文本在下面的示例中来自table or text输出然后按一个按钮 code 并将选定的文本分配给应用程序内的对象在下面的应用程序中所选文
无法在 Document-Term-Matrix 中看到 `RTextTools::toLower()` 文本的结果

我尝试创建一个矩阵为此我想降低文本为此我使用此 R 指令 matrix create matrix tweets 1 toLower TRUE language english removeStopwords FALSE remove
如何让“grep -zoP”单独显示每个匹配项？

我有一个此表格的文件 X this is the first match blabla X this is the second match and here we have some fluff 我想提取 X 之后和相同标记之间出现的所有
JavaScript 正则表达式两个标签之间的多行文本

我编写了一个正则表达式来从 HTML 中获取字符串但似乎多行标志不起作用这是我的模式我想将文本输入h1 tag var pattern div class box content 5 h1 lt lt h1 gt mi m html
使用starts_with() 将 NA 替换为 0

我正在尝试替换我的一组特定列的 NA 值tibble 这些列都以相同的前缀开头所以我想知道是否有一种简洁的方法来使用starts with 函数从dplyr包可以让我做到这一点我已经看到了有关 SO 的其他几个问题但是它们都需要使用特
在 R 中将时间间隔数据扩展为天数

假设我有如下所示的数据 interval id indiv id role start date end date 1 1 A 2006 05 01 2006 06 16 2 1 B 2006 06 16 2006 10 16 3 1 A
在 mutate 和 across 之后使用 ~separate

目的是将所有物种 setosa 行转换为一行 setosa 这是一个最小的示例实际上有更多列和更多组我有这个数据框 head iris 2 gt select 1 2 5 gt group by Species Sepal Length
在 OSX 和 GNU 中使用“find”删除带有数字的文件名

我正在尝试搜索一个文件并删除名称中包含数字的类似文件我的文件 txt from myfile 00 04 version txt myfile 00 txt find E iregex myfile 0 9 1 txt 删除 myfile
以任意顺序匹配可选捕获组

在解析用户输入的许多情况下用户有机会向输入添加几个可选标志这些标志应该以任何顺序接受如何使用正则表达式对其进行解析以便每个标志都位于它自己的捕获组中如果存在例如有一个必需的令牌a 然后是 3 个可选标记可以按任何顺序出现b
连接多个用户的 R 闪亮会话

最小可重现示例 library shiny ui lt fluidPage actionButton button1 Run 1 actionButton button2 Run 2 server lt function session i
需要正则表达式（使用 C#）将所有空白压缩为单个空白

我需要将文档中的多个空格替换为单个空格每次迭代无论它们是空格制表符还是换行符任何类型的空格的任何组合都需要被截断为单个空格假设我们有字符串 Hello t t n t n world 其中 t 和 n 分别代表制表符和换行符那么
需要 RegEx 返回第一段或前 n 个单词

我正在寻找一个正则表达式来返回段落中的前 n 个单词或者如果该段落包含少于 n 个单词则返回完整的段落例如假设我最多需要前 7 个单词 p one two p
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
正则表达式将单词的开头和结尾与元音匹配

我正在尝试以下操作Regex aeiou aeiou 但它不起作用我测试了 abcda 并且不匹配它应该只是 aeiou aeiou 额外的您需要第二个字符是一个文字点例如 a hello 但由于您的测试用例 abcda 不包含这样

随机推荐

在双变量中获取数字的问题

我的 java 程序中需要的函数出现了一些问题我想检查双精度变量的总位数例如 5 应该返回 1 5 0034 应该返回 5 2 04 应该返回 3 我的函数是这样的 private int getDoubleLength doubl
WPF Datagrid 绑定自定义列标题

我试图弄清楚如何使用 MVVM 模式将 WPF DataGrid 的列标题和主要数据绑定到数据源我正在寻找的结果如下所示 source vallelunga com http brian vallelunga com files data
浮点按位运算的用处

我注意到浮点存在 SSE 指令这让我想知道您可以对 fp integer union 中的标量执行相同的操作我突然想到如果对浮点数数组的各个分量进行按位或运算则可以通过查看结果的符号位来快速确定它们中是否有任何一个为负数浮点值的
获取 TWIG 模板中的控制器名称

我正在学习 symfony2 3 当我尝试在 twig 模板中获取控制器名称时出现错误控制器 namespace Acme AdminBundle Controller use Symfony Bundle FrameworkBundle
Mac OS-X Mountain Lion 上的 GCC-4.2 错误，无法使用 pip / virtualenv 安装某些软件包

我看到一个非常烦人的错误我真的不知道如何处理这似乎很常见我几乎尝试了所有能找到的解决方案但都无济于事我正在尝试使用 pip 安装库 gevent psycopg2 和 greenlet 都遇到过这个问题问题似乎是我的计算机找不到
如何从服务器在 ViewPager 内的 VideoView 上播放视频

我尝试开发一个应用程序从服务器检索视频并在 viewpager 内的 videoview 上播放原始文件夹中的视频工作正常但有两个问题 1 部分视频无法播放或黑色活动显示 2 页面滚动时视频不停止那么如何使用 URL 而不是 and
如何在打开另一个 Javascript 下拉菜单时关闭另一个下拉菜单

我不太熟悉 JavaScript 我希望能得到一些帮助来解决我似乎无法解决的问题目前我的网站上有 2 个下拉菜单一种是用于导航的下拉菜单单击汉堡菜单图标时会激活该菜单第二个下拉列表用于显示我网站上的类别目前当我单击一个下拉列表时
检测浏览器缓存是否已满

我们发现浏览器缓存已满是导致酒店后台出现问题的原因它只影响我们的一小部分用户但我们希望提醒他们该问题并为他们提供一些如何自行解决问题的指导我们希望使用与 GMail 使用的系统类似的系统当它检测到您的浏览器缓存已满表现不正常时它
Kafka中的延迟消息消费

如何使用 Apache Kafka 生成消费延迟消息似乎标准 Kafka 和 Java kafka client 功能没有此功能我知道我可以用标准的等待通知机制自己实现它但它看起来不太可靠因此任何建议和良好实践都值得赞赏 Fou
Android Shake(Sensor) 服务，用于应用程序后台的震动检测

我开发了一个具有晃动功能的应用程序以便某些功能正常工作因此我使用晃动类并实现了主活动以便在应用程序运行时顺利工作但我的问题是当我的应用程序进入睡眠或终止或停止时如何检测背景震动服务我的摇摇班 public class Shak
区别 - “e.preventDefault();”和“返回假；” [复制]

这个问题在这里已经有答案了有什么区别return false and e preventDefault e preventDefault 将防止默认事件发生并且return false停止传播
Android - Firebase 用户身份验证令牌会过期吗？

我决定使用Volley并走 RESTful 路线Firebase因为当没有互联网连接时他们的听众似乎会挂起至少对于 Volley 它可以让我知道网络请求是否由于互联网连接而失败我需要知道是否FirebaseUser身份验证令牌是否过期
在基础对象中构造派生类型的对象

vb net 中是否可以有一个方法来构造 bass 类中任何派生类的对象在此代码中 x Clone 应返回一个 Bar 对象这是使用两种不同对象类型在两个类中重复代码的唯一方法 Module Module1 Sub Main Dim x
.NET：我可以使用 DataContractJsonSerializer 序列化为 JSON 关联数组吗？

使用时数据契约Json序列化器 http msdn microsoft com en us library system runtime serialization json datacontractjsonserializer aspx序
cellForRowAtIndexPath 返回 nil

我正在尝试从表格视图中获取特定的单元格以便我可以更改它的标签并停止活动指示器我遇到的问题是cellForRowAtIndexPath返回零我的表视图只有 1 行 Code id initWithNibName NSString nib
Android Thread.sleep 有时等待时间太长

Edit 这里不是说精度问题从下面的代码和日志可以看到我请求休眠1秒但结果差不多是200秒有时会跳到600秒这不可能是精度问题我之前使用过 handlerthread 有时发布到处理程序的作业没有按时启动为了获得更多详细信息
如何在 Android 中以编程方式启动主屏幕 [重复]

这个问题在这里已经有答案了我想用我的应用程序启动 Android 的主屏幕主要目标是当用户按下专用键时向用户显示所有应用程序其实方式并不重要有想法这样做吗这是启动 HomeActivity 的代码 Intent startMai
devDependency 会影响包大小吗？

我仔细寻找找不到这个问题的直接答案执行我添加的软件包devDependencies实际上最终会出现在生产包 JS 文件中并从而影响其大小或者只是dependencies进入捆绑包不它不会影响您的包大小因为这些包仅在开发模式下使用
ActiveRecord 嵌套 SELECT

我需要有关 SELECT FROM 嵌套 SELECT 的帮助如何以 ActiveRecord 方式重写以下查询并获取 Relation 对象 SELECT candidates FROM SELECT candidates first
stringr、str_extract：如何进行正向后查找？

很简单的问题我只需要使用正则表达式正向查找捕获一些字符串但我没有找到一种方法来做到这一点这是一个例子假设我有一些字符串 library stringr myStrings lt c MFG acme something else M

stringr、str_extract：如何进行正向后查找？

stringr、str_extract：如何进行正向后查找？ 的相关文章

随机推荐

热门标签

stringr、str_extract：如何进行正向后查找？的相关文章