R-lang / 如何使用 R 进行正则表达式 (Perl) 提取

2024-03-16

我使用 javascript 的正则表达式测试器得出以下 3 个正则表达式案例,从文本中提取不同类型的 URL。我想在 R 中使用这些正则表达式(regxi?)来满足以下条件:

http 网址:(https?):\/\/(www\.)?[^\\s]+

比特利网址:[^https?:\/\/](bitly\.com|bit.ly)[^\s]+

网址:\bwww\.[^\s]+

在阅读 R 中的正则表达式后,似乎使用PERL=TRUE将允许从 javascript -> R 进行转换。我在一些测试示例中尝试了最后一个正则表达式:

grep("\\<(\bwww\\.[^\\s]+)\\>", 
     c("wwww.google.com and other stuff", 
       "http.www.google.com"), 
     perl=TRUE, value=TRUE)

但我收到以下错误:

错误:“grep(”\”中出现意外符号, c("www.google.com 和其他东西", "http.www.google.com") perl"

在 R 中使用此类正则表达式的语法是什么?


在 R 中使用此类正则表达式的语法是什么?

R 参考索引 https://cran.r-project.org/doc/manuals/r-release/fullrefman.pdf, regex:

类似 Perl 的正则表达式


扩展正则表达式描述的所有正则表达式 除‘\’外均被接受:在 Perl 中所有反斜杠 元字符是字母数字,反斜杠符号始终是 解释为字面字符。

所以,如果你想使用\< \>,你不能使用perl=TRUE.

除此之外,你忘了加倍反斜杠\b.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R-lang / 如何使用 R 进行正则表达式 (Perl) 提取 的相关文章

随机推荐

  • Node.js 还是 Go 来进行 Hyperledger Fabric 的链码开发?

    其中哪一种语言Node js and Go在可维护性 可扩展性和更好的支持方面更适合 链码 开发 这是个人喜好的问题 但我会说 Golang 因为 Node js chaincode 在容器构建时使用 npm install 速度很慢 并且
  • 物体识别、检测、分类?有什么不同?

    我不知道这是否是正确的 stackexchange 论坛 在哪里提出这个问题 如果不是这种情况 请告诉我 我正在开发一个应用程序 它给出包含绘画的输入图像作为输入 它能够告诉您绘画的标题 类似的情况是 给定一个包含建筑物的输入图像 返回的结
  • Angular 2 @angular/router 3.0.0-alpha.7 - 访问多个参数

    我只是在尝试最近发布的 Angular 2 中的新路由器 即 Angular 2 angular router 3 0 0 alpha 7 我知道在新路由器中我们可以使用以下代码访问路由参数 this activatedRoute para
  • 如何从维基百科文章中提取数据?

    我有一个关于为我的 Android 应用程序解析维基百科数据的问题 我有一个脚本 可以通过读取源代码来下载 XMLhttp en wikipedia org w api php action parse prop text format x
  • 文件还是数据库? - 在 Android 设备上保存对象的最佳实践

    我正在用java构建一个android应用程序 在其中定义一些对象 例如 用户 或 播放列表 等 如何将这些自定义对象保存在设备上以供以后访问 Gson gson new Gson String json gson toJson user
  • 如何使用 javascript 创建并读取 cookie 的值?

    如何在 JavaScript 中创建 cookie 并从中读取值 以下是可用于创建和检索 cookie 的函数 function createCookie name value days var expires if days var da
  • 使用自定义对象对 NSArray 进行排序

    在我的 Xcode 项目中 我有以下类 Address interface LDAddress NSObject NSString street NSString zip NSString city float latitude float
  • AngularJS:使用具有可选参数的 URL 进行路由

    我的 app js 中有一个包含路由的 URL 假设网址是 api opt1 opt2 opt3 users 我希望我的网址在任何情况下都能工作 我应该能够忽略可选参数 opt1 opt2 或 opt3 可能是全部或几个 我怎样才能做到这一
  • 无法从 {2,3,4,5,6,7,8} 获得的最小整数 (Mathematica)

    我正在尝试使用 Mathematica 解决以下问题 从集合中无法获得的最小正整数是多少 2 3 4 5 6 7 8 通过算术运算 求幂和括号 集合中的每个数字必须仅使用一次 不允许一元运算 例如 如果不使用 0 则 1 无法转换为 1 例
  • 如何实现简单的 Android OAuth 和服务器 API [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个 Android 应用程序 它将数据发送到我的网络服务器 数据由 php 处理并存储在 mysql 数据库中 出于安全原因 我
  • 为什么 WCF 中需要 KnownTypeAttribute [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在学习WCF 不了解KnowTypeAttribute的真正优势 有人可以简单地解释一下为什么我们需要它吗 DataContrac
  • Automapper v5 忽略未映射的属性

    以前 当我使用 Automapper v3 x 时 只需添加一个即可忽略未映射的属性 IgnoreUnmappedProperties 扩展看起来像这样 public static class AutoMapperExtensions pu
  • 在运行时获取当前 .NET CLR 版本?

    如何在正在运行的 NET 程序中获取当前的 CLR 运行时版本 查看System Environment Version财产 https learn microsoft com en us dotnet api system environ
  • 如何在 iPhone 中的自定义按钮上设置活动指示器

    我是 iPhone 开发新手 我想设置一个加载在我的自定义按钮上的活动指示器 请指导我 示例 应用商店 gt 搜索 gt 显示更多 25 个 点击时 Add the UIActivityIndicatorView作为按钮的子视图 Creat
  • 每个进程 System.Web.HttpApplication 初始化多少次

    我有global asax它从我创建的自定义类扩展而来 称为MvcApplication它延伸自System Web HttpApplication 在它的构造函数中 它记录应用程序的启动 如下所示 protected MvcApplica
  • 如何将选项传递给 Rust 的 serde,以便可以在 Deserialize::deserialize() 中访问?

    对于上下文 我正在用 Rust 编写光线追踪器 但我正在努力寻找一种以与文件系统无关的方式加载场景的好方法 我在用着serde https serde rs 这样我就不必发明自己的文件格式 还 资源 图像纹理和网格数据 单独存储到场景文件中
  • SignalR 和 require.js 配置

    我正在合并SignalR进入我已经使用的项目需要 js处理我的脚本依赖项 我在确保 jquery signalR 1 1 2 加载后调用 signalr hubs 时遇到了一些麻烦 我已经让它工作了 但我想知道是否有更好的选择 这就是我所拥
  • 如何同步包含克隆元素的 jquery 可排序列表?

    我的情况很特殊 我有两个清单 1 列表包含所有项目 2 包含顶部列表 显然 项目重叠 并且第二个列表中的项目根据它们从列表 1 中克隆的元素标记为类clone 23clone 25 Example List 1 1 run 2 eat 3
  • WPF 图像缩放

    我有一个视图框 里面有一个图像 这非常棒 因为 Viewbox 会缩放图像以适合窗口 但是 我需要能够将图像缩放到完整尺寸并显示滚动条 但我很难弄清楚如何做到这一点 这就是我现在所拥有的 谁能指导我如何修改它以实现上述功能
  • R-lang / 如何使用 R 进行正则表达式 (Perl) 提取

    我使用 javascript 的正则表达式测试器得出以下 3 个正则表达式案例 从文本中提取不同类型的 URL 我想在 R 中使用这些正则表达式 regxi 来满足以下条件 http 网址 https www s 比特利网址 https b