我使用 javascript 的正则表达式测试器得出以下 3 个正则表达式案例,从文本中提取不同类型的 URL。我想在 R 中使用这些正则表达式(regxi?)来满足以下条件:
http 网址:(https?):\/\/(www\.)?[^\\s]+
比特利网址:[^https?:\/\/](bitly\.com|bit.ly)[^\s]+
网址:\bwww\.[^\s]+
在阅读 R 中的正则表达式后,似乎使用PERL=TRUE
将允许从 javascript -> R 进行转换。我在一些测试示例中尝试了最后一个正则表达式:
grep("\\<(\bwww\\.[^\\s]+)\\>",
c("wwww.google.com and other stuff",
"http.www.google.com"),
perl=TRUE, value=TRUE)
但我收到以下错误:
错误:“grep(”\”中出现意外符号,
c("www.google.com 和其他东西", "http.www.google.com") perl"
在 R 中使用此类正则表达式的语法是什么?
在 R 中使用此类正则表达式的语法是什么?
R 参考索引 https://cran.r-project.org/doc/manuals/r-release/fullrefman.pdf, regex:
类似 Perl 的正则表达式
…
扩展正则表达式描述的所有正则表达式
除‘\’外均被接受:在 Perl 中所有反斜杠
元字符是字母数字,反斜杠符号始终是
解释为字面字符。
所以,如果你想使用\<
\>
,你不能使用perl=TRUE
.
除此之外,你忘了加倍反斜杠\b
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)