如何使用正则表达式提取字符串进行词性标记

2024-04-30

参考question https://stackoverflow.com/questions/44434739/how-to-extract-a-string-before-and-after-slash-in-r，我在以下示例的解决方案中面临一些困难。

 "I/PRP did/VBD n't/RB experienced/VBN much/JJ service/NN differentiation/NN" The/DT desktop/NN and/CC CAD/NN support/NN is/VBZ working/VBG as/IN expected/VBN CAD-support/NNP Desktop/NNP management/NN related/VBD to/TO LSB/NNP Desktop/NNP management/NN team/NN is/VBZ very/RB committed/VBN ./."

由于“n't”中有撇号和连字符“CAD-Support”，结果未按预期出现。我根据要求将此作为新查询发布。谁能帮我解决这个问题。谢谢！！

如果您想使用以前的解决方案，您只需将正则表达式更改为

[^\s/]+

in code:

str_extract_all(str1, "[^\\s/]+")

See the 正则表达式演示 https://regex101.com/r/KTaONV/1.

它将匹配除空格之外的 1 个或多个字符，并且/.

为了避免匹配./.，你需要使用类似的东西

\w+(?:['-]\w+)*

in code:

str_extract_all(str1, "\\w+(?:['-]\\w+)*")

将匹配 1+ 个单词字符，后跟 0+ 个序列' or -后跟 1+ 个单词字符。看这个正则表达式演示 https://regex101.com/r/KWcce7/1.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

regex

如何使用正则表达式提取字符串进行词性标记的相关文章

R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
R 错误：无法更改锁定绑定的值

我试图估计无限数字流的平均值和标准差当我运行代码时出现错误消息无法更改锁定绑定的值我做了一些研究发现这个错误与我使用全局变量有关但我无法弄清楚任何帮助将非常感激在此先感谢您的帮助 define global variable
根据 row_number() 过滤 data.frame

更新自从提出这个问题以来 dplyr 已经更新现在按照 OP 的要求执行我正在尝试获取第二行到第七行data frame using dplyr 我正在这样做 require dplyr df lt data frame id 1 1
正则表达式验证字符串是否包含三个非空白字符

我使用欧芹 js 来验证输入并且使用 data parsley pattern 它允许我传递正则表达式我正在尝试验证该字符串以确保它至少包含三个非空白字符下面是应该无效或有效的字符串 valid 1 2 b invalid 1 b s
PHP URL 验证

我知道有无数的线程问这个问题但我一直无法找到一个可以帮助我解决这个问题的线程我基本上试图解析大约 10 000 000 个 URL 的列表确保它们根据以下标准有效然后获取根域 URL 此列表包含您能想象到的几乎所有内容包括类似的内
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
如何从数据框中删除少于 5 个观察值的个体 [重复]

这个问题在这里已经有答案了为了澄清这个问题我将简要描述数据中的每一行data frame是一个观察值列代表与该观察值相关的变量包括观察到什么个体观察时间观察地点等我想排除过滤观察值少于 5 个的个体换句话说如果 in
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落
rvest 和 NHL 统计数据的 CSS 选择器问题

我想从 hockey reference com 中抓取数据特别是从以下链接中抓取数据 https www hockey reference com leagues NHL 1991 html https www hockey refer
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
使用 posix shell 测试字符串中的正则表达式

如何测试字符串是否与特定字符串匹配正则表达式与基本无 bash 或任何其他 posix shell 脚本在 if 语句中您可以使用expr在 POSIX shell 中计算正则表达式的命令 s Abc expr s alpha 3 e
git 匹配多个单词的标签

我们可以得到最后一个 git 标签它以一个单词例如 TEST 开头如下所示 git describe tag dirty match TEST 我想知道如何获得最后一个以 word1 开头的标签orword2 例如测试OR跑步我尝试
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本

随机推荐

为什么我的 android 项目中 onStart() 方法在 onCreate 之前运行？

根据 Activity 的生命周期 onCreate 在应用创建时会被调用一次然后 onStart 方法在整个 Activity 生命周期中可能会被调用多次然而这并不是发生在我身上的事情我的 onCreate 方法中有以下代码 mRe
App Engine Cron 作业始终返回 HTTP 状态代码 301

我已关注本指南 https cloud google com appengine docs flexible ruby scheduling jobs with cron yaml为我的 Rails 应用程序创建 cron 作业但 HTT
标签标签语义

我读了this https stackoverflow com questions 1094352 can a label only refer to input elements我通常使用跨度或强来描述文本标签对于最佳实践来说这是真的
org.dozer.MappingException：找不到字段的读取或写入方法

org dozer MappingException 找不到字段的读取或写入方法 tarShipMethodCode lmCourier courierName 在类 class com essilor ong domain invento
比较字符变量

我想在 R Studio 中比较两个不同的字符变量第一列 BZ Pred 显示参与者预测的 5 个最常用的应用程序第二列 BZ Act 显示实际使用最多的 5 个应用程序现在我想创建第三列如果第一个应用程序被正确猜测则包含是如
ASP.NET 中的网络凭据错误

我正在尝试使用 NetworkCredential 类通过 ASP NET 访问网页但是我不断收到以下消息的异常System Security Cryptography CryptographicException The handle
为什么在将应用程序部署到 Heroku 时会出现此错误？

使用 git hub 将应用程序部署到 heroku 时遇到某种错误问题是我不理解 heroku 日志和随之而来的错误这是 Heroku 日志 Marcuss MacBook Pro Weather App marcushurney
公钥的长度（加密）可以与私钥不同吗？

我有一个 1024 位的私钥并用它来生成公钥这是否自动意味着我的公钥也具有 1024 加密或者它的加密大小可以更小吗 512 256 PS 我最感兴趣并谈论的是 RSA 密钥中模数 n 的大小大小通常为 1024 或 2048 位
启用 WCF 数据服务默认接受/返回 JSON

我有一个 WCF 数据服务我希望默认情况下为所有操作返回 JSON 我可以在配置通过服务属性中设置它吗为了通过 format 标签启用 json 如下所示 host 8038 YourService svc format json 将
您会在新的商业项目中使用 S#arp 架构吗？

The S arp 架构 http code google com p sharp architecture 看起来真的很酷但是您是否认为它仍然太新而无法在重要的新项目中做出承诺我们假设该项目乍一看很适合它 It all seems非常
无法在 XAMPP 和 Windows XP 上安装 Xdebug

我知道这个问题已经被问过好几次了但答案并没有解决我的问题我在 Windows XP SP3 上运行 XAMPP 1 8 2 并且在安装 XDebug 时遇到困难我从网站下载了XDebug 不幸的是安装向导对我不起作用我的 PHP
如何在 CSV 文件中插入新行？

我正在创建一个系统其中涉及创建用于错误记录的 CSV 我当前的代码成功创建了一个具有唯一名称的新文件然后将现有数据来自数组添加到 CSV 中我遇到的问题是在文件中添加新行这是维持正确结构所必需的我现有的代码 current f
rvm 监控延迟作业

我正在尝试使用 monit 运行delayed job 但它无法运行因为 rvm 的路径每个用户的本地 rvm 安装对该命令不可用我的应用程序是一个带有捆绑器的rails2应用程序 Monit 无法找到捆绑程序有人对我如何了解 m
致命错误：未找到“MongoDB\Driver\Manager”类

我想使用 MongoDB 驱动程序但当我使用它时它抛出一个错误 mongo new MongoDB Driver Manager mongodb localhost 27017 错误消息未找到类 MongoDB Driver Man
合并 Pandas Dataframe：如何添加列和替换值

我有一个数据帧 df1 并想要合并其他许多数据帧 df2 以便合并发生在匹配的多索引上如果缺失将创建新列如果列已存在则替换值正确的 pandas 操作是什么以及使用什么参数我查看了 concat join merge
解析 JSONException：JSONArray 文本必须以字符 1 处的 '[' 开头

我正在尝试将 Android 应用程序与本地 MySQL 数据库连接但遇到问题解析 JSON 数组我在这里阅读了所有类似的问题但没有任何作用错误消息 Error parsing data org json JSONExceptio
使用 Sheets API v4 获取与 Google 帐户关联的所有电子表格的列表

使用 Google Sheets API v4 我希望获取附加到我的帐户的电子表格列表我做了很多研究但还没有找到任何解决方案 v4 API 不提供列出电子表格的方法您需要使用 Drive API 这从以前的 API 页面迁移 http
Mongodb 获取聚合框架中的最后组合

有一个消息集合 date NumberLong 1421134514 sender 53172480f9cd0e682840b9f7 recipient 52f37fbaf9cd0e02773c97b1 isRead false id 54
Office 365 默认日历的 ID 自动更改

我使用 Office 365 API 的 V2 DLL 来执行日历操作我正在保存默认日历的 ID 以对其执行操作从过去两年开始它对我来说工作得很好但最近自从上 1 个月以来当我尝试从我的帐户中获取日历时只是为了检查日历是否适用于
如何使用正则表达式提取字符串进行词性标记

参考question https stackoverflow com questions 44434739 how to extract a string before and after slash in r 我在以下示例的解决方案中面临

如何使用正则表达式提取字符串进行词性标记

如何使用正则表达式提取字符串进行词性标记 的相关文章

随机推荐

热门标签

如何使用正则表达式提取字符串进行词性标记的相关文章