如何在R中检查字符串是否包含罗马数字?

2023-12-30

我的数据集“ad”中有一个住宅地址列。我想检查没有数字(包括罗马数字)的地址。 我在用着

ad$check <- grepl("[[:digit:]]",ad$address)

标记出不存在数字的地址。如何对包含罗马数字的地址执行相同的操作?

例如:“ABC City DLF Building- III X 楼”


您需要创建一个正则表达式字符串。

编辑(我的第一个答案是废话):

x <- c("floor Imaginary,  building- Momentum, ABC City", "floor X, DLF Building- III, ABC City")
# here come the regex 
grepl("\\b[I|V|X|L|C|D|M]\\b", x, ignore.case = FALSE)
[1] FALSE  TRUE

分解它:

\\b是单词边界。这意味着罗马数字前面或后面必须有空格、标点符号或字符串的开头/结尾。

[I|V|X|L|C|D|M]我们正在寻找的“单词”只能由用于罗马数字的符号组成。据我所知应该就是这些了。

ignore.case = FALSE如果省略该选项,这是通常设置的标准。然而,我发现如果它对于手头的操作很重要,那么明确提及它会更安全。

请谨慎使用,因为一家名为“LCD Industries”的公司也会被标记为罗马数字。你可以将我的方法与这个答案 https://stackoverflow.com/a/267405/5028841进一步测试符号的顺序是否正确。

请测试您的数据并报告是否有效。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在R中检查字符串是否包含罗马数字? 的相关文章

  • 重用 R 中内置的模型

    在 R 中构建模型时 如何保存模型规范以便可以在新数据上重用它 假设我根据历史数据建立逻辑回归 但直到下个月才会有新的观察结果 最好的方法是什么 我考虑过的事情 保存模型对象并在新会话中加载 我知道某些模型可以使用 PMML 导出 但还没有
  • 匹配不可打印/非 ASCII 字符并从文本中删除

    我的 JavaScript 很生疏 所以任何有关这方面的帮助都会很棒 我需要检测字符串中的不可打印字符 控制字符 如 SOH BS 等 以及扩展 ascii 字符 如 并将其删除 但我不知道如何编写代码 谁能指出我正确的方向来解决这个问题
  • sapply 函数从命名向量中的值填充数据帧的列,需要很长时间。有更快的方法吗?

    这是我正在做的一个例子 x lt c a 2 b 4 c 2 d 9 df lt data frame names c d c a b x是一个命名向量 其值的顺序与它们在中出现的顺序不同df names 我需要在数据框中形成一个新列 该列
  • rpy2 在从 R 到 Python 的数据帧中处理 NA/缺失值时出现问题

    我在使用rpy2包进行转换时遇到问题dataframe将 R 中的内容保存到 Python 中 import os os environ R HOME Library Frameworks R framework Resources imp
  • 如何在 sqlSave() 命令中跳过主键?

    我正在尝试使用 RODBC 在 MySQL 数据库中插入 data frame 我正在使用的命令如下 sqlSave channel dbData tablename table name append TRUE safer TRUE fa
  • 在 Java/GWT 中解析用户时间输入

    解析用户在 GWT 中的文本字段中键入的时间的最佳方法是什么 默认时间格式要求用户完全按照区域设置指定的时间格式输入时间 我想要更加灵活 因为用户可以通过多种不同的方式输入时间 例如 8 8p 8pm 8 15pm 13 15 1315 1
  • 基于Java模式分割字符串

    您好 我有以下模式的日志文件 2014 03 06 03 21 45 432 ERROR mfs pool 3 thread 19 dispatcher StatusNotification Error processing notific
  • rmarkdown 中的内部链接不起作用

    我使用 rmarkdown 来渲染 pdf 文档 现在我想在文本中添加内部链接 在帮助页面中降价 http rmarkdown rstudio com authoring pandoc markdown html links 它说内部链接定
  • 找出段落中出现的单词

    sentence Alice was not a bit hurt and she jumped up on to her feet in a moment words Alice jumped played 我可以使用filterpyth
  • R闪亮的html小部件之间的交互

    我正在开发一个 R 闪亮应用程序 它使用多个 html 小部件 特别是网络D3 d3热图 and 和弦诊断 这些小部件单独工作正常 但是 在同一页面中使用它们会留下一个空格处他们应该在哪里 这是显示错误的可重现代码 在 UI 中注释绘图线
  • r : 直方图上的 ECDF

    在 R 中 与ecdf我可以绘制经验累积分布函数 plot ecdf mydata 与hist我可以绘制数据的直方图 hist mydata 如何在同一图中绘制直方图和 ecdf EDIT 我尝试做类似的东西 https mathemati
  • ggplot:按组自动化的百分位线

    我找到了dplyr gt 运算符有助于简单的 ggplot2 转换 无需求助于ggproto 这是必需的ggplot2 扩展 http docs ggplot2 org dev vignettes extending ggplot2 htm
  • Quarto/Rmarkdown 中的美人鱼图:狭窄且模糊

    我正在尝试生成 pdf 格式的四开文档 稍后会生成 word 格式 我遇到了美人鱼图的问题 请在下面找到一个示例 qmd 文件来说明该问题 所以首先它应该支持 mermaid 标签 但当我这样做时 我无法在 rstudio 中 运行 单元
  • 正则表达式 - 如何从引号之间提取文本并排除引号

    我需要正则表达式方面的帮助 我需要创建一个规则来保留引号之间的所有内容并排除引号 例如 我要这个 STRING ID 0 Stringtext 变成了 Stringtext Thanks 做到这一点的方法是使用捕获组 然而 不同的语言处理捕
  • 正则表达式:如何获取组名称

    我有一个 NET 正则表达式 它看起来类似于
  • 有效地将环境从内部功能转移到全局环境

    我有一个在其中创建环境的函数 我希望将该环境分配给全局环境 目前我通过将环境分配给来做到这一点globalenv 作为最后一步 如下 funfun lt function inc 1 dataEnv lt new env dataEnv d
  • dataTables fnFilter 列 on img 文件名

    我正在尝试根据标签的 src 属性中的图像文件名来过滤列 我的行看起来像这样 tr class unread odd td class td tr
  • 仅在具有重复块名称的另一个 Rmarkdown 文档中运行一个 Rmarkdown 文档中的代码

    我正在 Rmarkdown 中编写一系列相互补充的报告 我想将上一份报告的结果纳入我目前正在编写的报告中 我看到其他建议使用的问题purl从 Rmarkdown 文档中提取 R 代码然后运行它 所以我尝试了以下操作 r read previ
  • 如何判断某个软件包是否已经安装?

    当我安装 yaml 包时 如果之前已经安装过 RStudio 则会弹出一条烦人的错误消息 如何判断该软件包是否已安装 以便我可以在代码中决定是否安装该软件包 该消息位于弹出窗口中 内容如下 此安装将更新的一个或多个软件包 当前已加载 在更新
  • R 条形图中的 X 轴

    我想问一个关于 barplot 轴的问题 首先请看我的数据 SerNo DOY Rain 1 350 0 2 351 0 3 352 0 4 353 0 5 354 0 6 355 0 7 356 0 8 357 0 9 358 0 10

随机推荐

  • openssl 握手失败

    我正在尝试编写简单的 C openssl 客户端和服务器 这是客户的代码 int main int err SSL CTX ctx init ctx client cert pem client private pem certs cace
  • 当托管在 WinForms 容器中时,WPF ScrollViewer 不会接收鼠标事件

    我们有一个 WinForms 应用程序 我们正在逐步将其转换为 WPF 此时 应用程序的主窗体是一个 Form WinForms 其中包含 WPF 中内置的垂直侧边栏 侧边栏托管在 ElementHost 控件中 侧边栏由包含其他控件的 S
  • Sql查询性能慢

    我正在编写一个 SQL 查询 这给我带来了缓慢的性能 因此 它给我带来了 504 网关超时问题 请帮助我重新创建此查询 以便我的输出结果更快 我将把查询放在下面 select r c1 parent item c2 parent item
  • 类型“NSNotification.Name”没有成员“UITextField”

    在 Swift 4 2 中 出现以下错误 在 Swift 4 中工作正常 类型 NSNotification Name 没有成员 UITextField 这是我的错误代码 NotificationCenter default addObse
  • 以引用对象为标准的 mongoid 作用域

    我在 Rails 3 中的 Mongoid 模型有以下范围 class Expert include Mongoid Document referenced in category scope currently available lam
  • 在不违反 REST 的情况下处理长查询

    我们有一个 REST api 并且我们在坚持 REST 精神方面做得非常好 然而 我们有一个重要的消费者 他们请求一种方法来协调他们的数据存储 流程如下 消费者进行 GET 调用来检索在某个日期范围内创建的所有库存对象 假设这会返回 100
  • Antlr 数组帮助

    嘿 我开始在 java 中使用 Antlr 我想知道如何将一些值直接存储到二维数组中并返回该数组 我根本找不到任何关于此的教程 感谢所有帮助 假设您想要解析一个包含由空格分隔的数字的平面文本文件 您想将其解析为二维数组int其中每一行都是数
  • 为什么动态构造对于 php 编译器 (PHP) 来说很困难?

    我正在读保罗 比格的书http blog paulbiggar com archive a rant about php compilers in general and hiphop in pspecial http blog paulb
  • 无法使用集成在 P4 中创建新分支

    我在 P4 有一个分行 depot MyDemoInfo trunk Server My Service 在 My Service 下 存在我的整个源代码 现在 当我尝试从上面的主干分支创建一个新分支时 它给了我错误 我正在尝试创建一个新的
  • ggplot geom_tile 与面的间距

    我正在尝试制作一个按 x 轴上的两个离散变量排序的多面 ggplot 问题是我想让垂直相邻的条目全部接触 目前 行之间存在空间 具体取决于顶部图与底部图中因子的水平 抱歉 这个可重现的示例有点冗长 npats 20 simsympt c i
  • 如何将反应式rhandsontable重置为默认值?

    我正在构建一个应用程序 其中 2 2 表包含一些用于进一步计算的值 这些值可以由用户更新 并且用户将能够恢复到原始值 我试图通过一个操作按钮来实现它 该按钮会将表重置为其原始值 但表不会更新 这是一个简化的示例 rm list ls lib
  • HTML 电子邮件中的内联边框样式

    我正在处理响应式 HTML 电子邮件 并且仅在 IE 中的 Gmail 中遇到渲染问题 必须如此 它在其他 27 个客户端变体中运行良好 我们需要支持 我在这里设置了一个小提琴 http jsfiddle net 39gzj http js
  • 搭载 iOS 5 和 iOS 6 的 Facebook

    我即将发布一个应用程序 它必须同时支持 iOS 5 和 iOS 6 但是对于新的 Facebook SDK 3 1 我不太确定如何集成 Facebook 功能以与两个 iOS 版本一起使用 让登录和墙贴操作在 iOS5 和 iOS6 版本中
  • 如果连接了硬件键盘,则隐藏 inputAccessoryView

    类似于这个问题 iPad 检测外接键盘 https stackoverflow com questions 5019471 ipad detecting external keyboard 我正在开发一个 iPad 应用程序 该应用程序使用
  • list.item(0) 与 list[0]

    document getElementsByTagName a item 0 and document getElementsByTagName a 0 将返回相同的结果 前者比后者快吗 自制性能测试 http jsfiddle net 4
  • 在 Ubuntu 16.04 Xenial 和 apache 上安装 php 5.3 或 5.4

    我想在 Ubuntu 16 04 Xenial 和 Apache 上安装 php 5 3 或 5 4 教程指导我使用 PPA 但他们没有帮助我满足我的需要 我知道 PHP 5 3 和 4 已过时 但我需要这个项目 这可能吗 如果是 那么请教
  • AVURLAsset 未加载(.mov 文件)

    我正在尝试加载一个名为 output mov 在 iPhone 上创建 的文件作为AVURLAsset使用以下代码 NSURL outputURL NSURL fileURLWithPath NSString stringWithForma
  • 如何通过单击div外部的按钮来更改div的内容?

    感谢您花时间阅读这篇文章 希望问同样问题的人也能得到答案 我正在开发一个分为 8 个大 div 的单页面网站 这样当您单击菜单栏时 它会将您带到其中一个 div 或 页面 在我网站的介绍部分的一个 div 或页面 上 我试图引入这种效果 h
  • 获取 GDK_BACKEND 与 debian 中的可用显示错误不匹配

    实际上我正在尝试通过 selenium 在远程 debian 服务器中运行无头浏览器 我在服务器中安装了 firefox 46 0 1 我使用的是 selenium 2 53 1 版本 每当我尝试运行给定的测试时 我都会收到以下错误 org
  • 如何在R中检查字符串是否包含罗马数字?

    我的数据集 ad 中有一个住宅地址列 我想检查没有数字 包括罗马数字 的地址 我在用着 ad check lt grepl digit ad address 标记出不存在数字的地址 如何对包含罗马数字的地址执行相同的操作 例如 ABC Ci