使用 r 中包含特定字符串的行对数据进行子集化

2024-01-05

我想对名称以字符串 TRUST, LIMITED, INC., CO 结尾的数据进行子集化

数据看起来像这样

name            date
abc TRUST       2018-01-01
123 Foundation  1997-02-06
Tim LIMITED     2002-06-04
SA INC.         1968-12-28
Yu Co           2005-01-24
Coca Cola Ltd.  1980-05-30

我已尝试以下方法,但它不适用于多种情况

df[grepl(paste0(c("TRUST", "LIMITED", "INC", "CO"), collapse = "|"), df$name), ]   

它还提取了可口可乐公司行,但我不希望这样。


你可以试试:

df[grepl(paste0(c("TRUST", "LIMITED", "INC"), collapse = "|"), df$name), ]

         name       date
1   abc TRUST 2018-01-01
3 Tim LIMITED 2002-06-04
4     SA INC. 1968-12-28

str_detect():

df %>%
 filter(str_detect(name, paste0(c("TRUST", "LIMITED", "INC"), collapse = "|")))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 r 中包含特定字符串的行对数据进行子集化 的相关文章

  • 从命令行运行 R 脚本

    我有一个文件 名为a r 它有一个chmod of 755 sayHello lt function print hello sayHello 我如何通过命令行运行它 Answer recommended by R Language col
  • r + dplyr 过滤时间序列

    我有一些数据观察了一群人以及他们随时间推移所吃的水果 我想使用 dplyr 来观察每个人 直到他们吃香蕉并总结他们吃的所有水果直到他们吃第一根香蕉 data data lt structure list user c 1234L 1234L
  • 如何更改现已弃用的 dplyr::funs() (其中包含 ifelse 参数)?

    非常基本 但我认为我并没有真正理解这一变化 library dplyr library lubridate Lab import sql lt Lab import gt select if sum is na gt 0 gt mutate
  • 如何根据时间戳列制作时间跨度列?

    我有一个数据表 其中第 1 列中包含时间戳 第 2 列中包含事件 时间戳的格式为Y m d H M OS3 e g 2019 09 26 07 29 22 778 我想添加一个新列 其中包含时间戳 2 到时间戳 1 之间的差异的时间跨度值
  • R 中带有 ggplot 的背景带

    我正在尝试为不同的组创建箱线图 我想用 3 个水平条带为背景着色 中心观测值 其中所有观测值均接近总体平均值 平均值 体重 0 5 另外 2 个带是下面的和上面的 这些是我的情节 library ggplot2 bp lt ggplot d
  • Haskell printf 转字符串

    Haskell 中有等效的 sprintf 吗 我需要将双精度值转换并格式化为字符串 有没有其他方法而不使用printf什么样的功能 主要问题是要避免 Prelude gt putStrLn myDoubleVal 1 7944444444
  • 在 C# 中修改单个 XML 属性

    我已经很好地编写了 XML 文档 它看起来像这样
  • 数据表中的最大行数

    我的 data table 中有一个包含 8 000 000 行 100 列的数据集 其中每列都是一个计数 我需要找到每行的最大计数以及该最大值位于哪一列 我可以使用以下命令快速获取每行的哪一列具有最大值 dt lt dt maxCol w
  • 为什么在 C++ 中更喜欢 char* 而不是 string?

    我是一名 C 程序员 正在尝试编写 C 代码 我听说string在 C 中比char 在安全性 性能等方面 但有时似乎char 是一个更好的选择 有人建议程序员不要使用char 在 C 中 因为我们可以做所有的事情char 可以用绳子来做
  • 如何根据R中的条件创建新变量

    我正在尝试根据某些条件创建一个新变量 我的数据看起来像 a b 1 NA 2 3 3 3 NA 2 NA NA 我想要的是一个变量c这样 when a is not NA b is NA c a when a is NA b is not
  • 基本 R 图:帮助减少多个图之间的空间

    我试图减少一个窗口中多个绘图之间的空间量 但无法实现我想要的 情节和代码如下 我想将图例保留在原处 但减少 B 和 C 之间的空间 如何将图 C 向左 移动到靠近图 B 的位置以模仿 A 和 B 之间的间距 同时保持图例就位 我希望传奇是独
  • 包含 NA 的数据的聚类标准误差

    我无法使用 R 和基于此的指导对标准错误进行聚类post http thetarzan wordpress com 2011 06 11 clustered standard errors in r cl 函数返回错误 Error in t
  • 更改 geom_text 的默认“a”图例以标记字符串本身

    类似于这个问题 https stackoverflow com questions 18337653 remove a from legend when using aesthetics and geom text 我想更改图例中的默认 a
  • 为什么连接终止

    我正在尝试使用随机森林分类模型H2OR 内部的库 训练集有 7000 万行和 25 个数字特征 总文件大小为 5 6 GB 验证文件的大小为 1 GB 我的系统有 16 GB RAM 和 8 核 CPU 系统成功读取 H2O 对象中的两个文
  • 如何仅将数字形式的字符串哈希值转换为整数

    我有从几个不同的 XML 数据库转储导入的哈希行 如下所示 但具有不同的键 Id gt 1 Name gt Cat Description gt Feline Count gt 123 我尝试使用 to i但它将非数字字符串转换为0 Fel
  • Java 中字符串的最大长度 - 调用 length() 方法

    In Java 最大尺寸 a 是多少String对象可能有 指的是length 方法调用 我知道length 返回 a 的大小String as a char 考虑到String http docs oracle com javase 7
  • Angular 5在另一个变量更改时自动更新字符串变量

    当另一个变量发生变化时 有没有办法更新字符串变量 我有一个使用各种变量构建的字符串 我使用插值在组件的 html 文件中显示该字符串 但是 如果变量更改了字符串用于构建自身的变量 则该字符串将永远不会更改 因为它们不可变 唯一的方法是当其他
  • 当 edmx 文件位于单独的项目中时出错

    我有问题说 在配置中找不到指定的命名连接 或者不打算与EntityClient提供者 或无效 我的 edmx 文件位于单独的项目中 但该项目的连接字符串app config 什么可能导致问题 确保 app config 位于设置为启动项目的
  • 润滑mdy功能

    我正在尝试转换以下内容 但对其中一个日期 1 没有成功 4 2 10 变为 0010 04 02 有办法纠正这个问题吗 谢谢 维韦克 data lt data frame initialDiagnose c 4 2 10 14 01 200
  • 连接极线ggplot图中的间隙

    当 ggplot 使用极坐标绘制线图时 它会在最高和最低 x 值之间留下间隙 Dec and Jan如下 而不是缠绕成螺旋状 我怎样才能继续这条线并缩小差距 特别是 我想使用月份作为 x 轴 但在一条循环线上绘制多年的数据 Reprex l

随机推荐

  • Cl.exe 返回错误代码 D8050

    我在使用 microsoft Visual Studio Ultimate 2013 全新安装 Windows 8 时出现以下错误 cl Command line error D8050 cannot execute C Program F
  • 如何通过 urlfetchapp 发送带有有效负载中的数组的 post 请求

    我需要模拟从 html 表单到页面的 post 请求 我需要知道如何在有效负载中正确发送数组 提前致谢 我有简单的 html 代码 目标页面将以这种方式收到提交 args data files form Link picturelink1
  • 重定向到文件后使用 cout 或 cerr 输出到控制台

    将 cout 或 cerr 重定向到文件非常容易 我可以用它来将第三方输出重定向到文件 但是 当我将第三方输出重定向到文件后 我自己如何使用 cout 输出到控制台 我是 RAII 的忠实粉丝 所以我曾经编写过这个小助手类 它将重定向流 直
  • 使用依赖网络的代码进行单元测试

    我正在努力更好地对我的代码进行单元测试 但现在我正在编写大量处理远程系统的代码 SNMP WMI 之类的 对于大多数类 我可以模拟对象来测试它们 但是如何处理真实系统的单元测试呢 例如 如果我的类出去并获取服务器的 Win32 Logica
  • Python Selenium 等待任何文本

    我有一个硒测试 需要等到填充任何文本而不是精确的文本字符串匹配 我了解到text to be present in element text to be present in element value可以用于这种类型的目的 但我可能需要像
  • iOS 中解析 JSON 与解析 XML

    设想 我正在开发一个解析器 用于在发出请求后从服务器发回的数据 数据的格式是 JSON 或 XML 问题 是否有理由选择其中一种格式而不是另一种 解析 json 和解析 xml 哪个更快 谢谢大家 当 JSON 成为首选时 通常是因为它要短
  • 向量化 for 循环以加速 R 中的程序

    我正在寻找一些简单的矢量化方法for loop在 R 中 我有以下数据框 其中包含句子和两本正面和负面单词的字典 Create data frame with sentences sent lt data frame words c jus
  • 如何使用Java Math Commons CurveFitter?

    如何使用 Math Commons CurveFitter 将函数拟合到一组数据 我被告知使用 CurveFitterLevenbergMarquardt优化器 and 参数单变量函数 但我不知道在 ParametricUnivariate
  • 无法在 asp.net core 2.0 中发布原始类型

    我将非常简单的 json 数据发布到 net Core 2 0 API 为什么我有这样的方法 public async Task
  • Golang 从哪里获取根 CA?

    crypto tls Config RootCAs states https golang org pkg crypto tls Config RootCAs defines the set of root certificate auth
  • 确定列上使用的最大小数位数

    在 MS SQL 中 我需要一种方法来确定某个十进制列的行所使用的最大比例 例如 Col1 Decimal 19 8 的小数位数为 8 但我需要知道是否实际使用了所有 8 个 或者是否仅使用了 5 6 或 7 样本数据 123 123450
  • 是什么导致以下程序中的分段错误[重复]

    这个问题在这里已经有答案了 如果我将行的值保留为 100000 则程序可以正常工作 但是如果我将行数 100 万设置为 1000000 则程序会出现分段错误 是什么原因 我在 Linux 2 6x RHEL 内核上运行 include
  • 快速比较 DateComponents

    Swift 中有没有方便的方式来表示 例如 15 个月大于 1 年 1 周小于 10 天 我感到DateComponents最能代表我的需求 所以我需要类似的东西 DateComponents year 1 gt DateComponent
  • 无法将 colorFilter 应用于文本选择手柄

    我正在尝试将材质文本选择句柄引入我的应用程序 我从 SDK 中获取了中 右 左手柄 位图 和文本光标 9 块 的可绘制对象 并设置
  • 将列类型编辑为固定宽度字符串(在现有的 Pandas 数据框中)

    我在 pandas 数据框中有一列字符串对象 我想将它们更改为效率较低的固定宽度字符串类型 有很多这样的答案 如何在pandas DataFrame中按列设置dtypes https stackoverflow com questions
  • Rails 3.1 + Heroku = Worker 崩溃

    所以 我刚刚建立了一个全新的 Rails 3 1 1 应用程序 Ruby 1 8 7 在那里放置一些脚手架 安装 Authlogic 并创建一个新的 Heroku 应用程序 将其推送到 Heroku 并迁移数据库 一切都很好 我可以使用 A
  • 为什么我们不能在 C# 中使用公共字段进行数据绑定?

    我知道使用属性相对于字段的优点 例如能够在将来需要时提供额外的逻辑 但我真的想知道为什么不能使用公共字段进行数据绑定 甚至不能使用 JavaScriptSerializer 类等 JSON 序列化器 在这些情况下有什么充分的理由忽略公共字段
  • 从 pandas 返回多个值适用于 DataFrame

    我正在使用 Pandas DataFrame 按照以下示例进行逐行 t 检验 import numpy as np import pandas as pd df pd DataFrame np log2 np randn 1000 4 co
  • Visual Studio 2015 无法编译有效代码(std 函数错误?)

    我最近一直在使用 c 11 编写一些代码 这段代码在 GCC 和 Clang 中运行良好 并且我在我的项目中广泛使用了它 现在 我需要让它在 MSVC 中工作 我需要的所有 c 11 功能都标记为 是 然而 这个代码示例根本无法构建 我尝试
  • 使用 r 中包含特定字符串的行对数据进行子集化

    我想对名称以字符串 TRUST LIMITED INC CO 结尾的数据进行子集化 数据看起来像这样 name date abc TRUST 2018 01 01 123 Foundation 1997 02 06 Tim LIMITED