检测多列中的关键词并在新列中标记它们

2024-03-12

我有这种类型的数据：

set.seed(123)
df <- data.frame(
  v1 = sample(LETTERS[1:10], 5),
  v2 = sample(LETTERS[1:10], 5),
  v3 = sample(LETTERS[1:10], 5),
  v4 = sample(LETTERS[1:10], 5)      
)

以及一些key words:

keys <- c("A", "C", "F", "H")

我想 (i) 检测哪个key单词出现在每一列中df(ii) 为每个创建新列keys，记录用1if that key存在。我一直在使用for到目前为止，循环，但是不起作用：

library(stringr)
for(i in keys){
  df[i] <- +str_detect(apply(df, 1, paste0, collapse = " "), keys[i])
}
df
  v1 v2 v3 v4  A  C  F  H
1  C  A  J  I NA NA NA NA
2  H  E  E  C NA NA NA NA
3  D  H  F  A NA NA NA NA
4  G  D  I  J NA NA NA NA
5  F  C  A  F NA NA NA NA

我不知道为什么它不起作用，因为同样的逻辑适用于单个key确实有效：

+str_detect(apply(df, 1, paste0, collapse = " "), keys[1])
[1] 1 0 1 0 1

我将不胜感激关于如何for必须调整循环，但也必须对问题采取完全不同的解决方案（例如，dplyr).

A base解决方案：

cbind(df, +sapply(keys, grepl, x = do.call(paste, df)))

#   v1 v2 v3 v4 A C F H
# 1  C  E  J  I 0 1 0 0
# 2  J  D  E  J 0 0 0 0
# 3  B  F  C  E 0 1 1 0
# 4  H  H  H  C 0 1 0 1
# 5  F  A  A  B 1 0 1 0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

forloop

dplyr

检测多列中的关键词并在新列中标记它们的相关文章

kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
For...VBA 中的下一个循环超出限制

我正在使用一个For Next循环填充数组如下所示 ReDim array 1 to 100 1 to 100 For i 1 to 100 Next i But the i计数器似乎总是转到 101 而不是停止在 100 因此这会在我
R：编写抛硬币的随机采样程序

假设我们有以下情况有一枚硬币如果它正面朝上那么下一次抛掷正面的概率是 0 6 如果是反面那么下一次抛掷反面的概率也是 0 6 一个班有100名学生每个学生随机抛掷硬币几次 Student n 的最后一次抛硬币不会影响 Studen
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
从向量中删除元素在 R 中出现的时间量

我想从一个向量中删除元素在另一个向量中出现的时间就像我要减去它们一样鉴于我想要删除的元素向量中的每个元素也存在于我想要从中删除的主向量中 a lt c A B B C C C b lt c A B C C a a in b return
将 RDS 文件从网络（即 URL）直接加载到 R 中？

read csv 具有直接从 url 读取的出色能力 readRDS 才不是我想将 RDS 文件从 Internet 移动到我的 R 环境我看到有几种方法 Method 1 此方法会用下载的文件弄乱工作目录 myurl lt https
jupyter 中的 r 图形 - 无法启动 png() 设备

我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
美人鱼图：调整图表周围的空白

我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图在 HTML PDF 输出中图表上方和下方有大量空白请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
R 错误：无法更改锁定绑定的值

我试图估计无限数字流的平均值和标准差当我运行代码时出现错误消息无法更改锁定绑定的值我做了一些研究发现这个错误与我使用全局变量有关但我无法弄清楚任何帮助将非常感激在此先感谢您的帮助 define global variable
根据 row_number() 过滤 data.frame

更新自从提出这个问题以来 dplyr 已经更新现在按照 OP 的要求执行我正在尝试获取第二行到第七行data frame using dplyr 我正在这样做 require dplyr df lt data frame id 1 1
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
在 Lavaan 生长曲线模型中提取个体轨迹

我已经使用 R 的 Lavaan 包中的 Growth 函数成功地对一项研究的纵向数据进行了建模我找不到任何关于如何提取每个参与者的预测轨迹的记录我只能找到整个组的预测轨迹在摘要输出的拦截部分下给出使用 lavPredict m
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p

随机推荐

Java 中的包和 C++ 中的库之间有区别吗？

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
有没有办法配置 PuTTY 或其他终端以在下一个输出到 stdout 时闪烁任务栏？

我专门寻找 PuTTY 的解决方案但也对其他终端模拟器感兴趣例如 Gnome Terminal 我的想法是如果我开始一个tar zxvf为了能够在终端模拟器上设置触发器将其最小化然后在下一次输出到 stdout stderr 时
检查 Flask 中 Jinja2 内的变量类型

我创建的模板文件包含以下内容 if type a 1 b 2 is dict print Oh Yes else print Oh No endif 然后 Jinja2 回应说 TemplateAssertionError no test
是否可以使用Go编译器为其他操作系统分发可执行文件？

我目前正在Mac OS X上工作现在我需要构建一个 exe文件以便Go程序可以在Windows上运行那么问题来了如何在 MacOS amd64 下构建 Win X86 的可执行文件或者不可能这样做吗如果你不使用 CGo 而使用纯
使用或不使用 C++0x 功能 [重复]

这个问题在这里已经有答案了可能的重复您今天使用 C 0x 的情况如何 https stackoverflow com questions 1754397 how are you using c0x today 我正在与一个团队合作开发一
Websocket Java 服务器。不发送消息也不接收消息

我正在尝试制作一个 Java WebSocket 服务器没有什么真正复杂的只是一个丑陋的小服务器用于使用标准定义的 api 从浏览器尝试 websocket 我一直在阅读协议的规范它非常简单我已经握手了显然它正在起作用我用Ja
附加分配给特定分区的 KafaConsumer

如何将 python 消费者脚本附加到特定的 kafka 分区在运行消费者脚本的两个实例如下所示时每个实例都会随机选择一个分区然后按预期消费打印该特定分区的所有消息但由于我需要将这些消息输出到磁盘上名为本地文件的分区因此将脚
用于存储数百万张图像的文件夹结构？

我正在构建一个网站该网站正在查看轻松上传的数百万张照片每个上传的图像都有 3 个缩略图我需要找到存储所有这些图像的最佳方法我搜索并找到了存储为哈希的图像示例例如如果我上传 coolparty jpg 我的脚本会将其转换为 Md5
数据仓库模型：集线器有什么用？

我刚刚读到数据仓库建模 https en wikipedia org wiki Data vault modeling据我了解集线器仅包含密钥和记录源所以我想知道为什么我应该创建这些中心表只是为了存储记录源仅拥有卫星和链接还不够吗
NSValueTranformer 用于加密数据

我想在 NSValueTransformer 的帮助下加密一些核心数据列我的想法是我使用数据类型可转换并为我的数据类型定义一些转换器在转换方法中我想加密解密该值我定义了一个实际上什么都不做的变压器加密的东西目前还没有实现 im
ReportViewer 到 div/image/object 内的 PDF

这几天一直在寻找但没能找到我要找的东西希望我没有错过我有一个 ASP NET 4 0 站点我正在将其放在一起以检索工资信息目前我正在使用reportviewer 但由于跨浏览器支持它不能100 工作我已经将其设置为自动将 RV
Symfony2 形成没有实体的验证器组

我正在使用 Symfony2 表单组件来构建和验证表单现在我需要根据单个字段值设置验证器组不幸的是似乎每个示例都基于实体由于多种原因我没有使用实体例子如果任务为空则应删除所有约束验证器但如果不是则应使用默认的验证器集或
使用 spring RestTemplate 来自 Android 的 PUT 请求

我必须通过 Restful 服务 Net 将客户对象从 Android 客户端放入数据库服务合同 WebInvoke Method PUT UriTemplate customers customerId RequestFormat We
我可以将同一个 Firebase 用于两个不同的应用吗？

我想为两个应用程序使用相同的 Firebase 在这两个应用程序中用户应该能够通过 Google Facebook 或电子邮件登录但在我的 Firebase 仪表板的登录和身份验证部分中我只能添加一个 Facebook 应用程序
用不同的方式从列表中删除重复项

我有一个名为employee的类它是pojo 并且我创建了该pojo类型的employee类型的列表现在我想从列表中删除重复项请告知实现这一目标的各种方法是什么 class Emp implements Comparable Stri
无法在经典 asp 中写入文件

好吧自从我使用经典的 asp 以来已经有一段时间了所以我有点生疏了这是我的问题我正在尝试使用 FSO 将文件写入文件系统下面的代码非常简单但是该文件没有出现也没有出现错误我知道它正在运行代码因为我可以在此片段之前和之后添
无法打开源文件：“WIN32”：没有这样的文件或目录

在 VS2008 中构建 C 项目时出现此错误很困惑这是什么意思为什么它认为WIN32是一个文件 Go to Project gt 特性 gt C C gt 命令行你很可能有一个 I 在你之前 D WIN32 由于某种原因空的 in
在 Typescript 上获取插件函数

我正在尝试在打字稿文件上使用一些科尔多瓦插件功能但我无法构建该文件想象一下我想要访问设备平台和型号有人可以帮我弄这个吗我应该为插件的 js 文件上的每个函数创建接口吗提前致谢对此已有定义 https github com bo
在 Dart 中克隆列表、映射或集

来自 Java 背景克隆 Dart 的推荐方法是什么List Map and Set Use of clone in Java is tricky and questionable1 2 Effectively clone is a co
检测多列中的关键词并在新列中标记它们

我有这种类型的数据 set seed 123 df lt data frame v1 sample LETTERS 1 10 5 v2 sample LETTERS 1 10 5 v3 sample LETTERS 1 10 5 v4 sa

检测多列中的关键词并在新列中标记它们

检测多列中的关键词并在新列中标记它们 的相关文章

随机推荐

热门标签

检测多列中的关键词并在新列中标记它们的相关文章