在 R 中：带有向量变量的子集或 dplyr::filter

2024-04-15

df <- 
  data.frame(a=LETTERS[1:4],
             b=rnorm(4)
             )

vals <- c("B","D")

我可以过滤/子集df值在val with:

dplyr::filter(df, a %in% vals)
subset(df, a %in% vals)

两者都给出：

  a         b
2 B 0.4481627
4 D 0.2916513

如果我在向量中有一个变量名称怎么办，例如：

> names(df)[1]
[1] "a"

然后它不起作用 - 我猜是因为它被引用了

dplyr::filter(df, names(df)[1] %in% vals)
[1] a b
<0 rows> (or 0-length row.names)

你怎么做到这一点？

更新（如果是 dplyr::tbl_df(df) 会怎么样）

下面的答案适用于 data.frames，但不适用于 dplyr::tbl_df 包装的数据：

df<-dplyr::tbl_df(df)
dplyr::filter(df, df[,names(df)[1]] %in% vals)

不起作用（我以为tbl_df是在 df 之上简单的包裹吗？）

这确实再次起作用：

dplyr::filter(df, as.data.frame(df)[,names(df)[1]] %in% vals)

最终更新：它使用 lazyeval::interp 与 tbl_df() 一起使用

请参阅下面 AndreyAkinshin 的解决方案。

您可以使用df[,"a"] or df[,1]:

df <- data.frame(a = LETTERS[1:4], b = rnorm(4))
vals <- c("B","D")

dplyr::filter(df, df[,1] %in% vals)
#  a         b
# 2 B 0.4481627
# 4 D 0.2916513

subset(df, df[,1] %in% vals)
#  a         b
# 2 B 0.4481627
# 4 D 0.2916513

dplyr::filter(df, df[,"a"] %in% vals)
#  a         b
# 2 B 0.4481627
# 4 D 0.2916513

subset(df, df[,"a"] %in% vals)
#  a         b
# 2 B 0.4481627
# 4 D 0.2916513

使用 dplyr::tbl_df(df)

一些魔法与lazyeval::interp帮助我们！

df <- dplyr::tbl_df(df)
expr <- lazyeval::interp(quote(x %in% y), x = as.name(names(df)[1]), y = vals)

df %>% filter_(expr)
# Source: local data frame [2 x 2]
#
#   a        b
# 1 B 0.4481627
# 2 D 0.2916513

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

subset

dplyr

在 R 中：带有向量变量的子集或 dplyr::filter 的相关文章

使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
从每个子集中选择最大值

我在这里敲头我觉得自己很愚蠢因为我确信我以前做过类似的事情但我一辈子都不记得是怎么做的我想那一天 gt 假设我有以下数据 gt 和一个返回此数据的查询 gt 但我想要这个 ID FirstID ID FirstID ID First
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac
如何使用autoconf重新生成配置文件？

我使用 autoconf 重新生成配置文件它有效但是当我执行生成的配置文件时 configure 有一些错误消息例如 configure line 3713 syntax error near unexpected token bla
如何在基数 R 中进行分组

我想使用以下 SQL 查询来表达base R 没有任何特定的包 select month day count as count avg dep delay as avg delay from flights group by month d
dplyr 中的标准评估：全局环境中的函数出现“无法找到函数”错误

我试图在 dplyr 中对全局环境中的函数使用标准评估但出现无法找到函数错误这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
通过 Shiny 中的串扰将 Plotly 与 DT 结合使用

我正在编写一个应用程序来将 csv 文件读取为闪亮的并将散点图与 DT 表链接起来我几乎遵循了 Plotly 网站上 DT 数据表上的示例 https plot ly r datatable https plot ly r datatab
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
rvest 和 NHL 统计数据的 CSS 选择器问题

我想从 hockey reference com 中抓取数据特别是从以下链接中抓取数据 https www hockey reference com leagues NHL 1991 html https www hockey refer
更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本

随机推荐

为什么Xcode自动创建带下划线的变量？

为什么在最新版本的 Xcode dp 4 中声明的变量是retain nonatomic是否在变量名前使用下划线这会创建某种类型安全吗例如我创建一个属性 property retain nonatomic IBOutlet UILab
如何在本地进行 Facebook Messenger Bot 开发？

设置 webhooks 时它会说Secure URL是必须的我在用ngrok https ngrok com 隧道本地主机地址这里有一个例子 https github com wit ai node wit https github
如果 Objective C 是 C 的严格超集，那么为什么它不能编译呢？

考虑以下源文件它是至少应该是有效的 C void id 我正在尝试编译它gcc c test m 但我收到以下错误 test m 1 error id redeclared as different kind of symbol
如何从R中的不同函数将数据依次写入csv文件中？

我有一个 CSV 文件我想根据我执行的功能将数据写入另一个 CSV 文件例如 Data csv Identity State City BusinessName BusinessNeed 12 California Los Angele
通过 angular-cli 生成的角度组件的自定义项目级模板

如何将自定义角度组件原理图添加到现有项目我想要例如my page将复制现有的组件模板 node modules schematics angular component 文件但带有编辑过的模板我希望它可以通过以下方式实现angular
UnionBy Linq 实现

我需要 Union 的实现来比较对象的属性而不是对象本身我想出了以下几点 public static IEnumerable
实时清除数据容器的内容

My problem is best explained by the architecture below 基本上我必须清除NSMutableData实时对象或任何其他对象即我无法阻止其包含线程有没有办法 API 来做到这一点 u
32feet.net 如何在 C# 中异步发现附近的蓝牙设备

我正在尝试使用32英尺 NET http 32feet codeplex comC 应用程序中的蓝牙库用于检测附近的设备我的小应用程序的目的是通过人们手机的蓝牙功能让电脑知道谁在房间里执行此类操作的最佳方法是让我想要跟踪的设备连接一
将网络摄像头从浏览器流式传输到 RTMP 服务器

我正在尝试将一些内容从浏览器的网络摄像头实现流式传输到随机 RTMP 服务器我让它工作到每 2 秒将 WEBM 我相信是 VP8 编码的电影片段发送到我的服务器的部分但棘手的部分是从该部分将其发送到 RTMP 服务器对 FFMPEG
如何简单地解析没有指定年份的日期？

我有一个工具它似乎可以给我日期但没有指定我需要转换的年份并且我正在使用 Java 来完成任务实际上是 Groovy 但在本例中足够接近示例日期是 13 Dec 12 00 00 它应该指的是 12 13 2011 因为年份未指定
HTML 俄语

我必须设计一个俄语版本的网站我从翻译那里得到文本我把它复制到Dreamweaver的代码中但它不起作用我有平常的头我应该怎么办您应该将文件的编码更改为 UTF 8 您可以执行此过程当您Save As文件在记事本中或者您可以使用
OpenSSL 上的 EVP_DecryptFinal_ex 错误

我正在使用 OpenSSL EVP 例程使用 AES 128 cbc 模式进行解密我使用 NIST 站点指定的测试向量来测试我的程序该程序似乎在 EVP DecryptFinal ex 例程处失败谁能告诉我有什么问题吗另外我如何在
处理 Swift 2 中异步闭包错误的最佳方法？

我使用了大量的异步网络请求顺便说一句 iOS 中的任何网络请求都需要异步并且我正在寻找更好的方法来处理来自 Apple 的错误dataTaskWithRequest哪个不支持throws 我有这样的代码 func sendRequest
创建名称为“securityConfig”的 bean 时出错：自动装配依赖项注入失败

我正在尝试结合 Java config 和 xml config 进行 Spring 安全身份验证但我收到一个错误创建名称为 securityConfig 的 bean 时出错自动装配依赖项注入失败我的代码似乎有什么问题一直在谷歌
无法在 Ubuntu 上的 PyCharm 上启动终端

我想运行一段代码为此我在我的 Ubuntu 机器上安装了 PyCharm 现在当我打开 PyCharm 应用程序并尝试打开终端时它会抛出错误并且不会打开终端 java io IOException Exec tty错误未知的pyc
管理面板中的 django choicefield 过滤器

默认情况下 django 管理员list filter提供型号选择中所有可用的过滤器但除了那些我还想要一个过滤器我们可以说它是无过滤器 class Mymodel char choice field choices 1 txt1 2
18M+行表的子查询和MySQL缓存

由于这是我的第一篇文章我似乎只能发布 1 个链接因此我在底部列出了我所指的网站简而言之我的目标是让数据库更快地返回结果我尝试包含尽可能多的相关信息以帮助在帖子底部提出问题机器信息 8 processors model name
在 Snowflake 的公共表表达式中使用“match_recognize”

更新已回答here https stackoverflow com questions 68544567 match recognize with cte in snowflake 68550312 68550312 我正在将一个有点复杂
如何找到逻辑回归模型特征的重要性？

我有一个通过逻辑回归算法训练的二元预测模型我想知道哪些特征预测变量对于正类别或负类别的决策更重要我知道有coef 参数来自 scikit learn 包但我不知道它是否足够重要另一件事是我如何评估coef 值对于消极类和积极类的
在 R 中：带有向量变量的子集或 dplyr::filter

df lt data frame a LETTERS 1 4 b rnorm 4 vals lt c B D 我可以过滤子集df值在val with dplyr filter df a in vals subset df a in val

在 R 中：带有向量变量的子集或 dplyr::filter

在 R 中：带有向量变量的子集或 dplyr::filter 的相关文章

随机推荐

热门标签