如何同时按名称或标准差选择列？

2024-04-11

Solution

我采用了 @thelatemail 提供的解决方案，因为我试图坚持使用 tidyverse 和 dplyr——我对 R 仍然很陌生，所以我正在采取一些小步骤并利用辅助库。感谢大家花时间贡献解决方案。

df_new <- df_inh %>%
select(
  isolate,
  Phenotype,
  which(
    sapply( ., function( x ) sd( x ) != 0 )
  )
)

Question

如果列名称为“isolate”或“Phenotype”或者列值的标准差不为 0，我尝试选择列。

我已经尝试过以下代码。

df_new <- df_inh %>%
# remove isolate and Phenotype column for now, don't want to calculate their standard deviation
select(
  -isolate,
  -Phenotype
) %>%
# remove columns with all 1's or all 0's by calculating column standard deviation
select_if(
  function( col ) return( sd( col ) != 0 )
) %>%
# add back the isolate and Phenotype columns
select(
  isolate,
  Phenotype
)

我也尝试过这个

df_new <- df_inh %>%
select_if(
  function( col ) {
  if ( col == 'isolate' | col == 'Phenotype' ) {
    return( TRUE )
  }
  else {
    return( sd( col ) != 0 )
  }
}
)

我可以按标准差或按列名称选择列，但我不能同时执行此操作。

不确定你是否可以这样做select_if单独使用，但一种方法是将两个结合起来select操作，然后绑定列。使用mtcars作为样本数据。

library(dplyr)
bind_cols(mtcars %>% select_if(function(x) sum(x) > 1000), 
          mtcars %>% select(mpg, cyl))

#    disp  hp  mpg cyl
#1  160.0 110 21.0   6
#2  160.0 110 21.0   6
#3  108.0  93 22.8   4
#4  258.0 110 21.4   6
#5  360.0 175 18.7   8
#6  225.0 105 18.1   6
#7  360.0 245 14.3   8
#8  146.7  62 24.4   4
#....

但是，如果列满足两个条件（在select_if也select）然后该列将被重复。

我们还可以使用基本 R 来提供相同的输出，但避免列被选择两次unique.

sel_names <- c("mpg", "cyl")
mtcars[unique(c(sel_names, names(mtcars)[sapply(mtcars, sum) > 1000]))]

因此，对于您的情况，两个版本将是：

bind_cols(df_inh %>% select_if(function(x) sd(x) != 0), 
          df_inh %>% select(isolate, Phenotype))

and

sel_names <- c("isolate", "Phenotype")
df_inh[unique(c(sel_names, names(df_inh)[sapply(df_inh, sd) != 0]))]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

standarddeviation

如何同时按名称或标准差选择列？的相关文章

如何有效地将多个光栅 (.tif) 文件导入 R

我是 R 新手尤其是在空间数据方面我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中所有文件都存储在同一文件夹中不确定这是否重要但请注意在我的 Mac 和 Windows 并行 VM 上的文件夹
将所有分号替换为空格 pt2

我尝试对 2000 多行关键字的列表运行文本分析但它们的列出方式如下战略管理风格组织所以当我使用 tm 删除标点符号时它就变成了组织的战略管理风格我认为这在某种程度上破坏了我常用术语的分析我尝试过使用 vector lt
如何从 pandas 数据框中的列中删除字符串值

我正在尝试编写一些代码以逗号分隔数据帧列中的字符串因此它成为一个列表并从该列表中删除某个字符串如果存在删除不需要的字符串后我想再次以逗号加入列表元素我的数据框如下所示 df Column1 Column2 0 a a b c
在 R 中导入 csv 文件时如何保留前导零？

当我写一个 csv来自 R 的文件其中我的组名称以前导零值开头前导零被保留但是当我导入 csv前导零被删除组名称被转换为整数当我导入一个组时如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
如何在基数 R 中进行分组

我想使用以下 SQL 查询来表达base R 没有任何特定的包 select month day count as count avg dep delay as avg delay from flights group by month d
将 Tuple2 的值部分（即映射）合并为按 Tuple2 的键分组的单个映射

我在 Scala 和 Spark 中这样做我有和Dataset of Tuple2 as Dataset String Map String String 下面是值的示例Dataset A 1 gt 100 2 gt 200 3 gt 1
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落
如果条目出现次数少于 x 则删除数据框中的行

我有以下数据框称之为 df 它是由三个向量组成的数据框姓名年龄和邮政编码 df Name Age ZipCode 1 Joe 16 60559 2 Jim 20 60637 3 Bob 64 94127 4 Joe 23 9412
如何确定 R 包的作者？

如何确定包的作者是谁鉴于我们拥有这个广泛使用的代码库我认为参考我在分析中使用的软件是合适的有没有办法以编程方式检索作者和任何其他相关信息在伪代码中我想执行以下操作 references base 我怎样才能做到这一点为了能够引用
R 多元一步预测和准确性

我想使用 R 来比较两个预测模型的 RMSE 均方根误差第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年然后使用 1966 年至 2001 年的估计值来预测 2002 年依此类推直至 2015 年第二个模型使
汇总表中各列的字符值比例

在这种数据框中 df lt data frame w1 c A A B C A w2 c C A A C C w3 c C A B C B 我需要计算所有列中字符值的列内比例有趣的是以下代码适用于大型实际数据集但对上述玩具数据会引发错
Python/从每个包含类似字符串对象的 Pandas 数据框单元格中去除空格的有效方法

我正在将 CSV 文件读入 DataFrame 中我需要从所有类似字符串的单元格中删除空格在 Python 2 7 中保持其他单元格不变这是我正在做的事情 def remove whitespace x if isinstance x
如何绘制每条线之间具有特定距离的图形

实际上我尝试绘制一个图形但它将所有列线放在一起并显示因此它不具有代表性我尝试制作模拟数据并向您展示我如何绘制它并向您展示我想要的内容我不知道如何制作像下面所示的示例的数据但我在这里做了什么 set seed 1 M lt
从另一个数据帧创建一个数据帧（使用数据透视）

我对熊猫有疑问我有一个包含三列的数据框 id1 id2 amount 由此我想创建另一个数据框其索引为 id1 其列为 id2 单元格包含相应的金额我们来看一个例子 import pandas as pd df pd DataFr
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head

随机推荐

MySQL 5.7 innoDB集群中的一个节点崩溃并且无法将崩溃的节点重新加入集群

我们的一个环境中有一个 MySQL innodb 集群集群中的一个节点崩溃了虽然我们能够使崩溃的节点联机但无法将其加入集群有人可以帮助恢复恢复节点并将其加入集群吗我们尝试使用 dba rebootClusterFromCompl
SMTP 客户端在本地主机上发送消息失败，在远程主机上成功

我有一个小型 tcp 服务器除其他外还用于通过 SMTP 服务器发送邮件问题是当我在开发计算机到 smtp 服务器的远程连接上运行它时它可以正常工作但是当我在与 SMTP 服务器 Windows Server 2008 R2
本地语句输出与调用命令输出非常不同

直接登录到系统我运行此语句并得到以下输出 Get ClusterNetwork cluster backups role None 这是完美的甚至美丽因为它的简单然而当我使用 invoke command 从远程计算机运行完全相
chrome 72 更改了源映射行为

我正在为 Chrome 开发一个 Webextension 代码是用 Typescript 编写的所以我需要源映射该扩展与 ParcelJS 捆绑在一起但我相信我的问题与捆绑器无关从 Chrome 70 更新到 72 后源映射不再
限制用户从“主要区域”Dynamics 365 on Prem 进行访问

我们创建了一个新的应用程序这是我们解决方案中迄今为止的第一个应用程序这个想法是一组用户将只能访问该应用程序而他们将无法再访问该应用程序的主要区域某些实体的某些表格看起来与其他实体不同等主要区域是指默认情况下或多或少存在的
运算符 == 与 data.table 中的逻辑列不一致

请参阅以下可重现的示例 library data table set seed 123 DT lt data table A rep 0 3 10000 DT B runif N lt A DT B T N 1 3005 DT summar
在R中提取形状文件对象的质心？

我有一个形状文件上传到以下路径 https drive google com open id 0B1ITb 7lHh1EUFVfVWc4ekRfSnc https drive google com open id 0B1ITb 7lHh1
更改选定直方图 bin 条的颜色（给定其值）

类似于我之前问过的一个问题 https stackoverflow com questions 35780048 labelling a matplotlib histogram bin with an arrow 我有一个像这样的 MWE
Google 文档列表 API 和 Google Drive SDK

文档列表 Api 的路线图是什么它比 Google Drive SDK 有更多的功能即 ACL 现在 JAVA 或 PHP 的示例已从文档中消失它会在不久的将来被弃用吗目前 Documents List API 是与 Google
当行内的单元格具有类名称时，为什么 CSS 悬停在表格行上不起作用？

我遇到了这个问题所以任何帮助将不胜感激我有一张有几行的桌子行中的每个单元格都属于某个类别我使用这些类名来给单元格着色这是我的表中的一个示例行 tr td class summarypage odd column Theme td
链轮 SASS 部分 ERB 延伸

我注意到使用最新的 Rails 和 sprockets 版本 3 2 1 和 2 2 0 将 erb 文件扩展名添加到 sass 部分时似乎存在问题例如如果 somestylefilename css sass 重命名为 somesty
是否可以在已经存在的对象中模拟单个方法？

对于集成测试我需要在 java 服务客户端中模拟特定方法而不破坏其中的其余信息它没有自构造函数所以这样的解决方案是不可能的 private DBClient mockClient new DBClient alreadyExisti
MUI 文本字段上的省略号效果

如何在 MUI 文本字段上添加省略号效果他们有一个用于文本换行的多行选项但我想要单行像您可以做的那样换行文本
Xamarin：未找到绑定属性

这个应用程序在 UWP 中运行得很好除了在 Android 上失败的一个更基本的属性之外我已经删除了所有内容它看起来像这样我的页面 xaml
使用 apikey 从 Google Sheets API 获取 403 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我一直在使用 Google Sheets 作为我的一些应用程序的简单数据后端基本上这些是 20 行 x 20 列客户希望能够
调整图像大小，同时保持纵横比

大家好我从互联网上下载了一张图像需要将其大小调整为其大小的 1 4 同时保留其纵横比关于如何最简单地做到这一点有什么想法吗 WebRequest requestPic WebRequest Create imageURL WebRes
关于并行任务的 `srun ... >output_file` 的语义

抱歉这个问题需要大量的积累但总而言之它是关于许多并行实例的条件srun gt output file会或不会导致某些进程任务破坏其他进程任务产生的输出案例 0 仅 bash 无 SLURM 假设prog 0 sh是以下玩具脚本
Overflow:hidden 隐藏边框但不隐藏溢出的元素

我正在研究带有过渡的标题但有些东西不起作用我将 ul 设为 120px li 设为 60px 我给 li hover 一个translateY 60px 这样当您将鼠标悬停在 li 上时它就会弹出我想隐藏溢出的内容直到您将鼠标悬停在
自定义日期选择器对话框

目前我正在使用经过修改的本机对话框来隐藏日期微调器并且工作正常但现在我想以这样的格式设置日期当我旋转月份微调器或年份微调器时对话框仅显示月份和年份而不是完整的日历日期我的日期选择器对话框的自定义代码如下 Override pro
如何同时按名称或标准差选择列？

Solution 我采用了 thelatemail 提供的解决方案因为我试图坚持使用 tidyverse 和 dplyr 我对 R 仍然很陌生所以我正在采取一些小步骤并利用辅助库感谢大家花时间贡献解决方案 df new lt df i

如何同时按名称或标准差选择列？

如何同时按名称或标准差选择列？ 的相关文章

随机推荐

热门标签

如何同时按名称或标准差选择列？的相关文章