在r中,如何按一个因子修剪或缩尾数据

2024-03-28

我试图在因素(主题)的每个级别应用温莎函数,以消除极端情况。我可以将winsor函数应用于整个列,但想在主题内执行此操作。

Subject RT
1       402
1       422
1       155
1       460
2       283
2       224
2       346
2       447
3       415
3       161
3       1
3       343

理想情况下,我希望输出是一个向量,其中包含与输入相同的行数,但根据winsor函数删除和替换异常值(例如主题3的倒数第二个值)。


你正在寻找?by功能

 #  for example: 
 by(myDF, myDF$Subject, winsor(myDF$RT))

然而,使用data.table(代替data.frame)可能更适合你

### broken down step by step: 

library(data.table)
myDT <- data.table(myDF)

myDT[, winsorResult := winsor(RT), by=Subject]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在r中,如何按一个因子修剪或缩尾数据 的相关文章

  • R 中的匹配和计数字符串(DNA 的 k 聚体)

    我有一个字符串列表 DNA 序列 包括 A T C G 我想找到所有匹配项并插入到表中 该表的列都是这些 DNA 字母表的所有可能组合 4 k k 是每个匹配项的长度 K mer 必须由用户指定 行代表 DNA 字母表的数量在列表中按顺序匹
  • Leaflet Map - 第二个多边形使第一层不可点击

    我正在制作美国社区调查数据地图 目前我有一个主要层 如下所示plotMerge incomePerCapita 它运作良好 有一个完全充实的弹出窗口 图像等等 当我添加第二层以提供县和地区边界时 区域边界变得不可单击 似乎被新层掩盖了 如果
  • 如何使用 R / igraph 设置边缘颜色和顶点间距

    我是 R 新手 试图弄清楚如何为我有数据的系统制作社交网络地图 我已经设法从常见问题解答和教程中弄清楚我想做的大部分事情 但我被困在两件事上 如何使画布更大 图表间隔更大 现在已经太挤了 目前 边缘厚度是根据重量设置的 权重代表不同的状态
  • 通过变量分割 data.frame [重复]

    这个问题在这里已经有答案了 我将多个主题的数据存储在一个 CSV 文件中 导入 CSV 文件后 我想将每个参与者的数据拆分到自己的 data frame 中 更确切地说 我想采用下面的示例数据 并创建三个新的 data frames 每个
  • 如何在 dplyr 中使用切片来保留 R 中具有 NA 值的行

    我有以下数据集 我想知道每个组的最小单词 如果没有最小单词 它是 NA 我仍然想显示它 df data frame key c A A B B C word c 1 2 3 5 NA df gt group by key gt slice
  • PCA 图中带有名称的工具提示

    我想用 ggplotly 生成交互式绘图 工具提示应该显示变量的名称 interactive lt ggplotly pca dynamicTicks T tooltip c x y label list pca 是 PCA 的可视化 su
  • 列表列中的设置操作

    我正在尝试做集合运算在存储在列表列中的向量之间 例如this https stackoverflow com questions 38712196 text file to dataframe with a list column DT l
  • R 中的优化函数可以接受目标、梯度和粗麻布吗?

    我有一个想要优化的复杂目标函数 优化问题需要相当长的时间来优化 幸运的是 我确实有可用的函数的梯度和粗麻布 R 中是否有一个优化包可以接受所有这三个输入 optim 类不接受 Hessian 矩阵 我已经扫描了用于优化的 CRAN 任务页面
  • 如何在 R 中执行随机森林/交叉验证

    我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法 因此 我有一个数据集 其中包含 1664 个解释变量 不同的化学性质 和一个响应变量 保留时间 我正在尝试生成一个回归随机森林模型 以便能够预测给定保留时间的物质的化学性质 ID
  • dplyr :过滤一系列行(在一列中)

    虚拟数据框 id family lt c 1 1 2 2 3 3 people lt c male female male female male children dataset lt data frame id family peopl
  • 更改 ggplot 条形图填充颜色

    有了这个数据 df lt data frame value c 20 50 90 group c 1 2 3 我可以得到一个条形图 df gt ggplot aes x group y value fill value geom col c
  • 当按多列分组时,如何命名 dplyr 中的 group_split 列表

    我在 dplyr 中使用 group split 在分割了多个列后 我很难命名列表 当我们按一列分组时 我知道该怎么做here https stackoverflow com questions 57107721 how to name t
  • 从 data.frame 创建新列

    我有一个长格式的数据集 其中测量 时间 嵌套在 Networkpartners NP 中 而 Networkpartners NP 又嵌套在人员 ID 中 下面是它的示例 真实数据集有数千行 ID NP Time Outcome 1 11
  • 使用 ggplot_build 和 ggplot_gtable 后使用 ggsave 保存图形

    我正在通过更改 ggplot build 生成的数据来修改使用 ggplot 构建的图表 原因类似于包括 geom boxplot 中填充美学中使用的缺失因子水平的空间 https stackoverflow com questions 1
  • 为 RStudio Server 1.0.44 配置日志目录

    我在 CentOS 7 上运行 RStudio Server 1 0 44 根据文档 https support rstudio com hc en us articles 200554766 RStudio Server Applicat
  • 在knitr中打印漂亮的交叉表

    我想要的是使用 R Markdown 和 knit 从 RStudio 打印漂亮的交叉表 无论是在 pdf 文件中 还是在 html 文件中 我怀疑我错过了一些非常明显的东西 因为我不敢相信这是如此困难 我使用 xtabs 或 ftable
  • 从 Cox PH 模型预测概率

    我正在尝试使用 cox 模型来预测时间 称为停止 3 后失败的概率 bladder1 lt bladder bladder enum lt 5 coxmodel coxph Surv stop event rx size number cl
  • 在R中绘制3x3方形网格

    我得到了一个数字列表 n 9 想将它们画在一个 3 3 的正方形网格中 每个网格填充相应的数字 我如何在 R 中执行此操作而不安装额外的软件包 例如情节 非常感谢 这里有一个ggplot解决方案比我预期的要难一点 Setup the dat
  • Rglpk - 梦幻足球阵容优化器 - For 循环输出的 Rbind

    我有一个使用 Rgplk 的梦幻足球阵容优化器 它使用for循环生成多个最佳阵容 其数量由用户输入 代码如下 Lineups lt list for i in 1 Lineup no matrix lt rbind as numeric D
  • 使 matplotlib 图形默认看起来像 R?

    Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t

随机推荐

  • .NET 4.0 解决方案中的 NHibernate 1.2

    我有一些基于 NHibernate 1 2 的项目 我想将它们添加到 NET 4 0 解决方案中 但我收到 AmbigeousMatchException 无论这些项目是针对2 0还是4 0框架 如果我将它们添加到 NET 3 5 解决方案
  • 将刻度转换为时间格式 (hh:mm:ss)

    我从网络服务器获取视频长度值作为刻度 我想以 hh mm ss 格式显示它 我怎样才能在 JavaScript 中做到这一点 假设刻度以秒为单位 如果不是 您可以先将其转换为秒 您可以通过查找时间跨度中的整分钟数和小时数 然后获取剩余的秒数
  • 我什么时候应该使用解析器?

    我在正则表达式中遇到了将代码划分为功能组件的问题 它们可能会破裂 也可能需要很长时间才能完成 这段经历提出了一个问题 我什么时候应该使用解析器 当您对以下内容感兴趣时 应该使用解析器文本的词汇或语义意义 当模式可以变化时 当您只是想了解时
  • Java正则表达式正向预测但仅匹配唯一字符?

    我正在尝试将字符串输入与以下条件进行匹配 第一个字符是unique小写英文字母 接下来的字符代表从 1500 到 2020 的当前年份 接下来的字符只能是 10 或 100 或 1000 最后一个字符是 0 到 9 之间的数字 我创建的正则
  • 在多个数据库上使用 ActiveRecord

    我正在编写一个工资系统 它将与现有系统集成 原始系统有一个主数据库 用于处理用户管理和一些全局配置 下面有多个结构相同的数据库 基本上每个数据库都是一个公司的工资数据库 所有这些都与主数据库绑定 因为它属于父数据库公司拥有多家子公司 每个子
  • 在 matplotlib 底图投影上绘制椭圆

    我正在尝试在底图投影上绘制椭圆 要画一个像多边形一样的圆 有tissot用于绘图的函数天梭的指标 http en wikipedia org wiki Tissot 27s indicatrix如下例所示 from mpl toolkits
  • BeautifulSoup XML 仅打印第一行

    我正在使用 BeautifulSoup4 和 lxml 来解析 XML 文件 由于某种原因 当我打印 soup prettify 时 它只打印第一行 from bs4 import BeautifulSoup f open xmlDoc x
  • 将复选框数据插入mysql

    我的问题如下 这是我的 mySQL 表和 HTML 表单 https i stack imgur com g4qp5 jpg 我需要找到一个 PHP 代码来将复选框数据插入到 mySQL 表中 如果选中一个复选框 我想将该特定列填充为 1
  • 如何编写包含引号的字符串文字?

    我想用这个确切的文本创建一个字符串 nuke execute Write1 1 10 1 只需用双引号将其引起来 例如 nuke execute Write1 1 10 1 不起作用 gt gt gt nuke execute Write1
  • 使用自定义 INF 的微控制器的 USB 驱动程序安装问题

    我正在使用 NXP LPC1788 微控制器 并尝试在主机上创建一个驱动程序以通过 USB 与其进行通信 我相信我已经设法让设备正确处理标准 USB 请求 PC 能够正确读取字符串描述符 不过 我在编写示例 USB 驱动程序并为设备安装它时
  • 创建类路径资源中定义的名为“defaultValidator”的 bean 时出错

    尝试在 JBOSS 上部署 Spring Boot 应用程序时出现以下错误 但它在嵌入式 Tomcat 服务器上运行良好 我尝试浏览 Stack Overflow 以查找类似的问题 尚未找到解决方案 任何建议 将不胜感激 谢谢 Error
  • stdClass 或(对象)数组哪个更好地存储相关数据?

    我很长一段时间以来一直使用数组来存储相关字段 如果我想要相关的用户字段 我使用 user array id gt 27 name gt Pepe 但最近 我经常使用对象 我更喜欢使用 user gt id 而不是 user id 我的问题
  • 使用更多派生类型覆盖子类继承的属性

    我想要实现的目标的简化示例如下所示 public class Animal public virtual Teeth teeth get set public class Mouse Animal public override Small
  • 从 beta 升级后出现 Autofac / MVC4 / WebApi (RC) 依赖注入问题

    var resolver new AutofacWebApiDependencyResolver container configuration ServiceResolver SetResolver resolver 更新到 ASP NE
  • DividerItemDecoration 未显示在 RecyclerView 中

    我发现 DividerItemDecoration 可以很好地处理简单的单行列表项 但对于更复杂的列表项 它拒绝显示 这是列表项的 XML
  • 将事件处理程序绑定到“console.log”JavaScript 事件

    我的脚本将文本从 Javascript 中的多个位置发送到控制台输出 请参阅示例 如何将事件处理函数绑定到日志函数本身 以便每次触发事件时都执行一个函数 try some code catch e console log error e f
  • asp.net 文本框的默认值 -> TextMode = 密码

    请参阅下面的链接 https www boot loader com eng https www boot loader com eng该链接中的默认密码如何工作 我怎样才能有一个默认值 例如下面文本框的 密码 字符串 带星号
  • 模拟器:模拟器:警告:无法连接到代理:::1:8080:未知错误! - 安卓

    模拟器 模拟器 警告 无法连接到代理 1 8080 未知错误 安卓 更新后我收到此错误Android Studio 2 3 2 to Android Studio 3 0 canary 2 由于此错误 互联网无法在模拟器中运行 Edit 我
  • C 中任意数量的空格分割字符串

    我有一个文件 其中每个用户名和密码都由不同数量的空格分隔 bob passowrd1 saly password2 sam password2 void parse FILE open open fopen file txt char li
  • 在r中,如何按一个因子修剪或缩尾数据

    我试图在因素 主题 的每个级别应用温莎函数 以消除极端情况 我可以将winsor函数应用于整个列 但想在主题内执行此操作 Subject RT 1 402 1 422 1 155 1 460 2 283 2 224 2 346 2 447