如果小于行标准差，则将行值更改为零

2023-11-22

如果行的所有值小于该行的标准差，我想将它们更改为零。

set.seed(007)
X <- data.frame(matrix(sample(c(5:50), 100, replace=TRUE), ncol=10))

   X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1  37 10 43 45 11 17 39 13 13  44
2  10 24 32 16  7 50 41 47  9  39
3  23 49 46 35 16 30 22 10 11  46
4  41 46 19 28 47 39 27 40 49  13
5  29 23 49 10 50 17 42 43  7  31
6  31 26 11 36 35 43 45 29 33   9
7  21 12  5 21 29 12 31 30  7  30
8  32 24  8 43  9 17 35 44 41   8
9  20 44 39  8 40 17 27 45 14  37
10 50  8  5 48 27 15 15 12 30  15

下面的几行似乎可以完成这项工作，但在我的实际用例中速度非常慢，而且我有点不确定 sapply 正在返回什么......

Y <- t(sapply(1:nrow(X), function(i) 
      sapply(1:ncol(X), function(j) 
        ifelse(X[i,][[j]] < sd(X[i,]), 0, X[i,][[j]]))))

      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]   37    0   43   45    0   17   39    0    0    44
 [2,]    0   24   32    0    0   50   41   47    0    39
 [3,]   23   49   46   35   16   30   22    0    0    46
 [4,]   41   46   19   28   47   39   27   40   49    13
 [5,]   29   23   49    0   50   17   42   43    0    31
 [6,]   31   26    0   36   35   43   45   29   33     0
 [7,]   21   12    0   21   29   12   31   30    0    30
 [8,]   32   24    0   43    0   17   35   44   41     0
 [9,]   20   44   39    0   40   17   27   45   14    37
[10,]   50    0    0   48   27    0    0    0   30     0

什么是更快、更有效的方法？

UPDATE非常感谢大家快速有效的答复！

这是他们的堆积方式...

set.seed(007)
size <- 1e5
X <- matrix(sample(c(5:50), size, replace=TRUE), ncol=size/2)

library(microbenchmark)    
results <- microbenchmark(
  X[ sweep(X, 1, apply(X,1,sd) ) < 0 ] <- 0,
  X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0,
  sapply(X, function(x) ifelse(x < sd(x), 0, x)),
  times = 100L)
print(results)
Unit: milliseconds
                                              expr         min          lq     median         uq        max neval
          X[sweep(X, 1, apply(X, 1, sd)) < 0] <- 0    7.966167   10.869785   12.38399   15.00107   45.41557   100
 X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0    7.344227    9.675577   11.22283   14.34280   53.70728   100
    sapply(X, function(x) ifelse(x < sd(x), 0, x)) 3028.336236 3221.325598 3302.16115 3466.66875 4539.88358   100
# plot
if (require("ggplot2")) {
  plt <- ggplot2::qplot(y=time, data=results, colour=expr)
  plt <- plt + ggplot2::scale_y_log10()
  print(plt)
}

enter image description here

看起来阿伦的答案是最快的一点点（正如阿伦所说）。然而，DWin 的打字少了 8 个字符，并且以使用异国情调（对我来说）而闻名sweep功能。

一个小的娱乐更新，Arun 的方法明显更快（t = 2.0112，df = 191.985，p 值 = 0.04571），或者，如果您愿意，Arun 函数的平均速度比 DWin 的平均速度快得多（使用这种稳健的贝叶斯估计方法，第 1 组 = DWin，第 2 组 = Arun，尽管 Arun 的计时不太适合 t-dist）：

enter image description here

这个怎么样？

X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0
#    X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
# 1  50  0 34 36 41 31  0 18 45  20
# 2  23 15 18 17 22 38 28 32 45   0
# 3   0 40 50  0 39 40 40 43 16  46
# 4   0  0 46  0 25 33 36 33 39   0
# 5  16 25 50 22 46 38 30  0 22  38
# 6  41  0  0 43 19 22 35 31  0  31
# 7  20 30 33 27  0 12 26 25  0  29
# 8  49  0 27 41 42  0 27 25 40  21
# 9   0 50 49 43 46 22 20 33 21  42
# 10 26 19 21 26 49 17 24 47 24  13

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rows

standarddeviation

如果小于行标准差，则将行值更改为零的相关文章

R：从 Github 安装包时出现编码问题

我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
在 Shiny 应用程序中更改 bsModal 的背景

我正在开发一个 Shiny 应用程序我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮我做了一些研究并了解到我需要覆盖背景和键盘参数但即使我看到了一些建议我也不知道这到底需要放在我的代码中的哪里我不精通 Ja
闪亮的传单添加大量分离的折线

我有一个 200k 行数据集其中包含出发地和目的地的坐标我有一个 R 闪亮的应用程序带有传单地图可以在这些坐标上显示圆圈尽管坐标数量很大但效果很好这是数据的简化示例每行包含出行id 出发地经纬度目的地经纬度 id lat
如何在 Shiny 应用程序中访问/打印/跟踪当前选项卡选择？

我正在一个闪亮的应用程序中工作我希望能够访问用户在会话中当前所在选项卡上的信息我有一个观察事件用于侦听要单击的特定按钮简而言之我想存储打印用户单击此按钮时所在的当前选项卡单击此按钮后选项卡将更改为带有 updateTabIt
R闪亮：基于checkboxgroupinput的子集数据

我想根据复选框输入动态选择的列对数据进行子集有什么方法可以使我的输入文件在我的代码中全局可用以便可以方便地进行进一步的操作以下是我的代码 Server R library shiny shinyServer function inpu
使用 xtable 对乳胶输出的表进行排序

我正在尝试生成一个排序表并导出到乳胶中然而 xtable 似乎无法处理排序表建议 a lt sample letters 500 replace T b lt table a c lt sort table a decreasing T
如何在 R 中创建纯 ascii 表作为输出，类似于 MySQL 风格？

我正在尝试为 R 找到一个输出的函数data frameMySQL 风格的 ascii 表中的对象如下 id var1 var2 1 asdf g 2 asdf h 3 asdf j 有这样的功能吗至少有两个工具可以做到这一点 csvfi
使用 sprintf 打印换行符 - 有光泽

我试图在打印时进行换行这是我的代码 temp lt LETTERS 1 11 print sprintf Rank s s n 1 11 temp output 1 Rank 1 A n Rank 2 B n Rank 3 C n Ran
使用 alpha 通道叠加两个 ggplot2 stat_密度2d 图

我想叠加两个ggplot2使用 alpha 通道进行绘图结果图像显示两个数据集这是我的测试数据 data read table text P1 1 0 4 nP2 0 0 2 nP3 2 1 8 nP4 2 2 6 nP5 0 5 2
使用插入符号完全可重现的并行模型

当我在插入符中运行 2 个随机森林时如果设置随机种子我会得到完全相同的结果 library caret library doParallel set seed 42 myControl lt trainControl method cv
使用 R 数学独立库使用 C++ 编写矩阵/向量？

All 我一直在使用 C 中的 R 数学独立库我非常喜欢能够生成随机数并使用我熟悉的 R 分布函数我的问题是是否可以使用 R 中可用的矩阵运算乘法转置逆 Chol 等一个独立的库我在 Rmath h 中没有看到它们如果矩阵
R中两个时间之间的时间差

我正在尝试计算 R 中两个时间之间的差异例如两个时间之间的时间差 03 15 和 01 40 将为 1 小时 35 分钟我在 R 中尝试了以下代码 difftime 03 15 01 40 tz units secs 但我收到以下错误
在 R 中运行 glmnet 包，出现错误“缺少 TRUE/FALSE 需要的值”，可能是由于缺少值？

我正在尝试使用glmnet来自glmnet运行 LASSO 回归的包我正在使用以下命令 library glmnet glmnet a b family binomial alpha 1 我收到错误 gt Error in if all
可以使用部分名称访问列表成员吗？这是一个功能吗？

考虑这个 R 代码 gt l list key 1 gt l k 1 1 gt l ke 1 1 gt l k NULL gt names l 1 key 这是否意味着您可以使用以下方式访问列表成员及其部分名称当我在一次令人沮丧的错误搜
如何在 R 中压缩多个 CSV 文件？

我正在尝试在 R 中压缩多个 CSV 文件下面是供参考的代码 Create two dataframes using inbuilt datasets for reproducible code df1 lt head mtcars df
将“dplyr::across”与具有多个参数的函数一起使用

我想知道是否有办法使用dplyr across一个需要多个参数的函数如果没有如何执行以下操作dplyr tidyverse library dplyr create a dataframe df lt structure list x1
将值排列在特定组内

我试图在嵌套数据帧的精确组内按降序排列值我的输入数据如下所示我有两个分组变量 group1 and group2 和三个值即id value2 value3 library tidyverse set seed 1234 df lt
如何将曲线拟合到直方图

我已经探讨了有关该主题的类似问题但在我的直方图上生成漂亮的曲线时遇到了一些麻烦我知道有些人可能会认为这是重复的但我目前还没有找到任何可以帮助解决我的问题的东西尽管数据在此处不可见但这里是我使用的一些变量以便您可以在下面的代码中看
如何从 Matlab 运行 R 脚本 [重复]

这个问题在这里已经有答案了我有 m 文件我想用它来运行 R 脚本我怎样才能做到这一点 Matlab文件 caller m some matlab code need to call a R script some matlab cod
R 中的整数或双精度列表

我有一个大约 1000 个整数的列表我需要能够进行一些数学计算但它们被困在列表或字符形式中我怎样才能切换它们以便它们可用样本数据 gt y 1 1 7 3 1 6 7 1 7 6 5 3 1 3 3 0 6 2 4 9 19 1 9

随机推荐

Matlab：从循环中重复调用相同的 mex 函数是否会产生太多开销？

我有一些 Matlab 代码需要加速通过分析我确定了一个特定的函数是导致执行速度减慢的罪魁祸首该函数在一个循环内被调用数十万次我的第一个想法是将函数转换为 mex 使用 Matlab Coder 以加快速度然而常识告诉我 Mat
迁移匿名配置文件的最佳方法

是否有另一种方法可以隐式迁移所有参数或者有什么其他优点 From MSDN public void Profile OnMigrateAnonymous object sender ProfileMigrateEventArgs args
如何去除JInternalFrame中的边框？

我能够从JInternalFrame但我不知道如何删除边框要删除边框只需调用frame setBorder null 任何边界是null根本就没有显示出来
tomcat部署WAR文件时出错

请帮助我解决在尝试在 Tomcat 服务器上部署 WAR 文件时遇到的以下异常 07 46 50 076 WARN HostConfig 606 Exception while expanding web application archi
如何从 Spacy NER 模型获得每个实体的预测概率？

我用过这个官方示例代码使用我自己的训练样本从头开始训练 NER 模型当我在新文本上使用此模型进行预测时我想获得每个实体的预测概率 test the saved model print Loading from output dir nl
使用 SimpleDateFormat 将字符串转换为日期会返回随机日期[重复]

这个问题在这里已经有答案了我对以下行为感到非常困惑我从一个方法返回 2 个日期作为字符串 getLastSupplierFlightResults 我添加了一个屏幕截图将返回的日期分别显示为 2018 06 20 00 00 00 和
firebase/firestore：创建并存储文档的唯一ID（用户为USERID）

我想根据位置为每个用户生成唯一的 ID 例如如果用户来自 newyouk 则 ID 为 NY 23234 当用户第一次注册我的应用程序时应该会发生这种情况我发现我可以使用自动生成的 firestore ID 但它对于分配为 id 来说
SQL Server Reporting Services Round() 函数

我在 SQL Server Reporting Services 中生成的报告发生了一些奇怪的事情我希望我没有太愚蠢我使用 Round 函数来获取整数有时4 5会四舍五入到4 5 5会四舍五入到6 这是由于舍入方法的原因吗我正在使用
Firefox 上的按钮太高

我遇到了 Firefox 特有的问题我正在尝试设置链接和按钮的样式以使其看起来exactly相同在除 Firefox 之外的所有浏览器上这都可以按预期工作在 Firefox 上按钮内容的高度为 18 像素而链接的高度为 15 像
MongoDB 反向正则表达式

我在 MongoDB 中有一个带有正则表达式属性的文档 id ObjectId 516023189732da20ce000004 regex my your s regex 我需要用类似的东西检索这个文档db col find regex
在同一服务器中部署多个网络应用程序[关闭]

Closed 这个问题是基于意见的目前不接受答案我正在考虑使用以下架构在同一服务器上部署多个和不同的 Web 应用程序 www mydomain com app1 www mydomain com app2 这是一个好的做法吗有什么
borderStyle 在 android 中不起作用-react-native

这仍然显示实体边框样式经过大量研究后我发现在某些情况下使用 borderRadius 显示 borderStyle 但 borderStyle dotted 和 dashed 仍然对其没有影响
VBA 项目资源管理器仍然显示由宏关闭的 Excel 工作簿

我创建了一个宏用于打开 Excel 工作簿并执行一些操作最后关闭文件该宏运行良好现在当我在 vba 编辑器中打开 VBA 项目资源管理器时它显示宏已打开的文件列表即使它们已关闭如何从项目资源管理器窗口中删除它们为什么它仍然
Google IAB 退货购买错误类型=3 子类型=4

当我尝试购买所有商品时它返回如下消息您请求的商品无法购买和 logcat 日志 09 04 10 06 25 374 D 芬斯基 7185 1购买Fragment handleError 错误 PurchaseError type 3
Electron - 使用 showOpenDialog 时抛出不允许加载本地资源

我只是想用showOpenDialog并加载图像但是当我选择图像时应用程序会崩溃 main js ipcMain on open file dialog function event const window BrowserWindow
自定义验证属性指定的方法未被调用

我正在使用 System ComponentModel DataAnnotations CustomValidationAttribute 来验证我的 POCO 类之一当我尝试对其进行单元测试时它甚至没有调用验证方法 public cl
YouTube：如何在静音的情况下呈现嵌入视频

我正在尝试嵌入一个静音的视频但我不知道它是如何工作的目前我正在使用这个但不起作用你们中有人知道我怎样才能完成这项工作吗 Updated Add mute 1到你的网址的末尾您的新代码将是
使用 Owin 进行 Twitter 外部登录会出现 HTTP 403（禁止）

ASP NET MVC 5 项目欧文版本 4 0 0 0 启动 Auth app UseTwitterAuthentication consumerKey somekey consumerSecret someSecretKey 异常发生
VBScript创建excel 2016对象

我的机器上安装了两个版本的 excel 2010 和 2016 我想在 excel 2016 上运行 vbscript 但是那 CreateObject Excel Application 只创建 Excel 2010 我怎样才能将其更改
如果小于行标准差，则将行值更改为零

如果行的所有值小于该行的标准差我想将它们更改为零 set seed 007 X lt data frame matrix sample c 5 50 100 replace TRUE ncol 10 X1 X2 X3 X4 X5 X6 X

如果小于行标准差，则将行值更改为零

如果小于行标准差，则将行值更改为零 的相关文章

随机推荐

热门标签

如果小于行标准差，则将行值更改为零的相关文章