加速用于 FDR 估计的 MATLAB 代码

2024-04-15

我有 2 个输入变量：

p 值向量 (p) with N元素（未排序）
and N x M具有通过随机排列获得的 p 值的矩阵 (pr) with M迭代。N相当大，10K到100K甚至更多。M假设是 100。

我正在估计每个元素的错误发现率（FDR）p表示如果当前 p 值（来自p）将是阈值。

我用 ARRAYFUN 编写了该函数，但是对于大 N（2min for N=20K），与 for 循环相当。

function pfdr = fdr_from_random_permutations(p, pr)
%# ... skipping arguments checks
pfdr = arrayfun( @(x) mean(sum(pr<=x))./sum(p<=x), p);

有什么想法可以让它更快吗？

也欢迎在此提出有关统计问题的评论。

测试数据可以生成为p = rand(N,1); pr = rand(N,M);.

嗯，诀窍确实是对向量进行排序。我对此表示感谢@EgonGeerardyn。另外，没有必要使用mean。您可以将所有内容除以M. When p排序，查找小于当前值的数量x，只是一个运行索引。pr是一个更有趣的案例 - 我使用了一个名为的运行索引place发现有多少个元素小于x.

Edit(2):这是我想出的最快的版本：

 function Speedup2()
    N = 10000/4 ;
    M = 100/4 ;
    p = rand(N,1); pr = rand(N,M);

    tic
    pfdr = arrayfun( @(x) mean(sum(pr<=x))./sum(p<=x), p);
    toc

    tic
    out = zeros(numel(p),1);
    [p,sortIndex] = sort(p);
    pr = sort(pr(:));
    pr(end+1) = Inf;
    place = 1;
    N =  numel(pr);
    for i=1:numel(p)
        x = p(i);
        while pr(place)<=x
            place = place+1;
        end
        exp1a = place-1;
        exp2 = i;
        out(i) = exp1a/exp2;
    end
    out(sortIndex) = out/ M;
    toc
    disp(max(abs(pfdr-out)));

end

基准测试结果为N = 10000/4 ; M = 100/4 :

已用时间为 0.898689 秒。
已用时间为 0.007697 秒。
2.220446049250313e-016

and for N = 10000 ; M = 100 ;

已用时间为 39.730695 秒。
已用时间为 0.088870 秒。
2.220446049250313e-016

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

performance

MATLAB

vectorization

加速用于 FDR 估计的 MATLAB 代码的相关文章

内容长度标头与分块编码

我正在尝试权衡设置的利弊Content LengthHTTP 标头与使用分块编码从我的服务器返回可能大文件的比较使用持久连接需要其中之一来符合 HTTP 1 1 规范我看到了的优点Content Length标头是下载对话框可以显
类方法的自定义代码完成？

在 MATLAB 中可以定义代码建议和完成如标题为的文档页面中所述自定义代码建议和完成 https www mathworks com help matlab matlab prog customize code suggestio
估算缺失数据，同时强制相关系数保持不变

考虑以下 excel 数据集 m r 2 0 3 3 0 8 4 0 1 3 2 1 5 2 2 3 1 9 2 5 1 2 3 0 2 0 2 6 我的目标是使用以下条件填充缺失值将上述两列之间的成对相关性表示为 R 大约 0 68 将
如何避免循环

大家好我是 R 新手我有两个面板数据文件其中包含 id date 和 ret 列文件 A 的数据比文件 B 多得多但我主要处理文件 B 数据 id 和 date 的组合是唯一标识符有没有一种优雅的方式来查找 B 中的每个 id
MATLAB：比较两个不同长度的数组

我有两个长度不同的数组由于采样率不同需要比较我想对较大的数组进行下采样以匹配较小的数组的长度但是该因子不是整数而是小数举个例子 a 1 1 375 1 75 2 125 2 5 2 875 3 25 b 1 2 3 有什么方法可以
在 JavaScript 中嵌套“switch”案例：有速度优势吗？

这里有新手问题我有一个包含大量字符串的开关像这样按字母顺序拆分是否有速度优势 switch myString substring 0 1 case a switch myString case a string beginning w
PrintStream是有缓冲的，但是flush不会降低性能，而BufferedOutputStream会加速性能

我预计由于 PrintStream 是缓冲的通过在每次 print 之后添加刷新操作速度性能应该会显着降低但事实并非如此如下面的代码片段所示此外将 PrintStream 包裹在 BufferedOutputStream 周围可
Angularjs 在生产中禁用调试数据

我正在尝试按照角度文档中的建议禁用生产服务器中的调试数据here https docs angularjs org guide production 补充一点我并没有真正看到性能和加载时间有任何改进这是我的代码在 app js 中的样子
LINQ 函数的顺序重要吗？

基本上正如问题所述 LINQ 函数的顺序是否重要表现显然结果仍然必须相同 Example myCollection OrderBy item gt item CreatedDate Where item gt item Code g
方法不必要地被调用？

我有一个 BaseActivity 它可以通过其他所有活动进行扩展问题是每当用户离开暂停活动时我都会将音乐静音我也不再接听电话问题是 onPause每当用户在活动之间切换时就会被调用这意味着应用程序不必要地静音和停止tele
为什么在排序输入上插入到树中比随机输入更快？

现在我一直听说从随机选择的数据构建二叉搜索树比有序数据更快这仅仅是因为有序数据需要显式重新平衡以将树高度保持在最低限度最近我实现了一个不可变的treap http en wikipedia org wiki Treap 一种特殊的二叉搜
优化 MATLAB 代码（嵌套 for 循环计算相似度矩阵）

我正在 MATLAB 中基于欧几里德距离计算相似度矩阵我的代码如下 for i 1 N M N is the size of the matrix x for whose elements I am computing similarit
我有*很多*源文件要添加到 git 存储库，如何使其快速

我在看here https git scm com docs git fast import寻找更快地将批量文件导入 git 存储库的灵感但不确定是不是这样基本上情况是我有超过 1 亿个文件想要提交到 git 存储库我已将它们分解为
为什么 Haskell 的默认字符串实现是一个字符链接列表？

Haskell 默认值的事实String众所周知实现在速度和内存方面都效率不高据我所知 lists一般来说在 Haskell 中实现为单链表并且适用于大多数小型简单数据类型例如Int 这似乎不是一个好主意但是对于String这
为什么 MATLAB 本机函数 cov（协方差矩阵计算）使用与我预期不同的除数？

给定一个 M 维和 N 个样本的数据矩阵数据例如 data randn N M 我可以计算协方差矩阵 data mu data ones N 1 mean data cov matrix data mu data mu N 如果我使用原生
我应该增强客户端上的 Jquery Mobile 元素还是发送带有 data-enhance="false" 的增强标记？

我有一个产品搜索我正在发送回结果每个结果都包含两个按钮 JQM 控制组我一次发送 24 条记录因此需要增强 24 个控制组如下所示 div class submitButton linkBox div
展开 std::reference_wrapper 的成本

Given include
从 Java 运行 MATLAB 函数

我在 MATLAB 中有一个 m 文件我想从 Java 调用该文件并以字符串或 Java 中的任何形式获取解决方案这听起来很简单但由于某种原因我无法让它发挥作用我试过这个 matlab nosplash wait nodeskto
MATLAB - GUI 和 OPC 服务器

我想在 MATLAB 中设计一个图形用户界面可以使用 MATLAB 的过程控制对象链接和嵌入 OPC 工具箱连续读取数据我怎样才能实现这个我已经设计了图形用户界面但我无法将数据读入图形用户界面就这样做 type opctoolMA
使用 R2010b 中的符号工具箱来求解和/或 linsolve

我前几天问了一个问题here https stackoverflow com questions 20317038 matlab linear congruence solver that supports a non prime modu

随机推荐

如何将 std::filesystem::file_time_type 转换为 time_t？

我使用 MSVC2015 为 Windows 编写了一个解决方案其中以下代码将std filesystem last write time 结果到time t time t ftime std file time type clock t
使用Python C API时如何中断Windows上的Python子进程？

我可以用以下命令中断 Windows 中的子进程 import ctypes ctypes windll kernel32 GenerateConsoleCtrlEvent 1 proc pid 但前提是我通过正常的 Python 进程运行
xcrun：错误：活动开发人员路径（“/Applications/Xcode.app/Contents/Developer”）不存在

当我尝试使用时遇到 Xcode 问题Homebrew https en wikipedia org wiki Homebrew package manager 和 Git xcrun 错误活动开发人员路径 Applications Xco
Angular 2 模板中的类型检查

我们正在使用 Angular 2 和 TypeScript 构建一个应用程序我们尝试在可能的情况下静态检查类型有什么方法可以检查模板中的类型吗考虑以下片段
iPad：如何以编程方式获取以太网 IP 地址

我知道如何通过 en0 接口获取 IP 地址如下所示 iPhone iPad OSX 如何以编程方式获取我的 IP 地址 https stackoverflow com questions 7072989 iphone ipad osx
IE7
项目符号或数字显示在 div 之外

我遇到了 IE7 列表元素错误的问题和的项目符号或数字显示在页边距之外我该如何修复 IE 的这个问题从我读到的内容来看在 IE7 li 中指定高度宽度时这似乎是一个问题图片可以在这里找到 Firefox IE7 我有一个带
Entity Framework Core 可以运行非查询调用吗？

不幸的是我的 EF 应用程序必须调用我无法更改的存储过程虽然这并不理想但我通常可以绕过它但是我有一个确实返回任何内容的存储过程 EF core 如何处理这个问题我知道在以前的版本中您可以运行 ExecuteNonQuery 但我
获取两个给定日期之间的所有月份名称[重复]

这个问题在这里已经有答案了我正在尝试创建一个函数给出 C 中两个日期之间的所有月份名称 List
是否可以编写一个 Swift 函数来仅替换扩展字素簇的一部分，例如

我想编写一个可以像这样使用的函数 let replacingFirstOccurrence of with Given 这个字符串和 Swift 的字符串都很奇怪String图书馆是 https stackoverflow com ques
使用辅助 .h .m 文件向 NSManagedObject 添加其他属性

我创建了一些与 CoreData 一起使用的 NSManagedObject 类我需要添加一些附加属性来格式化我正在使用的GR小胡子 https github com groue GRMustache模板这是一个示例属性 NSStrin
如何通过将 csv 文件与 python 中的其他 csv 文件进行比较来删除和替换 csv 文件中的列？

我正在编写一个 python 代码来搜索删除和替换 csv 文件中的列我有3个文件输入 csv aaaaaaaa bbbbbb cccccc ddddddd eeeeeeee ffffff gggggg hhhhhhh iiiiiii
使用测试数据加载 Spring-Boot 数据库

Goal 利用弹簧引导数据初始化 http docs spring io spring boot docs current reference html howto database initialization html用于创建简单数据库
如何将示例 Oracle HR 数据库导入到 SQL Developer 中？

编辑我想我现在已经接近解决这个问题了如果是的话我会自我回答我已经被这个问题困扰了一段时间我想使用示例 Oracle Human Resources 数据库我一直在学习通过这些说明 http docs oracle com cd E
R 数据帧中的分层索引

我有一个 CSV 文件我正在尝试将其读入 R 中的数据帧我想知道如何使用分层索引来存储它换句话说我想用这样的列名制作一些东西 a1 b1 c1 a1 b1 c2 a1 b1 c3 a1 b1 c4 a1 b2 c1 a1 b2 c2
如何打开与 GOPATH 相关的文件？

我在用着io ioutil读取一个小文本文件 fileBytes err ioutil ReadFile absolute path to file txt 这工作得很好但这并不完全便携就我而言我要打开的文件位于我的 GOPATH 中
如何对特定消息做出反应 (discord.py)

我正在编写一个建议机器人该机器人应该将玩家的建议发送到我的服务器中的建议频道并在建议频道中使用一些表情符号做出反应问题是使用消息作为消息参数会对发送来触发代码的消息做出反应但我希望它对机器人发送到建议通道的消息做出反应我对编
从任何地方关闭 javascript-popup-window

我正在尝试构建一个可以从任何地方关闭的弹出窗口在主页上您可以选择打开它在浏览主页时的任何时候用户都可以再次关闭它我找到了这个基本的弹出控件 function popuponclick my window window open m
如何阻止 IDE 在我的非 Windows 项目中引用 Windows 特定的 XML 单元？

我想在 Delphi XE5 中创建一个 Android 程序来处理 XML 文件我用TXMLDocument 但我无法编译并运行它因为 Delphi 反复添加Xml Win msxmldom in the uses部分出现以下错误
ModuleNotFoundError：没有名为“win10toast”的模块； bs4.FeatureNotFound：找不到具有您请求的功能的树构建器：lxml

我已经使用 pip 命令安装了它们它显示它已安装但无法工作我还更新了 pip 的版本但它仍然显示更新 pip 的命令 C Users DELL gt pip install win10toast Requirement already
加速用于 FDR 估计的 MATLAB 代码

我有 2 个输入变量 p 值向量 p with N元素未排序 and N x M具有通过随机排列获得的 p 值的矩阵 pr with M迭代 N相当大 10K到100K甚至更多 M假设是 100 我正在估计每个元素的错误发现率 FDR p

加速用于 FDR 估计的 MATLAB 代码

加速用于 FDR 估计的 MATLAB 代码 的相关文章

随机推荐

热门标签

加速用于 FDR 估计的 MATLAB 代码的相关文章