Perl：计算大量数据的相关系数时的编程效率

2024-02-08

编辑：链接现在应该可以使用，抱歉给您带来麻烦

我有一个如下所示的文本文件：



Name, Test 1, Test 2, Test 3, Test 4, Test 5
Bob, 86, 83, 86, 80, 23
Alice, 38, 90, 100, 53, 32
Jill, 49, 53, 63, 43, 23.

我正在编写一个程序，给定这个文本文件，它将生成一个皮尔逊相关系数表，如下所示，其中条目 (x,y) 是人 x 和人 y 之间的相关性：



Name,Bob,Alice,Jill
Bob, 1, 0.567088412588577, 0.899798494392584
Alice, 0.567088412588577, 1, 0.812425393004088
Jill, 0.899798494392584, 0.812425393004088, 1

我的程序可以运行，只是我输入的数据集有 82 列，更重要的是，有 54000 行。当我现在运行我的程序时，它非常慢并且出现内存不足错误。有没有一种方法可以首先消除内存不足错误的任何可能性，并可能使程序运行得更有效一些？代码在这里：code http://www.duke.edu/~jl128/correlation.txt.

感谢您的帮助，
Jack

编辑：如果其他人尝试进行大规模计算，请将您的数据转换为 hdf5 格式。这就是我最终为解决这个问题所做的事情。

您将必须进行至少 54000^2*82 次计算和比较。当然这需要很多时间。你把一切都记在记忆里了吗？这也会相当大。它会更慢，但如果您可以将用户保存在数据库中并针对所有其他用户计算一个用户，然后继续下一个并针对所有其他用户而不是一个庞大的数组或哈希进行计算，那么它可能会使用更少的内存。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Perl：计算大量数据的相关系数时的编程效率的相关文章

Objective-C：int值无故改变

Objective C 我需要帮助保留 int 的值无需我的命令它就在我身上发生变化最初的问题是如何声明和保留 int 这在另一篇文章中得到了满足 Objective C 如何声明和保留 int https stackoverflo
为什么 Web Worker 性能在 30 秒后急剧下降？

我正在尝试提高在网络工作人员中执行时脚本的性能它旨在解析浏览器中的大型文本文件而不会崩溃一切都运行得很好但我注意到使用网络工作者时大文件的性能存在严重差异于是我做了一个简单的实验我在同一输入上运行脚本两次第一次运行在页面的主线程
无法从日志文件中提取特定信息

我这里有日志文件我想提取以下信息想要提取十六进制值如果该行有第二个括号 0 9 想要提取十进制值首先转换为十六进制然后提取 9 gt 0x09 想要提取负值 25 先转换为十六进制然后提取例如 25 gt FFE7 gt 想要提取
iOS 视图控制器内存在被关闭后未释放

当用户单击按钮时它会显示一个带有两个视图控制器的新选项卡栏视图控制器我是这样做的 ACLevelDownloadController dvc ACLevelDownloadController alloc initWithNibName
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
减少从 MongoDB 加载大熊猫数据帧所使用的内存

我有一个大型数据集包含 4000 万条记录总大小约为 21 0G 存储在 MongoDB 中我花了几个小时将其加载到 pandas 数据框中但总内存大小增加到约 28 7G 加载之前约为 600Mb cursor mongocoll
使用 g++ 5.3.1 编译的程序运行速度比使用 g++ 4.8.4 编译的相同程序慢 3 倍，相同的命令

最近我开始使用 Ubuntu 16 04 和 g 5 3 1 并检查我的程序是否运行慢3倍在此之前我使用过 Ubuntu 14 04 g 4 8 4 我用相同的命令构建它 CFLAGS std c 11 Wall O3 我的程序包含循环
Perl 正则表达式图灵完备吗？

我见过 Ruby 和 Perl 程序员做了一些事情复杂的代码挑战 https codegolf stackexchange com questions 3596 regex validating regex完全用正则表达式这前瞻和后瞻 h
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
为什么在展开的 ADD 循环内重新初始化寄存器会使其运行速度更快，即使循环内有更多指令？

我有以下代码 include
Erlang 中的接受器池和负载平衡？

From http www erlang org doc man gen tcp html accept 1 http www erlang org doc man gen tcp html accept 1 值得注意的是 accept 调
PHP 脚本不断执行 mmap/munmap

我的 PHP 脚本包含一个循环它只不过是回显和取消引用指针如 tab othertab i gt 中的内容直到昨天这个脚本开始变得非常慢比以前慢了 50 倍之前它一直运行良好使用 strace 后我发现 90 的情况下脚
C# 数据表更新多行

我如何使用数据表进行多次更新我找到了这个更新 1 行 http support microsoft com kb 307587 my code public void ExportCSV string SQLSyntax string L
针对约 225 万行的单表选择查询的优化技术？

我有一个在 InnoDB 引擎上运行的 MySQL 表名为squares大约有 2 250 000 行表结构如下 squares square id int 7 unsigned NOT NULL ref coord lat doubl
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
为 TFliteconverter 创建代表性数据集的正确方法是什么？

我正在尝试推断tinyYOLO V2 with INT8权重和激活我可以使用 TFliteConverter 将权重转换为 INT8 为了INT8激活我必须提供代表性数据集来估计缩放因子我创建此类数据集的方法似乎是错误的正确的程序是
为什么改变对象的 [[prototype]] 会降低性能？

来自 MDN 文档standard setPrototypeOf功能 https developer mozilla org en US docs Web JavaScript Reference Global Objects Object
为什么同样的算法在 Scala 中运行比在 C# 中慢得多？以及如何让它更快？

该算法根据序列中每个成员的变体创建序列的所有可能变体 C 代码 static void Main string args var arg new List
Perl：正则表达式不抓取代码中的多行 C 风格注释

我有一个 Perl 程序读取用 C 编写的 SRC 文件使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名打开新的目标文件执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释注意这些注释
如何在 Perl 中使用原始套接字？

你怎样才能得到一个rawPerl 中的套接字那么构建与其一起使用的数据包的最佳方法是什么与在 C 中执行的操作相同通过在创建套接字时设置套接字类型在示例中CPAN http search cpan org rgarcia perl

随机推荐

MIFARE Classic 标准按键

我有两个 NFC 标签其扇区具有不同的密钥标签 1 此标签包含 NDEF 消息扇区 0 A0 A1 A2 A3 A4 A5对于钥匙 A 扇区 1 至 15 D3 F7 D3 F7 D3 F7对于钥匙 A 标签 2 此标签上没有 NDE
具有重复名称的 JS 关联对象

好的所以我有一个像这样的对象 var myobject field 1 lorem ipsum field 2 1 field 2 2 field 2 6 正如您所看到的对象中有重复的名称但具有不同的值如果我像使用 jQuery
Facebook 不接受自定义开放图谱属性

我正在尝试使用 Facebook iOS SDK 3 5 来发布 Open Graph 操作我的行动是 take a photo and photo有一个额外的要求string属性名为filter 我正在创建我的图形对象所有值都是有效且
Python：简化嵌套FOR循环？

我想知道是否有一种方法可以简化下面的嵌套循环困难在于每个循环的迭代器取决于前一个循环的内容这是代码 Find the number of combinations summing to 200 using the given list
如何在 tweepy 中的某个位置获取特定主题标签的推文？

我希望从特定位置例如钦奈获取特定主题标签的推文以分析数据我对 Twitter API 和 tweepy 真的很陌生我发现搜索网址如下所示在 tweepy 中如何做同样的事情到目前为止的代码 import tweepy ckey
使用 AES/GCM 时，Java Cipher.update 不会写入缓冲区 (Android 9)

我正在尝试在 Android 上使用 javax crypto Cipher 来使用 AES GCM 加密数据流据我了解可以多次使用 Cipher update 进行多部分加密操作并使用 Cipher doFinal 完成但是当使
如何在 ExtJS 中的绑定公式中使用逻辑运算符？

我的表单中有 3 个输入字段并且希望仅当前两个输入有值时才启用第三个输入这似乎不起作用 Ext define MyApp view myobj MyPanel extend Ext Panel viewModel items xtype
删除 Firebase Android 应用，然后在另一个项目中使用其 SHA1 和包名称

我正在使用 Firebase 来实现其 Firebase 云消息服务我有 2 个帐户每个帐户都有一个带有 Android 应用程序的项目 Account A gt Project A gt Android App A Account B
全局变量默认是extern还是相当于在global中用extern声明变量？

我已经解决了以下两个问题 C 和 C 中的 static 和 extern 全局变量 https stackoverflow com questions 11055802 static and extern global variables
XPage 中存储的时间不一致

如果我有一个带有时间字段的 XPage
向 Selenium Webdriver 网格发出并行请求

我正在尝试使用硒服务器网格并行运行多个命令这是我的第一个测试代码 var webdriver require selenium webdriver for var u 0 u lt 3 u makeScreenshot foo test
获取android中具有互联网权限的应用程序列表

我想列出具有互联网访问权限的应用程序我有这个例子 PackageManager p context getPackageManager final List
如何测试 django 模型方法 __str__()

我尝试测试 str 方法当尝试在测试中访问它时它返回我的模型实例我认为是 def test str is equal to title self Method str should be equal to field title wo
安装 Qt 5.6：我应该选择哪些组件？

我打算开始学习 Qt 我没有任何先前的知识所以我已经下载了适用于 Windows 和 Linux 的最新稳定 Web 安装程序我已经安装了机器按照 Windows 向导的指示我到达了选择组件步骤但我对一切是什么以及我真正需要什
在自动完成（材料）中进行默认选择

我正在为我的项目使用自动完成组件即显示值自动完成这是堆栈闪电战 https stackblitz com angular mkyeqjagjya file app 2Fautocomplete display example ts ex
Rcpp 函数比相同的 R 函数慢

我一直在编写一个 R 函数来计算特定分布的积分请参见下面的代码 EVofPsi function psi probabilityMeasure eps 0 01 distFun function u probabilityMeasure
自定义 ACF Gutenberg 块未出现在 WPGraphQL 架构中

我要去一个headless设置 WordPress 作为我的 CMS 为了实现这一目标我使用了以下 WordPress 插件 Advanced Custom Fields PRO 使用专业版才能获得blocks option WP Gra
如何配置一个网络中的容器相互连接（服务器 -> mysql）？

我已经在 Windows 上运行了 ubuntu docker containers mysql 和 nodejs server app docker run d 网桥 name own p 80 3000 own latest docke
基于 python 的 Dockerfile 抛出 locale.Error: 不支持的区域设置

我在将主机 Centos7 区域设置传递给 python3 docker 映像时遇到问题尽管我使用了下面链接中描述的建议但图像中仅出现以下区域设置 C C UTF 8 POSIX 为什么 locale getpreferredencod
Perl：计算大量数据的相关系数时的编程效率

编辑链接现在应该可以使用抱歉给您带来麻烦我有一个如下所示的文本文件 Name Test 1 Test 2 Test 3 Test 4 Test 5 Bob 86 83 86 80 23 Alice 38 90 100 53 32 Jil

Perl：计算大量数据的相关系数时的编程效率

Perl：计算大量数据的相关系数时的编程效率 的相关文章

随机推荐

热门标签

Perl：计算大量数据的相关系数时的编程效率的相关文章