在R中快速读取多个文件

2024-01-10

我有超过 10000 个 csv 文件，我需要对每个 csv 文件的每一列进行快速傅里叶变换。我可以访问 1000 个核心。最快的方法应该是什么？

目前我有一个 for 循环按顺序读取每个文件并使用apply(data, 2, FFT)功能。我该怎么做呢？我尝试做clusterapply(1:10000, cl, transformation)。在转换函数中，我读了csv。完成所有阅读仍然需要很长时间。你们有人知道更快的方法吗？

我认为最快的方法是mclapply and fread.

#Bring in libraries
library(parallel)
library(data.table)

#Find all csv files in your folder
csv.list = list.files(pattern="*.csv")

#Create function to read in data and perform fft on each column
read.fft <- function(x) {
    data <- fread(x)
    result <- data[, lapply(.SD,fft)]
return(result)
}

#Apply function using multiple cores
all.results <- mclapply(csv.list,read.fft,mc.cores=10)

如果您对每个数据集进行随机样本有意义，我强烈建议更改read.fft函数来使用shuf命令。它会花费你相当多的阅读时间。

#Create function to read in data and perform fft
read.fft <- function(x) {
    data <- fread(paste0("shuf -n 10000",x)) #Takes random sample of 10000 rows
    result <- data[, lapply(.SD,fft)]
return(result)
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

在R中快速读取多个文件的相关文章

您使用 Attach() 或按名称或切片调用变量吗？

许多介绍 R 的书籍和指南都是从附加一个 R 语言的实践开始的 data frame这样您就可以通过名称调用变量我一直发现用以下方式调用变量是有利的符号或方括号切片 2 这样我就可以使用多个data frames 而不混淆它们和或使用
将值添加到 R 中 for 循环内的向量

我刚刚开始学习 R 我编写了这段代码来学习函数和循环 squared lt function x m lt c for i in 1 x y lt i i c m y return m squared 5 NULL 为什么这个返回NULL
在 R/ggplot2 中将字符串转换为函数参数的最佳方法？ [复制]

这个问题在这里已经有答案了我正在开发一个闪亮的应用程序用户可以选择可以使用 ggplot2 绘制哪些变量但是我完全不确定将字符串即要绘制的变量的名称转换为合适的函数参数的最佳方法考虑以下非常人为的有效的示例 df lt dat
使用 geom_bar 和 stat="identity" 绘制平均值的 hline

我有一个条形图其中确切的条形高度位于数据框中 df lt data frame x LETTERS 1 6 y c 1 6 1 6 1 g rep x c a b each 6 ggplot df aes x x y y fill g g
什么是 data.frame 可以做而 data.table 不能做的事情？

我刚刚开始使用 R 并遇到了 data table 我发现它很棒一个非常天真的问题我可以忽略 data frame 来使用 data table 以避免两个包之间的语法混淆吗来自数据表常见问题解答 http datatable r f
如何规划庭院灯最有效的路线

我正在尝试挂一些庭院灯基于另一个问题 https cs stackexchange com questions 80134 christmas light route efficiency我问我意识到我需要一种算法来解决路由检查问题 h
不同的分位数：箱线图与小提琴图

require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
如何编写一个也接受字符输入的 NES 函数？

我正在开发一个将字符串作为函数参数的 R 包现在我想使用非标准评估来允许非字符串输入另外为了保持向后兼容性我想保留函数接受字符串的可能性哈德利给出了example https cran r project org web pack
R 中的 For 循环分配给数据框

运行 for 循环后我在分配给数据帧时遇到问题当我使用 print 时它给出了我的价值有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
两个闪亮的操作按钮

我正在编写一个闪亮的函数其中包含两个操作按钮这两个按钮是左右按钮单击时可以帮助绘图移动第一次单击时这两个按钮都工作正常当我重新单击它们时就会出现问题无论我单击哪个按钮它都会在两个范围之间来回弹跳我猜可能是右和左按
将 R 传单地图保存为 html：不包括图块

我正在尝试使用 saveWidget 或将 rmd 文件输出到 html 来保存 R 传单地图如下所述将传单输出保存为 html https stackoverflow com questions 30110377 saving lea
Sweave 缓存包

我正在尝试编写一份报告我的问题是每次我编译 R 时都会加载我在报告中使用的包如 ggplot2 MASS cubature 这是非常耗时的有没有办法查包裹 I found 缓存编织但它不起作用这是我在 sweave 文件中添加的块
R 包“raster”在搜索“terra”最新版本时无法上传

我正在 Windows 10 中使用 RStudio 2021 09 2 中的 R 4 1 2 工作我正在处理空间数据包括矢量和栅格但三天前命令库栅格开始向我发出此警告错误 loadNamespace i c lib loc l
插值时间序列

我有两组具有不同时间戳的数据一组数据包含校准数据另一组包含样本数据校准的频率比样品少得多我想做的是将校准数据低频插值到采样时间序列高频上 sam lt textConnection time value 01 00 52 2
对 R/Sweave 进行编程以获得正确的 \Sexpr 输出

我在为 Sweave 进行 R 编程时遇到了一些问题 rstats twitter 小组经常指出这里所以我想我应该把这个问题向大家提出我是一名分析师而不是程序员所以在我的第一篇文章中请放轻松问题是我正在使用 R 在 Sweave
根据第二个数据帧中的匹配创建新列

如果有两个数据框 top3df http dpaste com 1709875 and qw qw lt structure list id structure 1 25 Label c w01 w02 w03 w04 w05 w06 w0
整理包中的字段说明

我很抱歉因为我知道这个答案可能出现在编写 R 包的手册中但在我阅读和查看其他包的整理字段时我无法 100 弄清楚该字段的用途用简单的语言我的是英语来看包的描述文件中的整理字段有什么作用人们想在那里放什么我认为这来自于某个时
使用 ggplot2 在一张画布上绘制多个图形[重复]

这个问题在这里已经有答案了我正在尝试根据此表将两个 ggplot2 图合并为一个图 Type RatingA RatingB 1 One 3 36 2 Two 5 53 3 One 5 57 4 One 7 74 5 Three 4 38
用于检查和批量线性模型的数据表选项

我想知道是否有data table用于从数据集中批量处理线性模型并首先进行检查的选项我需要对每个唯一标识符运行一堆线性模型但首先我需要进行检查对于每个唯一的 id 和年份我需要检查是否有至少 24 个月的先前每月数据但不超过 60
修改x轴刻度标签

我正在尝试更改由生成的箱线图的 x 轴刻度标签ggplot2 x 轴是一个分类变量 HabFac 我想要的是将其刻度更改为 6 个化学品 A E 下面是我的代码 raw data read table Read data p TT ggpl

随机推荐

@Value 变量在使用 @TestPropertySource 的单元测试中为 NULL

在下面的单元测试中我手动提供属性并尝试从现有的 YAML 资源文件中读取它们尝试了不同的策略 TestPropertySource the Value 属性未设置我总是为它们获取 NULL SpringBootConfiguratio
当我在 flutter 应用程序中切换 appbar 时，如何使 webview 不重新加载？

我希望当我在 flutter 应用程序中切换 appbar 时 webview 不重新加载但我不知道该怎么做很抱歉我是初学者这是我录制的gif I searched on Google but I didn t find an ans
Excel vba - 禁用鼠标事件

我正在开发一个Excel 2010工作簿处于手动公式计算模式文件 gt 选项 gt 公式 gt 工作簿计算 gt 手册但是我想要一些菜单选项来导致工作簿的重新计算所以我使用以下代码 Private Sub Worksheet Ch
突出显示 SWT 树节点中的特定字符串

我有一个要求首先要加载树树包含 4 个级别有一个文本字段用户可以在其中输入 filterText 然后可以按搜索按钮在树中在四个级别中的任何一个中如果与过滤器文本匹配则该特定字符串仅应以黄色突出显示而不是整个节点及其相应的
如何阻止固定对象超出其父容器？

我目前正在为学校制作一个网站在该网站上我有一个带有链接的侧边栏我希望它在侧面的任何地方都可见所以我使用了position fixed 但现在它不再保留在其父级的空间内而是从页面的最顶部开始 h1 text align center
是否有一种校验和算法也支持从中“减去”数据？

我有一个包含大约 1 亿个文档的系统我想跟踪它们在镜像之间的修改为了有效地交换有关修改的信息我想按天发送有关修改文档的信息而不是按每个单独的文档发送像这样的事情 2012 03 26 cs26 2012 03 25 cs25 20
Android - 延迟加载图像

我正在尝试伪造某种进度条我有 X 张图片并想要一张ImageView以一定的延迟向他们展示我尝试过做这样的事情 for i 2 i
关于如何正确重写 object.GetHashCode() 的一般建议和指南

根据MSDN http msdn microsoft com en us library system object gethashcode aspx 哈希函数必须具有以下属性如果两个对象比较相等则每个对象的 GetHashCode 方
在代码中组合 WPF DataTriggers 和 Storyboard

这是试图解决我之前的问题 https stackoverflow com questions 5826828 how to start stop animation in user control from view model以不同的方式
Android平台如何打开“前置摄像头”？

更一般地说如果一台设备有多个嵌入式摄像头有没有一种方法可以特别初始化其中一个我在Android参考文档中没有找到它 https developer android com reference android hardware Came
pycurl 仅获取部分响应

我正在使用 pycurl 在 python 中向 URL 发出请求该 URL 返回相当大的 json 格式响应当我在浏览器中转到 URL 时我会看到全部内容但如果我使用 pycurl 并打印接收到的数据我只能看到浏览到 URL 时
BitmapImage解码速度性能wpf

我有 5 张图像像素高度和像素宽度都相同 2481 3508 但是一张是 gif 一张是 jpeg 一张是 png 一张是 bmp 现在我将它们渲染到 BitmapSource 中其中 1 DecodePixelHeight 原始像
如何使用 Swig 将枚举值从 TCL 脚本传递到 C++ 类

我正在使用以下代码 1 文件 example i module example Put header files here or function declarations like below include example h incl
从 NUnit TestContext 检索测试持续时间

我希望能够在我的测试代码中访问测试的持续时间我一直在看TestContextNUnit 中的类但是当我找到有关 FullName 的信息时我无法弄清楚在哪里访问测试的持续时间 TearDown public void TearDown
如何在html中标记图片的版权？

这主要是一个语义问题我想把有版权的图片放在网站上我知道figure和figcaption元素但figcaption似乎不是最好的标签这是我也需要的标题如果我有这样的图像
我可以在内容加载之前更改或控制 IFRAME 区域的颜色吗？ [复制]

这个问题在这里已经有答案了可能的重复 fb 之类的按钮会在所有 ie 版本中的页面加载上创建白色背景 https stackoverflow com questions 6438502 fb like button creates a w
如何将输入值传递到 Angular 6 中表单提交的函数中？

所以当我按回车键时我的代码就可以工作它运行performSearch函数成功但是当我尝试通过点击提交按钮运行该函数时出现错误无法读取未定义的属性错误这是我的代码
如何用 Any 类型来包装价值？使用@Parcelize

我在尝试将值放入 Any 类型时遇到问题放入包裹中我正在使用 kotlinx android parcel 中的 Parcelize Lint 警告我并提示要添加的消息 RawValue 但这没有帮助我有 android os Bad
表单元素的 action 属性可以为空吗？

从 HTML5 开始广泛使用和推荐的action 是无效的 HTML 从规格来看如果指定了 action 和 formaction 内容属性则必须具有一个有效 URL 的值那么正确的方法是什么action属性指向当前页面我目前正
在R中快速读取多个文件

我有超过 10000 个 csv 文件我需要对每个 csv 文件的每一列进行快速傅里叶变换我可以访问 1000 个核心最快的方法应该是什么目前我有一个 for 循环按顺序读取每个文件并使用apply data 2 FFT 功能我该

在R中快速读取多个文件

在R中快速读取多个文件 的相关文章

随机推荐

热门标签

在R中快速读取多个文件的相关文章