r 读取多个 .dat 文件

2024-04-23

你好，我是新来的，也是 R 的初学者，

我的问题：如果我有多个文件（test1.dat，test2.dat，...）要在 R 中使用，我使用此代码来读取它们

filelist <- list.files(pattern = "*.dat")

df_list <- lapply(filelist, function(x) read.table(x, header = FALSE, sep = ","
                                               ,colClasses = "factor", comment.char = "", 
                                               col.names = "raw"))

现在我遇到的问题是我的数据很大，我找到了一个使用 sqldf-package 加快速度的解决方案：

sql <- file("test2.dat")
df <- sqldf("select * from sql", dbname = tempfile(),
                    file.format = list(header = FALSE, row.names = FALSE, colClasses = "factor", 
                                       comment.char = "", col.names ="raw"))

它对于一个文件运行良好，但我无法更改代码以读入多个文件，就像第一个代码片段中一样。有人能帮我吗？谢谢你！莫莫

这似乎有效（但我认为有更快的sql方法到此）

sql.l <- lapply(filelist , file)

df_list2 <- lapply(sql.l, function(i) sqldf("select * from i" ,  
    dbname = tempfile(),  file.format = list(header = TRUE, row.names = FALSE)))

查看速度 - 部分摘自 mnel 的帖子在 R 中快速读取非常大的表作为数据帧 https://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r/1820610#1820610

library(data.table)
library(sqldf)

# test data
n=1e6
DT = data.table( a=sample(1:1000,n,replace=TRUE),
                 b=sample(1:1000,n,replace=TRUE),
                 c=rnorm(n),
                 d=sample(c("foo","bar","baz","qux","quux"),n,replace=TRUE),
                 e=rnorm(n),
                 f=sample(1:1000,n,replace=TRUE) )

# write 5 files out
lapply(1:5, function(i) write.table(DT,paste0("test", i, ".dat"), 
                                 sep=",",row.names=FALSE,quote=FALSE))

read: 数据表

filelist <- list.files(pattern = "*.dat")

system.time(df_list <- lapply(filelist, fread))

#  user  system elapsed 
# 5.244   0.200   5.457

read: sqldf

sql.l <- lapply(filelist , file)

 system.time(df_list2 <- lapply(sql.l, function(i) sqldf("select * from i" ,  
   dbname = tempfile(),  file.format = list(header = TRUE, row.names = FALSE))))

#    user  system elapsed 
#  35.594   1.432  37.357

检查 - 除了属性之外似乎没问题

all.equal(df_list , df_list2)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

file

sqldf

r 读取多个 .dat 文件的相关文章

无法使用 Shinyjs() 禁用闪亮的应用程序单选按钮

我正在尝试禁用闪亮的应用程序单选按钮趋势 input Product A input month All 使用Shinyjs包但没有成功我的 ui 页面定义为 ui lt fluidPage shinyjs useShinyjs pa
在 unnest_wider 之后命名提升向量中的列

在使用 tidyr 1 0 的一些新功能时我遇到了一些令人头疼的问题我用过boxplot stats获取我想用来绘制的箱线图值向量我已经成功地完成了此操作但我相信有更好的方法来命名新的未嵌套向量的列这是当前设置 library t
将行从 0 折叠到 0

对于这样的数据集 Incident ID date product INCFI0000029582 2014 09 25 08 39 45 foo INCFI0000029582 2014 09 25 08 39 48 bar INCFI0
配置失败，因为找不到 libcurl

我正在尝试使用从远程服务器提取一些 json 数据fromJSON gt server lt http 111 111 000 00 3000 gt streams lt fromJSON paste server output strea
在闪亮的应用程序中选择文件夹或文件夹目录

我在使用闪亮时遇到问题我想选择保存我要在应用程序中使用的所有文件的文件夹方法是 1 将工作目录设置为该文件夹路径或 2 将此文件夹内的所有 csv 数据上传到我的应用程序以进行进一步处理 1 我找到了shinyFiles包但它非常非
具有可变宽度的重叠条形图/直方图

I have chr totgenes FST gt 0 4 FST gt 0 4 exFST gt 0 4 exFST gt 0 4 inFST gt 0 4 inFST gt 0 4 chrtotlen 1 1457 49 3 3630
自定义文件属性

我需要遵循在我的申请中我有文件需要随时签入和签出的文件当我从应用程序中签出文档时我需要将自定义属性添加到文件中以便稍后在签入文档时可以识别它我尝试使用以下代码使用 DSOFile 中的 OleDocumentPropertie
R：使用“lm”拟合线性模型时的对比错误

我发现了在 R 中定义线性模型时对比错误 https stackoverflow com questions 18171246 error in contrasts when defining a linear model in r并遵循了
根据另一个输入限制闪亮的应用程序输入

我有一个基本的闪亮应用程序可以评估A B library shiny ui lt fluidPage numericInput inputId A label A value 5 step 1 sliderInput inputId B l
UseMethod("select") 中的错误：没有适用于“select”的方法应用于“character”类的对象

这个问题与这个问题非常相似为所有日期类别制作系数 https stackoverflow com questions 69520290 make coefficient for all dates categories 不同的是retur
使用 Rcpp 的 R 快速 cbind 矩阵

cbindR中的重复调用比较耗时但对于各种数据类型也很强大我编写的代码比cbind当绑定两个矩阵时但bind cols in dplyr封装速度仅比cbind 唯一遗憾的是它不能将矩阵作为输入有人可以让下面的代码更快吗另外如何快
如何创建一个包含滚动桶集中数据计数的集合

我有一个月的流量的服务器日志下面是部分示例 UploadDateGMT UserFileSize TotalBusinessUnits 2012 01 01 00 00 38 1223 1 2012 01 01 00 01 16 1302
常见的 R 习语 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 R 习惯用法与 Java 和 Python 习惯用法一样有哪些好的资源我主要推荐R地狱 http
添加一个新列，其中标签附加到新月形数字

我想添加一个新列给出一个常量标签并逐行附加新月数字逻辑我的输入 position work chr1 jil2001 chr4 jil2001 chr3 kou2009 chr9 nai2012 chr7 fandis2005 我的预
在 Shiny 的压缩文件夹中下载多个 csv 文件

有人可以指出我如何使这个下载 zip 功能在 server R 中工作吗当我运行这个时我收到以下错误 1 var folders 00 1dk1r000h01000cxqpysvccm005p87 T Rtmps3T6Ua write
时间序列数据 - 如何[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在考虑进行一项为期一个月的研究受试者记录他的饮酒量和排尿频率我想让受试者每天记录这些活动这样我就有一个月的数据每天的排尿次
无法在 R 中安装插入符号包（在我的 Linux 机器中）

我在尝试在 R 中安装插入符号包时遇到以下错误 g error tmp Rtmp2Tos7n R INSTALL2e6e30153a74 nloptr nlopt 2 4 2 lib libnlopt cxx a No such file
在R包/.Rd文件中搜索unicode字符

如何在 R 包或特定文件中搜索特定的 unicode 字符我使用的是 RStudio IDE 我正在尝试向 CRAN 提交包裹所有检查均通过但以下情况除外 W checking PDF version of manual 49 5s
在两列上使用 Rollapply

我正在尝试做类似我要求的事情here https stackoverflow com questions 4472691 calculate returns over period of time不幸的是我无法解决这个问题这是我的数据框
在 dplyr 过滤器中引用同名的列和变量

鉴于这种情况 id a df lt tibble id c a b c value c 1 2 3 df gt dplyr filter id id 我预计最后一行的输出与df gt dplyr filter id a 但它仍然指的是id作

随机推荐

Start-Job - 实时检索输出

我们通过以下方式启动 Powershell 函数Start Job并希望实时检索调用者的输出有没有一种好的方法可以在不打电话的情况下做到这一点Retrieve Job在循环中尝试这样的事情 appJob Start Job foreac
对等网络应用程序的网络发现

我希望有两个类一个服务器类和一个客户端类服务器类应该接收每个新客户端的 IP 地址和端口号并将它们存储在列表中它应该为每个客户端提供已连接客户端及其 IP 地址的列表然后客户端可以使用 TCP 连接相互通信问题是客户端不知道服务
查找集合中的所有对象 Java Mongodb

下面的代码查找集合中的第一个文档 package database import com mongodb BasicDBObject import com mongodb BulkWriteOperation import com mong
使用 Python 从原始帧创建 MPEG4 视频文件

我有一个原始视频帧源我可以在 Python 中访问它我想用它创建一个 MPEG4 视频并带有 MP3 背景音乐 Python 中有哪些类型的工具和库可用于此类任务最好我想要一个 API 我可以为其提供输出文件名然后将各个帧作为 2
Aureliajs 等待应用程序构造函数上的数据

我正在 aureliajs 中开发一个应用程序开发过程已经开始了好几个月现在后端开发人员希望对其服务进行版本控制因此我有一个 Web 服务可以调用来获取每个服务器端 Web api 应用程序的版本然后对于进一步的请求调用正确的
更好的德尔福印地 2007

使用 Delphi 2007 附带的默认 indy10 或将其升级到最新快照版本哪个更好为什么谢谢始终保持最新版本它包含错误修复如果您报告 Delphi 提供的库存版本存在问题您将得到的第一个建议是升级到最新版本因为您的错误可
如何在选择自定义 UITableViewCell 时获取触摸坐标？

当我触摸触摸 UITableViewCell 时我的 ViewController 的 UITableViewDelegate 方法 void tableView UITableView tableView didSelectRowAt
整数包装对象仅在值 127 内共享相同的实例？ [复制]

这个问题在这里已经有答案了这里它们是同一个实例 Integer integer1 127 Integer integer2 127 System out println integer1 integer2 outputs true 但这里
在 ASP.NET 中通过 AJAX 使用后台工作程序

我需要执行一项后台任务该任务有一个显示完成百分比的进度条和一个取消按钮撇开任务细节不谈现在我只想让一个示例正常工作因此我只有三个主要事件处理程序 DoWork ProgressChanged 和 RunWorkerComplete
检查 401，然后重定向 Angularjs，但仅在某些路由上

我有一个很好的角度服务可以通过查看服务器是否返回 401 错误消息来检查用户是否登录如果是用户将被重定向到登录页面这很有效但问题是它对于我的所有页面来说都是完全全局的我有一条特殊路线位于 explore 顺便说一句使用 UI
使用 C# 更新 json 文件中的属性

我希望更改 json 文件中每个 json 记录的特定属性当方法完成执行时我想将 Completed 属性更改为 true 我的 json 文件如下所示 LoanRecords LoanGUID 70dbec7e 5e94 460d 8
如何将 AFHTTPClient、Afnetworking 1.0 迁移到 2.0

我的问题是我有一个旧代码我不知道如何更改它我有 1 个名为 API HTTPClient 的类我对 2 个方法有问题因为我不知道如何将它们放入 2 0 中这 void commandWithParams NSMutableDict
windows 10 本机构建错误 - Windows 上的本机映像构建当前仅支持目标架构：AMD64（不支持 x86）

我正在测试一个新项目并尝试使用 Gluon 来实现此目的 ATM 我正在 Windows 10 上使用 AMD Ryzen 7 进行构建按照以下指示 https docs gluonhq com platforms windows ht
如何使用 Spring Security 保护混合 Spring MVC + Flex 应用程序

我尝试在 Spring 论坛上询问这个问题 http forum springsource org showthread php 109948 Problem configuring spring security 3 1 with hyb
什么是微编码指令？

我看过很多参考微编码指令的文献这些是什么以及为什么使用它们 CPU 读取机器代码并将其解码为内部控制信号将正确的数据发送到正确的执行单元大多数指令映射到一个内部操作并且可以直接解码例如在 x86 上 add eax edx只是将
如何在 JavaScript 异步获取调用中使用返回的 JSON 错误

我有一个async fetch调用它调用我的后端来创建具有电子邮件地址的客户如果成功返回的 JSON 会发送到doNextThing 功能如果后端返回非 200 状态代码它也会返回 JSON 例如 message Something
Python Selenium UnexpectedAlertPresentException

我正在使用 selenium webdriver 使用 python 和生菜运行基本的 CRUD 测试我的所有其他测试都运行良好但是当我单击删除时会出现一个模式对话框要求用户确认他们想要删除该用户弹出窗口出现的那一刻我得到了
从 Assembly.ReflectionOnlyLoad 迁移到 MetadataLoadContext

我有以下代码适用于 NET 4 8 类库它使用Assembly ReflectionOnlyLoad Code Retrieve the doman assembly used by the compilation Assembly ba
如何从 PHP 中同一类中的其他方法访问变量？

我尝试了这个但无法让它工作 class Profile extends CI Controller public function index foo bar public function form submit echo this gt
r 读取多个 .dat 文件

你好我是新来的也是 R 的初学者我的问题如果我有多个文件 test1 dat test2 dat 要在 R 中使用我使用此代码来读取它们 filelist lt list files pattern dat df list lt

r 读取多个 .dat 文件

r 读取多个 .dat 文件 的相关文章

随机推荐

热门标签

r 读取多个 .dat 文件的相关文章