按列快速串联数千个文件

2023-12-04

我在用R使用以下命令绑定约 11000 个文件：

dat <- do.call('bind_cols',lapply(lfiles,read.delim))

这慢得令人难以置信。我使用 R 是因为我的下游处理（例如创建绘图等）是在 R 中进行的。按列连接数千个文件的快速替代方案有哪些？

我想要完成三种类型的文件。它们看起来像这样：

[centos@ip data]$ head C021_0011_001786_tumor_RNASeq.abundance.tsv
target_id   length  eff_length  est_counts  tpm
ENST00000619216.1   68  26.6432 10.9074 5.69241
ENST00000473358.1   712 525.473 0   0
ENST00000469289.1   535 348.721 0   0
ENST00000607096.1   138 15.8599 0   0
ENST00000417324.1   1187    1000.44 0.0673096   0.000935515
ENST00000461467.1   590 403.565 3.22654 0.11117
ENST00000335137.3   918 731.448 0   0
ENST00000466430.5   2748    2561.44 162.535 0.882322
ENST00000495576.1   1319    1132.44 0   0

[centos@ip data]$ head C021_0011_001786_tumor_RNASeq.rsem.genes.norm_counts.hugo.tab
gene_id C021_0011_001786_tumor_RNASeq
TSPAN6  1979.7185
TNMD    1.321
DPM1    1878.8831
SCYL3   452.0372
C1orf112    203.6125
FGR 494.049
CFH 509.8964
FUCA2   1821.6096
GCLC    1557.4431

[centos@ip data]$ head CPBT_0009_1_tumor_RNASeq.rsem.genes.norm_counts.tab
gene_id CPBT_0009_1_tumor_RNASeq
ENSG00000000003.14  2005.0934
ENSG00000000005.5   5.0934
ENSG00000000419.12  1100.1698
ENSG00000000457.13  2376.9100
ENSG00000000460.16  1536.5025
ENSG00000000938.12  443.1239
ENSG00000000971.15  1186.5365
ENSG00000001036.13  1091.6808
ENSG00000001084.10  1602.7165

Thanks!

为了快速读取文件，我们可以使用fread from data.table进而rbind the list of data.table using rbindlist指定idcol=TRUE提供分组变量来识别每个数据集

library(data.table)
DT <- rbindlist(lapply(lfiles, fread), idcol=TRUE)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

cbind

按列快速串联数千个文件的相关文章

如何将 r 数据框转换为 h2o 对象

我对 R 和 H2O 很陌生我试图找到一种将 r 数据帧转换为 h2o 对象的方法我花了一些时间研究如何做到这一点但没有运气其他方式也是可能的并且有详细记录如下 prosPath system file extdata prost
如何从 data.frame 中删除列？

不是你怎么但更多的是你怎么如果有人给你一个包含 200 列的文件并且你想将其减少到分析所需的少数列你会如何做呢一种解决方案是否比另一种解决方案更有优势假设我们有一个包含列 col1 col2 到 col200 的数据框如果
有没有一种简单的方法可以在 R 的 igraph 中按度数对网络节点进行着色？

使用igraphR 包我想按度数对网络节点进行着色颜色应代表渐变例如从蓝色到红色或从黄色到红色从网络中观察到的最低程度到最高程度我找到了一个可行的解决方案 https stackoverflow com questions 40
单击 hPlot 图表中闪亮的数据点时打印组名称

我有一个闪亮的应用程序它使用 rCharts 中的 highcharts 库显示一些图表在某些情况下我在单个图表上有多个图表这些图表是使用 hPlot 中的组选项创建的我希望在单击图表时打印单个数据点的所有参数 x y 和组值我
在 R 中使用 apply() 时出现未使用参数错误

当我尝试对日期列使用 apply 条件以返回一组系数时收到错误消息我有一个数据集为简单起见此处进行了修改但可重现 ADataset lt data table Epoch c 2007 11 15 2007 11 16 2007
如何检查向量是否是单个 NA 值，没有长度警告且没有抑制

我有一个功能NA作为默认值但如果没有NA应该是一个不限于大小 1 的字符向量我有一个检查来验证这些但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
最新的 Windows 10 更新后 R 将无法运行

我已经更新了我的 Windows 但 R 无法运行因此 R studio 也无法运行当我运行 R GUI 时它只是冻结并且没有响应我已允许防火墙豁免铬我正在使用 Windows Insider 计划并且刚刚更新到 Windows
写入抓取数据的 csv 文件时如何拆分项目名称

我有兴趣使用 R 从网上抓取的数据创建 csv 或类似的 Excel 兼容文件到目前为止我通过执行以下操作来存储数据 require textreadr spiegel lt read html http www spiegel de
ggplot2 geom_function 可以跨 arg 值进行分面吗？

我想通过分面 geom function 创建 ggplot2 图以便函数的参数在网格中变化例如像这样的东西 my function lt function x par if par 1 return sin x else return
使用多边形图层下方的轮廓线切割多边形

我想根据高程将多边形图层切割成两部分上部和下部多边形可能是凸的或凹的并且切割的位置可能彼此不同等高线的间隔为 5m 这意味着我可能需要生成一个具有更紧凑的等高线的等高线例如 1m 的间隔关于如何做到这一点的任何想法在 ArcG
在 Shiny 应用程序中更改 bsModal 的背景

我正在开发一个 Shiny 应用程序我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮我做了一些研究并了解到我需要覆盖背景和键盘参数但即使我看到了一些建议我也不知道这到底需要放在我的代码中的哪里我不精通 Ja
R 监督潜在狄利克雷分配包

我在用着这个LDA包 https cran r project org web packages lda 对于 R 具体来说我正在尝试做监督潜在狄利克雷分配 slda https www cs princeton edu blei pap
为什么表达式“1”==1 的计算结果为 TRUE？ [复制]

这个问题在这里已经有答案了 1 是字符值其他1是数字甚至当我尝试在下面执行时它给了我 TRUE as character 0 as numeric 0 谁能帮助我理解为什么来自help 如果两个参数是不同类型的原子向量则其中一
GitHub 操作 setup-r-dependency 失败，说明没有名为“digest”的包

我一直在尝试设置一些 GitHub 操作来自动检查我的 R 包并运行测试覆盖率我目前正在使用 setup r dependency v2 操作来安装依赖项但无法安装包 digest 返回以下错误 Error Error
‘!’ 对于 R 中的因子没有意义

我需要从数据框中排除变量 PABI 所以我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
挑战：优化取消列出[简单]

因为 SO 最近有点慢所以我发布了一个简单的问题如果大鱼们能在这场比赛中留在替补席上并给新秀们一个回应的机会我将不胜感激有时我们的对象具有大量的大列表元素向量您如何将这个对象取消列出到单个向量中证明你的方法比unlist
闪亮的仪表板侧边栏中的可折叠菜单项

我的侧边栏中有两个菜单项目前如果我单击任何菜单项则会显示所有菜单项的选项卡项我想让它可折叠如果我单击多个名称菜单单个分析应该折叠如果我单击单个分析多个分析应该折叠目前的设计是相同的可重现代码是 library shiny
如何在 R 中创建纯 ascii 表作为输出，类似于 MySQL 风格？

我正在尝试为 R 找到一个输出的函数data frameMySQL 风格的 ascii 表中的对象如下 id var1 var2 1 asdf g 2 asdf h 3 asdf j 有这样的功能吗至少有两个工具可以做到这一点 csvfi
包什么时候需要为它自己的对象使用 :::

考虑这个 R 包有两个函数一个是导出函数另一个是内部函数 hello R export hello lt function internalFunctions hello internal 你好内部 R hello internal

随机推荐

使用vba检查网络连接

有没有办法在vba中检查网络连接我正在使用这个命令 If Dir O Then MsgBox you have network connection Else MsgBox No Connection End If 但它不起作用我收到运
auto it = vector.begin() 结果类型不可转换为 const_iterator

容器需要提供iterator可以隐式转换为的类型const iterator 鉴于此我正在尝试使用auto通过初始化一个对象vector begin 并使用该结果对象std distance其中 RHS 是const iterator 这
如何在模态中传递当前行值？

我正在表上执行 PHP CRUD 操作当我单击编辑按钮而不是将其带到新页面时我想在模式中显示值我希望值以模态形式显示我已经创建了一个模式但我无法想出一种逻辑来传递单击编辑按钮的行的值任何帮助将不胜感激 Table table c
Javascript -> 热键 -> 禁用输入字段

好吧我的热键可以工作只是无法停止 document keypress function e if e which 13 Enter key is press do what you want else if e which 67 e w
将按键绑定到使用 Visual Studio Code 中当前文件的 shell 命令

有没有办法创建一个键绑定来在文件上执行 shell 命令就像是 key ctrl shift e command run command touch file when editorTextFocus 我不想使用任务因为这需要对于整个编
在 Clojure 中调试？ [关闭]

Closed 这个问题需要多问focused 目前不接受答案使用 repl 时调试 Clojure 代码的最佳方法是什么还有 dotrace 它允许您查看所选函数的输入和输出 use clojure contrib trace defn
Tensorflow 对象检测在启动前被终止

我正在运行 docker image tensorflow 1 1 0 我通过在本地克隆并为我的 docker 提供到该文件夹的连接来添加tensorflow对象检测api github 我正在尝试重现他们的宠物例子我相信我的所有代码和
Array.map + parseInt [重复]

这个问题在这里已经有答案了 var timeSplit timeCaption innerText trim split 将产生一个数组 10 00 18 00 var startStr timeSplit 0 split 将产生一个数组
如何从服务器异步检索图像

我有一个NSMutableArray带有一些图像网址图像的大小在 12KB 到 6MB 之间我用AsycImageView类并实现但是当大图像下载应用程序崩溃时我在该类中为 maxsize 指定了 6 1024 1024 6MB 将
Woocommerce - 如果购物车中有特定变体，则隐藏付款方式

在 Woocommerce 中如果购物车中有特定产品变体我想隐藏信用卡付款选项请帮忙 Thanks 这就是我现在的工作我为每个变体分配了一个单独的运输类别我想在结帐时禁用特定的付款方式但如果我可以定位特定的属性值那就容易多了
泽西岛的 GZip 编码

我正在 Jersey 2 中编写 RESTful Web 服务我想支持响应的 Gzip 编码下列的这个答案我启用了org glassfish jersey server filter EncodingFilter in my Reso
$展开空数组

我有一个用户集合其中每个文档都具有以下结构 id
在快照视图中查找文件的本地副本

我在一个工具中使用 ClearCase Automation Library CAL 它可以帮助我跟踪未集成的更改现在我想扩展该工具这样我也可以通过它进行签到对于此功能我需要找到快照视图的本地副本虽然我可以询问 CC 哪个视图附加
.NET 的免费 UML 绘图库 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我正在寻找一个免费的 NET C 库我可以在我的程序中使用它并简单地绘制 UML 图尤其是类图我尝试使用 Netron 图表库但它有点棘手
尝试从私有 ECR 中提取图像时出现“没有基本身份验证凭据”

我的 Dockerfile 中间有以下行用于从我的私有 ECR 检索图像 FROM dkr ecr ap southeast 1 amazonaws com prod ff03401 这是我在尝试构建此代码时在 AWS Codebuild
如何查找链接的标题文本

如何在 jquery 中找到链接的标题文本您可以使用attr找到title属性 var title jQuery a attr title replace a with your own selector
EF Core - System.InvalidOperationException：ExecuteReader 需要打开且可用的连接。连接的当前状态已关闭

我正在使用 Entity Framework Core 运行 ASP NET Core 1 0 Web 应用程序当应用程序运行一段时间 24 48 小时时应用程序在对任何端点或静态资源的每个请求上开始崩溃并引发错误System In
复制范围，包括粘贴到 Outlook 电子邮件正文时的格式

我已经搜索了这个问题但仍然没有得到它的确切代码我需要将数据透视表的颜色从 Excel 复制到 Outlook 主体运行代码时我得到了格式但唯一的问题是表格的颜色变成了黑色和灰色请帮助我弄清楚如何放置我需要的确切颜色这是我的代码
包括 Google 字体链接或导入？

在页面上包含 Google 字体的首选方式是什么 Via the tag 通过样式表中的导入 import url https fonts googleapis com css2 famil
按列快速串联数千个文件

我在用R使用以下命令绑定约 11000 个文件 dat lt do call bind cols lapply lfiles read delim 这慢得令人难以置信我使用 R 是因为我的下游处理例如创建绘图等是在 R 中进行的按列

按列快速串联数千个文件

按列快速串联数千个文件 的相关文章

随机推荐

热门标签

按列快速串联数千个文件的相关文章