要在 R 中列出的文本文件

2023-12-31

我有一个很大的文本文件，每行都有可变数量的字段。每行中的第一个条目对应于一个生物途径，每个后续条目对应于该途径中的一个基因。前几行可能看起来像这样

path1   gene1 gene2
path2   gene3 gene4 gene5 gene6
path3   gene7 gene8 gene9

我需要将此文件作为列表读入 R，其中每个元素都是字符向量，列表中每个元素的名称是该行的第一个元素，例如：

> pathways <- list(
+     path1=c("gene1","gene2"), 
+     path2=c("gene3","gene4","gene5","gene6"),
+     path3=c("gene7","gene8","gene9")
+ )
> 
> str(pathways)
List of 3
 $ path1: chr [1:2] "gene1" "gene2"
 $ path2: chr [1:4] "gene3" "gene4" "gene5" "gene6"
 $ path3: chr [1:3] "gene7" "gene8" "gene9"
> 
> str(pathways$path1)
 chr [1:2] "gene1" "gene2"
> 
> print(pathways)
$path1
[1] "gene1" "gene2"

$path2
[1] "gene3" "gene4" "gene5" "gene6"

$path3
[1] "gene7" "gene8" "gene9"

...但我需要对数千行自动执行此操作。我看到一个之前发布过类似的问题 https://stackoverflow.com/questions/4843128/r-read-a-text-file-with-variable-number-of-columns-to-a-list，但我不知道如何从该线程中执行此操作。

提前致谢。

这是一种方法：

# Read in the data
x <- scan("data.txt", what="", sep="\n")
# Separate elements by one or more whitepace
y <- strsplit(x, "[[:space:]]+")
# Extract the first vector element and set it as the list element name
names(y) <- sapply(y, `[[`, 1)
#names(y) <- sapply(y, function(x) x[[1]]) # same as above
# Remove the first vector element from each list element
y <- lapply(y, `[`, -1)
#y <- lapply(y, function(x) x[-1]) # same as above

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

list

r

Text

statistics

要在 R 中列出的文本文件的相关文章

R - 根据另一个数据框查找每组的重叠日期

我有一个数据框其中包含多个雨量计的降雨测量值如下例所示 gt rnfl ID date value 1 250 2000 03 01 5 37 2 250 2000 03 02 0 00 3 250 2000 03 03 2 94 4
包检查时如何有效处理未压缩的保存？

在最近开发一个包的过程中我将数据集包含在data 我的包的文件夹在我的具体情况下我有 5 个数据集所有这些数据集都位于data table格式尽管我在下面描述的问题仍然存在如果我将它们保留为data frame 我已将每个人单独
R比例置信区间因子

我正在尝试总结家庭调查的数据因此我的大部分数据都是分类因子数据我想用对某些问题的回答频率图来总结它例如回答某些问题的家庭百分比的条形图误差线显示置信区间我发现了这个很棒的教程我认为它是我祈祷的答案 http www coo
glm() 模型的交叉验证

我正在尝试对我之前在 R 中构建的一些 glm 模型进行 10 倍交叉验证我对cv glm 函数在boot包尽管我已经阅读了很多帮助文件当我提供以下公式时 library boot cv glm data glmfit K 10 这里
udunits2 R 安装：找不到 udunits2.h

我正在尝试在 R 中安装 udunits2 以满足对ggforce包裹但是安装程序在检查 udunits2 时始终失败我已经尝试过中的说明this https stackoverflow com questions 47059517
readRDS() 加载额外的包

什么情况下会出现readRDS R 中的函数尝试加载包命名空间我很惊讶地在新的 R 会话中看到以下内容 gt loadedNamespaces 1 base datasets graphics grDevices methods sta
r Shiny 中的 fileInput 函数没有响应

我是 R 和 R闪亮的新手一直致力于构建一个统计应用程序该应用程序将允许用户导入文件然后对数据运行不同的统计程序直到最近 fileData 函数一直对我来说运行良好现在每当我尝试上传文件时都不会打开任何内容我已尝试了所有我能想
通过 RSelenium 单击按钮

我正在尝试使用 Rselarium 和 Rvest 来抓取 REI 的评论吊床我想点击底部的按钮 x 次这样我就可以抓取所有评论我有点失落这是我到目前为止所拥有的如果您也知道如何在取景器中预览您正在做的事情而不是屏幕打印那就
如何在 R 地图库中绘制正确的颜色

我正在尝试使用 R 地图库为特定国家绘制特定颜色我可以填写颜色但它们与各自的国家地区没有正确关联我想知道是否有人能知道为什么我的数据框是 filld 有 3 列第一列是国家名称第二列只是一些数字数据第三列是颜色 countr
将字符串中的 i 个连续相同字符分组到列表中[重复]

这个问题在这里已经有答案了我希望以这样的方式分隔输入字符串即所有连续的相同字符都分组在一个列表中示例1 str aabbcccdeddgg output aa bb ccc d e dd 期望的输出 aa bb ccc d e dd
R中有字典功能吗

有没有办法在 R 中创建一个字典使其具有对一些效果 x dictionary c Hi Why water c 1 5 4 x Why 5 我问这个是因为我实际上正在寻找两个分类变量函数所以如果 x dictionary c a b
如何获取列表的最后一个索引？

假设我有以下列表 list1 1 2 33 51 indices 0 1 2 3 如何获取该列表的最后一个索引在本例中为 3 len list1 1绝对是可行的方法但如果您绝对需要list具有返回最后一个索引的函数您可以创建一个继承自
使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
如何制作一连串的ggplots并在它们之间绘制箭头？

对于一个项目我需要绘制一些图并在它们之间放置箭头作为序列的指示我想知道我是否可以用 ggplot 来做到这一点是否可以使用 ggplot2 绘制一个干净的大箭头并将其添加到最终的多重图中作为示例我使用此代码来绘制绘图 librar
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
如何根据查找表匹配多列

我有以下两个数据框 lookup lt data frame id c A B C price c 1 2 3 results lt data frame price 1 c 2 2 1 price 2 c 3 1 1 我现在想要浏览所有列
使用 dplyr 的 select 引用变量名[重复]

这个问题在这里已经有答案了通常我会想要选择变量的子集其中该子集是函数的结果在这个简单的例子中我首先获取与宽度特征相关的所有变量名称 library dplyr library magrittr data iris width var
一次评论多个对象

假设您有一个变量 a 到 j 的列表 for x in 1 10 assign letters x x 您将如何评论那些最近创建的对象我尝试过类似的事情 for x in 1 10 comment get letters x lt pas
获取所有ios应用程序的全局列表[重复]

这个问题在这里已经有答案了我想对苹果应用商店进行一些全球统计一个瓶颈是至少获取所有当前活动应用程序的 ID 这 9 位数字有谁知道如何获取 iOS 应用商店中当前活动应用程序的所有 id 的完整列表更好的是特定类别的所有 ID 例如
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G

随机推荐

Swift：检查字符串是否包含字符？ [复制]

这个问题在这里已经有答案了如何检查特定的string String含有一定的character Character string contains character Example let string Hello World let
Django Rest Framework，ajax POST 有效，但 PATCH 抛出 CSRF 失败：CSRF 令牌丢失或不正确

我正在将我的项目移植到 Django Rest Framework 来为我的项目制作一个合适的 REST Api 我认为这对设计 API 并使其健壮有很大帮助但我遇到了一个问题我有一个入门模型和关联的ListCreateAPIView
垂直求和直到 Google 表格上的空单元格

This is the scenario I need to get the sum of the values until it reaches a blank cell After that it should start again
多维数组初始化似乎对空格敏感

我注意到这两个声明之间的区别其中只有逗号的位置发生了变化 a a b c d b a b c d 在这种情况下 a length评估结果为 2 且 b length计算结果为 3 第一个子数组 b已被压扁这是一个功能吗在哪里可以找到它
如何将键值对插入到 python 列表中？

a 1 b 2 我想将 a b 插入到空白的 python 列表中 list as a b 正确的语法是什么结果是 a b c d 这只是为了以后我可以按值从最小到最大对列表进行排序如何将键值对插入到 python 列表中
Hive 因 java.lang.InknownClassChangeError 崩溃

运行 select from employee 时针对 Hadoop 3 2 0 运行 hive 3 1 1 会崩溃 java lang IncompatibleClassChangeError Class com google comm
如何在 AppleScript 中抑制/自动关闭错误对话框

我有一个以登录用户身份运行的后台进程该进程经常尝试挂载 AFP 共享来备份某些数据如果无法安装共享则应忽略该共享在我的脚本实际上是 bash 中我通过 AppleScript 挂载共享mount volume片段相比之下mou
从 TypedQuery 查找本机 SQL 查询

我需要知道数据库上正在执行什么查询以便检查是否可以改进它以下代码用于创建查询 TypedQuery
使用可变参数模板进行扩展[重复]

这个问题在这里已经有答案了以下3个调用有什么区别gun功能 template
使用 Puppeteer 抓取 Google 搜索结果链接

下面是我尝试用于 Google 网络抓取的代码当我传递特定请求时它不会返回链接列表我不明白是什么原因造成的有人可以帮忙吗 const puppeteer require puppeteer const searchGoogle as
无法使用 sls 在本地调用 aws lambda

我使用 sls 框架来启动我的代码直到今天它都运行良好 serverless yml 的配置未修改我尝试重新安装 sls 但似乎没有任何效果抛出以下命令后我的所有存储库都会出现以下消息 sls invoke local f func
Aurelia CLI 应用程序包自动更新变慢

您好我有一个在 Aurelia CLI 上运行的 Web 应用程序从我读到的在文档中 http aurelia io hub html doc article aurelia framework latest the aurelia c
iPhone 开发 - 在哪里可以获得应用程序接收到的所有信号及其含义的列表

在手机上测试时我的应用程序在特定点崩溃控制台显示此消息 Tue Jan 27 15 47 14 unknown SpringBoard 22
Pythonlogging.Formatter()：有什么方法可以固定字段的宽度并左/右对齐吗？

以下是日志记录教程中的日志记录示例 2005 03 19 15 38 55 977 simpleExample DEBUG debug message 2005 03 19 15 38 55 979 simpleExample INFO i
如何为 getServerSideProps 启用缓存？

我们有很少的页面和组件作为服务器端渲染我们尝试对少数 API 响应使用缓存 export async function getServerSideProps context const res await getRequest API h
在 PHP 中使用静态方法和属性是否会占用更少的内存？

我正在开发一个每秒有数十个并发用户的 Web 应用程序我有一个类将在同一页面加载中多次实例化在该类中我有一些属性在每个对象中始终相同因此我正在考虑将这些属性声明为static努力减少在同一个页面请求期间实例化此类的多个实例时将使用的
没有提交按钮的表单验证AngularJS

我想要验证没有提交按钮的表单 div div
.NET 图表中的 X 轴仅使用自定义标签

我正在用 C 制作一个 X 轴间隔为数周的 N ET 折线图对于我的项目我只想使用自定义标签但现在我仍然想要网格线有谁知道如何隐藏默认 X 轴标签同时仍保留自定义标签我试过这个 Chart4 ChartAreas 0 AxisX
强制在子方法之前执行父方法，无需显式调用

我正在开发一个 C 应用程序但遇到了一个问题我有一个从抽象类 A 派生的类 B 它具有一些事件处理方法第三个类 C 派生自 B 并且必须重新实现 B 的一些方法有没有一种方法可以在调用 C 的方法之前隐式调用 B 的方法类图 cl
要在 R 中列出的文本文件

我有一个很大的文本文件每行都有可变数量的字段每行中的第一个条目对应于一个生物途径每个后续条目对应于该途径中的一个基因前几行可能看起来像这样 path1 gene1 gene2 path2 gene3 gene4 gene5 gene

要在 R 中列出的文本文件

要在 R 中列出的文本文件 的相关文章

随机推荐

热门标签

要在 R 中列出的文本文件的相关文章