损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中

2024-01-04

这是一个扩展这个问题 https://stackoverflow.com/questions/42513614/select-specific-rows-and-cells-in-text-file-and-put-into-data-frame-python-on-r需要更改以容纳更多行Bands在文本文件中。我想要的是从如下所示的文本文件中选择“基本统计”行，然后将它们组织在数据框中，如问题底部的数据框。Here's https://www.dropbox.com/s/w76w2qqxqcdncik/test2.txt?dl=0如果您想直接使用该文件，请提供该文件的链接。

Filename: /blah/blah/blah.txt
ROI: red_2 [Red] 12 points

Basic Stats      Min         Max        Mean       Stdev
     Band 1 0.032262    0.124425    0.078073    0.028031
     Band 2 0.021072    0.064156    0.037923    0.012178
     Band 3 0.013404    0.066043    0.036316    0.014787
     Band 4 0.005162    0.055781    0.015526    0.013255

Histogram         DN       Npts   Total  Percent     Acc Pct
Band 1      0.032262          1       1   8.3333      8.3333
Bin=0.00036 0.032624          0       1   0.0000      8.3333
            0.032985          0       1   0.0000      8.3333
            0.033346          0       1   0.0000      8.3333

这是我正在使用的代码：

dat <- readLines('/blah/blah/blah.txt') 
# create an index for the lines that are needed: Basic stats and Bands
ti <- rep(which(grepl('ROI:', dat)), each = 8) + 1:8
# create a grouping vector of the same length
grp <- rep(1:203, each = 8)

# filter the text with the index 'ti' 
# and split into a list with grouping variable 'grp'
lst <- split(dat[ti], grp)
# loop over the list a read the text parts in as dataframes
lst <- lapply(lst, function(x) read.table(text = x, sep = '\t', header = TRUE, blank.lines.skip = TRUE))

# bind the dataframes in the list together in one data.frame
DF <- do.call(rbind, lst)
# change the name of the first column
names(DF)[1] <- 'ROI'

# get the correct ROI's for the ROI-column
DF$ROI <- sub('.*: (\\w+).*$', '\\1', dat[grepl('ROI: ', dat)])
DF

输出看起来像这样：

$ROI
[1] "red_2"  "red_3"  "red_4"  "red_5"  "red_6"  "red_7"  "red_8"  "red_9"  "red_10" "bcs_1"  "bcs_2" 
[12] "bcs_3"  "bcs_4"  "bcs_5"  "bcs_6"  "bcs_7"  "bcs_8"  "bcs_9"  "bcs_10" "red_11" "red_12" "red_12"
[23] "red_13" "red_14" "red_15" "red_16" "red_17" "red_18" "red_19" "red_20" "red_21" "red_22" "red_23"
[34] "red_24" "red_25" "red_24" "red_25" "red_26" "red_27" "red_28" "red_29" "red_30" "red_31" "red_33"

$<NA>
[1] "Basic Stats\t     Min\t     Max\t    Mean\t   Stdev"

$<NA>
[1] "Basic Stats\t     Min\t     Max\t    Mean\t   Stdev"
etc...

当它看起来应该是这样的：

ROI      Band         Min        Max         Mean   Stdev
red_2    Band 1 0.032262    0.124425    0.078073    0.028031
red_2    Band 2 0.021072    0.064156    0.037923    0.012178
red_2    Band 3 0.013404    0.066043    0.036316    0.014787
red_2    Band 4 0.005162    0.055781    0.015526    0.013255
red_3    Band 1 values...
red_4    Band 2 
red_4    Band 3 
red_4    Band 4

我想要一些帮助。

对于此文件，您必须进行调整我在这里提出的方法 https://stackoverflow.com/a/42514499/2204410。对于链接的文本文件（test2.txt）我建议采用以下方法：

dat <- readLines('test2.txt') 

len <- sum(grepl('ROI:', dat))
ti <- rep(which(grepl('ROI:', dat)), each = 7) + 0:6
grp <- rep(1:len, each = 7)

lst <- split(dat[ti], grp)
lst <- lapply(lst, function(x) read.table(text = x, sep = '\t', skip = 1, header = TRUE, blank.lines.skip = TRUE))

names(lst) <- sub('.*: (\\w+).*$', '\\1', dat[grepl('ROI: ', dat)])

library(data.table)
DT <- rbindlist(lst, idcol = 'ROI')
setnames(DT, 2, 'Band')

这给出了期望的结果：

> DT
         ROI        Band      Min      Max     Mean    Stdev
   1:  red_1      Band 1 0.013282 0.133982 0.061581 0.034069
   2:  red_1      Band 2 0.009866 0.112935 0.042688 0.026618
   3:  red_1      Band 3 0.008304 0.037059 0.018434 0.007515
   4:  red_1      Band 4 0.004726 0.040089 0.018490 0.009605
   5:  red_2      Band 1 0.032262 0.124425 0.078073 0.028031
  ---                                                       
1220: bcs_49      Band 4 0.002578 0.010578 0.006191 0.002285
1221: bcs_50      Band 1 0.032775 0.072881 0.051152 0.012593
1222: bcs_50      Band 2 0.020029 0.085993 0.042864 0.018628
1223: bcs_50      Band 3 0.012770 0.034367 0.023056 0.006581
1224: bcs_50      Band 4 0.005804 0.024798 0.014049 0.005744

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中的相关文章

ggplot 中的条形图，每组有不同数量的条形图

我的数据集如下所示 DSET lt data frame cbind c rep V1 3 rep V2 3 V3 c rep c X1 X2 X3 2 X1 c rep 1 7 names DSET lt c A B C DSET 3 l
Python - Pandas - 将特定函数应用于给定级别 - 多索引数据帧

我有一个多索引 DataFrame 并且我希望仅对分配给我的级别之一的向量应用一些计算使用下面的代码 import pandas as pd import datetime ticker date US datetime date tod
基于两列对数据框中的行进行求和[重复]

这个问题在这里已经有答案了我想添加一列的值将它们按两列分组我找到了如何在一列上执行此操作但无法弄清楚如何在两列上执行此操作例如如果我有以下数据框 x c a a b b c c a a b b c c a a b b c c y
将 Excel 数字日期重新格式化为 R 日期

希望将从 Excel 中提取的列重新格式化为包含数字 Excel 格式例如 40182 的数据框 as date 40182 origin 1899 12 30 format b Y Returns 1 2070 年 1 月 5 日我正
确定列的累积最大值

我正在尝试以下代码 df pd DataFrame 23 52 36 49 52 61 75 82 97 12 columns A B df C np where df A gt df C shift df A df C shift pri
pyspark.sql.functions.window 函数的“startTime”参数和 window.start 有何作用？

示例如下 df spark createDataFrame 1 2017 05 15 23 12 26 2 5 1 2017 05 09 15 26 58 3 5 1 2017 05 18 15 26 58 3 6 2 2017 05 15
data.table 相当于 dplyr::filter_at

考虑数据 library data table library magrittr vec1 lt c Iron Copper vec2 lt c Defective Passed Error set seed 123 a1 lt sampl
使用 R 将图例添加到绘图中

我使用 R 在一个图中创建了 4 条线这是代码 Define 2 vectors cars lt c 123 07 110 51 96 14 98 71 101 3 trucks lt c 110 31 89 91 89 81 89 31
将日期（系列）列从一个 DataFrame 添加到其他 Pandas，Python

我正在尝试将日期列从 df1 广播到 df2 在 df1 中我有所有用户的姓名及其基本信息在 df2 中我有一个用户购买的列表 df1 和 df2 代码 https i stack imgur com sN0uJ png 假设我有一
如何使用“downloadHandler”在闪亮的可反应内部创建下载按钮？

我创建downloadlinksa 的行内reactable 我这样做是为了DT datatable and a reactable reactable 我还创建了相应的output downloadHandler在 ids 上使用 app
在 Shiny 应用程序中更改 bsModal 的背景

我正在开发一个 Shiny 应用程序我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮我做了一些研究并了解到我需要覆盖背景和键盘参数但即使我看到了一些建议我也不知道这到底需要放在我的代码中的哪里我不精通 Ja
OpenStreetMap 不显示在 RStudio 中（使用 R 3.2.1）

我正在使用来自的代码here https rstudio github io leaflet library leaflet m lt leaflet gt addTiles gt addMarkers lng 174 768 lat 36
R 监督潜在狄利克雷分配包

我在用着这个LDA包 https cran r project org web packages lda 对于 R 具体来说我正在尝试做监督潜在狄利克雷分配 slda https www cs princeton edu blei pap
Python删除带有时间条件的行

我有 2 组 Dataframe 均具有唯一标识符和格式相同的日期时间数据 2020 01 01 00 00 01 日期时间和 12345 唯一标识符和类型第一个问题 DF1 DatetimeX ID Type 2020 01 01 02
‘!’ 对于 R 中的因子没有意义

我需要从数据框中排除变量 PABI 所以我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
如何使用 Rrank() 函数创建新的ties.method？ [复制]

这个问题在这里已经有答案了我试图按人口和日期排序这个数据框所以我使用order and rank 功能 gt df lt data frame idgeoville c 5 8 4 3 4 5 8 8 date c rep 1950 4
如何从另一个数组值中过滤数组值并返回新数组？ [复制]

这个问题在这里已经有答案了我有两个数组 all languages and taken languages 第一个包含所有语言例如 200 种或其他语言第二个包含之前选择的语言从 0 到 200 种我需要删除所有已采用的语言 ta
do.call 的 envir 选项如何工作？

的文档do call states If quote is FALSE 默认值然后对参数进行求值在调用环境中而不是在envir 这句话向我暗示当quote FALSE 指定envir没有什么区别然而事实并非如此事实上我遇到过需
如何在 R 中创建“堆叠瀑布”图表？

I was able to find several packages to create a waterfall chart in R which look like this But I could not find a way to
使用 alpha 通道叠加两个 ggplot2 stat_密度2d 图

我想叠加两个ggplot2使用 alpha 通道进行绘图结果图像显示两个数据集这是我的测试数据 data read table text P1 1 0 4 nP2 0 0 2 nP3 2 1 8 nP4 2 2 6 nP5 0 5 2

随机推荐

向包含多个模型的 gtsummary 回归表添加多级标题

我正在尝试为一个生成多个级别的标头gtsummary回归表包含应在表中按年份分组的回归模型这是一个玩具示例 library dplyr library gtsummary library purrr set seed 92922 df l
如何将重复键添加到字典

如何将重复的键添加到字典中即我已经添加了键值对作为 rollno 1 但我需要将相同的参数添加到字典中但不允许添加如何在字典中添加重复键重复键或者任何其他选择任何想法这是没有意义的如果你在字典中添加了重复的键那么当你查找它
使用 Delphi7 TClientDataSet：是否可以让它以缩进格式保存 XML 内容？

我用的是Delphi7TClientDataSet读取和写入一些数据的 XML 文件但是当我想在程序外部浏览此内容在 Windows 资源管理器中双击 XML 时我得到在文本内容中发现无效字符错误处理资源即使数据在 Delph
从 Drupal 的节点菜单设置中删除导航菜单

如何从节点编辑表单的菜单设置中删除导航菜单和其他菜单我怀疑这可以通过使用 module form alter 这样的钩子来实现但我不确定如何实现它这样做的动机是为了消除用户在下拉菜单中出现标准主链接菜单以外的菜单时所产生的困惑
“所有程序都被解释”。如何？

计算机科学家将正确地解释所有程序都是解释唯一的问题是在什么级别 perlfaq http perldoc perl org perlfaq1 html 所有程序如何解释 Perl 程序是一个文本文件由perl程序导致perl程序遵循一
如何使 filter() 的参数成为变量？

我有这个型号 class Item db Model glam db StringProperty casual db StringProperty speaking db StringProperty 这个处理程序带有一个带有单选按钮的表
Rails：对 custom.css.scss 的任何更改都会导致应用程序崩溃

我正在学习铁轨我有这个问题我希望你能帮助我这是我的custom css scss import bootstrap mixins variables etc grayMediumLight eaeaea universal html
如何在不使用个人凭据的情况下在 Gitlab CI 中创建 Git 标签？

我使用的是 GitLab 企业版 14 6 5 ee 我想在将分支合并回时自动创建一个 Git 标签master 我对实际的 Git 命令很满意问题在于身份验证构建机器人不知道如何向服务器进行身份验证有一个答案here https s
防止 XmlTextReader 扩展实体

我试图在不扩展实体的情况下读取 XML 文档对其进行一些操作然后将其与最初未扩展的实体一起重新保存直接使用 XDocument 时它无法加载抛出异常告诉我它有未扩展的实体 XDocument doc XDocument Load
SwiftUI：手势和偏移未按预期工作

我正在使用偏移和手势修改器在屏幕上移动一个圆圈当我使用这段代码时一切都按预期工作 import SwiftUI struct MovingCircle View State private var dragged CGSize zero
Pyinstaller非法指令4（其他电脑）

pyinstaller 遇到问题我正在尝试使用 PyInstaller 发送 exe app 文件但是任何尝试打开我的文件的人最终都会收到非法指令 4 错误仅当我尝试在我的机器上编译并发送给其他人时才会发生这种情况使用相同进程
如何在plotly express中从树状图最外层块中删除悬停文本

我使用以下代码使用plotlyexpress创建了一个3级树状图 import plotly express as px fig px treemap veh 3d data path Date Capacity 2 Transporter
在c#中实现多态性，如何最好地做到这一点？

这是第一个问题所以希望你们都能温柔地对待我在过去的几天里我阅读了大量有关多态性的文章并尝试将其应用到我在 C 中所做的事情似乎有几种不同的方法来实现它我希望我已经掌握了这个问题但即使我没有得到澄清我也会很高兴据我所知我有
如何从输出中删除换行符？

在 shell 中对密码进行哈希处理 sha512 会破坏这条线如何在一行中得到结果哈希脚本 password abc123 hashPassw bin echo n password openssl dgst binary sha51
ffserver 可以播放 mp4 流吗？

我尝试使用 ffserver 流式传输 mp4 文件的日子我读过很多这样的问题 https superuser com questions 563591 streaming mp4 with ffmpeg https superuser
OpenFileMapping 问题，找不到文件映射

我目前正在尝试使用文件映射来测试进程间通信我的第一个程序我将其称为生产者在以下创建文件映射并写入文件映射的代码上不会出错如下所示 hEvent CreateFileMapping INVALID HANDLE VALUE use p
如何在 django-tastypie 中组合多个资源？

假设我有三个模型提交联系和提交联系 class Submission models Model title models CharField max length 255 verbose name Title class Contact
使用 RequestScoped Bean 和渲染属性的正确方法是什么？

有人知道如何在 jsf 中将 RequestScoped bean 与渲染属性一起使用吗呈现的属性是在 applyValues 阶段之前评估的因此无法正确评估我不想保留任何状态该示例可以是带有数据表和按钮的outputPanel 数
使用纯虚拟成员地址的虚拟呼叫。合法吗？

我之前读过可能是在 c l c moderated 上虚拟函数调用可以模板化我尝试了以下几行 include
损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中

这是一个扩展这个问题 https stackoverflow com questions 42513614 select specific rows and cells in text file and put into data fram

损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中

损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中 的相关文章

随机推荐

热门标签

损坏的 R 代码用于选择文本文件中的特定行和单元格并将其放入数据框中的相关文章