如何从文本文件中读取信息？

2024-03-16

我有数百个文本文件，每个文件中包含以下信息：

*****Auto-Corelation Results******
1     .09    -.19     .18     non-Significant

*****STATISTICS FOR MANN-KENDELL TEST******
S=  609
VAR(S)=      162409.70
Z=           1.51
Random : No trend at 95%

*****SENs STATISTICS ******
SEN SLOPE =  .24

现在，我想阅读所有这些文件，并“收集”森的统计从每个文件（例如.24）并与相应的文件名一起编译成一个文件。我必须用 R 来做。

我曾经使用过 CSV 文件，但不确定如何使用文本文件。

这是我现在使用的代码：

require(gtools)
GG <- grep("*.txt", list.files(), value = TRUE)
GG<-mixedsort(GG)
S <- sapply(seq(GG), function(i){
X <- readLines(GG[i])
grep("SEN SLOPE", X, value = TRUE)
})
spl <- unlist(strsplit(S, ".*[^.0-9]"))
SenStat <- as.numeric(spl[nzchar(spl)])
SenStat<-data.frame( SenStat,file = GG)
write.table(SenStat, "sen.csv",sep = ", ",row.names = FALSE)

当前代码无法正确读取所有值并给出以下错误：

Warning message:
NAs introduced by coercion

另外，我没有得到输出另一列的文件名。请帮忙！

诊断1

该代码也读取 = 符号。这是 print(spl) 的输出

 [1] ""       "5.55"   ""       "-.18"   ""       "3.08"   ""       "3.05"   ""       "1.19"   ""       "-.32"  
[13] ""       ".22"    ""       "-.22"   ""       ".65"    ""       "1.64"   ""       "2.68"   ""       ".10"   
[25] ""       ".42"    ""       "-.44"   ""       ".49"    ""       "1.44"   ""       "=-1.07" ""       ".38"   
[37] ""       ".14"    ""       "=-2.33" ""       "4.76"   ""       ".45"    ""       ".02"    ""       "-.11"  
[49] ""       "=-2.64" ""       "-.63"   ""       "=-3.44" ""       "2.77"   ""       "2.35"   ""       "6.29"  
[61] ""       "1.20"   ""       "=-1.80" ""       "-.63"   ""       "5.83"   ""       "6.33"   ""       "5.42"  
[73] ""       ".72"    ""       "-.57"   ""       "3.52"   ""       "=-2.44" ""       "3.92"   ""       "1.99"  
[85] ""       ".77"    ""       "3.01"

诊断2

发现了我认为的问题。负号有点棘手。在某些文件中是

SEN SLOPE =-1.07
SEN SLOPE = -.11

由于 = 之后的间隙，我得到第一个的 NA，但代码正在读取第二个。如何修改正则表达式来解决这个问题？谢谢！

Assume "text.txt"是您的文本文件之一。读入 RreadLines，您可以使用grep找到包含的行SEN SLOPE。没有进一步的争论，grep返回找到正则表达式的元素的索引号。这里我们发现是第11行。添加value = TRUE参数来获取该行所读取的内容。

x <- readLines("text.txt")
grep("SEN SLOPE", x)
## [1] 11
( gg <- grep("SEN SLOPE", x, value = TRUE) )
## [1] "SEN SLOPE =  .24"

为了找到所有的.txt我们可以使用工作目录中的文件list.files用正则表达式。

list.files(pattern = "*.txt")
## [1] "text.txt"

循环多个文件

我创建了第二个文本文件，text2.txt与不同的SEN SLOPE值来说明我如何在多个文件上应用此方法。我们可以用sapply，其次是strsplit，得到spl所需的值。

GG <- list.files(pattern = "*.txt")
S <- sapply(seq_along(GG), function(i){
    X <- readLines(GG[i])
    ifelse(length(X) > 0, grep("SEN SLOPE", X, value = TRUE), NA)
    ## added 04/23/14 to account for empty files (as per comment)
})
spl <- unlist(strsplit(S, split = ".*((=|(\\s=))|(=\\s|\\s=\\s))"))
## above regex changed to capture up to and including "=" and 
## surrounding space, if any - 04/23/14 (as per comment)
SenStat <- as.numeric(spl[nzchar(spl)])

然后我们可以将结果放入数据帧并将其发送到文件write.table

( SenStatDf <- data.frame(SenStat, file = GG) )
##   SenStat      file
## 1    0.46 text2.txt
## 2    0.24  text.txt

我们可以将其写入文件

write.table(SenStatDf, "myFile.csv", sep = ", ", row.names = FALSE)

2014 年 7 月 21 日更新：

由于结果被写入文件，因此可以使这变得更加简单（并且更快）

( SenStatDf <- cbind(
      SenSlope = c(lapply(GG, function(x){
          y <- readLines(x)
          z <- y[grepl("SEN SLOPE", y)]
          unlist(strsplit(z, split = ".*=\\s+"))[-1]
          }), recursive = TRUE),
      file = GG
 ) )
#      SenSlope file       
# [1,] ".46"   "test2.txt"
# [2,] ".24"   "test.txt"

然后写入并读入 R

write.table(SenStatDf, "myFile.txt", row.names = FALSE)
read.table("myFile.txt", header = TRUE)
#   SenSlope      file
# 1     1.24 test2.txt
# 2     0.24  test.txt

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

textfiles

textprocessing

logfileanalysis

如何从文本文件中读取信息？的相关文章

如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
R Shiny：如何将无功值从闪亮模块返回到主服务器功能？

我有一个简单的玩具示例它使用 add removeBtn 模块在第一个模块中添加和删除 UI 我需要跟踪单击添加删除的次数如果我不使用模块这很容易但我试图在嵌套模块的上下文中执行此操作代码如下但基本上我似乎无法访问主
在 R 的 for 循环中创建动态命名对象并分配动态值

我正在尝试创建一套动态命名的新对象例如 temp2015 使用 for 循环并存储动态值具体来说其他对象的名称例如 Y2015 和 for 循环中使用的值例如 2015 在动态命名的新对象中我不确定为什么下面的代码不起作用 Y
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
在ggplot中设置y轴中断

我在代码中设置中断时遇到困难我尝试添加breaks seq 0 100 by 20 但似乎无法让它正常工作本质上我希望 Y 轴从 0 到 100 每 20 个刻度一次 YearlyCI lt read table header T te
如何为自定义 S3 类实现提取/取子集 ([ [<-, [[ [[<-)] 函数？

我有一个自定义的 S3 类foo 它在正常的基础上添加了一些自定义行为data frame foo object lt data frame class foo object lt c foo data frame 对于这个类还应该有一个
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
平滑连续 2D 点

UPDATE 感谢 user20650和李哲源Zheyuan Li 这是我想出的解决方案 Example data set df 3600 observations points Create a vector of the cumula
R 改变构面的顺序

我正在尝试将方面的顺序从 BA SLG 更改为 SLG BA 我发现了与此类似的问题但我认为我的解决方案可能不起作用因为我已经在Excel中汇总了数据因此我的数据框可能会有所不同无论如何我尝试实现这个但无济于事 df2 lt f
计算 R 行中的非零条目数

我有以下类型的数据 mode1 mode2 mode3 1 8 1 0 2 0 0 0 3 6 5 4 4 1 2 3 5 1 1 1 数据使用dput structure list mode1 c 8L 0L 6L 1L 1L mode2
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
我如何查看 quantmod 包中所有可用的数据系列？

如何显示可用的所有报价数据系列的列表例如使用雅虎的 getSymbols 我不知道有什么办法 TTR包有一个功能 stockSymbols 下载 NYSE AMEX 和 NASDAQ 的所有当前代码它试图将它们采用雅虎可接受的格式但
如何将参数从 Excel/VBA 传递到 Rstudio 中的脚本

我正在尝试使用 Rstudio 从 VBA 打开 R 脚本同时将参数传递给 R 脚本然后我可以使用 commandArgs 访问该脚本该问题与此处描述的问题非常相似 WScript Shell 用于运行路径中包含空格且来自 VBA 的
条件和分组 mutate dplyr

假设我有以下每个抽屉库存增加的数据 gt socks year drawer nbr sock total 1990 1 2 1991 1 2 1990 2 3 1991 2 4 1990 3 2 1991 3 1 我想要一个二进制变量来标
R：改变堆积条形图的颜色

library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g
使用“assign()”为列表项分配值

首先了解一些背景我写了一个中缀函数本质上取代了这个习惯用法 x length x 1 lt y 或者简单地说x lt append x y 对于向量这里是 lt function x y xcall lt substitute x x

随机推荐

允许 VSTS 更新测试数据库

为了运行验收测试我需要在 SQL Azure 上运行的数据库上定义一个已知的良好状态我的测试在本地运行良好并设置了连接字符串来更新 Azure PaaS 上的 SQL 实例使用 VSTS 部署数据库后将运行测试为了让部署过程运行我
显示特定日期范围内的帖子

尝试显示特定日期范围的我的自定义帖子类型我只想显示某个月份内的帖子我知道我需要连接 posts where 过滤器但我不知道如何将参数传递给这个函数因为我需要传递日期范围我见过很多关于如何更改 WHERE 子句以获取日期范围的示例
iOS 8 Swift 读取 Plist

我想从 plist 文件中读取整数值我有以下代码 let path NSBundle mainBundle pathForResource savedState ofType plist let dict NSDictionary con
Modbus 错误：[无效消息] 收到的消息不完整，预计至少 2 个字节（收到 0 个字节）

Problem pymodbus 主站客户端可以向从站服务器发送请求从属服务器准备好返回的东西并等待主控客户端来接收它们尽管服务器从站已准备就绪但主站客户端仅返回错误 Modbus 错误输入输出 Modbus 错误
Symfony2：onKernelResponse 作为 MASTER_REQUEST 被调用两次

我正在使用事件监听器onKernelResponse I used if HttpKernelInterface MASTER REQUEST event gt getRequestType return 它有一个MASTER REQUES
Windows Phone 7 中的进度条？

任何人都可以提供有关如何在 Windows Phone 7 中使用进度栏的代码示例 Microsoft 的开发人员 Jeff Wilcox 发布了一个可能有用的进度条适用于 Windows Phone 的高性能 ProgressBar h
如何消除 html 页面中一行中元素之间的空格？

我显示的是3 img 像这样连续 div style width 100 img src UploadedImages 86 jpg alt style width 300px margin 0px padding 0px border 1
C#：从txt文件中读取数据

我有一个 EDF 文本文件该文件的内容如下 ConfigFile Sample Software v0 32 CP Version 0 32 123 Float 2 127 Number 0 039 Code 70 我想阅读这些项目并像
class A {...};模板 class A {...};' （如果有的话）？' aria-label='C++11 标准中哪里禁止 'template class A {...};模板 class A {...};' （如果有的话）？'> C++11 标准中哪里禁止 'template class A {...};模板 class A {...};' （如果有的话）？

我试图通过想象神秘的结构来更全面地掌握模板语法和语义我认为 C 11 标准不允许使用以下语法 template
集成测试时在AngularJS中使用$injector（不使用ngMock）

我需要使用 Karma Jasmine 在 AngularJS 中设置一些集成测试但遇到麻烦因为不使用 ngMock 时因为我想访问实际的 http 端点没有module or inject方法那么如何将服务注入到我的测试中呢我
Ubuntu + scala REPL，未在控制台上键入命令

我使用的是 Ubuntu 18 04 Scala 2 11 12 OpenJDK 64 位服务器虚拟机 Java 1 8 0 162 一旦我打开 scala shell 我就看不到我输入的任何内容但它会被输入下面是我打字时发生的情况pr
如何在两条直线android之间放置文本？

我需要在直线之间放置文本我尝试使用视图但文本视图位于该行下方怎么解决这个问题呢我的代码如下
Maven - 在当前项目和插件组中找不到前缀“tomcat7”的插件

我创建了一个 Maven 项目这是结构 parent core web 但是当我尝试使用命令进行部署时mvn tomcat7 deploy 我收到以下错误 No plugin found for prefix tomcat7 in the
链接维度的不同粒度级别的事实表

数据仓库设计新手我有一个代表地理位置例如郊区城市州的非规范化维度表这是一个缓慢变化的维度还有多个事实表每个事实表都有不同的粒度级别是否可以对此进行建模以便事实表使用代理键同时维护非规范化维度表如果您实际上拥有相同的维
类型错误：流未定义

无法向我的小型 React 应用程序添加数据库连接我尝试了一堆 npm 模块 sqlite sqlite3 realm 全部因类型错误而回退 TypeError stream is undefined 我什么也没做只是在我的组件中添加了
我如何找到启动我的进程的计划任务的实例ID/相关ID

如果我有一个运行我的 EXE 的 Windows 计划任务有没有办法从我的 EXE 内部找到触发我的计划任务实例简单的回答是不你能做的最好的事情是以编程方式访问任务调度程序库看看你所在的进程是否处于运行模式获取进程的 PID
检测两张图片之间的相似点然后将它们叠加（Python）

我有两张相同神经切口的照片深度略有不同每张切片使用不同的染料进行染色我想叠加这两个图像但它们在幻灯片照片上没有完美对齐因此无法简单地做到这一点我想要做的是编写代码来检测两个切片之间的相似形状即相同的单元格然后根据这些单元格
Django自定义装饰器重定向问题

我尝试在 Django 中编写一个自定义装饰器如果用户未通过该页面登录我想将用户重定向到自定义登录页面我已经编写了装饰器并调试了它虽然如果用户未登录它可以正常工作但在用户登录后它会给出错误 The view APPNAME v
Playwright locator.evaluateAll 如何返回使用节点 forEach 填充的地图

我想抢夺所有人的财产
如何从文本文件中读取信息？

我有数百个文本文件每个文件中包含以下信息 Auto Corelation Results 1 09 19 18 non Significant STATISTICS FOR MANN KENDELL TEST S 609 VAR S 16

如何从文本文件中读取信息？

诊断1

诊断2

如何从文本文件中读取信息？ 的相关文章

随机推荐

热门标签

如何从文本文件中读取信息？的相关文章