使用awk解析

2024-02-16

如何使用 awk 根据另一个文件的数据解析文件。

我做了一个脚本：

BEGIN{ FS="\t" ; OFS="\t"

while((getline<"headfpkm")>0) {
        ++a
        id[a]=$1
        fpkm[a]=$2
        print id[a],fpkm[a]
        }
lastid=id[a]
print lastid
close("headfpkm")
}

/$lastid/{
        print $2,$3,$5,$7,$8,$14,fpkm[a]
        a--
        lastid=id[a]
}
END{ print "total lines=",FNR,"\n\nfile 1 index: ",a}

当我运行它时：

/$ awk -f testawk.awk file2

它正确运行 BEGIN 部分，但不给出任何输出。

NM_000014       5.04503
NM_000015       0.586677
NM_000016       1.138332278
NM_000017       0.64386
NM_000018       3.61746
NM_000019       2.8793
NM_000020       10.846
NM_000021       0.685098
NM_000022       46388.6
NM_000026       0.257471
NM_000026
total lines=    10

file 1 index:   10

搜索部分有问题吗？

文件 2 如下所示：

34      ACADM   NM_000016       9606    hsa-miR-3148    3       80      87      0.003   -0.016  -0.094  0.082   0.112   -0.160  97
34      ACADM   NM_000016       9606    hsa-miR-3163    1       623     629     0.001   -0.022  -0.020  0.065   0.125   -0.01   57
35      ACADS   NM_000017       9606    hsa-miR-3921    3       68      75      0.013   0.192   -0.097  0.031   -0.039  -0.147  82
35      ACADS   NM_000017       9606    hsa-miR-4303    2       67      73      0.012   0.150   -0.052  0.013   -0.039  -0.036  31
35      ACADS   NM_000017       9606    hsa-miR-4653-5p 3       68      75      0.003   0.192   -0.097  0.031   -0.039  -0.157  84
37      ACADVL  NM_000018       9606    hsa-miR-124     2       31      37      0.003   0.023   -0.057  0.012   -0.032  -0.171  76
37      ACADVL  NM_000018       9606    hsa-miR-1827    2       135     141     -0.007  -0.043  -0.058  0.039   -0.069  -0.258  91
37      ACADVL  NM_000018       9606    hsa-miR-2682    2       134     140     0.003   -0.014  -0.058  0.004   -0.047  -0.232  87
37      ACADVL  NM_000018       9606    hsa-miR-449c    2       134     140     -0.035  -0.014  -0.058  0.004   -0.047  -0.270  92
37      ACADVL  NM_000018       9606    hsa-miR-506     2       31      37      -0.016  0.023   -0.057  0.012   -0.032  -0.190  80

这将是一个猜测，因为我不能 100% 确定你想要完成什么。解决您的问题的更好方法是执行以下操作：

BEGIN {
    FS=OFS="\t"
}

FNR==NR {
    c++

    a[$1]=$2
    next
}

$3 in a {
    print $2,$3,$5,$7,$8,$14,a[$3]
}

END {
    printf "total lines=%s\n\nfile 1 index: %s\n", FNR, c
}

运行如下：

awk -f script.awk headfpkm file2

Results:

ACADM   NM_000016  hsa-miR-3148     80   87   -0.160  1.138332278
ACADM   NM_000016  hsa-miR-3163     623  629  -0.01   1.138332278
ACADS   NM_000017  hsa-miR-3921     68   75   -0.147  0.64386
ACADS   NM_000017  hsa-miR-4303     67   73   -0.036  0.64386
ACADS   NM_000017  hsa-miR-4653-5p  68   75   -0.157  0.64386
ACADVL  NM_000018  hsa-miR-124      31   37   -0.171  3.61746
ACADVL  NM_000018  hsa-miR-1827     135  141  -0.258  3.61746
ACADVL  NM_000018  hsa-miR-2682     134  140  -0.232  3.61746
ACADVL  NM_000018  hsa-miR-449c     134  140  -0.270  3.61746
ACADVL  NM_000018  hsa-miR-506      31   37   -0.190  3.61746
total lines=10

file 1 index: 10

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Parsing

awk

使用awk解析的相关文章

.Net 有什么好的解析库吗？

我正在寻找一些简单易用语法易于定义的东西虽然我以前没用过 ANTLR http www antlr org 有 C 运行时
Gson解析没有键值对的字符串

我正在尝试使用 Gson 库解析字符串但没有成功这是我的字符串 1 816513 52 5487566 1 8164913 52 548824 此示例中的问题是没有键值对我查看了其他示例但它们都有键值对看起来不像我的问题我的解决
Matlab 的快速 JSON 解析器

您知道 Matlab 中有一个非常快速的 JSON 解析器吗目前我正在使用JSONlab http www mathworks com matlabcentral fileexchange 33381 jsonlab a toolbox
如何解析代码（Python）？

我需要解析一些特殊的数据结构它们采用某种类似 C 的格式大致如下所示 Group GroupName C Style comment Group AnotherGroupName Entry some variables 0 3 141
如何提取Python代码文件中使用的函数？

我想创建代码文件中使用的所有函数的列表例如如果我们在名为 add random py 的文件中有以下代码 import numpy as np from numpy import linalg def foo print np rand
处理调车场额外的操作员

给定这样的输入 3 4 算法将其转化为3 4 当执行后缀表达式时我可以找到错误但是在转换过程中是否有可能发现这一点我读过的维基百科文章和互联网文章不处理这种情况谢谢除了括号不匹配之外还可以使用正则表达式来验证有效表达式如维基百
按行号和列号对文件进行子集化

我们想要按行和列对文本文件进行子集化其中行数和列数是从文件中读取的不包括标题第 1 行和行名称第 1 列输入文件 txt制表符分隔的文本文件 header 62 9 3 54 6 1 25 1 2 3 4 5 6 96 1 1
分析 ELF 部分和符号大小的工具

我需要一种方法来分析 ARM 的 GCC 编译器的输出文件我正在为裸机进行编译并且我非常关心大小我可以用arm none eabi objdump由交叉编译器提供但如果存在用于此任务的工具则解析输出并不是我渴望做的事情您知道存在
如何拆分一行并重新排列其元素？

我在一行中有一些数据如下所示 abc edf xyz rfg yeg udh 我想呈现如下数据 abc xyz yeg edf rfg udh 以便打印备用字段并用换行符分隔有没有这样的衬里下列awk脚本可以做到这一点 gt echo
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
正则表达式是否用于构建解析器？

这只是出于好奇的一个问题因为我最近需要越来越多地解析和使用正则表达式似乎对于我在搜索中遇到的有关某种解析的问题有人总是最终说当问一些与正则表达式相关的问题正则表达式对此不好请使用这样那样的解析器因为我已经更好地理解了正则表达
修复 PHP 中格式错误的 HTML？

我正在根据用户提供的片段构建一个大型 HTML 文档这些用户有以各种方式格式错误的烦人习惯浏览器足够强大且宽容但我希望能够验证并理想情况下修复任何格式错误的 HTML 如果可能的话例如 td b Title b td 可以合理地
用于冒号分隔标签的 XML 解析器？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 TStringList 的分隔符解析字符串，似乎也解析空格（Delphi）

我有一个简单的字符串由某个字符分隔比如说逗号我应该能够创建一个 TStringList 并将其分隔符设置为逗号然后将 DelimitedText 设置为我想要解析的文本并且应该自动解析它问题是当我查看输出时它还包含空格作为分
将人类日期（当地时间 GMT）转换为日期

我正在服务器上工作服务器正在向我发送 GMT 本地日期的日期例如Fri Jun 22 09 29 29 NPT 2018在字符串格式上我将其转换为日期如下所示 SimpleDateFormat simpleDateFormat ne
如何删除最后一次出现模式后的所有行？

我想删除最后一次出现模式之后的所有行除了模式本身 file txt honor apple redmi nokia apple samsung lg htc file txt 我想要什么 honor apple redmi nokia a
无论如何要抓取重定向的链接吗？

无论如何我可以让 python 单击一个链接例如 bit ly 链接然后抓取生成的链接吗当我抓取某个页面时我唯一可以抓取的链接是重定向的链接它重定向到的位置就是我需要的信息所在的位置重定向有 3 种类型 HTTP 作为响应标头
用于（联合国）结构化文本文档的词法分析器/解析器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有很多脚本解析器和词法分析器即结构化计算机语言但我正在寻找一个可以将几乎非结构化文本文档分成更
有一种简单的方法可以忽略时间戳来区分日志文件吗？

我需要比较两个日志文件但忽略每行的时间戳部分确切地说是前 12 个字符有没有一个好的工具或者一个聪明的 awk 命令可以帮助我根据您使用的 shell 您可以改变方法 Blair https stackoverflow com
awk 子串单个字符

这是columns txt aaa bbb 3 ccc ddd 2 eee fff 1 3 3 g 3 hhh i jjj 3 kkk ll 3 mm nn oo 3 我可以找到第二列以 b 开头的行 awk if substr 2 1 1

随机推荐

JavaScript 中的应用函数

我正在学习 JavaScript 目前正在尝试找出原因在蜘蛛猴 https developer mozilla org en SpiderMonkey concat apply 1 2 返回预期的 1 2 but Array concat
如何使用Torch生成的模型进行预测？

我已经执行了神经网络 tutorial lua https github com nicholas leonard dp blob master examples neuralnetwork tutorial lua 现在我有了模型我想用
尝试...否则...除了语法错误

我无法理解这个无法运行此代码我不知道为什么它是语法错误 try newT read existingArtist newT Exif Image Artist value existingKeywords newT Xmp dc sub
Android：AsyncTask 或带有 ExecutorService 的普通 Java 线程 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我的应用程序使用Service做一些背景工作我正在服务中使用额外的线程来进行一些计算为此我每 5 到 10 秒创建两个线程运行 5 到
.NET混淆工具/策略[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我的产品有几个组件 ASP NET Windows Forms App 和 Windows Service 大约 95 的代码是用 VB NET
firebase云函数ServerValue增量不起作用

我有一个 firebase 功能我想在这里增加ServerValue 但它不起作用并给出错误我哪里做错了我在下面附上控制台屏幕截图注我不太了解javascript java代码也可能有错误 const functions requ
有什么方法可以监控 Airflow DAG 的执行时间吗？

我想将 Airflow 与 Statsd 和 DataDog 一起使用来监控 DAG 是否需要例如是之前执行的两倍所以我需要某种用于 DAG 的实时计时器或者operator 我知道 Airflow 支持一些指标 https airf
PHP 在 foreach 循环中将变量转换为对象类型

在下面的代码中 quiz object gt personalities包含一个数组Personality对象 Loop through each personality that exists for the quiz foreach q
Java访问字符串数组中的特定元素

我正在运行一个网络爬虫供我自己使用我下载了一个并想为其提供种子我想给它提供大约 50 颗种子所以我创建了一个字符串数组我想在每次执行 for 循环时为爬虫提供 1 个种子我的代码是字符串临时新字符串 http www ran
在使用 iis7 asp.net 注册时为帐户创建子域

我花了三天时间在 Stackoverflow 和 google 上进行挖掘我没有得到任何确切的步骤如何完成它我在 stackoverflow 上阅读了所有这些问题很多人问了同样的问题但没有得到执行此任务的确切步骤 ASP NET
在 C 中 Malloc 一个二维数组[重复]

这个问题在这里已经有答案了每次我首先为二维数组分配内存时我都会创建一个数组int 然后使用 for 为每个元素分配内存例如 int arr malloc N sizeof int for i 0 i lt N i arr i mall
css 文件可能无法工作的完整原因列表

这是我的 html 文件的头部我的 html css 文件确实在它应该在的地方但我绝对没有得到任何造型好的现在我只是
ellipsize 不适用于 Textview

这2个作品
授予用户 ' 的权限不足以执行此操作。 (rsAccessDenied)"}

我使用 SSRS 2005 创建了一个报告模型并发布到本地服务器但是当我尝试使用报告生成器运行我发布的模型的报告时出现以下错误报告执行错误授予用户的权限不足以执行此操作拒绝访问这是因为您运行报表生成器的用户缺乏权限只需授予该
在pyspark中动态添加小时到时间戳

import pyspark sql functions as F from datetime import datetime data 1 datetime 2017 3 12 3 19 58 Raising 2 2 datetime 2
需要正则表达式来提取字符串中的第 5 到第 8 个字符

需要一个 UNIX 正则表达式来提取第 4 到 8 个字母例如文件 15870712 iis 如果我们想提取 Ist 3 位数字我们可以给出 0 9 0 9 0 9 gt 158 我需要第五个第六个第七个和第八个字符 gt 071
在 javascript 中解构嵌套对象 |解构第二级父对象和子对象

我需要从该对象中解构并获取 title child childTitle 的值 const obj1 title foo child title2 bar let title child obj1 console log title foo
如果 jstat 已被弃用，我应该使用什么来代替？

突然我发现jstat 已弃用 http docs oracle com javase 1 5 0 docs tooldocs share jstat html jstat 工具显示已检测的性能统计信息 HotSpot Java 虚拟机 JV
Haproxy 性能调整？

我们正在尝试为来自客户端而不是浏览网络交易类型的用户的 get 和 post 请求找到 haproxy 的最佳调整选项使用 30k 线程运行 jmeter 测试其中包括 5 个对服务器的调用 1 个用户注册和一些更新调用这些通过管
使用awk解析

如何使用 awk 根据另一个文件的数据解析文件我做了一个脚本 BEGIN FS t OFS t while getline lt headfpkm gt 0 a id a 1 fpkm a 2 print id a fpkm a last

使用awk解析

使用awk解析 的相关文章

随机推荐

热门标签

使用awk解析的相关文章