在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件

2024-01-14

我有制表符分隔的文件，需要将 FILE_1 与 N (10) 个文件进行比较，如果第一个文件的第 1 列的 IDS 与其他文件的第一列匹配，则打印文件 1 和其他文件的值，如果 IDS 不存在，第一个文件和其他文件的列不适用。下面给出了输入和预期输出文件的示例。

File 1

A   1.1  0.2    0.3     1.1
B   1.3  2.1    0.2     0.1
C   1.8  0.5    2.6     3.8
D   1.2  5.1    1.7     0.1
E   1.9  4.3    2.8     1.6
F   1.6  5.1    2.9     7.1
G   1.8  2.8    0.3     3.7
H   1.9  3.6    3.7     0.1
I   1.0  2.4    4.9     2.5
J   1.1  2.0    0.1     0.4

File 2

A   d1   Q2    Q.3  E.1
B   a.3  S.1   A.2  R.1
J   a.1  2.0   031  4a4

File 3

E    1d9    4a3  2A8    1D6
F    1a.6   5a1  2W9    7Q1
J    QA8    1.8  0W3    3E7

File 4

F   1aa  5a   2Q    7WQ
G   ac   UW   0QW   3aQ
A   QQ   aws  AW    qw

我最初使用两个文件尝试了以下代码，但没有得到预期的输出

awk  '
        FILENAME == "File_2" {
                id = $0
                val[id] = $2","$3","$5
        }
        FILENAME == "File_1" {
                id = $1
                string
                if (val[id] == "") {
                        print id " " "NA"
                } else {
                        print id " " val[id]
                }
        }
' File_2 File_1

上面的代码在每行末尾打印 File_2 和 NA。

我的预期输出如下所示

最终预期输出

A  1.1  0.2  0.3  1.1  d1   Q2   Q.3  E.1  NA    NA   NA   NA   QQ   aws  AW   qw
B  1.3  2.1  0.2  0.1  a.3  S.1  A.2  R.1  NA    NA   NA   NA   NA   NA   NA   NA
C  1.8  0.5  2.6  3.8  NA   NA   NA   NA   NA    NA   NA   NA   NA   NA   NA   NA
D  1.2  5.1  1.7  0.1  NA   NA   NA   NA   NA    NA   NA   NA   NA   NA   NA   NA
E  1.9  4.3  2.8  1.6  NA   NA   NA   NA   1d9   4a3  2A8  1D6  NA   NA   NA   NA
F  1.6  5.1  2.9  7.1  NA   NA   NA   NA   1a.6  5a1  2W9  7Q1  1aa  5a   2Q   7WQ
G  1.8  2.8  0.3  3.7  NA   NA   NA   NA   NA    NA   NA   NA   ac   UW   0QW  3aQ
H  1.9  3.6  3.7  0.1  NA   NA   NA   NA   NA    NA   NA   NA   NA   NA   NA   NA
I  1.0  2.4  4.9  2.5  NA   NA   NA   NA   NA    NA   NA   NA   NA   NA   NA   NA
J  1.1  2.0  0.1  0.4  a.1  2.0  031  4a4  QA8   1.8  0W3  3E7  NA   NA   NA   NA

使用 GNU awk 处理数组的数组，ARGIND, and gensub():

$ cat tst.awk
BEGIN { FS=OFS="\t" }
ARGIND < (ARGC-1) {
    key = $1
    sub("[^"FS"]+"FS"?","")
    fileNrsKeys2vals[ARGIND][key] = $0
    fileNrs2numFlds[ARGIND] = NF
    next
}
{
    printf "%s", $0
    for ( fileNr=1; fileNr<ARGIND; fileNr++ ) {
        if ( fileNr in fileNrs2numFlds ) {
            numFlds = fileNrs2numFlds[fileNr]
            printf "%s", ( $1 in fileNrsKeys2vals[fileNr] ?
                OFS fileNrsKeys2vals[fileNr][$1] :
                gensub(/ /,OFS"NA","g",sprintf("%*s",numFlds,"")) )
        }
    }
    print ""
}

$ awk -f tst.awk file2 file3 file4 file1
A       1.1     0.2     0.3     1.1     d1      Q2      Q.3     E.1     NA      NA      NA      NA      QQ      aws     AW      qw
B       1.3     2.1     0.2     0.1     a.3     S.1     A.2     R.1     NA      NA      NA      NA      NA      NA      NA      NA
C       1.8     0.5     2.6     3.8     NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA
D       1.2     5.1     1.7     0.1     NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA
E       1.9     4.3     2.8     1.6     NA      NA      NA      NA      1d9     4a3     2A8     1D6     NA      NA      NA      NA
F       1.6     5.1     2.9     7.1     NA      NA      NA      NA      1a.6    5a1     2W9     7Q1     1aa     5a      2Q      7WQ
G       1.8     2.8     0.3     3.7     NA      NA      NA      NA      NA      NA      NA      NA      ac      UW      0QW     3aQ
H       1.9     3.6     3.7     0.1     NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA
I       1.0     2.4     4.9     2.5     NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA      NA
J       1.1     2.0     0.1     0.4     a.1     2.0     031     4a4     QA8     1.8     0W3     3E7     NA      NA      NA      NA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

shell

awk

sed

在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件的相关文章

Bash 方法的返回值总是模 256

我有一个 bash 脚本方法它返回输入值然而返回值始终是模 256 的值我用 google 搜索了一段时间发现this http www tldp org LDP abs html exitcodes html文章说它总是以 25
如何使用 sed 仅删除双空行？

我找到了这个问题和答案 https stackoverflow com questions 4651591 howto use sed to remove only triple empty lines关于如何删除三重空行但是我只需要对
如何将设备屏幕位置转换为发送事件位置？

我知道关于input tap x yshell 命令但是我想了解如何使用执行单击sendevent命令我能够通过以下命令实现它 sendevent dev input event5 3 53 X sendevent dev inpu
在 Linux 中禁用历史记录 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案要在 Linux 环境中禁用历史记录我执行了以下命令 export HISTFILESIZE 0 export HISTSIZE 0 u
使用正确的头打印文件名

我想获取当前目录中的文件名使得文件的第一行等于myWord 我想结合find type f命令与 exec选项与head 1 filename但无济于事有没有一些聪明的单行的解决方案来解决这个问题您可以使用find with awk
xsel -o 对于 OS X 等效项

是否有一个等效的解决方案可以在 OS X 中抓取选定的文本就像适用于 Linux 的 xsel o 一样只需要当前的选择这样我就可以在 shell 脚本中使用文本干杯埃里克你也许可以安装xsel在 MacOS 上更新根据 A
如何使用我在 github 中发布的 bash 脚本执行 chsh？

我有一个要点我总是用它来在新服务器上安装我需要的软件包 http gist github com 4372049 http gist github com 4372049 我需要做的就是通过 ssh 在新服务器中输入以下内容 bash c
Bash 解析和 shell 扩展

我对 bash 解析输入和执行扩展的方式感到困惑对于输入来说 hello world 作为 bash 中的参数传递给显示其输入内容的脚本我不太确定 Bash 如何解析它 Example var hello world displaywh
如何在递归调用函数时阻止 bash 创建子 shell

这是一个计算阶乘的简单 shell 函数 bin bash function factorial if 1 lt 2 then echo 1 else echo 1 factorial 1 1 fi factorial 1 但我发现这个脚本
如何在 shell 脚本中并行运行多个实例以提高时间效率[重复]

这个问题在这里已经有答案了我正在使用 shell 脚本它读取 16000 行的输入文件运行该脚本需要8个多小时我需要减少它所以我将其划分为 8 个实例并读取数据其中我使用 for 循环迭代 8 个文件并在其中使用 while
使用 sed 更新 xml 属性（Windows + cygwin 和 Linux）？

我需要使用 sed 命令对 xml 文件进行更新但我在这方面遇到了麻烦它需要在 Windows 使用 cygwin 和 Linux 上运行 XML 具有以下元素
如何在数组中存储包含双引号的命令参数？

我有一个 Bash 脚本它生成存储和修改数组中的值这些值稍后用作命令的参数对于 MCVE 我想到了任意命令bash c echo 0 0 echo 1 1 这解释了我的问题我将用两个参数调用我的命令 option1 without
有没有办法让我简化这些回声？ [复制]

这个问题在这里已经有答案了我仍在学习如何编写 shell 脚本并且我面临着一个挑战让我更容易回显 Name1 Name2 Name15 我不太确定从哪里开始我已经想法但如果我搞砸了我不想看起来很傻有什么帮助吗我实际上还没有尝
OSX bash 最小化窗口

在 Mac 中并使用 bash shell 我想执行一个包含单个命令启动 Jupyter Lab 的文件并立即最小化终端窗口有没有办法在不安装第三方软件的情况下做到这一点是的只需使用osascript https ss64 com
awk/Unix 分组依据

有这个文本文件 name age joe 42 jim 20 bob 15 mike 24 mike 15 mike 54 bob 21 试图得到这个计数 joe 1 jim 1 bob 2 mike 3 Thanks awk F NR
使用 sh 运行 bash 脚本

我有 bash 脚本它需要 bash 另一个人尝试运行它 sh script name sh 它失败了因为 sh 是他的发行版中 dash 的符号链接 ls la bin sh lrwxrwxrwx 1 root root 4 Aug
如何以管理员身份在 rake 任务中运行 shell 命令？

我有一个简短的 cmd 文件我想将其作为部署过程的一部分运行不幸的是 cmd 文件需要管理员权限是否可以从 rake 中获得管理员权限或者我是否需要以管理员身份启动 shell 您可以尝试runas http ss64 com nt
使用正则表达式模式查找 -name 并使用 cp 替换文件名

目前我正在使用该命令cron复制 data从源到目标路径 find source path name data exec cp target path 源码结构为 source path category1 001 data source
如何从我自己的脚本向 Fish shell 提供制表符补全？

我运行的是 Ubuntu 13 10 和 Fish 2 1 0 我想自己编写一个 Python 脚本来从命令行执行一些任务该脚本将需要命令行参数我怎样才能编写我的脚本以便 Fish 可以请求并获取给定参数的可能值潜在值列表是动态的
折叠具有多个字段的行

我有这个代码 awk seen 1 2 a 1 a 1 a 1 t 2 END for i in a print i a i inputfile 我想折叠具有两个以上字段的行但始终基于第一个字段作为索引输入文件三列制表符分隔 prot

随机推荐

如何在 Erlang 中向进程列表广播消息？控制台悬挂

我是 Erlang 新手我试图了解如何将消息从一个进程发送到一系列进程假设我们有一个数据结构其中包含一个列表其中的元素包含字符串和 Pid 如何让 Pid 向作为前面描述的两个元素之一的 Pid 发送消息 M 我想出的是 broad
尝试 jQuery wrapAll 似乎将内容包装两次

我得到了一个如下所示的标记 lt a lot of tags from the web site gt 我希望它以这种方式结束 div lt a lot of tags from the web site div
Android 资源链接失败：Unity 错误：在中找到意外元素

我在使用 Admob 用于统一的 Google 移动广告 SDK 和用于统一的 Facebook Audience Network SDK 构建时遇到此错误如果我在项目中单独使用其中之一那么不会出现错误但如果我同时使用这两个那么我开
System.Text.Json 中 Newtonsoft.Json 的 JsonProperty 属性的等效项是什么？

Newtonsoft Json 的等价物是什么JsonPropertySystem Text Json 中的属性 Example using Newtonsoft Json public class Example JsonProperty
通过 canvas.toDataURL 将画布保存到图像会产生黑色矩形

我正在使用 Pixi js 并尝试将动画帧保存到图像中 canvas toDataUrl 应该可以工作但我得到的只是一个黑色矩形查看实例here http anatoliyg github io toaster 我用来提取图像数据并设置
.Net Core 和完整框架项目合二为一

假设我有一个包含多个项目的解决方案其中一个项目是 Main 放置通用代码和 API 其余项目是 Main 的扩展 Extension1 Extension2 Extension3 并使用第三方库现在我正在使解决方案在完整框架和 Net
Pickle ImportError：没有名为 __builtin__ 的模块

我正在尝试在 python3 6 中加载复制的 pickle 对象但出现导入错误 builtin r当我这样做时 with open FilePath FileName pkl rb as file file pickle load f
生产 JVM 的安全调试

我们有一些应用程序有时会进入不良状态但仅限于生产环境当然虽然进行堆转储有助于收集状态信息但使用远程调试器通常更容易设置起来很简单只需将其添加到命令行中即可 Xdebug Xrunjdwp 传输 dt socket 服务器 y 挂
R：如何从列表的每个内部元素中删除第一个元素而不将其转换为矩阵？

我有一个这样的清单 1 1 a1 b1 c1 2 1 a2 b2 c2 3 1 a3 b3 c3 我希望从它的每个部分中删除特定元素 1 1 a1 c1 2 1 a2 c2 3 1 a3 c3 I tried tail但删除外部元素也
PHP + MySQL 中的递归逻辑

我正在尝试应用递归逻辑我有以下数据tbl appointment table recur type 1 每周 2 每月 0 非递归 appointment id user id date recur type 18 56 2014 06
Java Web 应用程序可以访问远程工作站上的智能卡读卡器吗？

我正在为我们现有的基于 Java 的 Web 应用程序之一开发一些新功能该网络应用程序本身托管在我们的一台内部服务器上可以通过我们工厂内多个计算机终端的浏览器进行访问该应用程序用于在我们生产过程的各个阶段进行质量检查目前在进行每次
Megaparsec：无法解析递归算术字符串

我正在使用 Megaparsec 开发一个小型解析器并尝试解析算术 Arithmetic expressions data Aexp N Num V Var Mult Aexp Aexp Add Aexp Aexp Sub Aexp Aex
如何在使用 png() 保存时修复 R 中 ggplot 的大小？

地图尺寸经纬度 38 31536111 76 55011111 与地图不同纬度经度 59 5624775 139 7410994 在地图上标绘点用 png 保存时如何保持尺寸一致高度和宽度不够编辑完整代码 library m
删除sqlite中的第一行后如何重新排列表？

我在 sqlite 中有 1 个表我正在向该表插入值当插入行id大于100时我想删除第一个插入的记录并在第100个位置插入新记录我被删除了第一个记录但第二个记录在第二个位置但我想在删除第一行后重新排列记录我该怎么做我的表名称
我将如何等待多个线程停止？

我有一个主线程它生成大约 20 个工作线程我需要停止主线程直到所有其他线程完成我知道线程加入但这仅适用于一个线程多个连接会像这样损害性能 t1 Join t2 Join t20 Join 因为程序会一一等待每个停止我怎样才
触发器后不允许更新新行

为什么我使用这个会出现错误trigger CREATE TRIGGER save Assignee AFTER INSERT ON changeitem FOR EACH ROW BEGIN SET new assignee SELECT
Xcode调试问题

我的 Xcode 调试器有一个小问题在我看来步入功能并没有发挥应有的作用或者正如我所期望的那样我可以介入任何方法调用只要它没有返回值 myObject DoSomething find 可以工作但如果该方法有返回值则没有 S
LolliPop 设备中的 AutoCompleteTextView 奇怪行为

我在用AutoCompleteTextView在我的布局中但它是colorControlNormal and Activate没有按我的预期工作我的颜色值为 0072BA 下图是不同设备的图 1 安卓奇巧 2 Android 棒棒糖 3
IOS：一个IBAction用于多个按钮

在我的项目中我必须控制40个按钮的操作但我不想创建40个IBAction 我可以只使用一个IBAction吗如果您使用界面生成器来创建按钮只需将它们指向相关类中的相同 IBAction 即可然后您可以通过读取按钮中的文本来区分
在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件

我有制表符分隔的文件需要将 FILE 1 与 N 10 个文件进行比较如果第一个文件的第 1 列的 IDS 与其他文件的第一列匹配则打印文件 1 和其他文件的值如果 IDS 不存在第一个文件和其他文件的列不适用下面给出了输入和预

在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件

在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件 的相关文章

随机推荐

热门标签

在比较第 1 列 1 个文件与第 1 列 N 个文件的比较的基础上进行分析，并根据第 1 列打印所有文件的相关文章