快速合并/连接两个表linux命令行

2023-12-02

假设我有两个相对较大的制表符分隔文件 file1.txt、file2.txt。

file1.txt
id\tcity\tcar\ttype\tmodel

file2.txt 
id\tname\trating

让我们假设 file1.txt 有 2000 个唯一 id，因此有 2000 个唯一行，而 file2.txt 只有 1000 个唯一行，因此有 1000 个唯一 id。有没有办法合并两个表？

情况1.通过file1.txt中的id合并它们，当file2.txt中没有id时，将填写NA。

案例2。按file2.txt中的id合并它们，此时仅将file2.txt中的id与file1.txt和file2.txt中的字段一起打印出来。

注意：合并的新文件也应该是制表符分隔的文件，并带有头文件。笔记2。我也很感激有关在没有标题时如何执行此操作的建议。

Thanks!

join -j 1 <(sort file1.txt) <(sort file2.txt)

您的“案例 2”方法是否仅使用标准 UNIX 工具？当然，如果文件已排序，您可以放弃排序。

如果您包含标题，那么您might依靠数字 id 将连接的标头排序到顶部：

join -j 1 <(sort file1.txt) <(sort file2.txt) | sort -n

With

文件1.txt

id  city    car type    model
1   york    subaru  impreza king
2   kampala toyota  corolla sissy
3   luzern  chrysler    gravity falcon

文件2.txt

id  name    rating
3   zanzini PG
2   tara    X

output:

id  city    car type    model   name    rating
2   kampala toyota  corolla sissy   tara    X
3   luzern  chrysler    gravity falcon  zanzini PG

PS要保留 TAB 分隔符，请传递-t option:

 join -t'    ' ...

It's kind of hard to show on SO that ' ' contained a TAB character. Type it with ^VTAB (e.g. in bash)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

unix

join

MERGE

awk

快速合并/连接两个表linux命令行的相关文章

Linux 中的 Windows NAmed Pipes 替代品

我们正在将现有的 Windows 代码移植到 Linux 我们使用 ACE 作为抽象层我们使用 Windows 命名管道与多个客户端进行通信并执行重叠操作 linux 下这个相当于什么我检查了linux命名管道 FIFO 但它们似乎只支
在 MacOS 上构建需要 net461 的 dotnet SDK 项目的最简单方法

我有一个 dotnet SDK sln and a build proj with
使用 wget 从 Google Scholar 搜索结果下载所有 pdf 文件

我想写一个简单的网络蜘蛛或者只是使用wget从谷歌学术下载 pdf 结果这实际上是获取研究论文的一种非常巧妙的方式我已阅读 stackoverflow 上的以下页面使用wget爬取网站并限制爬取链接总数 https stackover
虚拟内存澄清——大连续内存的分配

我有一个应用程序我必须在 Windows 上分配使用运算符 new 相当大的内存空间数百 MB 该应用程序是 32 位我们现在不使用 64 位即使在 64 位系统上也是如此我启用了 LARGEADDRESSAWARE 链接器选项
Unix 排序实用程序：使用十六进制字节值作为分隔符

我想知道是否可以使用十六进制值作为 Unix 的分隔符sort公用事业基本上我想做一些类似的事情 sort t x00
使用 .htaccess 启用 PHP 短标签

我在自己的 Centos 服务器上设置了 Apache 并具有多个虚拟 Web 服务器并且我希望仅为位于以下位置的其中一个 Web 服务器启用 PHP 短标记 var www ostickets html 我可以通过添加成功启用短标签sh
在 Windows / Linux 中创建 Mac 包

我自己努力制作一个 r 包我按照 stackoverflow 中上一个问题的说明进行操作如何为外行开发软件包 http cran r project org bin windows Rtools 以下是我根据上一个问题采取的步骤在新的
SIGHUP 用于重新加载配置

根据signal 7 SIGHUP用于检测控制终端的挂起或控制进程的死亡然而我遇到过很多 OSS 守护进程服务其中SIGHUP用于启动配置的重新加载这里有一些例子 hostapd sshd snort etc 这是实现重新加载的标
进程如何知道它已收到信号

如果我错了请纠正我以下是我对信号的理解据我所知信号生成和信号传递有2个不同事物为了产生信号操作系统只是在位数组中设置一个位在过程控制中维护工艺块 PCB 每一位对应于特定信号当设置一个位时这意味着该位对应的信号为
删除 Python 中某些操作的 root 权限

在我的 Python 脚本中我执行了一些需要 root 权限的操作我还创建并写入文件我不想由 root 独占所有而是由运行我的脚本的用户独占所有通常我使用以下命令运行脚本sudo 有办法做到上述吗您可以使用以下方式在 uid
PHP 日志文件颜色

我正在编写一个 PHP 日志文件类但我想为写入文件的行添加颜色我遇到的问题是颜色也会改变终端的颜色我想要实现的是仅更改写入日志文件的行的颜色 class logClass extends Singleton private funct
在Linux中创建可执行文件

我计划做的一件事是编写非常简单的 Perl 脚本并且我希望能够在不从终端显式调用 Perl 的情况下运行它们我明白要做到这一点我需要授予他们执行权限使用 chmod 执行此操作非常简单但它似乎也是一个稍微费力的额外步骤我想要
在Linux中使用C/C++获取机器序列号和CPU ID

在Linux系统中如何获取机器序列号和CPU ID 示例代码受到高度赞赏 Here http lxr linux no linux v2 6 39 arch x86 include asm processor h L173Linux 内核似
ARM 的内核 Oops 页面错误错误代码

Oops 之后的错误代码给出了有关 ARM EX 中的恐慌的信息 Oops 17 1 PREEMPT SMP在这种情况下 17 给出了信息在 x86 中它代表 bit 0 0 no page found 1 protection faul
在 bash 中快速引用 stdout（即上一个命令的输出）？

有没有办法快速例如通过键盘快捷键等引用写入到 stdout 的上一个命令的输出例如如果我这样做 which rails 它回来了 usr local bin rails然后我想在 textmate 中打开该文件我可以像这样重新输入
python 可以检测它运行在哪个操作系统下吗？

python 可以检测操作系统然后为文件系统构建 if else 语句吗我需要将 Fn 字符串中的 C CobaltRCX 替换为 FileSys 字符串 import os path csv from time import strf
在 Bash 中拆分 csv 文件中的列

我想从 csv 文件的第二列中提取值并将提取的值存储在新列中我的数据集示例 page name post id page id A 86680728811 272953252761568 86680728811 A 86680728811
有没有办法只安装mysql客户端（Linux）？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有没有不需要安装整个mysql db安装包的Linux mysql命令行工具我想做的是从服务器 1 应用程序服务器执行将在服务器 2
bash "&" 不打印 "[1]+ Done "

我在 bashrc 中调用一个脚本来打印打开终端时收到的新消息数我希望该调用在访问网络时是非阻塞的有时需要几秒钟这意味着我无法使用终端直到完成但是如果我输入 mailcheck 在我的 bashrc 中它工作正常但然后打印一个空
VSCODE 在 Linux 上不适用于我

刚刚了解 VSCODE 很高兴尝试一下我下载解压并运行可执行文件我得到 Code 2183 0429 201254 ERROR browser main loop cc 170 Running without the SUID san

随机推荐

pandas - 按部分字符串分组

我想按部分子字符串对 DataFrame 进行分组这是一个示例 csv 文件 GridCode Key 1000 Colour 1000 Colours 1001 Behaviours 1001 Behaviour 1002 Favour
selenium webdriver C# 多线程

Selenium WebDriver 支持多线程吗我尝试在打开 2 4 个窗口的情况下使用它看起来浏览器窗口 Firefox 有时会被冻结当一个线程启动时 driver FindElement By Id id SendKeys My
Django 复杂注释

先决条件查询集必须返回Articles 查询集必须返回唯一的对象不得使用访问数据库的 for 循环意味着对要注释的 N 个对象进行 N 个查询我的模型 class Report BaseModel ios report JSONFi
是否可以在 Node.js 上使用 UDP 来保证消息的传递？

如何在 Node js 上使用 UDP 保证消息的传递例如如果数据包失败我可以重新发送数据包但有没有办法识别它何时失败另外数据包丢失有多常见如果您真正想知道的是如何检测丢失的数据包那么一般的技术是让接收方对发送的每个数据包
ng-options 在另一个下拉列表中按值过滤

这似乎是一个非常简单的代码但我无法弄清楚为什么它不起作用我想按所选的品牌过滤型号下拉列表 Make
如何在 webview 组件中检索 Javascript 函数值

如何从 webview 组件中加载的网页中检索 Javascript 函数值你不能直接您可以通过以下方式调用 Javascript 函数loadUrl javascript where 是你的函数调用但是您无法通过这种方式得到结果
从 API 网关调用时，Cloudwatch Logs PutLogEvents 操作失败，并出现 com.amazon.coral.service#UnknownOperationException

我使用 API Gateway 的 AWS 服务集成类型通过 PutLogEvents 操作将日志添加到 Cloudwatch Logs 服务如下所述 https docs aws amazon com AmazonCloudWatchL
为什么在将临时变量传递给线程函数时移动构造函数会被调用两次？ [复制]

这个问题在这里已经有答案了在下面的代码中我无法理解为什么类的移动构造函数被调用两次因为我的线程函数通过右值引用获取参数所以我希望当参数移动到线程构造函数时移动构造函数只会被调用一次有人可以给出关于线程构造函数如何工作以及如何将参
linux 杀死命令 -9 与 -15

我有一个进程想要终止然后重新启动服务有人编写了通过编写以下脚本集来终止进程的代码 ps ef grep process name awk print kill 15 2 gt projects test kill sh run the k
控制守护进程和应用程序的差异

关于这篇优秀的文章 nohup 和守护进程有什么区别我想问以下问题从我的终端启动应用程序后该应用程序会在后台或前台继续运行我唯一能与之交互的就是从我的终端向其发送信号假设标准输入仍然存在然而在启动守护进程后我意识到可以通过其
使用 shape-outside 包裹图像时如何将图像与文本底部对齐

我一直在玩弄 shape outside 并在这里工作了一个示例 http www thelionscall com wp content Temp wrap test html element shape outside url http
XMLRPC 显示 -32601 错误（使用 PHP）

我有以下代码
使用 OpenCV 的 Heroku NodeJS 应用

我尝试了很多构建包并在 google 上搜索了很多文章但我就是无法部署我的 NodeJS 应用程序所有构建包都已过时 2 年以上而且都不起作用到目前为止我尝试了以下构建包 https github com zachlatta he
增加 WordPress 的最大上传限制

我需要将 PDF 文件上传到我的WordPress 网站当我去上传新媒体然后尝试上传它它说 FileName pdf 超出了该网站的最大上传大小我尝试查找 php ini 文件但找不到它我跑了phpinfo 通过创建一个新文件
如何读取 MIT/GNU 方案中的文本文件？

我一直在学习 SICP 我想应用我迄今为止学到的一些概念也就是说积累映射和过滤将帮助我提高工作效率我主要使用 CSV 文件并且我知道 MIT GNU 方案不支持这种文件格式但这没关系因为我可以将 CSV 文件导出到 txt 文
如何在sql server中将字符串转换为查询

如何添加包含 And 子句的字符串但是当我们应用查询该字符串时该字符串将被视为查询并满足所有和条件我有一个查询例如 Declare WhereQuery varchar max SET WhereQuery class BCA and
如何跳过 XML 反序列化中引发错误的对象？

我正在对非常大的 XML 文档有时超过 200MB 使用 XML 反序列化大多数文档都运行得很好但有时反序列化函数会抛出错误例如当整数是字符串时您会收到格式错误当无法识别指定的类型时您会收到错误 Input string
如何在dust.js中实现自定义渲染逻辑？

我使用dust js 来呈现变量名称列表这些名称有时很长并且包含下划线例如 SUM COUNT LABOR COUNTRIES SMS PAST 浏览器不会用下划线换行因此它会变得难看我希望我的灰尘模板在每个下划线后添加一个零宽度的
简单的 OpenGL GUI 框架用户交互建议？ [关闭]

Closed 这个问题是基于意见的目前不接受答案我正在从头开始设计一个简单的 GUI 框架作为一个项目使用 OpenGL 没有任何其他外部东西并且需要一些关于如何实现用户交互的建议基本上我有一个基类GUIItem所有元素都继承自
快速合并/连接两个表linux命令行

假设我有两个相对较大的制表符分隔文件 file1 txt file2 txt file1 txt id tcity tcar ttype tmodel file2 txt id tname trating 让我们假设 file1 txt 有

快速合并/连接两个表linux命令行

快速合并/连接两个表linux命令行 的相关文章

随机推荐

热门标签

快速合并/连接两个表linux命令行的相关文章