如何查找两个文件的集合差异？

2024-04-21

我有两个文件 A 和 B。我想找到 A 中 B 中没有的所有行。在 bash/使用标准 Linux 实用程序中执行此操作的最快方法是什么？到目前为止，这是我尝试过的：

for line in `cat file1`
 do
   if [ `grep -c "^$line$" file2` -eq 0]; then
   echo $line
   fi
 done

它有效，但速度很慢。有没有更快的方法来做到这一点？

Bash 常见问题解答 http://mywiki.wooledge.org/BashFAQ 描述了用 comm 来做这件事 http://mywiki.wooledge.org/BashFAQ/036，这是规范正确的方法。

# Subtraction of file1 from file2
# (i.e., only the lines unique to file2)
comm -13 <(sort file1) <(sort file2)

diff 不太适合此任务，因为它尝试对块而不是单独的行进行操作；因此，它必须使用的算法更加复杂且内存效率较低。

通讯已Single Unix 规范的一部分 http://pubs.opengroup.org/onlinepubs/9699919799/utilities/comm.html自 SUS2（1997）以来。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

gnucoreutils

如何查找两个文件的集合差异？的相关文章

Bash：更新文件中的变量

我知道这是一个简单的答案在找到答案之前我可能可以继续在谷歌上进行挖掘但我的日程很紧我希望能得到一个轻松的答复我需要在安装时更新 ifcfg eth0 中的变量换句话说这就是需要发生的事情以下变量需要更改 ONBOOT no B
如何在 awk 或 sed 中编写查找所有函数（使用正则表达式）

我有运行 python 的 bash 函数它从标准输入返回所有找到的正则表达式 function find all python c import re import sys print n join re findall 1 sys s
Bash 变量：区分大小写？

Bash shell 脚本区分大小写吗是可变的date与DATE 是的它区分大小写就像 UNIX 的其余部分一样 date and DATE是两个不同的变量 makefile and Makefile是两个不同的文件 h and H是
混淆 bash 中存储的密码

我有一个 bash 脚本我需要编写密码才能运行程序其他人可以看到它有没有办法把密码写得不太明显即使他可以在 bash 中执行相同的命令并获取密码他也无法读取文本形式的密码今天我这样做 PASSWORD 1234567 progr
将 erlang shell 作为守护进程/服务运行

显然我有一个在 Erlang shell 中运行的 Erlang 程序我想监视它这就是我要的当机器启动时 Erlang shell 应该随之启动并且在 shell 中运行的程序也应该随之启动如果 Erlang shell 由于某
bash 用变量值替换字符串中的变量名

这有点奇怪我有以下字符串我有一个名为 REDIRECT 的变量设置为 https working MYDOMAIN blah blah 我需要将 MYDOMAIN 替换为分配给 MYDOMAIN 的变量的实际值不确定 bash 还是
在 nohup 中使用别名

为什么以下不起作用 alias sayHello bin echo Hello world sayHello Hello world nohup sayHello nohup appending output to nohup out no
在 UNIX 时间戳 Shell/Bash 中将日期与时区转换

我需要将日期从格式为 yyyy mm dd hh mm ss TZ 的字符串转换为 UNIX 时间 TZ 时区到目前为止我所做的是将没有时区的 yyyy mm dd hh mm ss 格式的日期转换为时间戳 dateYMD 2019 2
远程 ssh 命令：第一个回显输出丢失

我试图通过 ssh 1 liner 调用在远程机器上运行多个命令方法是将它们指定为传递给 bash c 的分号分隔字符串它适用于某些情况但不适用于其他情况看一下这个 Note the echo 1 output is lost ba
在 bash 函数中生成后台进程

我正在编写一个 Bash 函数来启动需要从某个文件夹启动的服务器但我不希望启动该服务器影响我当前的工作我写了以下内容 function startsrv pushd cd TRUNK SERVERCOMMAND popd 我的变量都已设
如何使用 awk 或 sed 将“[1.0 - 4.0]”等字符串替换为数值？

我有一个 CSV 文件正在通过一组 awk sed 命令进行管道传输 CSV 文件中的某些行如下所示 10368 Verizon DSL DSL NY NORTHEAST 5 4 1 1 3 0 0 384 0 768 其中第 8 列和第
如何查找出现在括号之间的所有单词？

我有一个文件其中包含括号中的一些单词我想编制一个出现在那里的所有独特单词的列表例如 This is some text This text has some words in parenthesis Sometimes there a
在 makefile 中，当我在 bash 函数内部使用 if 语句时，它会抛出错误

在 makefile 中当我在 bash 函数内部使用 if 语句时它会抛出错误 test foo if a a then echo 1 fi foo hello ERROR bin sh 1 未找到或与一个 test foo if
如何摆脱每个新终端会话上运行的某些内容？

我正在使用狮子我在每个新的终端会话上都会输出一个错误 bash rvm add to path command not found 这是一个几乎全新的用户帐户 RVM 安装在计算机上的另一个帐户上 bashrc 和 bash profil
Bash 中的 Shellshock 漏洞背后的行为是有记录的还是有意为之？

最近的一个漏洞 CVE 2014 6271 http web nvd nist gov view vuln detail vulnId CVE 2014 6271 如何Bash http en wikipedia org wiki Bash
Bash 完成脚本在某些参数选项后完成文件路径

我正在为命令行工具编写 bash 完成脚本 plink local cur prev opts COMPREPLY cur COMP WORDS COMP CWORD prev COMP WORDS COMP CWORD 1 opts 1
Bash 中 $() 和 () 之间的区别

当我打字时ls l echo file 支架的输出这只是简单的回显被获取并传递到外部ls l命令就等于简单的ls l file 当我打字时ls l echo file 我们有错误因为不能嵌套内部外部命令有人可以帮助我理解之间的区
Bash - 如何将参数传递给通过标准输入读取的脚本

我正在尝试从标准输入执行脚本并将参数传递给它有办法做到吗假设我有以下内容 cat script sh bash 我如何将参数传递给脚本我不想这样做 bash script sh arguments 也不是这个 script sh ar
如何使用 bash 脚本关闭所有终端，在每个终端中有效地按 Ctrl+Shift+Q

我经常打开许多终端其中一些正在运行重要的进程例如服务器而另一些则没有运行任何东西并且可以关闭如果您按重要则会弹出确认提示Cntrl Shift Q在其中如下所示我想要一个 bash 脚本它可以关闭所有终端但将重要终端
在 Ubuntu 上纯粹通过 bash 脚本安装 mysql 5.7

我想要一个无需任何手动输入即可安装 MySQL 5 7 实例的 bash 脚本我正在关注数字海洋教程 https www digitalocean com community tutorials how to install mysql

随机推荐

javascript - 从输入类型=文件获取文件名和扩展名

我有一个文件上传输入当我单击浏览按钮并选择文件时我希望文件名和扩展名显示在两个输入文本框中请参阅代码示例它与扩展名一起正常工作但文件名还显示了给我 fakepath 警告的路径我明白为什么但是有什么好方法可以做到这一点并将文件
在 thymeleaf spring boot 中，动态轮播滑块不起作用

In my spring boot thymeleaf this following code is slider does not work well Show the result in image What wrong with in
您应该如何诊断错误 SEHException - 外部组件抛出异常

每当用户报告错误时例如 System Runtime InteropServices SEHException 外部组件引发的异常作为一名程序员我可以做些什么来确定原因吗场景一名用户使用我公司编写的程序报告了此错误这可能是也
从另一个页面访问时引导滚动间谍

我试图链接到主页的特定部分同时保持滚动间谍功能有了这个代码 li a href sec1 About a li 滚动间谍正在运行但如果我尝试从主页以外的页面访问它它只会添加 sec1 到当前页面的 url 没有效果如果我把它改成
关于在单列中查找重复项的宏的建议

发现了很多涉及在两列中查找重复项的问题 i e MS Excel 如何创建宏来查找重复项并突出显示它们 https stackoverflow com questions 2162684 ms excel how to create a m
为什么numba cuda调用几次后运行速度变慢？

我正在尝试如何在 numba 中使用 cuda 然而我却遇到了与我预想不同的事情这是我的代码 from numba import cuda cuda jit def matmul A B C Perform square matrix m
ggpairs 中的数字四舍五入

是否可以将 ggpairs 中的相关数字舍入为例如 2 位数字 library GGally ggpairs iris columns 1 4 mapping ggplot2 aes col Species 这是一个修改版本ggally c
用于累积逗号分隔字符串的 C++ 预处理器宏

我需要执行以下操作 const char my var Something REGISTER my var const char my var2 Selse REGISTER my var2 concst char all OUTPUT R
SSIS 错误 - 包中的版本号无效

失败作业对应的日志如下 2014 年 4 月 11 日 06 40 00 LPR New 错误 0 USPHND0088 LPR New 作业结果作业失败该作业由 Schedule 14 调用 LPR New Job 最后运行的一步是
如何检测远程机器的操作系统

从基于 net 的应用程序中确定远程计算机上运行的操作系统是 Windows 还是 Linux 的最快方法是什么只需 ping 一下即可如果 TTL 生存时间为 254 或更小则它是基于 UNIX 的如果 TTL 为 128 或
WPF：多显示器编程

我在用着WPF in C 我想从多显示器编程开始这意味着该应用程序将在许多具有不同视图的显示器上显示我在网上搜索过我得到了使用的方法Screen AllScreens 但是我有以下问题有多种方法可以将多台显示器连接到 PC 情况 1
PDF 文件中的隐写术 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案有人能告诉我哪里可以将一些数据隐藏到 PDF 文件中吗换句话说 PDF 文件中的隐写术有什么算法可以做到这一点吗有很多方法可以做到这一点包括
如何用bind来定义apply？

在 Haskell 中 Applicatives 被认为比 Functor 更强这意味着我们可以使用 Applicative 来定义 Functor 例如 Functor fmap a gt b gt f a gt f b fmap f
Swift - 在 LaunchScreen 上执行代码 [重复]

这个问题在这里已经有答案了在 iOS 中在应用程序准备就绪之前会有一个 LaunchScreen 您可以在此添加要做的事情代码吗我想在 LaunchScreen 上执行 JSON 请求但不知道将代码放在哪里提前致谢卡塞特正
是否可以更改 MediaRecorder 的流？

getUserMedia constrains then stream gt var recorder new MediaRecorder stream recorder start recorder pause get new strea
将对象转换为可编码对象失败

我收到以下错误 Converting object to an encodable object failed Instance of Patient 0 JsonStringifier writeObject dart convert j
Deltaspike 和@Stateless Bean

我想使用 DeltaSpike API 保护我的无状态 EJb Stateless Remote UserServiceRemote class public class UserService implements UserServic
我们可以检索 li 的默认计数器值吗？

我们可以检索到CSSli 的默认计数器值例如如果我有 6 个 li 分成 2 ol 但我想要 li 从 1 到 6 列出而不是从 1 到 3 列出两次我用了value 4 在第一个 li li 第二个的 ol 所以它有效但现在因为
TeamCity Agent 缺少 DotNetFramework4.0_x86，但不是？

我一直在尝试将 TeamCity 安装从旧服务器转移到新的 Windows Server 2008 R2 服务器上我终于完成了所有配置然而构建代理说DotNetFramework4 0 x86在构建代理上不可用但已安装 NET 4
如何查找两个文件的集合差异？

我有两个文件 A 和 B 我想找到 A 中 B 中没有的所有行在 bash 使用标准 Linux 实用程序中执行此操作的最快方法是什么到目前为止这是我尝试过的 for line in cat file1 do if grep c li

如何查找两个文件的集合差异？

如何查找两个文件的集合差异？ 的相关文章

随机推荐

热门标签

如何查找两个文件的集合差异？的相关文章