Linux下快速比较两个目录的不同

2023-11-07

转载请务必在文章最开头标明原文地址
本文原创地址:博客园骏马金龙https://www.cnblogs.com/f-ck-need-u/p/9071033.html

强烈谴责大量盗文狗:波波说运维,说不定你们的文章也已被抄袭

 

曾多次想要在Linux下比较目录a和目录b中文件列表的差别,然后对目录a比目录b中多出的文件、少掉的文件分别做处理。但是,在网上搜索了多次也都没找到能直接处理好的工具。

所以想了不少方法,自我感觉都不错,而且网上似乎没有这方面的文章,所以分享出来给大家。如果各位有更好的工具或者方法,盼请留下说明(本文第2部分:图形化的比较结果搜集自网上,我也没有在图形化界面下操作的需要,所以没有多做介绍)

以下是本文有些地方涉及到的目录结构。

[root@node1 ~]# tree directory1 directory2
directory1
├── 1.png
├── 2.png
└── 3.png
directory2
├── 2.png
├── 3.png
└── 4.png

1.命令行输出的结果

方法一:使用diff

diff -r directory1 directory2

但是diff会对每个文件中的每一行都做比较,所以文件较多或者文件较大的时候会非常慢。请谨慎使用。

方法二:使用diff结合tree

diff <(tree -Ci --noreport /mnt/f/自然马) <(tree -Ci --noreport /mnt/i/自然马)
< /mnt/f/自然马
---
> /mnt/i/自然马
87a88
> xyz.avi
488d488
< rsync.txt
534d533
< 542D0.mp4

说明:

  1. tree的-C选项是输出颜色,如果只是看一下目录的不同,可以使用该选项,但在结合其他命令使用的时候建议不要使用该选项,因为颜色也会转换为对应的编码而输出;
  2. -i是不缩进,建议不要省略-i,否则diff的结果很难看,也不好继续后续的文件操作;
  3. --noreport是不输出报告结果,建议不要省略该选项。
  4. 该方法效率很高。

方法三:find结合diff

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -
2d1
< 1.png
4a4
> 4.png

说明:

  1. <代表的行是directory1中有而directory2没有的文件,>则相反,是directory2中有而directory1中没有。
  2. 不要省略-printf "%P\n",此处的%P表示find的结果中去掉前缀路径,详细内容man find。例如,find /root/ -printf "%P\n"的结果中将显示/root/a/xyz.txt中去掉/root/后的结果:a/xyz.txt。
  3. 效率很高,输出也简洁。

如果不想使用-printf,那么先进入各目录再find也行。

[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)       
[root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)
2d1
< ./1.png
4a4
> ./4.png

上面将命令放进括号中执行是为了在子shell中切换目录,不用影响当前所在目录。

方法四:使用rsync

rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
deleting a/xyz.avi
rsync.txt
新建文件夹/542D0.mp4

其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。

如果想区分出不同的是目录还是文件。可以加上"-i"选项。

rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
*deleting   a/xyz.avi
>f+++++++++ rsync.txt
>f+++++++++ 新建文件夹/542D0.mp4

其中>f+++++++++中的f代表的是文件,d代表的目录。

上面的rsync比较目录有几点要说明:

  1. 一定不能缺少-n选项,它表示dry run,也就是试着进行rsync同步,但不会真的同步。
  2. 第一个目录(directory1/)后一定不能缺少斜线,否则表示将directory1整个目录同步到directory2目录下。
  3. 其它选项,如"-r -v --delete"也都不能缺少,它们的意义想必都知道。
  4. sed的作用是过滤掉和文件不相关的内容。
  5. 以上rsync假定了比较的两个目录中只有普通文件和目录,没有软链接、块设备等特殊文件。如果有,请考虑加上对应的选项或者使用-a替代-r,否则结果中将出现skipping non-regular file的提示。但请注意,如果有软链接,且加了对应选项(-l或-a或其他相关选项),则可能会出现fileA-->fileB的输出。
  6. 效率很高,因为rsync的原因,筛选的可定制性也非常强。

2.图形化的比较结果

方法一:使用vimdiff

vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort)
# 或者
vimdiff <(find directory1 -printf "%P\n"| sort) <(find directory2 -printf "%P\n"| sort)

方法二:使用meld

meld是python写的一个图形化文件/目录比较工具,所以必须先安装图形界面或设置好图形界面接受协议。它的功能非常丰富,和win下的beyond compare有异曲同工之妙。

meld具体的使用方式就不介绍了。

3.将两目录中不同的文件筛选出来

个人建议使用命令行输出的结果中的方法方法三和方法四,因为它们都能很好地保留目录前缀。

以方法三为例:

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -

以下是实验所需目录结构:

[root@node1 ~]# tree /root/a;tree /root/b 
/root/a
├── 1.png
├── 2.png
└── 3.png

0 directories, 3 files
/root/b
├── 2.png
├── 3.png
├── 4.png
└── xen
    └── scripts
        └── block-drbd

首先比较这两个目录得到文件列表的差异。

find /root/a -printf "%P\n" | sort > /tmp/file1
find /root/b -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt

然后从diff.txt中过滤出/root/a中多出的文件和/root/b中多出的文件。

# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen
/tmp/etc/xen/scripts
/tmp/etc/xen/scripts/block-drbd

需要注意的是,如果多了某个目录,则这个目录和其内所有文件都会列出来。如果要将多出的文件复制到其他地方,应当要注意这一点。

如果只想要比较出/root/a和/root/b下的文件和目录的不同,不再递归到子目录中比较。那么可以在find上继续加工一番:

find /root/a -maxdepth 1 -printf "%P\n" | sort > /tmp/file1
find /root/b -maxdepth 1 -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt
# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen

这样一来,/root/b中多出的文件就是4.png和xen,xen目录中的文件不再列出。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Linux下快速比较两个目录的不同 的相关文章

  • 未找到 ffmpeg 命令,但 pip 列表显示 ffmpeg

    我一直在尝试使用命令安装 ffmpegpip install ffmpeg我正在没有 sudo 权限的服务器上执行此操作 在编写 ffmpeg 时 我得到 ffmpeg command not found 然后我检查了pip list它显示
  • Laravel 5.4.* - 运行 artisan 时“”目录不存在

    我有一个全新安装的Ubuntu服务器14 04我目前正在尝试安装我的Laravel项目上 我已将整个存储库移至所需的文件夹中 但是当我运行命令时 php artisan 在该目录中 终端返回一个错误 指出 InvalidArgumentEx
  • 在 64 位 RHEL 上安装 32 位库 (glibc),而不使用 yum

    我试图让 32 位应用程序在 64 位 RHEL 6 1 上运行 但该计算机无法访问互联网 有没有办法在 64 位 RHEL 上安装 32 位 glibc 而不使用 yum 即仅使用 RPM 安装 我从 RHEL 6 1 ISO 中获取了
  • UNIX/Linux IPC:从管道读取。运行时如何知道数据长度?

    我有一个子进程 它生成一些可变长度的输出 然后使用半双工管道将其发送到父进程 在父级中 如何使用 read 函数 由于每次数据的长度可能不同 我如何在运行时知道数据的大小以对缓冲区执行任何 malloc 操作 fstat 函数可以用于管道文
  • 如何在Linux下生成系统范围的唯一ID

    我正在使用多进程 Linux 系统 需要生成唯一的 ID 安全性不是考虑因素 因此 ID 生成器从零开始递增就可以了 而且它只是在本地计算机内 不涉及网络 显然 实现这一点并不难 但我只是想知道是否已经提供了任何东西 最好是轻量级的 这听起
  • 简单的awk命令问题(FS、OFS相关)

    我尝试重新组织包含以下内容的文件的格式 gt Humanl chr16 86430087 86430726 element 1 positive gt Humanl chr16 85620095 85621736 element 2 neg
  • Capistrano RVM 和 Ubuntu RVM 不是一个函数,使用“rvm use ...”选择 rubies 将不起作用

    我第一次尝试在 ubuntu 服务器上部署我的应用程序 我一直遇到这个错误 2013 03 24 15 13 36 executing deploy run migrations executing rvm gemset use vapin
  • Linux 服务器的 CPU 使用百分比

    我想从 linux 服务器获取 CPU 使用率百分比 我通过 python 连接到我的 linux 服务器 shell spur SshShell hostname ip username root password password mi
  • WSL gprof 报告零次

    我正在尝试在 Windows 10 上的 WSL 中使用 gprof 我没有预料到会遇到任何困难 因为上次我在 Windows 7 上的 Ubuntu 虚拟盒中使用它时它工作得很好 与以前一样遵循来自https www thegeekstu
  • 如何将动态链接的应用程序转换为静态链接的应用程序?

    我有一个应用程序 例如 gedit 它是动态链接的 但我没有源代码 所以我不能按我喜欢的方式编译它 我想要做的是将其静态链接并将其移动到没有运行该应用程序所需的库的系统 那么是否可以做到以及如何做到呢 理论上是可能的 您基本上必须执行与动态
  • 尽管 EXPORT_SYMBOL 模块插入时出现“模块中的未知符号”

    我正在尝试编译并插入 r8169 realtek 以太网驱动程序 我的内核版本是 ebin sony uname r 4 2 0 rc3 custom 我的本地磁盘中有相同的完整源代码 用于安装当前的内核 当我运行时该模块编译成功make
  • 在linux中将数据“广播”到多个进程的规范方法?

    我有一个应用程序需要将数据流从一个进程发送到多个读取器 每个读取器都需要查看自己的流副本 这是相当高的速率 100MB s 并不罕见 因此我希望尽可能避免重复 在我的理想世界中 Linux 应该有支持多个读取器的命名管道 并为常见的单读取器
  • 何时调用setsockopt?在bind()和connect()之前?

    我继承了一些 TCP 代码 调用 bind tcpSocket struct sockaddr server addr sizeof server addr 在致电之前 setsockopt tcpSocket SOL SOCKET SO
  • 如何重新安装cudnn?

    安装Cudnn 4 0 4后 我发现如果我想运行我下载的代码 我需要更高版本的Cudnn 然后我下载 cudnn 7 0 linux x64 v4 0 prod tgz 并直接按以下顺序安装 sudo cp include cudnn h
  • Linux 上共享内存的生命周期是多长

    我正在使用 ftok shmget shmat shmdt 函数在 Linux 上创建 写入和读取共享段 如果我写入一个程序中的段 然后退出 然后稍后从另一个程序中读取该段 我会惊讶地发现数据仍然存在 我预计当共享一个段的最后一个进程执行
  • Visual Studio 代码中的“Git:gpg 未能签署数据”

    全新安装 Linux 后 我尝试设置我的环境 并且不断收到Git gpg failed to sign the data在本地提交更改时出错 我使用的是 Visual Studio Code 专有版本 而不是开源版本 gitconfig u
  • Cmake 错误未定义对“pthread_create”的引用

    我对 cmake FindThreads 进行了测试 这是我的源代码test cpp和CMakeLists txt include
  • C++向量数组运算符计算成本高?

    我一直都知道 C 的丰富抽象会带来一定的计算开销 但我的印象是 一旦应用了正确的编译器优化 这种开销几乎可以忽略不计 我很好奇这种开销到底有多大 所以我编写了一个简单的测试来确定这一点 该测试是一个模板化函数 它接受一个容器变量 为容器中的
  • 如何配置和采样英特尔进程内性能计数器

    简而言之 我试图在用户级基准测试进程中实现以下目标 伪代码 假设 x86 64 和 UNIX 系统 results for iteration 0 iteration lt num iterations iteration pctr sta
  • 32 位 x86 汇编中堆栈对齐的职责

    我试图清楚地了解谁 调用者或被调用者 负责堆栈对齐 64 位汇编的情况相当清楚 它是由caller 请参阅系统 V AMD64 ABI 第 3 2 2 节栈帧 输入参数区域的末尾应按 16 对齐 32 如果 m256 在堆栈 字节边界上传递

随机推荐

  • 卷积神经网络之-ZFNet

    更多内容请关注 机器视觉 CV 公众号 原文地址 说在前面 貌似江湖上有两篇 ZFNet 的论文 也即 Visualizing and Understanding Convolutional Networks 最新的请见论文地址 https
  • 【LeetCode】最长回文子串 [M](Manacher算法)

    5 最长回文子串 力扣 LeetCode 一 题目 给你一个字符串 s 找到 s 中最长的回文子串 如果字符串的反序与原始字符串相同 则该字符串称为回文字符串 示例 1 输入 s babad 输出 bab 解释 aba 同样是符合题意的答案
  • Flutter手势--GestureDetector各种手势使用详情

    1 GestureDetector单击手势 序列号 字段 属性 描述 1 onTapDown GestureTapDownCallback 手指按下时的回调函数 2 onTapUp GestureTapUpCallback 手指松开时的回调
  • 解决zookeeper启动失败Could not find or load main class org.apache.zookeeper.server.quorum.QuorumPeerMain报错

    zookeeper的默认日志在 xxxxx apache zookeeper 3 5 9 logs目录下 完整报错名称为 Error Could not find or load main class org apache zookeepe
  • C++学习 三、weak_ptr使用

    C 学习 三 weak ptr使用 前言 weak ptr概述 创建weak ptr对象 创建空weak ptr对象 使用拷贝构造函数初始化weak ptr对象 使用shared ptr对象初始化weak ptr对象 注意 不能使用堆指针初
  • QT 实现简单截图功能

    QT 实现简单截图功能 代码内容完善 有详细的代码注释所以不在赘述 头文件CaptureScreen h ifndef CAPTURESCREEN H define CAPTURESCREEN H include
  • shiro多realm异常解决

    shiro多realm异常解决 1 情况描述 2 自定义token 用户名 密码 使用shiro自带token 1 TelCodeToken 参考shiro自带UserNamePasswordToken 3 自定义Realm 1 Paren
  • opencv从入门到精通 哦吼10

    目录 视频处理 读取并显示摄像头视频 VideoCapture 类 播放视频文件 保存视频文件 小结 视频处理 OpenCV 不仅能够处理图像 还能够处理视频 视频是由大量的图像构成的 这些图像以固定的时间间隔从视频中获取 这样 就能够使用
  • python库-jieba安装(很多库都可以这样安装)

    方式一 直接安装 win R gt cmd gt pip install jieba 亲测安装很多python库的时候大家获取会遇到很多坑 不管是pip命令 conda 命令 Anaconda图形化 或者pycharm导入安装 都会遇到安装
  • PHPStorm超级好用的插件

    一 常用插件 1 Translation 翻译插件 2 CodeGlance 代码地图 3 Key Promoter X 快捷键提示 4 Color Highlighter 颜色代码显示为颜色 5 Database Navigator 数据
  • 在学习k8s时候,pod services 和deployment

    在学习 Kubernetes K8s 时 Pod Service 和 Deployment 是三个非常重要的概念 它们是 Kubernetes 中用于管理容器化应用程序的核心组件 Pod Pods Pod 是 Kubernetes 最基本的
  • Rust学习资源清单

    官网学习栏目 https www rust lang org learn 包含标准库 rustdoc cargo和rustc的文档 第三方库文档 https docs rs 各种第三方库的文档 直接搜索tokio anyhow ftp第三方
  • 数据结构-第二讲 线性结构-学习笔记(MOOC 浙江大学 陈越 何钦铭)

    目录 第二讲 线性结构 2 1 线性表及其实现 2 1 1 引子 多项式表示 2 1 2 线性表及顺序存储 2 1 3 顺序存储的插入和删除 顺序存储 数组实现 code 2 1 4 链式存储及查找 2 1 5 链式存储的插入和删除 2 1
  • JAVA - 对象与对象变量

    对象变量 Date deadline 定义了一个对象变量deadline 它可以引用Date类型的对象 但是 一定要认识到 变量deadline不是一个对象 实际上也没有引用对象 此时 不能将任何 Date 方法应用于这个变量上 可以显式地
  • 旋转链表(C语言)

    题目 给定一个链表 旋转链表 将链表每个节点向右移动 k 个位置 其中 k 是非负数 示例 1 输入 1 gt 2 gt 3 gt 4 gt 5 gt NULL k 2 输出 4 gt 5 gt 1 gt 2 gt 3 gt NULL 解释
  • 【ChatGPT+MindShow高效生成PPT,保姆级安装教程】

    AI破局先行者 AI工具 AI绘图 AI专栏 如果你想学到最前沿 最火爆的技术 赶快加入吧 作者简介 硕风和炜 CSDN Java领域优质创作者 保研 国家奖学金 JAVA开发技术栈 面试刷题 面经八股文 经验分享 好用的网站工具分享 恭喜
  • Vue.js 学习笔记:项目实战

    项目实战 使用技术栈 Vue 2 x Vue CLI 4 x Element UI 2 x 开发工具自选 VS Code HbuilderX WebStorm 因本人主要是 Java 开发 使用 Idea 安装 Vue js 插件即可开发
  • 图像处理笔试面试题整理1

    1 图像处理笔试面试题 1 https blog csdn net m0 37407756 article details 78800709 1 1 给定0 1矩阵 求连通域 二值图像分析最重要的方法就是连通区域标记 它是所有二值图像分析的
  • Android平台GB28181设备接入模块分辨率发生变化怎么办?

    技术背景 我们在做Android平台gb28181设备接入模块的时候 遇到这样的情况 比如横竖屏分辨率不锁定 采集摄像头的时候 可以实现 横屏状态采集横屏 竖屏状态采集竖屏 简单来说 横屏状态比如采集的1280 720的 竖屏状态 采集的数
  • Linux下快速比较两个目录的不同

    转载请务必在文章最开头标明原文地址 本文原创地址 博客园骏马金龙https www cnblogs com f ck need u p 9071033 html强烈谴责大量盗文狗 波波说运维 说不定你们的文章也已被抄袭 曾多次想要在Linu