filecmp.cmp() 什么时候会返回误报或漏报？

2024-03-27

使用 Windows 7，我有两个文件夹，一个是我处理文件的“Master”文件夹，另一个是 NAS4Free 服务器上的“Backup”文件夹。

我有超过 800 个 jpg 文件，总计 2.6GB，大小从 124KB 到 16MB 不等。

我经常“交换”文件名，即：

rename 01-020.jpg 99-020.jpg
rename 01-040.jpg 01-020.jpg
rename 99-020.jpg 01-040.jpg

我还添加新文件 - 01-030.jpg - 然后重新编号该集，即：

rename 01-020.jpg 99-020.jpg
rename 01-030.jpg 99-040.jpg
rename 01-040.jpg 99-060.jpg
rename 99-020.jpg 01-020.jpg
rename 99-040.jpg 01-040.jpg
rename 99-060.jpg 01-060.jpg

为了保持主文件夹和备份文件夹同步，我首先考虑对整个文件夹进行 XCOPY 或 ROBOCOPY，但这太耗时，特别是因为绝大多数文件都没有更改。

我正在尝试提出一个 Python 3 解决方案。我已阅读有关 filecmp.cmp() 的文档。让我担心的是以下声明：

“……如果他们seem平等……”（强调我的）。

指定shallow=False 似乎有点矫枉过正，导致filecmp 比较1,600 多个文件的内容，而绝大多数比较都匹配。

指定shallow=True 会导致filecmp 使用os.stat() 函数。使用该函数在 filecmp 返回 True 的两个文件上运行测试，stat 返回的一些值是相同的，其他值是不同的。显然，filecmp 不会使用 stat 返回的所有值来确定文件是否相等。

所以，我的问题是：在什么“现实世界”情况下 filecmp.cmp(file1, file2,shallow=True) 会返回误报或漏报？我可以相信它吗？

并且，一个可能的“子问题”是，filecmp.cmp() 使用 os.stat() 返回的哪些特定值？

（如果您好奇我对这些文件做了什么，我在这里讨论：)

仅当大小和修改时间属性值相同时比较才会返回 true。仅当同时修改相同数量的字节时，它才会返回误报。

可用于确认上述内容的模块文件引用：

摘自 cmp 函数实现 (filecmp.py)

        s1 = _sig(os.stat(f1))
        s2 = _sig(os.stat(f2))
        if shallow and s1 == s2:
            return True

上面使用的 _sig 函数（filecmp.py）：

def _sig(st):
    return (stat.S_IFMT(st.st_mode),
            st.st_size,
            st.st_mtime)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

filecmp.cmp() 什么时候会返回误报或漏报？的相关文章

Python：如果满足条件，则循环遍历一个字典并在新字典中创建键/值对

我想将一个字典的值与第二个字典的值进行比较如果值满足特定条件我想创建第三个字典其中的键和值对将根据匹配情况而变化这是一个显示我的问题的人为示例编辑对所有返回感到抱歉但堆栈溢出无法识别单个返回并且在一行上运行 3 4 行使代
让 Django 提供可下载文件

我希望网站上的用户能够下载路径被遮挡的文件因此无法直接下载它们例如我希望 URL 是这样的 http example com download f somefile txt 在服务器上我知道所有可下载的文件都位于该文件夹中 home
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
Python 正则表达式从文本中提取域

我有以下正则表达式 r a zA Z0 9 a zA Z0 9 61 a zA Z0 9 a zA Z 2 6 当我将其应用于文本字符串时比方说这是 www website1 com 这是 website2 com 我得到 www we
在 Python 中倾斜数组

我有一个 2D 数组我将使用它保存为灰度图像scipy misc toimage 在此之前我想将图像倾斜给定角度像这样进行插值scipy ndimage interpolation rotate 上图只是为了说明倾斜过程我知道我必须
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
django-allauth：电子邮件确认

我已经设置了 django allauth 并在新用户注册时使用电子邮件确认效果很好但在确认电子邮件中我得到 Hello from example com You re receiving this e mail because us
Scrapy FakeUserAgentError：获取浏览器时发生错误

我使用 Scrapy FakeUserAgent 并在我的 Linux 服务器上不断收到此错误 Traceback most recent call last File usr local lib64 python2 7 site pack
Python：两个列表之间的成对比较：列表 a >= 列表 b？

如果我想检查列表中的所有元素 a 1 2 3 6 大于或等于另一个列表中对应的元素 b 0 2 3 5 如果 a i gt b i 对于所有i的则返回 true 否则返回 false 这有逻辑功能吗比如a gt b 谢谢你可以这样做
在python中检测按下了哪些键

我需要知道现在按下的是哪个键我不想捕获一些特定的按键来触发事件或类似的事情我想知道现在按下了哪些键并显示它们的列表我还需要捕获特殊键如 F1 F12 shift alt home windows 等基本上是键盘上的所有键我如何在
如果任何单元测试失败，如何使 Python 的覆盖率工具失败？

我想使用 shell 脚本来确保我的单元测试通过and我的代码有足够的测试覆盖率我只想运行我的测试代码once 我希望我可以通过coverage https coverage readthedocs io 工具和单次运行的工具如果一项或
在解析器/子解析器的开头使用 argparse.REMAINDER

我想实现一个 arg 解析器它允许我将单元测试作为子命令之一运行盲目地将参数传递给 unittest main 例如 foo py unittest args to pass to unittest main 以及其他子命令 foo p
如何在 Windows 7 中使用 Python 廉价地创建非常大的文件？ [复制]

这个问题在这里已经有答案了可能的重复在Windows系统上快速创建大文件 https stackoverflow com questions 982659 quickly create large file on a windows s
Django - 渲染到字符串无法加载 CSS

我正在尝试使用 Django 1 8 render to string 通过管理命令将 html 转换为 pdf 而不是使用 View request 以下代码可以将模板转换为 pdf 但它无法将 CSS 加载到模板中 def html t
使用 Python 获取 Youtube 数据

我正在尝试学习如何分析网络上可用的社交媒体数据我从 Youtube 开始 from apiclient errors import HttpError from outh2client tools import argparser fro
`numpy.diff` 和 `scipy.fftpack.diff` 在微分时给出不同的结果

我正在尝试计算一些数据的导数并且正在尝试比较有限差分的输出和谱方法的输出但结果却截然不同我无法弄清楚到底为什么考虑下面的示例代码 import numpy as np from scipy import fftpack as sp
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
在不同进程之间共享列表？

我有以下问题我编写了一个函数它将列表作为输入并为列表中的每个元素创建一个字典然后我想将这本字典附加到一个新列表中这样我就得到了一个字典列表我正在尝试为此生成多个进程我的问题是我希望不同的进程访问由其他进程更新的字典列表例如
如何使用多阶段构建减小 python (docker) 图像大小？

我正在寻找一种使用 python 和 Dockerfile 创建多阶段构建的方法例如使用以下图像第一张图片安装所有编译时要求并安装所有需要的 python 模块第二张图片将所有已编译构建的包从第一个映像复制到第二个映像而不

随机推荐

空状态页面和导航器问题？

我想实施空状态页 https material io design communication empty states html content在 Flutter 应用程序中当新闻源为空时当提要中没有活动时我想显示没有活动当数据
如何将服务变量与组件 Angular 2 绑定？

我有一个变量 public tick number 在服务中该服务注入了另一个服务计时器它的启动方式如下 class Service constructor public timer TimerService public sendSm
Python 和类似字典的对象

我需要一个用于字典的 python 3 1 深度更新函数该函数将递归更新父字典内的子字典但我认为将来我的函数可能必须处理行为类似于字典但实际上并非如此的对象此外我想避免使用isinstance and type 因为它们被认为是不
无法运行 React-Native UIExplorer 示例项目

我一直在尝试在 Windows 上运行 UIExplorer 项目我收到以下错误 make D react native ReactAndroid build tmp buildReactNdkLib local armeabi v7a
Gunicorn + nginx：通过套接字还是代理服务器？

我见过两种使用 Gunicorn 和 nginx 托管 django 应用程序的策略一种策略是在网络端口上运行 Gunicorn 例如来自goodcode https goodcode io articles django nginx
jQuery TouchSwipe 插件不适用于链接？

我正在使用 jQuery TouchSwipe 插件它在 div 上工作得很好但在链接上根本不起作用我想要它因此如果您点击或单击链接您将获得默认的链接行为但是如果你滑动我希望 javascript 滑动能够像元素是 div 一
Java 相当于 .NET Action 和 Func 等[重复]

这个问题在这里已经有答案了 Java 中是否有标准的通用回调或函数方法类型例如System Action
ASP.NET 网站项目何时重新编译？

As Maurico https stackoverflow com users 21239 mauricio scheffer and codeka https stackoverflow com users 241462 codeka首
如何使用 Ecto 的时间戳向现有表添加时间戳？

Since inserted at and updated at不可能是null这是行不通的 def change do alter table channels do timestamps end end Postgrex Error E
在 Outlook 2013 中调用功能区按钮

我们有一个 Outlook 插件我们需要以编程方式取消任务项检查器窗口中的任务分配就像取消分配按钮一样人们会认为调用TaskItem CancelResponseState 可能会起作用虽然它确实取消了分配但它也使任务处于不可分配
使用 RequestAnimationFrame 实现准确计时

到目前为止我还没有找到很多关于这个主题的文档我的总体感觉是在为浏览器实现动画时最好使用 RequestAnimationFrame 而不是 bog 标准 JavaScript 计时器我的理解是计时器不可靠并且它们的分辨率在不同浏
Windows 8 Phone - 访问 NFC 读卡器？

简短的问题我可以使用支持 NFC 的 Windows Phone 8 读取信用卡信息吗长问题 NFC 与信用卡如何工作卡或具有钱包功能的手机通过 NFC 接收请求并以某种标准化格式回复明文信用卡信息那么钱包选项在广播信用卡信息
传送仅公开 C api 的 C++ dll

我正在编写一个软件其 API 仅为 C 语言因为很容易将 C 代码与其他软件客户端链接起来然而实际的程序代码是用 C 完成的使用所有常见的 C 功能如异常 STL 等导出的 API 标头本身将用纯 C 编写其中export
如何使用 pandas tz_convert 转换为多个不同时区

我有一些数据如下所示hour以世界标准时间 UTC 表示我想创建一个名为的新列local hour基于time zone 我怎样才能做到这一点好像是熊猫的tz convert不允许列或 pandas 系列作为输入tz争论 Create
Rails ActionController::Metal 的实际作用是什么

我想了解一下Rails ActionController 金属控制器我读过相关内容here http api rubyonrails org classes ActionController Metal html但不完全理解它用于构建
对 DataGrid 组进行排序

我有一个非常基本的DataGrid以及一些测试数据数据作为ObservableCollection
应用程序崩溃时 QSharedMemory 不会被删除

我正在使用实现一个应用程序Qt C 我用过的地方QSharedMemory限制应用程序的多个实例相关代码段在main cpp如下 QSharedMemory sharedMemory sharedMemory setKey SM INST
用于对重复 UPDATE 进行 UPSERT 或 INSERT 的 MERGE 语法

所以我来自 MySQL 我可以做插入重复更新 http dev mysql com doc refman 5 0 en insert on duplicate html INSERT INTO table a b c VALUES 1 2
是否可以从字符串中获取 Swift 类型？

我想知道是否可以动态获取 Swift 类型例如假设我们有以下嵌套结构 struct Constants struct BlockA static let kFirstConstantA firstConstantA static let
filecmp.cmp() 什么时候会返回误报或漏报？

使用 Windows 7 我有两个文件夹一个是我处理文件的 Master 文件夹另一个是 NAS4Free 服务器上的 Backup 文件夹我有超过 800 个 jpg 文件总计 2 6GB 大小从 124KB 到 16MB 不等

filecmp.cmp() 什么时候会返回误报或漏报？

filecmp.cmp() 什么时候会返回误报或漏报？ 的相关文章

随机推荐

热门标签

filecmp.cmp() 什么时候会返回误报或漏报？的相关文章