加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志）

2024-01-09

我通过查看 NTFS MFT / USN 日志来枚举 NTFS 硬盘分区的文件：

HANDLE hDrive = CreateFile(szVolumePath, GENERIC_READ, FILE_SHARE_READ | FILE_SHARE_WRITE, NULL, OPEN_EXISTING, NULL, NULL);
DWORD cb = 0;

MFT_ENUM_DATA med = { 0 };
med.StartFileReferenceNumber = 0;
med.LowUsn = 0;
med.HighUsn = MAXLONGLONG;      // no change in perf if I use med.HighUsn = ujd.NextUsn; where "USN_JOURNAL_DATA ujd" is loaded before

unsigned char pData[sizeof(DWORDLONG) + 0x10000] = { 0 }; // 64 kB

while (DeviceIoControl(hDrive, FSCTL_ENUM_USN_DATA, &med, sizeof(med), pData, sizeof(pData), &cb, NULL))
{
        med.StartFileReferenceNumber = *((DWORDLONG*) pData);    // pData contains FRN for next FSCTL_ENUM_USN_DATA

       // here normaly we should do: PUSN_RECORD pRecord = (PUSN_RECORD) (pData + sizeof(DWORDLONG)); 
       // and a second loop to extract the actual filenames
       // but I removed this because the real performance bottleneck
       // is DeviceIoControl(m_hDrive, FSCTL_ENUM_USN_DATA, ...)
}

有效，比平常快得多FindFirstFile枚举技术。但我看到这还不是最佳的:

在我的 700k 文件上C:\，需要 21 秒。（此措施必须在重启后进行，否则会因为缓存而出错）。
我见过另一种索引软件（不是 Everything，而是另一个）能够索引C:\在 FSCTL_ENUM_USN_DATA，而是低级 NTFS 解析。

我为提高性能所做的努力:

使用另一个标志打开文件，例如FILE_FLAG_SEQUENTIAL_SCAN, FILE_FLAG_RANDOM_ACCESS, or FILE_FLAG_NO_BUFFERING：相同的结果：读取 21 秒
看着估计 NTFS 卷上的 USN 记录数 https://stackoverflow.com/questions/11336390/estimate-the-number-of-usn-records-on-ntfs-volume, 为什么在 VB.NET 中使用 DeviceIoControl 进行文件枚举比在 C++ 中更快？ https://stackoverflow.com/questions/27393985/why-file-enumeration-using-deviceiocontrol-is-faster-in-vb-net-than-in-c我已经深入研究了它们，但它没有提供这个实际问题的答案。
测试另一个编译器：MinGW64 而不是 VC++ Express 2013：相同的性能结果，没有差异
在 VC++ 上，我已经切换到Release代替Debug：还有其他项目属性/选项可以加快程序速度吗？

Question:

是否可以提高性能DeviceIoControl(hDrive, FSCTL_ENUM_USN_DATA, ...)?

或者是提高性能的唯一方法是对 NTFS 进行低级手动解析？

注：根据测试，这些期间读取的总大小DeviceIoControl(hDrive, FSCTL_ENUM_USN_DATA, ...)对于我的 700k 文件来说是only84MB。读取 84MB 需要 21 秒，速度仅为 4 MB/秒（而且我确实有 SSD！）。性能可能还有一些改进的空间，您不这么认为吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

performance

WINAPI

ntfs

ntfsmft

加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志）的相关文章

当我使用“control-c”关闭发送对等方的套接字时，为什么接收对等方的套接字不断接收“”

我是套接字编程的新手我知道使用 control c 关闭套接字是一个坏习惯但是为什么在我使用 control c 关闭发送进程后接收方上的套接字不断接收在 control c 退出进程后发送方的套接字不应该关闭吗谢谢我知道使用
mysql表中的数据非常大。即使 select 语句也需要很多时间

我正在开发一个数据库它是一个相当大的数据库有 13 亿行和大约 35 列这是我检查表状态后得到的结果 Name Table Name Engine InnoDB Version 10 Row format Compact Rows 1
将数组向左或向右旋转一定数量的位置，复杂度为 o(n)

我想编写一个程序根据用户的输入正 gt 负 include
pthread_cond_timedwait() 和 pthread_cond_broadcast() 解释

因此我在堆栈溢出和其他资源上进行了大量搜索但我无法理解有关上述函数的一些内容具体来说 1 当pthread cond timedwait 因为定时器值用完而返回时它如何自动重新获取互斥锁互斥锁可能被锁定在其他地方例如在生产者
UML类图：抽象方法和属性是这样写的吗？

当我第一次为一个小型 C 项目创建 uml 类图时我在属性方面遇到了一些麻烦最后我只是将属性添加为变量 lt
如何在列表框项目之间画一条线

我希望能够用水平线分隔列表框中的每个项目这只是我用于绘制项目的一些代码 private void symptomsList DrawItem object sender System Windows Forms DrawItemEvent
C++ 子字符串返回错误结果

我有这个字符串 std string date 20121020 我正在做 std cout lt lt Date lt lt date lt lt n std cout lt lt Year lt lt date substr 0 4 l
当 contains() 工作正常时，xpath 函数ends-with() 工作时出现问题

我正在尝试获取具有以特定 id 结尾的属性的标签 like span 我想获取 id 以国家地区结尾的跨度我尝试以下xpath span ends with id Country 但我得到以下异常需要命名空间管理器或 XsltCon
C - 找到极限之间的所有友好数字

首先是定义一对友好的数字由两个不同的整数组成其中第一个整数的除数之和等于第二个整数并且第二个整数的除数之和等于第一个整数完美数是等于其自身约数之和的数我想做的是制作一个程序询问用户一个下限和一个上限然后向他她提供这两个限
如何将图像和 POST 数据上传到 Azure 移动服务 ApiController 终结点？

我正在尝试上传图片and POST表单数据尽管理想情况下我希望它是json 到我的端点Azure 移动服务应用我有ApiController method HttpPost Route api upload databaseId sea
如果使用 SingleOrDefault() 并在数字列表中搜索不在列表中的数字，如何返回 null？

使用查询正数列表时SingleOrDefault 当在列表中找不到数字时如何返回 null 或像 1 这样的自定义值而不是类型的默认值在本例中为 0 你可以使用 var first theIntegers Cast
WPF TabControl，用C#代码更改TabItem的背景颜色

嗨我认为这是一个初学者的问题我搜索了所有相关问题但所有这些都由 xaml 回答但是我需要的是后台代码我有一个 TabControl 我需要设置其项目的背景颜色我需要在选择取消选择和悬停时为项目设置不同的颜色非常感谢你的帮助
Web API - 访问 DbContext 类中的 HttpContext

在我的 C Web API 应用程序中我添加了CreatedDate and CreatedBy所有表中的列现在每当在任何表中添加新记录时我想填充这些列为此目的我已经覆盖SaveChanges and SaveChangesAsy
vector 超出范围后不清除内存

我遇到了以下问题我不确定我是否错了或者它是一个非常奇怪的错误我填充了一个巨大的字符串数组并希望在某个点将其清除这是一个最小的例子 include
如何衡量两个字符串之间的相似度？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案给定两个字符串text1 and text2 public SOMEUSABLERETURNTYPE Compare string t
在 Dynamics CRM 插件中访问电子邮件发件人地址

我正在编写一个 Dynamics CRM 2011 插件该插件挂钩到电子邮件实体的更新后事件阶段 40 pipeline http msdn microsoft com en us library gg327941 aspx 并且在此阶
C - 直接从键盘缓冲区读取

这是C语言中的一个问题如何直接读取键盘缓冲区中的数据我想直接访问数据并将其存储在变量中变量应该是什么数据类型我需要它用于我们研究所目前正在开发的操作系统它被称为 ICS OS 我不太清楚具体细节它在 x86 32 位机器上运行
x86 上未对齐的指针

有人可以提供一个示例将指针从一种类型转换为另一种类型由于未对齐而失败吗在评论中这个答案 https stackoverflow com questions 544928 reading integer size bytes from a
C 中的异或运算符

在进行按位操作时我在确定何时使用 XOR 运算符时遇到一些困难按位与和或非常简单当您想要屏蔽位时请使用按位 AND 常见用例是 IP 寻址和子网掩码当您想要打开位时请使用包含或然而 XOR 总是让我明白我觉得如果在面试中被问
限制C#中的并行线程数

我正在编写一个 C 程序来生成并通过 FTP 上传 50 万个文件我想并行处理4个文件因为机器有4个核心文件生成需要更长的时间是否可以将以下 Powershell 示例转换为 C 或者是否有更好的框架例如 C 中的 Actor 框

随机推荐

window 对象在 Chrome 和 IE 中表现奇怪

考虑以下 HTML 示例 div div 以及以下脚本 var about function window document use strict var methods methods init function Do things he
如何在 R 中一起绘制两个直方图？

我正在使用 R 并且有两个数据框胡萝卜和黄瓜每个数据框都有一个数字列列出所有测量的胡萝卜总计 100k 胡萝卜和黄瓜总计 50k 黄瓜的长度我希望在同一个图上绘制两个直方图胡萝卜长度和黄瓜长度它们重叠所以我想我还需要一
django-tastypie PATCH 给了我一个“400（错误请求）”

我正在 Apache 上运行一个 Django 站点该站点以 Nginx 实例为前端为我的静态媒体提供服务我通过 django tastypie 将 API 暴露给需要修补字段的模型当我进行本地测试通过 django runser
数组衰减为指针的异常？

我在许多帖子中看到在大多数情况下数组名称会退化为指针我可以知道在什么情况表达式下数组名称不会衰减为指向其第一个元素的指针吗 Sure 在C99中存在三种基本情况即当它是争论的时候地址运算符当它是争论的时候sizeof操作员
如何使用 libphonenumber 以国际格式格式化电话号码。

In the 文档 https github com googlei18n libphonenumber由Github上的libphonenumber提供有一个demo https rawgit com googlei18n libpho
view.getId() 在 OnItemClickListener 中返回错误的 id

在我的应用程序中我有一个包含一些图像的图库当用户选择图像时我想以某种方式检索所选图像的 id getId 返回的 int 为 1 为什么我无法获取所选图像的系统 ID gallery setOnItemClickListener ne
使用左连接的 LINQ orderby FK

我有以下代码 from categories in context SCT Categories join categoryOrders in context SCT CategoryOrders on categories ID equa
如何在 Firefox 中正确渲染@font-face？

我正在尝试对 Chrome Safari Firefox 和 IE 使用 font face 对于 IE 我什至不知道该怎么做但对于其他浏览器我希望 font face 部分能够工作这是我用过的 font face font fami
ruby 从数组中删除一个元素

我想从数组中按值删除仅一个元素例子 x 1 2 3 2 x remove 2 result x 1 3 但是我想得到 1 3 2 thanks 正如 7urkm3n在评论中提到的你可以使用x delete at删除第一个出现的位置
Git hooks - 从远程存储库传播？

我目前正在寻求将现有的 SVN 存储库转换为 git 然后在允许推送之前使用 Reviewboard 进行审核我最近才开始使用 git 而且远不是这方面的专家但是我想做的是有一个预推送钩子它运行后审查以将更改提交到 ReviewB
为什么不允许调用main函数？

C 03 3 6 1 3 不得在程序中使用 main 函数 3 2 我想知道为什么这条规则存在有人知道如果使用 main 会出现问题的任何系统实现吗附 1 我知道这个词的定义used 2 我知道有一些简单的解决方法例如从 main
找不到提供者 docker - Vagrant

每当我跑步时vagrant up provider docker 我收到此错误消息 The provider docker could not be found but was requested to back the machine d
为什么 gcc 不会对 int 和 char 产生类型不匹配警告？

为什么在 gcc 中编译以下代码不会产生任何类型不匹配警告 1属于类型int and f 期望类型char void f char c int main void f 1 return 0 即使我们明确指定类型也不会出现警告 void f
混合 fdopen() 和 open() -> 错误的文件描述符

int source open hi O CREAT O RDONLY int dest open resultfile O CREAT O RDWR O TRUNC FILE source1 fdopen source r FILE de
合并（与拆分相反）r 中的行对

我有如下的专栏每列有两对每对带有后缀 a 和 b 例如 col1a col1b colNa colNb 等直到文件末尾 gt 50000 mydataf lt data frame Ind 1 5 col1a sample c 1 3
ROC 函数错误“预测变量必须是数字或有序的。”

我无法让 ROC 函数正常工作收到错误预测器必须是数字或有序的我浏览了其他帖子但没有解决我的问题非常感谢任何帮助 Get data flying dget https www math ntnu no emner TMA4268
SQL - 查找两列相同的所有实例

所以我有一个简单的桌子来容纳comments from a user与特定博客相关的post id user post id comment 0 email protected cdn cgi l email protection 1001
MySQL 不允许对 DATETIME 字段执行 ON UPDATE CURRENT_TIMESTAMP

我看过很多相关问题但我无法指出这个具体问题我有一个 MySQL 表其中包含 TIMESTAMP 用于创建字段的时间和 DATETIME 用于每次更新字段的时间它看起来像这样 CREATE TABLE vis ID BIGINT P
sqlite 在日期中添加天数

我正在尝试编写一个 sqlite 语句该语句从表中返回一个日期并从另一列添加了一定的天数日期存储为YYYY MM DD HH mm ss以及整数形式的天数我有 SELECT strftime Y m d H M S strftime
加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志）

我通过查看 NTFS MFT USN 日志来枚举 NTFS 硬盘分区的文件 HANDLE hDrive CreateFile szVolumePath GENERIC READ FILE SHARE READ FILE SHARE WRIT

加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志）

加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志） 的相关文章

随机推荐

热门标签

加速 NTFS 文件枚举（使用 FSCTL_ENUM_USN_DATA 和 NTFS MFT / USN 日志）的相关文章