提高mmap memcpy文件读取性能

2024-07-01

我有一个从文件中顺序读取数据的应用程序。有些是直接从指向的指针读取mmaped 文件和其他部分是memcpyed 从文件到另一个缓冲区。我注意到在进行大型操作时性能不佳memcpy我需要的所有内存（1MB 块）以及在执行大量较小操作时的更好性能memcpy调用（在我的测试中，我使用了 4KB，页面大小，这花费了 1/3 的时间来运行。）我相信问题是使用大的页面时会出现大量的主要页面错误memcpy.

我尝试过各种调整参数（MAP_POPUATE, MADV_WILLNEED, MADV_SEQUENTIAL）没有任何明显的改善。

我不知道为什么很多小memcpy通话速度应该更快；这似乎违反直觉。有什么办法可以改善这一点吗？

结果和测试代码如下。

在 CentOS 7 (linux 3.10.0) 上运行，默认编译器 (gcc 4.8.5)，从常规磁盘的 RAID 阵列中读取 29GB 文件。

跑步与/usr/bin/time -v:

4KB memcpy:

User time (seconds): 5.43
System time (seconds): 10.18
Percent of CPU this job got: 75%
Elapsed (wall clock) time (h:mm:ss or m:ss): 0:20.59
Major (requiring I/O) page faults: 4607
Minor (reclaiming a frame) page faults: 7603470
Voluntary context switches: 61840
Involuntary context switches: 59

1MB memcpy:

User time (seconds): 6.75
System time (seconds): 8.39
Percent of CPU this job got: 23%
Elapsed (wall clock) time (h:mm:ss or m:ss): 1:03.71
Major (requiring I/O) page faults: 302965
Minor (reclaiming a frame) page faults: 7305366
Voluntary context switches: 302975
Involuntary context switches: 96

MADV_WILLNEED似乎对1MB复制结果没有太大影响。

MADV_SEQUENTIAL1MB 的复制结果减慢了很多，我没有等到它完成（至少 7 分钟）。

MAP_POPULATE将 1MB 复制结果减慢了约 15 秒。

用于测试的简化代码：

#include <algorithm>
#include <iostream>
#include <stdexcept>

#include <fcntl.h>
#include <stdint.h>
#include <string.h>
#include <sys/mman.h>
#include <unistd.h>

int
main(int argc, char *argv[])
{
  try {
    char *filename = argv[1];

    int fd = open(filename, O_RDONLY);
    if (fd == -1) {
      throw std::runtime_error("Failed open()");
    }

    off_t file_length = lseek(fd, 0, SEEK_END);
    if (file_length == (off_t)-1) {
      throw std::runtime_error("Failed lseek()");
    }

    int mmap_flags = MAP_PRIVATE;
#ifdef WITH_MAP_POPULATE
    mmap_flags |= MAP_POPULATE;  // Small performance degredation if enabled
#endif

    void *map = mmap(NULL, file_length, PROT_READ, mmap_flags, fd, 0);
    if (map == MAP_FAILED) {
      throw std::runtime_error("Failed mmap()");
    }

#ifdef WITH_MADV_WILLNEED
    madvise(map, file_length, MADV_WILLNEED);    // No difference in performance if enabled
#endif

#ifdef WITH_MADV_SEQUENTIAL
    madvise(map, file_length, MADV_SEQUENTIAL);  // Massive performance degredation if enabled
#endif

    const uint8_t *file_map_i = static_cast<const uint8_t *>(map);
    const uint8_t *file_map_end = file_map_i + file_length;

    size_t memcpy_size = MEMCPY_SIZE;

    uint8_t *buffer = new uint8_t[memcpy_size];

    while (file_map_i != file_map_end) {
      size_t this_memcpy_size = std::min(memcpy_size, static_cast<std::size_t>(file_map_end - file_map_i));
      memcpy(buffer, file_map_i, this_memcpy_size);
      file_map_i += this_memcpy_size;
    }
  }
  catch (const std::exception &e) {
    std::cerr << "Caught exception: " << e.what() << std::endl;
  }

  return 0;
}

如果底层文件和磁盘系统不够快，您是否使用mmap()或 POSIXopen()/read()或标准Cfopen()/fread() or C++ iostream根本不重要。

如果性能真的很重要并且底层文件和磁盘系统足够快，mmap()可能是顺序读取文件的最糟糕的方法。创建映射页是一项相对昂贵的操作，并且由于每个数据字节仅读取一次，因此每次实际访问的成本可能会非常高。使用mmap()还会增加系统的内存压力。你可以明确地munmap()阅读它们后，您会看到它们，但是当映射被拆除时，您的处理可能会停止。

使用直接 IO 可能是最快的，特别是对于大文件，因为不涉及大量页面错误。 Direct IO 绕过了页面缓存，这对于只读取一次的数据来说是一件好事。缓存数据仅读取一次（永远不会重新读取）不仅无用，而且可能会适得其反，因为 CPU 周期会从页面缓存中逐出有用的数据。

示例（为了清楚起见，省略了标头和错误检查）：

int main( int argc, char **argv )
{
    // vary this to find optimal size
    // (must be a multiple of page size)
    size_t copy_size = 1024UL * 1024UL;

    // get a page-aligned buffer
    char *buffer;
    ::posix_memalign( &buffer, ( size_t ) ( 4UL * 1024UL ), copy_size );

    // make sure the entire buffer's virtual-to-physical mappings
    // are actually done (can actually matter with large buffers and
    // extremely fast IO systems)
    ::memset( buffer, 0, copy_size );

    fd = ::open( argv[ 1 ], O_RDONLY | O_DIRECT );

    for ( ;; )
    {
        ssize_t bytes_read = ::read( fd, buffer, copy_size );
        if ( bytes_read <= 0 )
        {
            break;
        }
    }

    return( 0 );
}

在 Linux 上使用直接 IO 时存在一些注意事项。文件系统支持可能不稳定，并且直接 IO 的实现可能很挑剔。您可能必须使用页对齐缓冲区来读取数据，并且如果文件的最后一页不是整页，您可能无法读取该文件的最后一页。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

提高mmap memcpy文件读取性能的相关文章

C++11 中的延迟初始化顺序

考虑以下代码分为三个编译单元 a h struct A void Register const char s const char m s 10 int m i 0 A GetA a cpp include a h include
如何使用OpenCV的归一化相关性？

如何使用 OpenCV 的归一化相关性有人可以提供代码示例吗我的问题我有一个螺丝头图像需要找到螺丝的中心所以我正在考虑使用 OpenCV 相关性这是一个好主意吗您可以在下面的链接下找到示例图像 http imageshack
如何管理 JSONP 响应中的 ' ？

我需要像这样管理 char 在我的 JSONP 请求中通过 jquery 使用 Ajax 所以来自 C 这就是我所做的 myText Hello I m a string myText Replace Response Write Re
在 OpenCV C++ 中使用 gpu::GpuMat

我想知道如何修改gpu GpuMat 事实上我想知道是否可以使用gpu GpuMat like a cv Mat 我想做这样的事情 cv namedWindow Result cv Mat src host cv imread lena j
在 C# 中创建新 List 的这三种方式有什么区别？

这三种创建新的方式有什么区别List
Microsoft.Graph GetAsync() 无限期挂起

介绍我正在开发一个 ASP NET 应用程序除其他外它应该从 Azure Active Directory 检索用户为此我使用 Microsoft Graph 版本 1 14 0 预览库可以找到该库here https www
启动离线 ClickOnce 应用程序并等待退出

我已经部署了 ClickOnce Windows 窗体应用程序应用程序 A 另一个应用程序应用程序 B 以文件名作为参数启动应用程序 A 我用这段代码做到这一点 var basePath Environment GetFolderPat
如何在C++中从Imagemagick图像获取缓冲区

我正在使用 ImageMagick 库进行图像处理我需要加载 bmp 图像将其转换为 jpeg 将其加载到缓冲区中并通过网络发送但是我在 ImageMagick 中找不到任何可以在缓冲区中转换和存储数据的支持函数我只能写入文件尝
使用 X509 证书对多个收件人进行 XML 加密和解密

我已经成功地使用 MSDN 上的示例来加密和解密 xml 文档 http msdn microsoft com en us library ms229744 aspx http msdn microsoft com en us librar
如何在单击按钮时关闭 .exe 应用程序

谁能告诉我如何使用 C 在单击按钮时关闭 exe 文件我知道如何使用 C 在单击按钮时运行 exe 文件如下所示 string str C windows system32 notepad exe process StartInfo F
在运行的 Windows 控制台应用程序中处理拖放文件

首先澄清一下我是not询问如何将文件拖放到 exe 图标上我想知道如何处理拖放到已经运行win32 控制台应用程序我也是not询问如何通过 Windows 消息泵处理基于 WinMain 的应用程序内部的拖放我想在带有入口点的程序内
如何在类型依赖于派生类的基模板类中声明成员？

给定一个使用 CRTP 的基类我正在考虑在基模板类中声明一个成员其中类型依赖于派生类虽然以下内容按预期工作 template
在 OpenGL 中绘制 2D 纹理 [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我有一个绘图函数叫做DrawImage但这确实令人困惑并且仅适用于特定形式的重塑函数所以我有两个问题如何在 Ope
将 HTML 渲染为图像

我正在基于动态输入和裁剪图像生成优惠券并且现在使用 ntml 和 css 显示优惠券问题是打印这已成为一个问题因为打印时背景如何消失以及其他问题所以我认为最好的解决方案是能够基于html生成图像或者设置某种接受字符串和图像的模板
C 中的隐式类型转换

我在维基百科上偶然发现了以下示例 http en wikipedia org wiki Type conversion Implicit type conversion http en wikipedia org wiki Type con
如何为 Office AddIn 创建静默安装程序

我在为使用 C 中的 VSTO 开发的 Outlook 加载项创建静默安装程序时遇到问题安装程序是由 clickOnce 生成的 Outlookaddin vsto 此加载项将由 SCCM 在多台计算机上发布我需要静默安装但当软件包到
跨 Web 服务列表<国家/地区> 变为国家/地区 []

我有一个 Web 服务调用时会返回一个包含多态列表的 Result 对象但是当我在客户端应用程序中添加引用时公共字段将成为客户端应用程序中的国家地区数组如何将客户端应用程序中的字段更改为列表 public Result GetC
从构造函数调用虚函数[重复]

这个问题在这里已经有答案了我正在阅读有效的C https en wikipedia org wiki Scott Meyers 还有第 9 条在构造或销毁期间切勿调用虚函数我想知道我的代码是否正确即使它违反了这条规则 using
Kate 文本编辑器无法处理超过 1024 的行？

对于编辑某些配置文件例如 mozilla 来说这是一个非常烦人的限制prefs js 它通常包含比这更长的行这是一个众所周知的安全选项它是可配置的 Go to Settings configure editor open and
最高效的 Java 原始集合库 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案最好的 Java 原始集合库是什么记忆力和时间效率最高我找到了 Trove 和FastUtil http fastutil di un

随机推荐

什么、为什么或何时选择 cshtml 与 aspx 更好？

我想知道什么为什么或何时选择 cshtml 更好什么为什么或何时选择 aspx 技术更好这两项技术的用途是什么谢谢你正如其他人已经回答的那样 cshtml or vbhtml如果您喜欢的话提供了一个处理程序映射来加载 MVC
使用maven时gpg没有默认密钥错误

我正在尝试在中央存储库中发布我的 Maven 项目并且我需要签署我的工件我已经下载并安装了 gpg 并创建了我的密钥环当我在 Eclipse 中运行 maven clean deploy 时出现以下错误 gpg no default
如何在 JRuby 中初始化 SQLite3 JDBC 驱动程序？

如何在不使用活动记录的情况下通过 JDBC 访问 SQLite3 下面是一个使用 JRuby 1 6 6 Ruby 1 8 兼容模式和 jdbc sqlite3 3 7 2 的示例 require rubygems require jdb
如何添加对嵌入消息的反应 JDA

当我执行命令 verify 时我尝试发送和嵌入消息然后它发送嵌入消息但我找不到如何添加反应我已经嵌入了消息并发送了它但可以添加反应 import Main Bot import net dv8tion jda core Embed
clangd 中有“includePath”选项吗？

我曾经使用 VSCodeC C https marketplace visualstudio com items itemName ms vscode cpptools扩大这个扩展中有一个功能在 json 文件中称为 includeP
如何在 Scala 中使 lambda 函数变得通用？ [复制]

这个问题在这里已经有答案了大多数人可能都知道在 scala 中可以通过两种方式定义函数即 def 方法和 lambda 方法使 def 类型变得通用是相当简单的 def someFunc T a T insert body here
设置 Emacs 并排分割缓冲区

很多 Emacs 功能会自动分割屏幕然而它们的做法都是使窗户一个在另一个之上有什么方法可以让它们分开以便默认情况下它们是并排的吗 setq split height threshold nil setq split width th
Excel 读取错误：标头签名无效。如何解决？

我正在从浏览器上传一个 Excel 文件我正在使用 POI jar 但出现错误标头签名无效读取 3255307777713450285 预期为 2226271756974174256 下面是我使用过的两个jsp文件 JSP 1
我想在我的 Wordpress BootStrap 导航中添加一行

我有一个简单的网站我想在导航上方添加一行其中包含电话号码也许还有一些社交链接我的主题名为 Hestia Pro 找不到在哪里添加此额外行我正在寻找一些关于将其添加到网站主题中的位置的指示网站是 www gpoint co uk
无法在 IntelliJ IDEA 中导入 javax.validation.constraints

I can t import that simple library i have all jar files also i tried Ivalidate Caches Restart Maybe i have to add valida
使用 Docker 的多节点 Hadoop 集群

我正处于多节点的规划阶段Hadoop簇于一个Docker基础环境所以应该是基于一个轻量级易用的虚拟化系统当前架构关于文档包含 1 个主节点和 3 个从节点本主机使用HDFS文件系统和KVM用于虚拟化整个云由以下人员管理Cloud
Bind 与 curry* 的 JavaScript 用法？

我试图理解之间的区别curry vs bind 实施bind is 1 Function prototype bind function 2 3 var fn this 4 args Array prototype slice call a
友好的 URL 和查询字符串

在我的项目 ASP NET Web Forms 中我想使用友好的网址 http www nuget org packages Microsoft AspNet FriendlyUrls 从 NuGet 安装我注册了route in 全局
ElasticSearch 日期范围

我有以下查询 query query string query searchTerm default operator AND facets counts date histogram field firstdate interval ho
DOCKER_TLS_VERIFY 和 DOCKER_CERT_PATH 变量有什么作用？

我是 Docker 新手在 Windows 7 上使用 boot2docker 当我尝试通过 spotify maven 插件配置 Docker 构建时系统要求我设置以下环境变量 DOCKER HOST DOCKER CERT PATH
使用 xctool / xcodebuild 与 XCode Archive 的成功相比出现错误 ITMS-90046

我有一个命令行脚本用于编译存档并将我的 ios 版本提交给 ITC 以进行 TestFlight 部署它们工作得很好但我最近在尝试在我的其他工作项目中使用嵌入式框架时遇到了一个问题我的脚本成功编译并存档了项目但由于嵌入的二进制冲
如何让 bash 函数在出现任何错误时返回 1

我有一个假的 bash 函数如下所示 has error true echo Ok false echo Shouldn t be here 当我运行此函数并检查错误状态时我希望发生什么 gt has error echo Ok 1 但实
Google Play Console - 管理第一个应用程序发布的发布

根据通过托管发布控制何时发布应用程序更改 https support google com googleplay android developer answer 9859654 hl enPlay 管理中心帮助中的页面托管发布仅适用于更
Liquibase：关系“databasechangeloglock”已经存在，使用 grails 插件和非默认架构

我正在使用 grails 2 0 3 数据库迁移 liquibase 插件 1 1 和 postgres 9 1 我看到我认为与其他用户描述的问题相同但有皱纹使用 maven 和 postgres db 运行 liquibase 时出现
提高mmap memcpy文件读取性能

我有一个从文件中顺序读取数据的应用程序有些是直接从指向的指针读取mmaped 文件和其他部分是memcpyed 从文件到另一个缓冲区我注意到在进行大型操作时性能不佳memcpy我需要的所有内存 1MB 块以及在执行大量较小操作时的更好

提高mmap memcpy文件读取性能

提高mmap memcpy文件读取性能 的相关文章

随机推荐

提高mmap memcpy文件读取性能的相关文章