就性能而言，使用 std::memcpy() 还是 std::copy() 更好？

2024-03-28

是不是比较好用memcpy如下所示还是使用更好std::copy()就性能而言？为什么？

char *bits = NULL;
...

bits = new (std::nothrow) char[((int *) copyMe->bits)[0]];
if (bits == NULL)
{
    cout << "ERROR Not enough memory.\n";
    exit(1);
}

memcpy (bits, copyMe->bits, ((int *) copyMe->bits)[0]);

我要反对这里的普遍智慧std::copy将会有轻微的、几乎难以察觉的性能损失。我刚刚做了一个测试，发现这是不真实的：我确实注意到了性能差异。然而，获胜者是std::copy.

我编写了一个 C++ SHA-2 实现。在我的测试中，我使用所有四个 SHA-2 版本（224、256、384、512）对 5 个字符串进行哈希处理，并循环 300 次。我使用 Boost.timer 测量时间。 300 个循环计数器足以完全稳定我的结果。我每次测试 5 次，交替进行memcpy版本和std::copy版本。我的代码利用尽可能大的块来获取数据（许多其他实现都使用char / char *，而我操作的是T / T * (where T是用户实现中具有正确溢出行为的最大类型），因此对最大类型的快速内存访问对于我的算法的性能至关重要。这些是我的结果：

完成 SHA-2 测试运行的时间（以秒为单位）

std::copy   memcpy  % increase
6.11        6.29    2.86%
6.09        6.28    3.03%
6.10        6.29    3.02%
6.08        6.27    3.03%
6.08        6.27    3.03%

std::copy 相对于 memcpy 的速度平均提高：2.99%

我的编译器是 Fedora 16 x86_64 上的 gcc 4.6.3。我的优化标志是-Ofast -march=native -funsafe-loop-optimizations.

我的 SHA-2 实现的代码。 https://bitbucket.org/davidstone/sha-2/

我决定也对我的 MD5 实现进行测试。结果不太稳定，所以我决定运行 10 次。然而，在我最初的几次尝试之后，我得到的结果从一次运行到下一次运行都有很大的变化，所以我猜测正在发生某种操作系统活动。我决定重新开始。

相同的编译器设置和标志。 MD5 只有一个版本，而且它比 SHA-2 更快，因此我对一组类似的 5 个测试字符串进行了 3000 次循环。

这是我的最终 10 个结果：

完成 MD5 测试运行的时间（以秒为单位）

std::copy   memcpy      % difference
5.52        5.56        +0.72%
5.56        5.55        -0.18%
5.57        5.53        -0.72%
5.57        5.52        -0.91%
5.56        5.57        +0.18%
5.56        5.57        +0.18%
5.56        5.53        -0.54%
5.53        5.57        +0.72%
5.59        5.57        -0.36%
5.57        5.56        -0.18%

std::copy 相对于 memcpy 的速度平均下降：0.11%

我的 MD5 实现的代码 https://bitbucket.org/davidstone/md5

这些结果表明 std::copy 在我的 SHA-2 测试中使用了一些优化std::copy无法在我的 MD5 测试中使用。在 SHA-2 测试中，两个数组都是在调用的同一函数中创建的std::copy / memcpy。在我的 MD5 测试中，其中一个数组作为函数参数传递给函数。

我做了更多的测试，看看我能做些什么std::copy又快了。答案很简单：打开链接时间优化。这些是我打开 LTO 的结果（gcc 中的选项 -flto）：

使用 -flto 完成 MD5 测试运行的时间（以秒为单位）

std::copy   memcpy      % difference
5.54        5.57        +0.54%
5.50        5.53        +0.54%
5.54        5.58        +0.72%
5.50        5.57        +1.26%
5.54        5.58        +0.72%
5.54        5.57        +0.54%
5.54        5.56        +0.36%
5.54        5.58        +0.72%
5.51        5.58        +1.25%
5.54        5.57        +0.54%

std::copy 相对于 memcpy 的速度平均增加：0.72%

总之，使用似乎不会造成性能损失std::copy。事实上，性能似乎有所提高。

结果解释

那么为什么可能std::copy提高性能？

首先，只要打开内联优化，我不希望任何实现都会变慢。所有编译器都积极内联；它可能是最重要的优化，因为它支持许多其他优化。std::copy可以（我怀疑所有现实世界的实现都可以）检测到参数是可以简单复制的并且内存是按顺序布置的。这意味着在最坏的情况下，当memcpy是合法的，std::copy表现应该不会更差。简单的实现std::copy遵循memcpy应该满足编译器的“在优化速度或大小时始终内联”的标准。

然而，std::copy还保留了更多信息。你打电话时std::copy，该函数保持类型完整。memcpy运行于void *，它丢弃了几乎所有有用的信息。例如，如果我传入一个数组std::uint64_t，编译器或库实现者可能能够利用 64 位对齐std::copy，但这样做可能会更困难memcpy。像这样的算法的许多实现都是首先处理范围开头的未对齐部分，然后是对齐部分，然后是末尾的未对齐部分。如果保证全部对齐，那么代码就会变得更简单、更快，并且处理器中的分支预测器更容易获得正确的结果。

过早优化？

std::copy处于一个有趣的位置。我希望它永远不会慢于memcpy有时使用任何现代优化编译器都会更快。此外，任何你能做的事memcpy，你可以std::copy. memcpy不允许缓冲区有任何重叠，而std::copy支持一个方向的重叠（与std::copy_backward对于重叠的另一个方向）。memcpy仅适用于指针，std::copy适用于任何迭代器（std::map, std::vector, std::deque，或我自己的自定义类型）。换句话说，你应该只使用std::copy当您需要复制大量数据时。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

就性能而言，使用 std::memcpy() 还是 std::copy() 更好？的相关文章

如何在 C# 中将 IEnumerable 转换为 Enum？

我已将多个字符串解析为枚举标志但看不到将它们合并为单个枚举位字段的巧妙方法我使用的方法循环遍历字符串值然后将值转换为 Enum 对象如下所示 Flags public enum MyEnum None 0 First 1 Seco
make: *** 没有规则可以创建“all”所需的目标“gcc”。停止

我正在通过一个eg pgm 来创建一个make 文件 http mrbook org tutorials make http mrbook org tutorials make 我的文件夹eg make creation包含以下文件 des
C# 中的嵌套正则表达式替换

我不太擅长正则表达式但我了解基础知识我试图弄清楚如何根据匹配中的某个值进行条件替换例如假设我有一些嵌套的字符串结构如下所示 id value id and value are space delimited id will nev
修改 CookieAuthenticationOptions LoginPath OnRedirectToReturnUrl 事件

我的 MVC 6 ASP NET 5 项目中有以下设置配置方法中的Startup cs app UseCookieAuthentication options gt options AuthenticationScheme Cookie
C# 中是否有相当于 php array_merge 的函数

如果不是创建它的最佳方法是什么注意合并不仅仅是附加它融合了相同的键此功能存在于 List 元素上在 C 中数组是固定宽度的项因此在不创建新数组的情况下无法修改大小然而列表却是另一回事你可以做 List
VS Code 不会构建具有多个 .cpp 源文件的 C++ 程序

请注意我在 Ubuntu 17 10 上使用 VS Code 并使用 GCC 编译器我在构建一个使用附加 cpp 文件的简单程序时遇到问题我可能在这里遗漏了一些明显的东西因为我对编程相当陌生但我会解释到目前为止我所做的事情这阻止
CommandBehavior.SequentialAccess 是否有任何性能提升？

我意识到我总是按照索引返回的顺序读取字段使用常量所以据我所知我的代码已经与 CommandBehavior SequentialAccess 兼容如果我打开它会有什么好处吗 DataReader 已经是只向前只读这才是真正的性能
Arduino C++ 析构函数？

我知道在Arduino中你不能使用delete 那么什么时候调用 C 类中定义的析构函数呢同样如果我想创建一个指向数组的指针我必须使用malloc and free 当对象被销毁时析构函数被调用对于自动堆栈上变量它在离开其作
C# 从视频文件的一部分中提取帧

使用 AForge ffmpeg 包装器您可以使用 VideoFileReader 类从视频中提取帧并将其保存为位图请参阅以下示例提取 avi 文件的帧 https stackoverflow com questions 178256
HttpCookie 和 Cookie 的区别？

所以我很困惑因为 msdn 和其他教程告诉我使用 HttpCookies 通过 Response Cookies Add cookie 添加 cookie 但这就是问题所在 Response Cookies Add 只接受 Cookie
是否需要显式事务回滚？

许多例子都主张显式回滚数据库事务大致如下 using var transaction try do some reading and or writing here transaction Commit catch SqlExceptio
L"" 和 u8"" 之间的区别

以下有什么区别吗 auto s1 L 你好 auto s2 u8 你好 Are s1 and s2指的是同一类型如果不是有什么区别以及首选哪一个它们不是同一类型 s2是 UTF 8 或窄字符串文字这C 11标准草案 http www
Mono 的 DNS 刷新超时

虽然目前Mono项目的ServicePointManager类有DnsRefreshTimeout属性启用到其接口中相关属性未实现调用示例 ServicePointManager DnsRefreshTimeout 10 60 1000
为什么指向 int 的指针会转换为 void* 而指向函数的指针会转换为 bool？

C 标准草案 N3337 对指针转换有以下规定 4 10 指针转换 2 指向的指针类型的右值cv T 在哪里T是一个对象类型可以转换为指向的指针类型的右值cv void 将指针转换为cv T 到指向cv void 指向类型对象的
Python 比 C++ 更快、更轻吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
ARM + gcc：不要使用一大块 .rodata 部分

我想使用 gcc 编译一个程序并针对 ARM 处理器进行链接时间优化当我在没有 LTO 的情况下编译时系统会被编译当我启用 LTO 时使用 flto 我收到以下汇编错误错误无效的文字常量池需要更近环顾网络我发现这与我系统
为数据提供有效类型是否会产生副作用？

假设我有一大块动态分配的数据 void allocate size t n void foo malloc n return foo 我希望使用指向的数据foo作为一种特殊类型 type t 但我想稍后再这样做而不是在分配期间这样做为了
C++ 使用枚举调用基类构造函数

是否可以将值和常量枚举传递给类的基本构造函数例如 enum CarBrand Volkswagen Ferrari Bugatti class Car public Car int horsePower CarBrand brand th
Xamarin Mac 中 AttributeName 的用途

我正在尝试对 Xamarin 中的 NSMutableAttributedString 中的子字符串进行着色但它似乎缺少正确的常量我应该在那里放什么 Update 这越来越接近 var s new NSMutableAttributed
编译时检查函数是否使用/未使用 C++

我想在编译时检查是否有某些函数某堂课使用未使用相应地使编译过程失败通过例如如果函数F1在代码中的某处调用我希望编译成功并且 if 函数F2称为我希望它失败关于如何使用预处理器模板或任何其他 C 元编程技术来做到这一点有什么想

随机推荐

java.lang.NullPointerException：使用 QueryDsl 过滤数据时

我正在使用 Spring data jpa 来创建服务在下面的代码中我使用 Querydsl 在网格上实现搜索过滤器但对于建筑物名称我无法过滤网格我正进入状态 java lang NullPointerException nul
Visual Studio 2008、C++ 的探查器？

有什么好的免费的或者至少相当便宜的至少适用于本机 C 的分析器可以与 Visual Studio 2008 专业版我在看社区版但是他们似乎只支持 Visual Studio 2003 和 Visual Studio 2005 如
@NotNull 注释在 Spring boot 应用程序中不起作用

下面是我的 DTO 课程 public class AbstractDTO extends BaseDTO private Integer createdBy JsonFormat shape JsonFormat Shape STRING
如何设置子视图到窗口的视图方向

我创建了一个 UIView 我想将视图子视图添加到 appdelegate 窗口 UIView newView UIView alloc initWithFrame CGRectMake 0 0 1048 748 AppDelegate a
从列表中删除重复的子列表

如果我有一个这样的列表 mylist 1 2 3 a c 3 4 5 1 2 3 4 5 a c 3 4 5 1 2 删除重复子列表的最佳方法是什么现在我用this https stackoverflow com a 20462808 4
Docker COPY 没有这样的文件或目录

构建 docker 映像在复制任务中失败没有这样的文件或目录我正在使用你好世界春天的例子 https spring io guides gs spring boot docker 从 openjdk 构建 8 jdk alpine Ru
Jquery 加载函数将附加到已经存在的 HTML 上

我正在尝试进行 AJAX 调用该调用将附加 html 即向标签之间已存在的内容添加额外的 html 这是我的加载函数的样子我如何修改这个函数才能将其附加到类 tid list 中提前致谢您必须通过ajax获取数据并使用 tid li
在 jQuery 中将 processData 设置为 false 会破坏我的 AJAX 请求

我已经用谷歌搜索了一段时间只能找到什么processData false做我找不到经历过同样问题的人我将 JSON 传递回服务器并且不希望 jQuery 自动将数据转换为查询字符串因此我将 processData 设置为 fals
获取 VBScript 中变量的类型

如何使用 VBScript 获取变量的类型 Is VarType https msdn microsoft com en us library aa263402 v vs 60 aspx你需要什么返回一个指示变量子类型的值 Constan
在区域之外的 MVC 应用程序中托管 WCF 服务

我有一个 MVC 项目我在根目录中添加了一个名为 WCF 的文件夹在此文件夹中我创建了一个名为的 WCF 服务CustomFunctions 当我尝试启动该服务时我收到以下错误错误无法从中获取元数据http localhost
使用 ajax 包含子行的闪亮数据表

我正在尝试使用数据表库来实现更多自定义的闪亮效果这是我试图做的例子 https datatables net examples api row details html https datatables net examples api
AfxGetAppName() 返回垃圾字符

我的应用程序中有以下代码行 CString strAppName AfxGetAppName 有时会充满strAppName出现了垃圾字符我不明白为什么有人有主意吗 TIA 如果你改变的话这是可能的m pszAppName手动在应用程
将字符串列表通过管道传输到 for 循环

我如何将列表传递给for在bash中 I tried echo some different lines for i do echo do something with i done 但这行不通我也试图找到一个解释man但没有man fo
使用 javascript 在循环内设置超时

我正在制作一个解谜函数它使用当前打乱顺序的一系列拼图每个片段都有一个 id 它指向数组中的正确位置我在要交换的部分上设置了叠加颜色我希望在着色和交换的部分之间有一个延迟 function solvePuzzle while rezo
JavaScript/GSON：通过对象图动态访问 JSON 引用（循环引用）

由于存在多个循环引用我在通过 Google GSON 序列化 Java 对象时遇到了问题我所有的尝试都以 StackOverflowException 结束因为 GSON 无法处理这些循环引用作为解决方案我发现以下GraphAda
SELECT FOR UPDATE 中的数据库死锁

我的应用程序间歇性陷入僵局我的应用程序有 1 个表例如 EMPLOYEE ID PK NAME SAL 并且有 2 个会话第一节 SELECT ID NAME SAL FROM EMPLOYEE WHERE SAL SELECT MI
spring mvc 对 URL 参数进行加密和编码

我正在编写一个 Spring mvc 应用程序它需要发送一封包含链接和加密参数的电子邮件用户将单击该链接我需要解密新页面中的参数因此我正在编写一个 util 类来加密和解密以及对参数进行编码和解码当我运行我的独立java类用于
你能告诉 PHP 在发生错误时发送标头（如 500）吗？

在我当前的项目中我使用普通 HTTP 请求查询 PHP 但也通过 AJAX 查询有时返回 JSON 格式的数据有时返回普通文本当发生错误时在正常请求中您会看到错误消息并可以采取一些措施另一方面对于 AJAX 请求您无法确定
getchar() 返回错误的特殊情况是什么？

所以我知道getchar 当输入结束或发生错误时返回 EOF 我也知道我可以通过以下方式检查发生了哪些情况ferror stdin and feof stdin 我想知道什么情况下会特别发生错误我检查了这两个函数的手册页但那里没有任何内
就性能而言，使用 std::memcpy() 还是 std::copy() 更好？

是不是比较好用memcpy如下所示还是使用更好std copy 就性能而言为什么 char bits NULL bits new std nothrow char int copyMe gt bits 0 if bits NULL cou

就性能而言，使用 std::memcpy() 还是 std::copy() 更好？

就性能而言，使用 std::memcpy() 还是 std::copy() 更好？ 的相关文章

随机推荐

热门标签

就性能而言，使用 std::memcpy() 还是 std::copy() 更好？的相关文章