std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？

2024-01-08

EDIT:我又添加了两个基准测试，以比较 realloc 与 C 数组的使用以及 Reserve() 与 std::vector 的使用。从最后的分析看来，realloc 的影响很大，即使只调用了 30 次。检查文档，我猜这是因为 realloc 可以返回一个全新的指针，复制旧的指针。为了完成该场景，我还添加了用于在初始化期间完全分配数组的代码和图表。区别于reserve()是有形的。

编译标志：只有图中描述的优化，使用 g++ 编译，仅此而已。

原问题：

我做了一个基准std::vector与新/删除数组相比，当我添加 10 亿个整数时，第二个代码比使用向量的代码快得多，尤其是在打开优化的情况下。

我怀疑这是由于向量内部调用realloc太多次造成的。如果向量每次被填充时大小不会增加一倍（这里数字 2 没有什么特别的，重要的是它的大小呈几何级数增长），就会出现这种情况。在这种情况下，对 realloc 的调用只会是O(log n)代替O(n).

如果这就是导致第一个代码缓慢的原因，我如何告诉 std::vector 以几何级数增长？

请注意，在这种情况下调用reserve一次可以工作，但在提前不知道push_back的数量的更一般情况下则不行。

黑线

#include<vector>

int main(int argc, char * argv[]) {
    const unsigned long long size = 1000000000;

    std::vector <int> b(size);
    for(int i = 0; i < size; i++) {
        b[i]=i;
    }    
    return 0;
}

蓝线

#include<vector>

int main(int argc, char * argv[]) {
    const int size = 1000000000;    
    std::vector <int> b;
    for(int i = 0; i < size; i++) {
        b.push_back(i);
    }    

    return 0;
}

绿线

#include<vector>

int main(int argc, char * argv[]) {
    const int size = 1000000000;
    std::vector <int> b;
    b.reserve(size);
    for(int i = 0; i < size; i++) {
        b.push_back(i);
    }    

    return 0;
}

red line

int main(int argc, char * argv[]) {
    const int size = 1000000000;
    int * a = new int [size];
    for(int i = 0; i < size; i++) {
        a[i] = i;
    }
    delete [] a;   
    return 0;
}

橙色线

#include<vector>

int main(int argc, char * argv[]) {
    const unsigned long long size = 1000000000;
    int * a = (int *)malloc(size*sizeof(int));
    int next_power = 1;
    for(int i = 0; i < size; i++) {
        a[i] = i;
        if(i == next_power - 1) {
            next_power *= 2;
            a=(int*)realloc(a,next_power*sizeof(int));
        }
    }
    free(a);
    return 0;
}

编辑：检查.capacity()正如所建议的，我们看到增长确实是指数级的。那么为什么向量这么慢呢？

优化后的C风格数组被优化为无。

上神螺栓 https://godbolt.org/g/nUGn9c:

xorl %eax, %eax
retq

这就是程序。

每当你的程序优化到接近 0 秒时，你就应该考虑这种可能性。

优化器发现您没有对分配的内存进行任何操作，注意到未使用的分配内存可能具有零副作用，并消除了分配。

并且写入内存然后不读取它也具有零副作用。

相比之下，编译器很难证明向量的分配是无用的。也许编译器开发人员可以教它识别未使用的 std 向量，就像识别未使用的原始 C 数组一样，但这种优化确实是一个极端情况，根据我的经验，它会导致很多分析问题。

请注意，任何优化级别的带有保留的向量与未优化的 C 风格版本的速度基本上相同。

在C风格的代码中，唯一需要优化的是“不做任何事情”。在矢量代码中，未优化的版本充满了额外的堆栈帧和调试检查，以确保您不会超出范围（如果超出范围，则干净地崩溃）。

请注意，在 Linux 系统上，分配大块内存除了修改虚拟内存表外不会执行任何操作。只有当内存被触及时，它才会真正为你找到一些归零的物理内存。

如果没有保留，std 向量必须猜测初始的小尺寸，调整其大小并复制它，然后重复。这会导致 50% 的性能损失，这对我来说似乎是合理的。

有了保留，它实际上就完成了工作。这项工作只需不到 5 秒。

通过推回添加到向量确实会导致它呈几何级数增长。几何增长导致每条数据生成 2-3 个副本的渐近平均值。

至于 realloc，std::vector 确实not重新分配。它分配一个新的缓冲区，并复制旧数据，然后丢弃旧数据。

Realloc 尝试增大缓冲区，如果不能，则按位复制缓冲区。

对于按位复制类型来说，这比 std 向量更有效。我敢打赌 realloc 版本实际上永远不会复制；总是有内存空间可以将向量增长到其中（在实际程序中可能并非如此）。

标准库分配器中缺少 realloc 是一个小缺陷。你必须为它发明一个新的 API，因为你希望它能够用于非按位复制（类似于“尝试增加分配的内存”，如果失败，则由你来增加分配）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？的相关文章

查找哪些页面不再与写入时复制共享

假设我在 Linux 中有一个进程我从中fork 另一个相同的过程后forking 因为原始进程将开始写入内存 Linux写时复制机制将为进程提供与分叉进程使用的不同的唯一物理内存页在执行的某个时刻我如何知道原始进程的哪些页面已被写
为什么libc++的shared_ptr实现使用完整内存屏障而不是宽松内存屏障？

在boost的实现中shared ptr 它用放松内存排序以增加其引用计数 https github com boostorg smart ptr blob master include boost smart ptr detail sp
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
使用具有现有访问令牌的 Google API .NET 客户端

用例如下移动应用程序正在通过 Google 对用户进行身份验证并且在某些时候我们需要将用户的视频发布到他的 YouTube 帐户出于实际原因实际发布应该由后端完成已经存储在那里的大文件由于用户已经通过应用程序的身份验证因此应
如何从 C# 控制器重定向到外部 url

我使用 C 控制器作为网络服务在其中我想将用户重定向到外部网址我该怎么做 Tried System Web HttpContext Current Response Redirect 但没有成功使用控制器的重定向 http msdn
检查算术运算中的溢出情况[重复]

这个问题在这里已经有答案了可能的重复检测 C C 中整数溢出的最佳方法 https stackoverflow com questions 199333 best way to detect integer overflow in c
IronPython：没有名为 json 的模块

我安装了 IronPython 我的 python 文件如下所示 import sys print sys version import json 运行它的代码 var p Python CreateEngine var scope p C
如何识别 WPF 文本框中的 ValidationError 工具提示位置

我添加了一个箭头来指示工具提示中的文本框当文本框远离屏幕边缘时这非常有效但是当它靠近屏幕边缘时工具提示位置发生变化箭头显示在左侧 Here is the Image Correct as expected since TextBo
如何从网站下载 .EXE 文件？

我正在编写一个应用程序需要从网站下载 exe 文件我正在使用 Visual Studio Express 2008 我正在使用以下代码 private void button1 Click object sender EventArgs
C 语言中 =+（等于加）是什么意思？

我碰到与标准相反今天在一些 C 代码中我不太确定这里发生了什么我在文档中也找不到它 In ancientC 版本相当于它的残余物与最早的恐龙骨头一起被发现例如 B 引入了广义赋值运算符使用x y to add y to x
为什么我不应该对不是由 malloc() 分配的变量调用 free() ？

我在某处读到使用它是灾难性的free删除不是通过调用创建的对象malloc 这是真的为什么这是未定义的行为永远不要尝试它让我们看看当您尝试时会发生什么free 自动变量堆管理器必须推断出如何获取内存块的所有权为此它要么必须使
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
将构建日期放入“关于”框中

我有一个带有关于框的 C WinForms 应用程序我使用以下方法将版本号放入关于框中 FileVersionInfo GetVersionInfo Assembly GetExecutingAssembly Location F
如何挤出平面 2D 网格并赋予其深度

我有一组共面连接的三角形即二维网格现在我需要将其在 z 轴上挤出几个单位网格由一组顶点定义渲染器通过与三角形数组匹配来理解这些顶点网格示例顶点 0 0 0 10 0 0 10 10 0 0 10 0 所以这里我们有一个二维正方
获取 2 个数据集 c# 中的差异

我正在编写一个简短的算法它必须比较两个数据集以便可以进一步处理两者之间的差异我尝试通过合并这两个数据集并将结果更改放入新的数据集来实现此目标我的方法如下所示 private DataSet ComputateDiff DataSet
System.Runtime.InteropServices.COMException（0x80040154）：[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 C 项目中遇到异常 System Runtime InteropServices COMException 0x80040154 检
有没有一种简单的方法可以让 Visual Studio 2015 使用特定的 ToolsVersion？

使用特定版本构建项目或解决方案时msbuild我可以使用以下命令选择早期的 net 工具链 toolsversion or tv switch C Program Files x86 MSBuild 14 0 bin msbuild tv
当前的 x86 架构是否支持非临时加载（来自“正常”内存）？

我知道有关此主题的多个问题但是我没有看到任何明确的答案或任何基准测量因此我创建了一个处理两个整数数组的简单程序第一个数组a非常大 64 MB 第二个数组b很小无法放入 L1 缓存程序迭代a并将其元素添加到相应的元素中b在模块化
剪贴板在 .NET 3.5 和 4 中的行为有所不同，但为什么呢？

我们最近将一个非常大的项目从 NET Framework 3 5 升级到 4 最初一切似乎都工作正常但现在复制粘贴操作开始出现错误我已经成功制作了一个小型的可复制应用程序它显示了 NET 3 5 和 4 中的不同行为我还找到了一种解
使用 CSharpCodeProvider 类编译 C# 7.3 的 C# 编译器版本是什么？

我想使用 Microsoft CSharp CSharpCodeProvider 类来编译 C 7 3 代码编译器版本在 IDictionary 中指定在创建新的 CSharpCodeProvider 时将其作为输入例如 Compil

随机推荐

iOS 8 Swift Xcode 6 - 设置顶部导航栏背景颜色和高度

我到处查看并测试了 Stack 上发布的所有代码片段但没有任何东西对我有用因为我需要它工作我只是想设置导航栏高度导航栏背景颜色 RGB 导航栏居中徽标我正在使用 iOS8 Xcode 6 和 Swift 非常感谢您的明确答复这
Tmux：如何使用选择树过滤当前会话窗口并格式化输出以显示不带主机名的窗口名称

我想配置tmux choose tree to 仅显示我当前会话的窗口但与此同时我想保留我当前使用的格式不带主机名的窗口名称我当前的设置是 bind key w choose tree F window name 看起来像这样我发现
将删除导航栏边框转换为 swift

我正在尝试快速删除导航栏边框这是通过在 Objective C 中使用以下代码来完成的 UINavigationBar appearance setShadowImage UIImage alloc init UINavigationBa
使用超类静态方法获取子类的实例

我有一个超类我想转发一个名为的静态方法getInstance 到所有子类创建子类的实例时我然后在超类中注册该实例可能使用哈希表其中键基于getClass 然后我希望使用前面提到的静态方法 getInstance 其中超类方法将返
PHP 中使用特殊字符对数组进行排序

我有一个包含西班牙语语言名称的数组 lang ko coreano korean lang ar rabe arabic lang es espa ol spanish lang fr franc s french 我需要对数组进行排序并维
跳过配置文件“main/binary-i386/Packages”的获取

下午好请告诉我我做错了什么我刚在电脑上安装了Linux Ubuntu 但仍然对它一无所知我尝试安装 PostreSQL 和 pgAdmin 我按照这个视频教程安装的https www youtube com watch v Vdzb7
Perl：打印传递给子例程的数组名称

我将一个数组和一个标量传递给一个函数以检查该值是否属于数组的一部分如果它不是数组的一部分则将其推送到数组出于参考目的它必须显示的是在推动它时必须显示数组的名称这是我的代码 use v5 10 1 use strict use w
Angular2 Rxjs 404错误

尝试启动 Angular2 应用程序时出现以下错误 Failed to load resource the server responded with a status of 404 Not Found angular2 polyfills
文件写入在程序流程中应该发生时却没有发生

这对我来说不是一个新问题从 C 到 PERL 再到 Windows Mobile Windows XP 和其他 Windows 版本上的 Python 这个问题一直存在让我心烦意乱现在在我最新的脚本中这种情况再次发生更具体地说
使用 Expo 时如何忽略 fetch() 调用中的 SSL 证书问题？

似乎反应原生无法在 fetch 调用期间禁用 SSL 验证有人提到here https stackoverflow com questions 51130878 how to disable ssl check in react nati
使用小数分隔符和可选的千位分隔符匹配数字的正则表达式

我需要使用小数分隔符和千位分隔符可选来验证数字是否有效我需要一个正则表达式因为当前的代码不是由我完成的使用的正则表达式无法正常工作我的目标是修复它因此以下组合是合法的使用作为小数点分隔符和作为千位分隔符 10000 10
如何在 Spring DM 中获取 BundleContext？

我刚刚接触 Spring DM 我想访问 Bundlecontext 我的问题是我有一个包含 Activator 的捆绑包但它没有 xml 配置文件我无法触及这个捆绑包那么我需要访问 BundleContext 和 serviceRe
CSS/Flexbox：仅显示容器中容纳的尽可能多的项目

我的目标是构建一个面包屑样式组件其中显示项目的水平列表每个项目都有最大宽度如果宽度不足以显示项目则从列表开头省略项目优先考虑last列表中的项目所有布局仅通过 CSS 实现没有 JS 调整大小观察器等 Flexbox 似乎是
如何检查Selenium WebDriver下载的文件？

我使用 C 在 Selenium webdriver 中编写了一个自动化测试其中一个步骤需要从服务器下载 XLSX 文件如何验证文件是否已成功下载并获取其名称 Regards 我通过以下源代码找到了解决方案 string current
包含服务器上任何位置的文件

我的网站在生产服务器上完美运行我已将其移至另一个网络服务器 VPS 让我用例子来解释一下目录结构 includes header php business index php some other files index2 php 在我
插入python数组以最小化元素之间的最大差异

插值一维数组以使元素之间的最大差异最小化的简洁且可读的方法是什么例如如果我有数组 4 9 13 25 并且允许我再添加 1 个数字以最小化元素之间的最大差异我会在 13 和 25 之间插入 19 最大差异现在是 6 而不是 12 当然
在 MVC 中使用 ASP.NET 服务器控件？

在我当前的项目中我需要添加一项功能允许用户查看其上传的 PDF 的缩略图我找到了一个方便的组件 http www tallcomponents com pdfthumbnail aspx就实现了这一点基本版本是免费的但足以满足我当
为什么原始类型有一个“类”，它是如何使用的？

谈论 Java 7 您可以获得一个基本类型的类如下所示 Class classOfInt int class 对于每一个您都会得到一个名为原始类型的类 int class gt int byte class gt byte doubl
使用类包装器和 __new__ 装饰类

Code import functools class MyInt1 int def new cls x value print MyInt1 new cls x value return super new cls x base 2 de
std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？

EDIT 我又添加了两个基准测试以比较 realloc 与 C 数组的使用以及 Reserve 与 std vector 的使用从最后的分析看来 realloc 的影响很大即使只调用了 30 次检查文档我猜这是因为 realloc

std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？

std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？ 的相关文章

随机推荐

热门标签

std::vector 的性能不佳是否是由于未调用 realloc 对数次数所致？的相关文章