std::vector 中的每个元素访问都是缓存未命中吗？

2024-04-04

据了解std::vector将其数据保存在堆上，因此向量本身的实例和第一个元素具有不同的地址。另一方面，std::array是原始数组的轻量级包装，其地址等于第一个元素的地址。

假设集合的大小足以容纳一个缓存行int32。在我的具有 384kB L1 缓存的机器上，它是 98304 个数字。

如果我迭代std::vector事实证明，我总是首先访问向量本身的地址，然后访问下一个元素的地址。并且这些地址可能不在同一缓存行中。因此，每个元素访问都是缓存未命中。

但如果我迭代std::array地址位于同一高速缓存行中，因此应该更快。

我用VS2013进行了全面优化测试std::array大约快 20%。

我的假设正确吗？

Update:为了不创建第二个类似的主题。在这段代码中，我有一个数组和一些局部变量：

void test(array<int, 10>& arr)
{
    int m{ 42 };

    for (int i{ 0 }; i < arr.size(); ++i)
    {
        arr[i] = i * m;
    }
}

在循环中，我访问数组和堆栈变量，它们在内存中彼此远离。这是否意味着每次迭代我都会访问不同的内存并错过缓存？

您所说的许多事情都是正确的，但我不相信您会以您认为的速度看到缓存未命中。相反，我认为您看到了编译器优化的其他影响。

你是对的，当你在 a 中查找一个元素时std::vector，有两次内存读取：首先，读取指向元素的指针的内存；其次，读取元素本身的内存。但是，如果您对std::vector，那么您执行的第一次读取很可能会在元素上出现缓存未命中，但所有后续读取要么在缓存中，要么是不可避免的。内存高速缓存针对引用局部性进行了优化，因此每当将单个地址拉入高速缓存时，大量相邻的内存地址也会被拉入高速缓存。因此，如果您迭代 a 的元素std::vector，大多数时候根本不会有任何缓存未命中。性能看起来应该与常规阵列非常相似。还值得记住的是，缓存存储多个不同的内存位置，而不仅仅是一个，因此您正在读取堆栈上的内容（std::vector内部指针）和堆中的某些内容（元素）或堆栈上的两个不同元素不会立即导致缓存未命中。

需要记住的是，缓存未命中是极其与缓存命中相比昂贵 - 通常慢 10 倍 - 因此，如果您确实看到缓存的每个元素上存在缓存未命中std::vector您不会看到只有 20% 的性能差距。您会看到更接近 2 倍或更大的性能差距。

那么，为什么您会看到性能差异呢？您尚未考虑的一个重要因素是，如果您使用std::array<int, 10>，那么编译器可以在编译时得知该数组中正好有十个元素，并且可以展开或以其他方式优化循环，您必须消除不必要的检查。事实上，编译器原则上可以用 10 个连续的代码块替换循环，这些代码块全部写入特定的数组元素，这可能比在循环中反复向后分支要快得多。另一方面，使用等效代码std::vector，编译器无法总是提前知道循环将运行多少次，因此它很可能无法生成与为数组生成的代码一样好的代码。

事实上，您在这里编写的代码非常小，任何对其计时的尝试都会产生大量噪音。很难评估其可靠程度，因为与该方法的“冷”运行相比，仅仅将其放入 for 循环这样简单的事情就会扰乱缓存行为。

总的来说，我不会将其归因于缓存未命中，因为我怀疑缓存未命中的数量是否有明显不同。相反，我认为这是对大小静态已知的数组的编译器优化，与对数组的优化相比std::vector其大小只能动态得知。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

std::vector 中的每个元素访问都是缓存未命中吗？的相关文章

为基于架构的 XML 文件创建 WPF 编辑器

这是场景我们的服务器产品之一使用大型 XML 配置文件该文件的布局相当好并且针对 XSD 文件进行了验证现在是时候构建一个配置 GUI 来维护这个文件了我想深入研究 WPF 来完成它我可以为每个配置部分布置一个单独的表单每次向
如何使用 libclang 判断成员函数是 const 还是 volatile？

我有一个实例CXCursor同类CXCursor CXXMethod 我想知道这个函数是否是const or volatile 例如 class Foo public void bar const void baz volatile voi
如何修复此 YCrCb -> RBG 转换公式？

我使用的公式来自这个问题 https stackoverflow com questions 8838481 kcvpixelformattype 420ypcbcr8biplanarfullrange frame to uiimage c
公共基类打破了元组的空基类优化

gcc 4 7 1 对元组进行空基类优化我认为这是一个非常有用的功能然而这似乎有一个意想不到的限制 include
如何在 C# 中创建 PKCS12 .p12 文件？

这可能是一个n00b问题但我在这方面确实没有任何经验我需要创建一个包含 X509 证书和私钥的 p12 捆绑包我当前有两个对象 X509Certificate2 和包含关键信息的 RSAParameters 对象如何将它们合并到 p
无法在 Visual Studio 和 vcpkg 中构建 cmake 项目（致命错误 C1083）

我今天安装了vcpkg 启用了与Visual Studio的集成即 vcpkg集成安装并开始安装库我基本上安装了 cpprestsdk 并触发了 boost 库的安装然后我在 Visual Studio CMake 中打开该项目当
Moq - 是否可以在不使用 It.IsAny 的情况下设置模拟

我一直使用 Moq 进行单元测试有时我会嘲笑有很多参数的方法想象一下这样的方法 public class WorkClient public void DoSomething string itemName int itemCount
如何使用 Selenium Webdriver .NET 绑定设置 Chrome 首选项？

这是我正在使用的用户代理可以成功设置而下载首选项则不能 Windows 7 Chrome 26 Selenium dotnet 2 31 2 chromedriver win 26 0 1383 0 ChromeOptions chro
VS C# 中的依赖地狱，找不到依赖项

我创建了一个图表 C 库我们称之为chartlibrary 它本身依赖于多个第三方 dll 文件在另一个可执行项目中我们称之为chartuser 我参考了chartlibrary项目两个项目位于 Visual Studio 中的同一
这个元组创建习惯有名字吗？

On the 增加邮件列表 http lists boost org Archives boost 2014 06 214213 php LouisDionne 最近发布了以下创建类似元组的实体的巧妙技巧 include
C# 中的类和模块有什么用

有人可以解释一下类和模块之间的区别吗你什么时候使用其中一种而不是另一种我正在使用 C 更新我的意思是相当于 VB 模块的 C 版本这在很大程度上取决于您所指的模块 Visual Basic 的模块 C 中没有真正等效的 VB Ne
PowerShell 与 MongoDB C# 驱动程序方法不兼容？

由 C 泛型引起的最新 MongoDB 驱动程序的问题 Cannot find an overload for GetCollection and the argument count 1 我可能可以使用其他没有泛型的 GetCollect
在 boost 元组、zip_iterator 等上使用 std::get 和 std::tie

我有哪些使用选择std get lt gt and std tie lt gt 与增强结构一起例子我想使用基于范围的 for 循环在多个容器上进行迭代我可以实施zip函数它使用boost zip iterator include
如何在RcppParallel中调用用户定义的函数？

受到文章的启发http gallery rcpp org articles parallel distance matrix http gallery rcpp org articles parallel distance matrix 我
来自用户定义文字的整数字符序列，以字符串作为参数

目前只有双精度数可以在用户定义的文字中生成字符模板 template
没有 FPU 的处理器中的浮点计算

是否可以在没有浮点单元的嵌入式处理器中执行浮点运算是的您只需要在软件中完成即可你的编译器可能会提供支持 http gcc gnu org onlinedocs gccint Soft float library routines ht
在 C++ 中什么时候首选传递指针而不是引用传递？

我可以想象一种情况其中输入参数可以为 NULL 以便首选传递指针而不是传递引用有人可以添加更多案例吗在传递的对象实际上将被修改的情况下有些人更喜欢传递指针当对象通过引用传递时它们使用 pass by const referenc
曲线/路径骨架二值图像处理

我正在尝试开发一个可以处理图像骨架的路径曲线的代码我想要一个来自两点之间骨架的点向量该代码在添加一些点后结束我没有找到解决方案 include opencv2 highgui highgui hpp include opencv2
查找文本文件中每行的行大小

如何计算每行中的字符或数字数量是否有类似 EOF 的东西更像是行尾您可以遍历行中的每个字符并不断增加计数器直到行尾 n 遇到确保以文本模式打开文件 r 而不是二进制模式 rb 否则流不会自动将不同平台的行结束序列转换为 n 人物这是
从最大到最小的3个整数

我是 C 初学者我使用编程使用 C 的原理与实践第二版问题如下编写一个程序提示用户输入三个整数值然后以逗号分隔的数字顺序输出这些值如果两个值相同则应将它们排列在一起 include

随机推荐

使用 cblas 库时出现“对‘cblas_ddot’的未定义引用”

我正在测试 cblas ddot 我使用的代码来自link https stackoverflow com questions 14470799 calling ddot function in blas library我将其修复为 inc
为什么当我添加产品图像代码时不支持“产品名称”并且“列“产品名称”不允许为 NULL；SQL 语句：”[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 i am not add any null in productName but error org hibernate exception
用户输入是否进入控制器或模型？

现在我已经拆分了模型但我的控制器和视图仍然组合在一个 12k 行文件中我一直在寻求为此创建一个真正的 MVC 系统拆分视图但是在寻找要拆分的内容时我注意到我的控制器正在执行大量可能属于模型的工作例如假设我有 if isset
IE7 一段时间后停止发出网络请求

我们的 asp net 系统是一个更大系统的一部分它是通过这个更大的系统从 javascript 启动的该系统执行 window open 调用来打开一个新窗口此外身份验证数据等通过加密的查询字符串参数传递到我们的系统当使用 IE
Windows - 使用 perl 监视目录中是否有新文件删除/创建

寻找一种方法来监视目录中新文件的创建或删除因此如果我有一个文件夹 c temp 并且在其中复制创建了 abc txt 我需要一个事件或其他内容以便我可以拾取该文件然后处理它另外我想持续监控这个文件夹我怎样才能做到这一点我正在
使用 AVAudioRecorder 看似随机的文件损坏（有时文件无法播放） - iOS

在我目前正在开发的应用程序中我或多或少遇到了障碍在应用程序中您可以进入一个视图该视图在标准表格视图中列出所有本地保存的音频文件从这里您可以单击它们来播放它们或者点击下面的录制按钮来制作新的录音该录音随后会自动保存到应用程序沙
Android：Listview的弹跳到scrollview

有什么方法可以将ListView的弹跳效果添加到常规滚动视图中吗我所说的弹跳是指当您到达列表底部时类似橡皮筋的效果在android中为listview添加效果反弹 Step 1 在com base view包中创建新文件BounceLi
在 vaadin 8 中将文本复制到剪贴板

我想问如何在 vaadin 8 java web 应用程序中正确地将一些文本复制到剪贴板我找到了适用于 Chrome 和 IE 的解决方案但不适用于 Firefox Firefox 总是提示错误 document execComman
JqGrid 单元格中的选择框

我试图让选择框位于特定的单元格中我的复选框显示得很好但选择框没有显示 list5 jqGrid datatype local width 100 height 100 colNames Universe1 Connect String1
从更高的时间范围获取历史值

我构建了一个自定义指标并使用蜡烛顶部的点绘制了它们当一个点与另一个点满足特定标准时我会绘制一条连接它们的趋势线这样可行我想做的是从更高的时间范围增加这些线因为我通常在 5m 上进行交易意思是如果每日时间范围内的这些点符合标准
jquery加载大数据

我有一个返回数据的 Web 服务数据集相当大可能有 600 行 20 列在 Jquery 代码中将此数据加载到 html 表中最快最有效的方法是什么我尝试通过循环返回的数据并在字符串中创建表 DOM 来创建表 html 但循环部分非
遵循 JSON-LD API 中的所有链接

假设我想使用一个返回 JSON LD 的 API 并跟踪所有链接我正在尝试Hydra API 演示 http www markus lanthaler com hydra api demo 但它应该适用于所有 JSON LD API 而不
ListView 中的 WPF ListView

我确信我错过了一些简单明显的东西但我似乎无法在 ListView 中绑定 ListView 的数据
Java 中的 Thread.Sleep 替代方案

有人告诉我使用Thread Sleep 有时人们希望在同步方法的操作循环中设置一些时间间隔这是一个糟糕的解决方案另一方面我有两个不同的线程它们在程序运行期间处于活动状态还有一个共享对象当我在该共享对象中使用 Object wa
是否有像 pygccxml 一样的 Python Clang 包装器来包装 GCC-XML？

很长一段时间以来我一直在使用 pygccxml 来解析和内省我的 C 源代码它帮助我在构建过程中进行一些巧妙的代码生成最近我读了很多关于 LLVM 堆栈的好处特别是 LLVM Clang 解析器给 C 编译带来的好处我现在想知道
如何在 Debian 上升级 glibc？

我听说我可以使用apt get install libc6 但我需要向 etc apt sources list 添加一些内容才能接收最新的 glibc 版本我应该怎么办我能够安装libc6 2 17 in Debian Wheezy通
3D饼图：图例太大

传说的问题太大了当我改变cex的数量时字体太小盒子仍然很大希望盒子和测试可以搭配不会太小也不会太大 table lt data frame num c 90 26 28 39 98 countries c India Sri La
Parse.com：如何为 Fragment 内的 Parse ListView 添加搜索过滤器

我正在尝试为选项卡片段内的 ListView 添加搜索过滤器使用适配器从解析服务器调用数据我的片段java文件如下跑车 java import android os Bundle import android text Editabl
如何使 Hibernate @Lock 注释适用于 Oracle DB？

我偶然发现 Oracle DB 中锁定行的问题锁的目的是防止多个事务从数据库读取数据因为这些数据会影响新数据的生成并且会在事务中发生更改为了进行锁定我将 Lock 注释放在 SpringData find 方法上该方法检索参与事
std::vector 中的每个元素访问都是缓存未命中吗？

据了解std vector将其数据保存在堆上因此向量本身的实例和第一个元素具有不同的地址另一方面 std array是原始数组的轻量级包装其地址等于第一个元素的地址假设集合的大小足以容纳一个缓存行int32 在我的具有 384kB

std::vector 中的每个元素访问都是缓存未命中吗？

std::vector 中的每个元素访问都是缓存未命中吗？ 的相关文章

随机推荐

热门标签

std::vector 中的每个元素访问都是缓存未命中吗？的相关文章