哪个对缓存最友好？

2024-04-27

我试图很好地掌握面向数据的设计以及如何在考虑缓存的情况下进行最佳编程。基本上有两种情况我无法完全确定哪个更好以及为什么 - 是拥有一个对象向量更好，还是拥有对象原子数据的多个向量更好？

A）对象向量示例

struct A
{
    GLsizei mIndices;
    GLuint mVBO;
    GLuint mIndexBuffer;
    GLuint mVAO;

    size_t vertexDataSize;
    size_t normalDataSize;
};

std::vector<A> gMeshes;

for_each(gMeshes as mesh)
{
    glBindVertexArray(mesh.mVAO);
    glDrawElements(GL_TRIANGLES, mesh.mIndices, GL_UNSIGNED_INT, 0);
    glBindVertexArray(0);

    ....
}

B）具有原子数据的向量

std::vector<GLsizei> gIndices;
std::vector<GLuint> gVBOs;
std::vector<GLuint> gIndexBuffers;
std::vector<GLuint> gVAOs;
std::vector<size_t> gVertexDataSizes;
std::vector<size_t> gNormalDataSizes;

size_t numMeshes = ...;

for (index = 0; index++; index < numMeshes)
{
    glBindVertexArray(gVAOs[index]);
    glDrawElements(GL_TRIANGLES, gIndices[index], GL_UNSIGNED_INT, 0);
    glBindVertexArray(0);

    ....
}

哪一种内存效率更高且缓存友好，从而减少缓存未命中并提高性能，为什么？

根据您所讨论的缓存级别的不同，缓存的工作原理如下：

如果数据已经在缓存中，那么访问速度很快
如果数据不在缓存中，那么您会产生成本，但是整个缓存行（或页面，如果我们谈论 RAM 与交换文件而不是缓存与 RAM）都会被带入缓存，因此靠近丢失地址的访问将不要错过。
如果幸运的话，内存子系统将检测顺序访问并预取它认为您将需要的数据。

所以天真地要问的问题是：

发生了多少次缓存未命中？ -- B 获胜，因为在 A 中，您为每条记录获取了一些未使用的数据，而在 B 中，您只在迭代结束时获取了一个小的舍入误差。因此，为了访问所有必要的数据，假设有大量记录，B 会获取较少的缓存行。如果记录数量微不足道，那么缓存性能可能与代码的性能几乎没有关系或根本没有关系，因为使用足够少量数据的程序会发现它始终都在缓存中。
访问是顺序的吗？ -- 两种情况都是如此，尽管在情况 B 中可能更难检测到，因为有两个交错序列而不是只有一个。

所以，我有点希望 B 更快对于这段代码。然而：

如果这是对数据的唯一访问，那么您可以通过从 A 中删除大部分数据成员来加速 Astruct。所以就这么做吧。事实上，它可能不是对程序中数据的唯一访问，其他访问可能会以两种方式影响性能：它们实际花费的时间，以及它们是否用您需要的数据填充缓存。
我的预期和实际发生的情况经常是不同的事情，如果你有能力进行测试，那么依赖猜测就没有什么意义。在最好的情况下，顺序访问意味着任一代码中都没有缓存未命中。测试性能requires没有特殊的工具（尽管它们可以让事情变得更容易），只是一个带有秒针的时钟。必要时，用手机充电器制作一个钟摆。
有一些并发症我忽略了。根据硬件的不同，如果 B 不幸运，那么在最低缓存级别，您可能会发现对一个向量的访问正在逐出对另一向量的访问，因为相应的内存恰好使用缓存中的相同位置。这会导致两次缓存未命中每条记录。这只会发生在所谓的“直接映射缓存”上。 “双向缓存”或更好的方式可以挽救局面，通过允许两个向量的块共存，即使它们在缓存中的第一首选位置相同。我不认为PC硬件通常使用直接映射缓存，但我不确定并且我对GPU了解不多。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

OpenGL

caching

memorymanagement

dataorienteddesign

哪个对缓存最友好？的相关文章

起订量要求？违背了目的？

是否需要虚拟化您想要模拟的所有属性访问器就违背了模拟的目的我的意思是如果我必须修改我的对象并虚拟化我想要模拟的每个访问器我难道不能继承我的类并自己模拟它吗你的问题非常有效但如果你仔细想想没有其他方法可以模拟课程如果你采用一个接
如何从RichTextBox中获取显示的文本？

如何获得显示的RichTextBox 中的文本我的意思是如果 RichTextBox 滚动到末尾我只想接收那些对我来说可见的行 P S 获得第一个显示的字符串就足够了您想使用 RichTextBox GetCharIndexFrom
使用API隐藏程序标题栏

它可以使用 c 和 windows api 删除窗口控制台标题栏如果是的话如何请这个简单的应用程序隐藏并显示其所在控制台的标题栏它会立即将控制台标题更改为 guid 以查找窗口句柄然后它使用 ToggleTitleBar 使用找
是否允许将类模板类型参数键入相同的名称？

这似乎可以在 MSVC 中按预期编译甚至工作但它是合法的 C 代码吗它是否能保证执行此处所期望的操作即将模板类型导出到结构体的同名用户 template
用户控件内所有控件均为空

我有一个 UserControl 它使用 UserControl 以及其他控件 In the ascx文件我有以下代码
静态类变量与外部变量相同，只是具有类作用域吗？

在我看来静态类变量与外部变量相同因为你只需要declare它在static int x extern int x语句并在其他地方实际定义它通常在 cpp 文件中静态类变量 h file class Foo static int x
有没有办法使用 i387 fsqrt 指令获得正确的舍入？

有没有办法使用 i387 fsqrt 指令获得正确的舍入除了改变精确模式在 x87 控制字中我知道这是可能的但这不是一个合理的解决方案因为它存在令人讨厌的重入型问题如果 sqrt 操作中断精度模式将出错我正在处理的问题如下 x
存储过程上的 OdbcCommand - 输出参数上出现“未提供参数”错误

我正在尝试执行存储过程通过 ODBC 驱动程序针对 SQL Server 2005 但收到以下错误过程或函数 GetNodeID 需要参数 ID 但未提供该参数 ID 是我的过程的 OUTPUT 参数在存储过程中指定了一个输入 mac
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
默认值 C# 类 [重复]

这个问题在这里已经有答案了我在控制器中有一个函数并且我收到表单的信息我有这个代码 public Actionresult functionOne string a string b string c foo 我尝试将其转换为类似的类
无法加载文件或程序集“EntityFramework，版本=6.0.0.0”

我究竟做错了什么我该如何解决这个问题我有一个包含多个项目的解决方案它是一个 MVC NET 4 5 Web 应用程序在调试模式下启动后调用其中一个项目时出现此错误导致此错误的项目具有以下参考两个都是版本6 0 0 0 应用程序
正确使用“extern”关键字

有一些来源书籍在线材料解释了extern如下 extern int i declaration has extern int i 1 definition specified by the absence of extern 并且有支
不兼容的类型 - 是因为数组已经是指针吗？

在下面的代码中我创建一个基于书籍结构的对象并让它保存多个书籍我设置的是一个数组即定义启动的对象然而每当我去测试我对指针的了解实践有帮助并尝试创建一个指向创建的对象的指针时它都会给我错误 C Users Justin D
如何使用收益返回和递归获得字母的每个组合？

我有几个像这样的字符串列表可能有几十个列表 1 A B C 2 1 2 3 3 D E F 这三个仅作为示例用户可以从几十个具有不同数量元素的类似列表中进行选择再举个例子这对于用户来说也是一个完全有效的选择 25 empty 4 1
相当于 C# 中 Java 的“ByteBuffer.putType()”

我正在尝试通过从 Java 移植代码来格式化 C 中的字节数组在 Java 中使用方法 buf putInt value buf putShort buf putDouble 等等但我不知道如何将其移植到 C 我尝试过 MemoryS
TPL 数据流块下游如何获取源生成的数据？

我正在使用 TPL Dataflow 处理图像我收到处理请求从流中读取图像应用多次转换然后将生成的图像写入另一个流 Request gt Stream gt Image gt Image gt Stream 为此我使用块 Buff
ASP.NET Core Razor Page 多路径路由

我正在使用 ASP NET Core 2 0 Razor Pages 不是 MVC 构建系统但在为页面添加多个路由时遇到问题例如所有页面都应该能够通过 abc com language 访问segment shop mypage 或
C# 粘贴到文本框时检查剪贴板中的字符

有没有一些方法可以在粘贴到文本框 C 之前仅检查剪贴板中的字符 Ctrl V 和右键单击 gt 粘贴但不使用 MaskedTextbox 在文本框文本更改中添加规则以仅接受数字例如 private string value privat
启动画面后主窗口出现在其他窗口后面

我有一个带有启动屏幕的 Windows 窗体应用程序当我运行该应用程序时启动屏幕显示正常消失并加载应用程序的主窗体但是当我加载主窗体时它出现在包含该应用程序的 Windows 资源管理器目录下这是运行启动画面然后运行主窗体的代
无法使 Polly 超时策略覆盖 HttpClient 默认超时

我正在使用 Polly 重试策略并且正如预期的那样在重试过程中HttpClient达到 100 秒超时我尝试了几种不同的方法来合并 Polly 超时策略将超时移至每次重试而不是总计但 100 秒超时仍然会触发我读过大约 5 个

随机推荐

主函数抱怨返回非 IO monad

import Debug Trace main do trace Main function parses and returns 0 return 这会引发错误 app hs 3 1 Couldn t match expected typ
如何在 Docker 容器中运行 Nginx 而不停止？

我在 Docker 容器上安装了 Nginx 并尝试像这样运行它 docker run i t p 80 80 mydockerimage usr sbin nginx 问题是 Nginx 的工作方式是初始进程立即生成一个 Nginx 主
使用 wp_read_audio_metadata()

我正在尝试从 WordPress 中的 mp3 文件获取一些元数据特别是长度变量这是我的一些代码这里没有显示但我已经包含了 wp admin includes media php 文件当我查看我的页面时http beta open
如何从函数调用事件处理程序？

我有一个类我从中调用一个函数ABC string st 带字符串参数该函数定义在一个Form class Form1 我有一个列表视图想要从函数中自动调用列表视图 mouse click 事件我该如何做到这一点您不能调用另一个类的
python lxml 我如何在项目名称中使用标签？

我需要使用项目的特殊名称构建 xml 文件这是我当前的代码 from lxml import etree import lxml from lxml builder import E wp E wp tmp wp title print
Array.filter 与 $filter('filter')

我应该在 Angular 应用程序中使用哪一个为什么 array filter o gt o name myName or filter filter array name myName true 关键的区别是快捷方式或语法糖由提供 fi
如何将 VBScript 转换为可执行 (EXE) 文件？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我四处寻找转换 VBScript 的信息 vbs 到可执行文件并意识到大多数可用的工具实际上是将脚本包装在可执行文件中尝试了一些工
包含多个双引号的 CSV 拆分正则表达式

我有一个包含文本的 CSV 列数据每行用双引号分隔一行中的示例文本类似于此 notice 新行和每行之前的空格是故意的 Lorem ipsum dolor sit amet consectetur adipisicing elit se
我可以在 python 中获得没有 echo 的控制台输入吗？

我可以在 python 中获取没有 echo 的控制台输入吗 Use getpass http docs python org library getpass html gt gt gt from getpass import getpas
Primefaces 中的过滤数据表仅有效一次

我正在尝试使用 Primefaces 过滤数据表就像这个例子 http www primefaces org showcase ui datatableFiltering jsf 在网络浏览器中我输入要过滤的文本它会工作一次但是当我
Python Asyncio 子进程永远不会完成

我有一个简单的 python 程序我用它来测试带有子进程的 asyncio import sys time for x in range 100 print processing s 100 x sys stdout flush prin
cmd的字符集

C Users Kolink gt php r echo C Users Kolink gt echo 正如你所看到的一个程序输出一个结果是但使用echo命令给出所需的字符并且我可以配置 PHP 也许是脚本开头的某个命令来输出正
需要新版本后 Firebase 参考为空

The new 文档 https firebase google com docs database server start authenticate with admin privileges提供了一种初始化 firebase 的简单方
什么是受污染的对象，我们什么时候应该清除它们？

什么时候需要对 Ruby 对象进行污染什么时候应该消除它们的污染受污染对象的概念如何使 Ruby 脚本在安全模式下运行任何人都可以详细说明这一点通过一些代码片段使概念清晰吗什么是污染根据定义用户输入被污染了例如 string
jQuery UI、可拖动、可放置、自动滚动

我有一组可放置的 li 元素它接受可拖动的图标项目列表位于可滚动的 div 元素中我在这里整理了一个简单的例子 http www nerdydork com demos dragscroll http www nerdydork co
当用另一个图像替换它时，防止悬停时图像闪烁（CSS）

当我在页面加载后第一次将光标悬停在徽标上时它开始快速闪烁大约一秒钟我考虑过使用精灵但我不想将徽标设置为背景图像我已经有了一个这是我的 CSS 代码
R Shiny - 将 csv 下载到工作目录

我有一个 Shiny 应用程序我想在其中完成以下任务 1 用户按下按钮 2 数据框导出为 csv 保存在工作目录包含 server R 和 ui R 中或者最好保存在下一级目录中我希望这种情况自动发生因为最终我会将其与 check
如何以编程方式将用户锁定到 iOS 6 中的单一应用程序模式？

有一些与此相关的问题但得到确切的答案锁定 iPhone iPod iPad 使其只能运行一个应用程序 https stackoverflow com questions 5011774 lock down iphone ipod ipa
__syncthreads() 死锁

如果只有部分线程执行 syncthreads 会导致死锁吗我有一个这样的内核 global void Kernel int N int a if threadIdx x
哪个对缓存最友好？

我试图很好地掌握面向数据的设计以及如何在考虑缓存的情况下进行最佳编程基本上有两种情况我无法完全确定哪个更好以及为什么是拥有一个对象向量更好还是拥有对象原子数据的多个向量更好 A 对象向量示例 struct A GLsizei mInd

哪个对缓存最友好？

哪个对缓存最友好？ 的相关文章

随机推荐

热门标签

哪个对缓存最友好？的相关文章