了解 CPU 如何决定将哪些内容加载到高速缓存中

2023-11-23

假设一台计算机有 64k 的 L1 缓存和 512k 的 L2 缓存。

程序员在主内存中创建/填充了一个包含 10mb 数据的数组（例如 3D 模型的顶点/索引数据）。

该数组可能包含一系列结构，例如：

struct x
{
  vec3 pos;
  vec3 normal;
  vec2 texcoord;
};

接下来，程序员必须对所有这些数据执行一些操作，例如在将数据传递给 GPU 之前进行一次正常计算。

CPU 如何决定数据如何加载到 L2 缓存中？

程序员如何检查给定架构的高速缓存行的大小？

程序员如何确保数据组织得适合缓存行？

数据与字节边界对齐是帮助此过程唯一可以做的事情吗？

程序员可以采取什么措施来最大限度地减少缓存未命中？

有哪些分析工具可以帮助可视化 Windows 和 Linux 平台的优化过程？

这里有很多问题，所以我将简短地回答。

CPU 如何决定数据如何加载到 L2 缓存中？

无论你使用什么，都会被加载。 L2 的行为与 L1 相同，只是它的数量更多，而且由于线条较大且设置的关联性较少，因此出现混叠（可能导致过早驱逐）更为常见。有些 CPU 只向 L2 加载从 L1 推出的数据，但这对程序员来说没有太大区别。

大多数 MMU 都有用于未缓存内存的功能，但这是用于设备驱动程序的。我不记得曾经见过在不禁用 L1 的情况下禁用 L2 的选项。如果没有缓存，就无法获得性能。

程序员如何检查给定架构的高速缓存行的大小？

通过查阅用户手册。有些操作系统提供查询功能，例如sysctl.

程序员如何确保数据组织得适合缓存行？

关键的想法是空间局部性。通过同一内部循环同时访问的数据应该进入相同的数据结构。最佳组织是将该结构适合高速缓存行并将其与高速缓存行大小对齐。

除非您仔细地使用分析器作为指导，否则不要自找麻烦。

数据与字节边界对齐是帮助此过程唯一可以做的事情吗？

不，另一部分是避免用无关数据填充缓存。如果某些字段仅由其他算法使用，那么在当前算法运行时它们就会浪费缓存空间。但您不可能一直优化所有内容，并且重新组织数据结构需要编程工作。

程序员可以采取什么措施来最大限度地减少缓存未命中？

使用真实数据进行分析，并将过多的遗漏视为错误。

有哪些分析工具可以帮助可视化 Windows 和 Linux 平台的优化过程？

Cachegrind 非常好，但使用虚拟机。无论好坏，英特尔 V-Tune 使用您的实际硬件。后者我没用过。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

caching

Optimization

了解 CPU 如何决定将哪些内容加载到高速缓存中的相关文章

如何在自定义保存操作 WFFM 中获取 Sitecore.Current.Site 对象？

我在用着面向营销人员的 Sitecore 网络表单在里面save action我得到的表格Sitecore Context Site对象但该对象没有返回正确的上下文该值为 modules shell 有谁知道我如何才能获得正确的上下文
如何在 C++ 中的嵌套词法作用域可访问的作用域中声明静态信息？

我想声明范围的标识符该标识符将用于自动填充最内部范围内任何日志记录语句的字段它们通常会但并非总是如此例如 lambda 使用引入的块匹配封闭块的名称用法看起来像这样 namespace app LOG CONTEXT app
在 std::forward 中它如何接受右值？

看看斯科特迈耶的有效的现代 C 第200 201页建议的简化实施std forward可能是在其他地方看到了正确的实现 template
ctypes.ArgumentError：不知道如何转换参数

我在C库中定义了一个函数如下所示 int Test char str1 int id1 char str2 float val float ls 我想在Python中使用它所以我编写了以下Python代码 str1 a str2 b i
C# 委托实例化与仅传递方法引用 [重复]

这个问题在这里已经有答案了我有一个简单的问题与仅传递函数引用相比实例化 C 委托有什么优势我的意思是 Why do Thread t new Thread new ThreadStart SomeObject SomeMethod
本机 C++ 通过代理 C++ 托管 dll 使用 C# dll

这相当复杂所以请耐心听我说我有一个用本机仅限 Win32 C 编码的第 3 方程序目标作为目标设计的一部分它实现了一个 dll 插件系统本机 DLL 当放置在程序的 ext 目录中时由目标加载然后目标根据需要调用每个 D
类型定义存在于两个库中

我正在使用 NET 4 5 构建 ASP NET Web 窗体网站错误 The type System ComponentModel DataAnnotations Schema ForeignKeyAttribute exists in
带有 Prism 区域适配器的 AvalonDock

我看到了一些关于 SO 的问题但似乎没有一个适合我我希望能够使用伟大的使用 Prism 4 但是所有示例区域适配器均适用于 Avalondock 1 x 系列我无法使其工作有人有关于如何为 AvalonDock 的 LayoutD
flowlayoutpanel和水平滚动条问题

我正在使用一个 flowlayoutpanel 它有很多逻辑上的按钮我遇到的问题是当我调整窗口大小时当窗口变小时我无法看到所有水平排列的按钮相反当窗口变小时按钮会下降到下一行谁能帮我解决这个问题我只是希望按钮水平排列当窗
在 C++ 中从另一个数组初始化结构内的数组[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions struc
可以轻易移动，但不可轻易复制

是否可以创建类类型即普通移动构造但不是普通复制构造但仍然可复制构造普通复制构造但不是普通移动构造但仍然可移动构造可以简单地复制分配但不能简单地移动分配但仍然可以移动分配可以简单地移动分配但不能简单地复制分配但仍然可
在 .NET Core 上通过 MEF 将参数传递给插件构造函数？

我花了几个小时试图弄清楚如何通过 MEF System Composition 将参数传递给插件构造函数但一切都无济于事不用说相关文档很少查看源代码也没有帮助这曾经非常容易做到使用 CompositionHost Compose
在 C# 中给定周数和年份，计算一周的开始和结束日期（基于 ISO 规范）

我需要生成一份报告显示一年中的 52 周或某些年份的 53 周及其开始日期和结束日期有一个 ISO 规范可以做到这一点但看起来非常复杂我希望有人知道在 C 或 Visual Basic 中执行此操作的方法实际上适用于 Visu
将控制台输入和输出重定向到文本框

您好提前致谢我正在尝试非常努力将控制台输入和输出重定向到文本框到目前为止输出工作正常但问题在于输入例如我无法执行一个简单的程序来执行以下操作 Console WriteLine 请输入您的姓名字符串名称 Console
使用 openssl 库获取 x509 证书哈希

我目前正在开发一个应用程序它使用 openssl 库 libcrypto 来生成证书现在我必须获取现有证书的哈希值当我使用终端时我可以使用以下命令生成哈希值 openssl x509 hash in cert pem noout 输
给出对象的指针作为参数

假设我有 void func foo obj 我有 foo object 我该如何制作object进入争论func 只需取消引用它即可 func object
创建 PING 程序时限制 ICMP 回显答复

我正在编写一个多线程 ping 程序我在每个线程针对每个 IP 上创建了原始套接字并使用 sendto 向每个线程发送了 ICMP Echo 请求然后在每个线程中执行了 receivevfrom 我正在从各种套接字中的 IP 获取消
BlueZ D-Bus C，应用 BLE

我正在尝试编写一个应用程序来搜索附近的蓝牙设备并与它们通信我的应用程序将用 C 语言编写并打算在 Linux 下工作是否有通过 C 中的 D Bus 使用 BlueZ 的教程或示例此应用程序的目的是从 BLE 中的文件发送数据你能
允许使用 AutoMapper 或类似工具映射动态类型吗？

我已经开始使用https github com robconery massive https github com robconery massive对于一个项目我想知道是否有任何映射工具可以支持动态到静态类型的映射我以前使用过 Au
为什么一个结构体，如果没有显式的默认构造函数，则无法编译将另一个结构体作为成员包装在联合体中的结构体？

这就是我所说的关系 struct A int i 1 struct B union A a void main B b 在这个星座中我的编译器 vs2015 抱怨 B 的默认构造函数B B void 被删除并附有编译器已生成的注释B B

随机推荐

GoogleCertificatesRslt：Kotlin Android 应用程序中不允许

我正在开发一个使用 Kotlin 作为开发语言的 Android 应用程序该应用程序显示地图并应该加载标记但是地图会加载但标记不会加载我收到安全异常GoogleCertificatesRslt not allowed我发现这可能是
检测前景窗口何时发生变化

我知道哪个使用GetForegroundWindow函数我可以获取当前活动窗口句柄但是现在i want to detect when the active window of any application changes become
QTabWidget 大小取决于当前选项卡

I ve a QTabWidget 其中包含不同高度的小部件它们的宽度是固定的但是默认实现QTabWidget选择最大的部件的高度作为自己的高度我想知道是否有一种可能快速的方法来改变大小QTabWidget取决于其当前选项卡以
删除 Activity 作为默认启动器

我将我的活动设置为默认启动器来拦截主页按钮点击如下所示
AngularJS 中的滚动事件

我有一个带有滚动条的 div 现在我想获取一个事件每次用户滚动时都会触发该事件这在 AngularJS 中可能吗还是我必须使用 jQuery Edit 到目前为止我想出了以下内容 JS directive scroll functio
没有名为“fbprophet”的模块？

我尝试按照以下说明在 Ubuntu 上的 Anaconda 中安装 Facebook Prophet https facebook github io prophet docs installation html installation
pip 和 conda 之间的实际区别

我看到了有关 pip 和 conda 之间差异的其他问题但我还不清楚请在标记为重复之前考虑这一点如果我跑pip install seaborn and conda install seaborn我会得到同样的结果吗我可以跑pip i
更好的错误处理[重复]

这个问题在这里已经有答案了 Here https github com astaxie build web application with golang blob master en 11 1 md描述了如何根据 http 包使用自定义路
IPython 导入失败和 python sys.path 一般情况

我正在关注这个post让一个 ipython 统治所有 virtualenvs 据我了解这篇文章的主要思想是当在 virtualenv 中时 ipython 找不到它的模块 a virtualenv me pc ipython Trac
从服务器 HTTPS 接收并验证证书 - android

我正在通过 https 从 Android 客户端调用 Web 服务我必须验证从服务器端收到的证书我怎么做目前这是我用来调用网络服务的代码 private static String SendPost String url Arra
如何在 Jekyll 中链接到没有 html 扩展名的 page.url 页面？

我正在 Jekyll 中建立一个网站为了删除帖子中的 html 扩展名我将以下内容添加到 config yml permalink kb title 为了从页面中删除 html 扩展名我为每个页面创建了文件夹并在每个页面文件夹中放置
如何有条件地为表格单元格中的背景着色？

我正在渲染一个表格p 数据表 PrimeFaces 我想要做的是根据单元格内容的值对单元格的背景进行着色这与为行或列着色不同它是单个单元格首先是CSS问题如果我这样做
从 HTML 页面源下载图像文件

我正在编写一个抓取工具用于从 HTML 页面下载所有图像文件并将它们保存到特定文件夹中所有图像都是 HTML 页面的一部分下面是一些代码用于从提供的 URL 下载所有图像并将它们保存在指定的输出文件夹中您可以根据自己的需要对其进
Flutter widget 测试选择另一个项目时不会触发 DropdownButton.onChanged

我正在编写一个 Flutter Web 应用程序并向我的代码库添加一些小部件测试我很难让 flutter test 按预期工作我当前面临的问题是尝试在 DropdownButton 中选择一个值以下是重现问题的完整小部件测试代码 v
添加和删除 JLabel 上的图标

您好我有一个标签我已为其设置了图标我想在单击按钮后删除此图标它的方法是什么 Create icon Icon icon new ImageIcon getClass getResource foo bar baz png Creat
掩蔽者在 SHAP 包中真正做了什么并让他们适合训练或测试？

我一直在努力与shap包裹我想从我的逻辑回归模型中确定形状值与此相反TreeExplainer the LinearExplainer需要一个所谓的掩蔽器这个掩码器到底有什么作用独立掩码器和分区掩码器有什么区别另外我对测试集中的
Windows中当前目录和工作目录的区别

Windows 中的当前目录和工作目录有什么区别如何更改 Notepad 或 Mozilla Firefox 等应用程序的工作目录当前目录和工作目录只是同一事物的两个不同名称每个进程维护一个当前目录当前目录在启动时指定为用于创建进程
正则表达式在尊重 CDATA 的同时转义 HTML 和符号

我编写了一个内容管理系统它使用服务器端正则表达式在页面响应发送到客户端浏览器之前对页面响应中的符号进行转义正则表达式会注意已转义的或属于 HTML 实体一部分的符号例如以下内容 a b c amp d copy 2009 更改为
jQuery AJAX 调用弄乱了字符编码

我有一个输出 JSON 的 servlet Servlet 的输出编码是 ISO 8859 1 我们的网络应用程序中的页面也设置为 ISO 8859 1 我会使用 UTF 8 但这超出了我的控制范围我们必须使用 ISO 8859 1 当我
了解 CPU 如何决定将哪些内容加载到高速缓存中

假设一台计算机有 64k 的 L1 缓存和 512k 的 L2 缓存程序员在主内存中创建填充了一个包含 10mb 数据的数组例如 3D 模型的顶点索引数据该数组可能包含一系列结构例如 struct x vec3 pos vec3

了解 CPU 如何决定将哪些内容加载到高速缓存中

了解 CPU 如何决定将哪些内容加载到高速缓存中 的相关文章

随机推荐

热门标签

了解 CPU 如何决定将哪些内容加载到高速缓存中的相关文章