有多少数据加载到 L2 和 L3 缓存中？

2023-12-21

如果我有这门课：

class MyClass{
    short a;
    short b;
    short c;
};

我有这段代码对上面的内容执行计算：

std::vector<MyClass> vec;
//
for(auto x : vec){
    sum = vec.a * (3 + vec.b) / vec.c;
}

我知道CPU只从L1缓存加载它需要的数据，但是当L1缓存从L2缓存检索数据时，它会加载整个“缓存行”（其中可能包括它不需要的几个字节的数据）。

L2 缓存从 L3 缓存加载多少数据，L3 缓存从主内存加载多少数据？它是根据页面定义的吗？如果是的话，根据不同的 L2/L3 缓存大小，这个答案会有何不同？

L2 和 L3 高速缓存还具有小于虚拟内存系统页的高速缓存线。 L2 和 L3 高速缓存行的大小大于或等于 L1 高速缓存行大小，通常是 L1 高速缓存行大小的两倍。

对于最新的 x86 处理器，所有缓存都使用相同的 64 字节缓存行大小。（早期的 Pentium 4 处理器具有 64 字节 L1 高速缓存线和 128 字节 L2 高速缓存线。）

IBM 的 POWER7 在 L1、L2 和 L3 中使用 128 字节缓存块。（但是，POWER4 在 L1 和 L2 中使用 128 字节块，但在片外 L3 中使用扇区 512 字节块。扇区块为子块提供有效位。对于 L2 和 L3 缓存，扇区允许单个一致性大小在整个系统中使用。）

在末级高速缓存中使用较大的高速缓存行大小可以减少标签开销，并有利于处理器和主内存之间的长突发访问（较长的突发可以提供更多带宽并有助于更广泛的纠错和 DRAM 芯片冗余），同时允许其他级别的高速缓存和缓存一致性以使用较小的块，从而减少带宽使用和容量浪费。（大的末级缓存块还可以提供预取效果，由于末级缓存的容量相对较高，因此缓存污染问题不太严重。但是，硬件预取可以达到相同的效果，并且缓存容量的浪费较少。）（例如，典型的一级缓存），驱逐发生得更频繁，因此可以利用空间局部性的时间跨度更小（即，在缓存行被驱逐之前更有可能只使用一个较小块中的数据）。较大的缓存行也会减少可用块的数量，从某种意义上减少缓存的容量；这种容量减少对于小型高速缓存来说尤其成问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有多少数据加载到 L2 和 L3 缓存中？的相关文章

文件修改时间检查的成本

对于Linux下包含少量字节的文件我只需要处理自上次处理以来发生更改的时间我通过调用 PHP 检查文件是否被更改clearstatcache filemtime 定期由于整个文件总是很小因此删除对 filemtime 的调用并通过将
是否可以调整AppFabric缓存服务器来存储更大的对象？

当我假设将较大的对象图添加到缓存中时我收到 AppFabric 缓存服务器错误错误代码子状态连接已终止可能是由于服务器或网络问题或序列化对象大小大于服务器上的 MaxBufferSize 请求的结果未知我确信这不是网络问题我能
为 PostgreSQL 查询选择正确的索引

简化表 CREATE TABLE products product no integer PRIMARY KEY sales integer status varchar 16 category varchar 16 CREATE INDE
Rust 编程竞赛中最快的惯用 I/O 例程？

我的问题已部分得到解答因此我根据从评论和其他实验中学到的知识对其进行了修改总之我想要一个用于编程竞赛的快速 I O 例程其中使用单个文件解决问题无需外部包它应该从一个以空格分隔的标记序列中读取BufRead 标准输入或文件标记
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
mysql表中的数据非常大。即使 select 语句也需要很多时间

我正在开发一个数据库它是一个相当大的数据库有 13 亿行和大约 35 列这是我检查表状态后得到的结果 Name Table Name Engine InnoDB Version 10 Row format Compact Rows 1
gcc 与 clang：符号剥离

gcc 和 AMD Open64 opencc 都有一个 s选项剥离符号表和重定位信息到目前为止我还没能在 Clang LLVM 中找到相同的选项它存在吗您可以使用stripbinutils 中的实用程序实际上 llvm ld 有
CPU 周期与总 CPU 时间

在 Windows 上 GetProcessTimes 和 QueryProcessCycleTime 可用于获取应用程序所有线程的总计我期望显然是天真地找到总周期数和总处理器时间用户内核之间的比例关系当转换为相同的单位秒
为什么X86中没有NAND、NOR和XNOR指令？

它们是您可以在计算机上执行的最简单的指令之一它们是我亲自实施的第一个指令执行 NOT AND x y 会使执行时间和依赖链长度和代码大小加倍 BMI1 引入了 andnot 这是一个有意义的补充是一个独特的操作为什么不是这个问题
getItem 与 getItemAtPosition

有两种方法可以获取列表视图中的选定项目 list getAdapter getItem position list getItemAtPosition position 我的问题是哪一种是首选的做法我见过人们同时使用这两种方法您可以使
为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
使用 React.forwardRef 与自定义 ref prop 的价值

我看到React forwardRef从反应文档来看似乎是将引用传递给子功能组件的认可方式 const FancyButton React forwardRef props ref gt
处理大数据二进制文件

我正在处理包含原始数据的大型二进制文件每个大约 2 GB 这些文件具有明确定义的结构其中每个文件都是一个数组events 每个事件都是一个数组data banks Each event and data bank有一个结构 header
React Native：加载图像后应用程序性能不佳

加载图像似乎没有问题但是加载完毕后就出现问题了在我的应用程序中我在整个游戏中一张一张地加载卡片图像一旦我加载了 40 张卡片图像整个应用程序就会变得很慢它总是发生在第 40 个图像处当我在第 40 个图像之后继续加载更多卡片图
在 MySQL 数据库中保持 TEXT 字段唯一的最佳方法

我想让 TEXT 字段的值在我的 MySQL 表中唯一经过小型研究我发现由于性能问题每个人都不鼓励在 TEXT 字段上使用 UNIQUE INDEX 我现在想用的是 1 创建另一个字段来包含 TEXT 值的哈希值 md5 text v
如何优化分割重叠范围？

我编写的这个 Python 脚本用于将重叠范围拆分为唯一范围最后一次迭代 https codereview stackexchange com questions 285932 python script to split overlap
比较两个 numpy 数组的最快方法

我有两个数组 gt gt gt import numpy as np gt gt gt a np array 2 1 3 3 3 gt gt gt b np array 1 2 3 3 3 无论顺序如何比较这两个数组的元素是否相等的最快方
编写此代码片段的有效方法是什么？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案更有效和或更短地重写此代码以节省字节并显得不那么冗长的方法 if N 2 0 N 6 N 8 N 10 N 12 N 14 N 16 N

随机推荐

Microsoft JScript 运行时错误：对象不支持属性或方法“验证”

这个问题是我收到错误 Microsoft JScript 运行时错误对象不支持属性或方法验证不明白为什么有什么建议么
如何获取原始订单中的字段？

我有一个类似的代码 class Ordered object x 0 z 0 b 0 a 0 print dir Ordered 它打印 a b x z 如何按原始顺序获取字段 x z b a 我在 Django 模型中看到了类似的行为如
Java：当一个新线程从同步块启动时会发生什么？

第一个问题这是 Java 中一个非常简短但基本的东西我不知道在下面的情况下是run 方法以某种方式使用锁执行somemethod 获得了吗 public synchronized void somemethod Thread t n
了解 csr 格式

我试图了解 scipy CSR 的工作原理 https docs scipy org doc scipy reference sparse html https docs scipy org doc scipy reference spar
通过Javascript跨域XHR上传[重复]

这个问题在这里已经有答案了可能的重复在 IE9 中解析 xml json 响应 https stackoverflow com questions 10866439 parsing xml json response in ie9 我想
现代 C 编译器中 __STDC_IEC_559__ 的状态

C99添加了一个宏 STDC IEC 559 可用于测试编译器和标准库是否符合 ISO IEC IEEE 60559 或 IEEE 754 标准根据这个问题的答案如何检查 ieee 754 单精度 32 位浮点表示 https stac
如何将包含 Integers 的 ArrayList 转换为原始 int 数组？

我正在尝试使用以下代码将包含 Integer 对象的 ArrayList 转换为原始 int 但它引发编译时错误可以用Java进行转换吗 List
如何在 Gatsby 中使用 React.lazy

当使用React lazy在 Gatsby 中你会在执行时出错production gatsby build 最好的使用方法是什么React lazy and suspense在盖茨比计划中 React lazy 和 Suspense 还
python 中是否有与 R 的 qchisq 函数等效的函数？

The R qchisq函数将 p 值和自由度数转换为相应的卡方值是否有一个具有同等功能的 Python 库我在 SciPy 中环顾四周没有发现任何东西 It s scipy stats chi2 ppf 百分点函数 cdf 的倒数
快速排序 (Java) 在 array.length > 60k 时导致 StackOverFlow

我的代码可以正常工作据我所知直到我的输入数组大小 a length 大约是 62 000 此时我始终得到StackOverFlowError 我之前使用过两次递归调用quicksort 小于和大于枢轴q 然后我切换到尾递归正如您所看到
Snackbar 滑动动画导致浮动操作按钮意外跳转

我的活动中有一个浮动操作按钮当小吃栏出现时它应该向上移动一点但是当我使用代码将小吃栏动画更改为滑动时 pressAgainToExitSnackBar setAnimationMode BaseTransientBottomBar A
当一个字段是日期字段时，如何在 MongoDB 中按多个字段进行分组

我对 MongoDB 还很陌生我正在尝试弄清楚当其中一个字段是计算日期字段时如何按多个字段进行分组我的数据如下简化 id ObjectId 52d6ed19e4b0a491abb53ff2 build duration 667075
无法捕获 Winforms 中未处理的异常

我正在尝试捕获 C Windows 窗体应用程序中的所有未处理异常我已将以下代码添加到Program cs文件但未捕获异常我得到异常例如NullReferenceException 我究竟做错了什么 static void Main
如何在 Windows 上为 javax.net.ssl.trustStore 配置 trustStore？

我正在尝试使用 imap 从 java 中的电子邮件服务器中提取消息但遇到了以下异常 DEBUG JavaMail version 1 4 2 DEBUG successfully loaded resource META INF jav
Ionic 2+ 中选项卡页面的 setRoot

我有两张地图每张地图都有自己的视图我正在使用选项卡从一个视图跳转到另一个视图但是当我使用这种导航方法时不会设置根目录并且页面在访问后不会被推送或弹出或设置这是我使用的谷歌地图的问题当我使用菜单区域中设置根目录的常规菜单时此
使用 Flask 和 Python 从配置文件中读取属性

建筑自在 Flask 中将配置文件作为字典读取 https stackoverflow com questions 50415433 reading config file as dictionary in flask我正在尝试定义自定义配
为什么需要对 μop 进行分层？

In Intel CPU 中的 MicroFusion 作者丹尼斯巴赫瓦洛夫 https easyperf net blog 2018 02 15 MicroFusion in Intel CPUs 他说 Unlamination fo
PowerShell 5.1 - 如何卸载当前使用的模块

我们在一个部署 PowerShell 脚本中使用一些 PowerShell 模块使用以下命令我们将模块即 XXXX 安装到 C Program Files WindowsPowerShell Modules 中 Install Mod
为什么 Espresso 的 registerIdlingResources 被弃用，以及什么取代了它？

我正在使用 Espresso for Android 进行 UI 测试并遵循 Google 的代码示例 https github com googlesamples android testing blob master ui espre
有多少数据加载到 L2 和 L3 缓存中？

如果我有这门课 class MyClass short a short b short c 我有这段代码对上面的内容执行计算 std vector

有多少数据加载到 L2 和 L3 缓存中？

有多少数据加载到 L2 和 L3 缓存中？ 的相关文章

随机推荐

热门标签

有多少数据加载到 L2 和 L3 缓存中？的相关文章