存储指令是否会在缓存未命中时阻塞后续指令？

2023-11-22

假设我们有一个具有两个核心（C0 和 C1）的处理器和一个从地址开始的高速缓存行k最初由 C0 拥有。如果 C1 在第 8 行的 8 字节槽上发出存储指令k，这会影响 C1 上执行的以下指令的吞吐量吗？

intel优化手册有如下一段

当指令将数据写入内存位置 [...] 时，处理器确保包含该内存位置的行位于其 L1d 高速缓存 [...] 中。如果缓存行不存在，它将使用 RFO 请求 [...] RFO 从下一级获取数据，并在指令退出后存储数据。因此，存储延迟通常不会影响存储指令本身

参考下面的代码，

// core c0
foo();
line(k)->at(i)->store(kConstant, std::memory_order_release);
bar();
baz();

英特尔手册中的引用让我假设在上面的代码中，代码的执行看起来好像存储本质上是无操作，并且不会影响结束之间的延迟foo()和开始bar()。相反，对于以下代码，

// core c0
foo();
bar(line(k)->at(i)->load(std::memory_order_acquire));
baz();

结束之间的延迟foo()和开始bar()会受到负载的影响，因为以下代码将负载的结果作为依赖项。

这个问题主要与英特尔处理器（Broadwell 系列或更新版本）如何在上述情况下工作有关。另外，特别是关于如何将类似于上面的 C++ 代码编译为这些处理器的程序集。

一般来说，对于后续代码不会很快读取到的 store，该 store 不会directly延迟任何现代乱序处理器（包括英特尔）上的后续代码。

例如：

foo()
*x = y;
bar()

If foo()不修改x or y, and bar不加载自*x，商店是独立的，甚至可以在之前开始执行foo()已完成（或什至在开始之前），并且bar()可以在存储提交到缓存之前执行，并且bar()甚至可能执行 whilefoo()正在运行等

虽然有一点点direct影响，并不意味着没有间接影响，实际上存储可能会主导执行时间。

如果缓存中的存储未命中，则在满足缓存未命中的情况下可能会占用非核心资源。它通常还可以防止后续存储耗尽，这可能是一个瓶颈：如果存储缓冲区已满，则前端完全阻塞，并且新指令不再进入调度程序。

最后，像往常一样，一切都取决于周围代码的细节。如果重复运行该序列，并且foo() and bar()很短，与存储相关的未命中可能会主导运行时。毕竟，缓冲无法掩盖无限数量存储的成本。在某些时候，您将受到商店固有吞吐量的限制。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

存储指令是否会在缓存未命中时阻塞后续指令？的相关文章

OpenCv读/写视频色差

我试图简单地使用 openCV 打开视频处理帧并将处理后的帧写入新的视频文件我的问题是即使我根本不处理帧只是打开视频使用 VideoCapture 读取帧并使用 VideoWriter 将它们写入新文件输出文件看起来比输入更绿
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
32 位应用程序的特征最大矩阵大小

所以我正在寻找Eigen http eigen tuxfamily org index php title Main Page当我尝试声明大于 10000x10000 的矩阵时包崩溃我需要声明一个像这样的矩阵可靠地大约有 13000
从 MVC 迁移到 ASP.NET Core 3.1 中的端点路由时，具有角色的 AuthorizeAttribute 不起作用

我正在尝试将我的项目从 UseMVC asp net core 2 2 兼容样式升级到 UseEndpoint Routing 并且我的所有请求都被重定向到我的验证失败页面它与声明有关如果我删除 Authorize Roles Adm
C# 中的接口继承

我试图解决我在编写应用程序时遇到的相当大的对我来说问题请看这个为了简单起见我将尝试缩短代码我有一个名为的根接口IRepository
对齐 GridView 中的行值

我需要在 asp net 3 5 中右对齐 gridview 列中的值我怎样才能做到这一点
JSON 数组到 C# 列表

如何将这个简单的 JSON 字符串反序列化为 C 中的列表 on4ThnU7 n71YZYVKD CVfSpM2W 10kQotV 这样 List
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
从多个类访问串行端口

我正在尝试使用串行端口在 arduino 和 C 程序之间进行通信我对 C 编程有点陌生该程序有多种用户控制形式每一个都需要访问串口来发送数据我需要做的就是从每个类的主窗体中写入串行端口我了解如何设置和写入串行端口这是我的 Fo
访问者和模板化虚拟方法

在一个典型的实现中Visitor模式该类必须考虑基类的所有变体后代在许多情况下访问者中的相同方法内容应用于不同的方法在这种情况下模板化的虚拟方法是理想的选择但目前这是不允许的那么模板化方法可以用来解析父类的虚方法吗鉴于
如何从网站下载 .EXE 文件？

我正在编写一个应用程序需要从网站下载 exe 文件我正在使用 Visual Studio Express 2008 我正在使用以下代码 private void button1 Click object sender EventArgs
C 语言中 =+（等于加）是什么意思？

我碰到与标准相反今天在一些 C 代码中我不太确定这里发生了什么我在文档中也找不到它 In ancientC 版本相当于它的残余物与最早的恐龙骨头一起被发现例如 B 引入了广义赋值运算符使用x y to add y to x
如何在c#中的内部类中访问外部类的变量[重复]

这个问题在这里已经有答案了我有两个类我需要声明两个类共有的变量如果是嵌套类我需要访问内部类中的外部类变量请给我一个更好的方法来在 C 中做到这一点示例代码 Class A int a Class B Need to access
当模板类不包含可用的成员函数时，如何在编译时验证模板参数？

我有以下模板struct template
获取 2 个数据集 c# 中的差异

我正在编写一个简短的算法它必须比较两个数据集以便可以进一步处理两者之间的差异我尝试通过合并这两个数据集并将结果更改放入新的数据集来实现此目标我的方法如下所示 private DataSet ComputateDiff DataSet
尚未处理时调用 Form 的 Invoke 时出现 ObjectDisposeException

我们得到一个ObjectDisposedException从一个电话到Invoke在尚未处理的表格上这是一些演示该问题的示例代码 public partial class Form2 Form void Form2 Load object
g++ 对于看似不相关的变量“警告：迭代...调用未定义的行为”

考虑以下代码strange cpp include
我在在线程序挑战编译器中遇到演示错误

include
WinRT 定时注销

我正在开发一个 WinRT 应用程序要求之一是应用程序应具有定时注销功能这意味着在任何屏幕上如果应用程序空闲了 10 分钟应用程序应该注销并导航回主屏幕显然执行此操作的强力方法是在每个页面的每个网格上连接指针按下事件并在触
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在

随机推荐

将 numpy 数组从使用 numpy.save(...) 保存的文件加载到 C 中

我想访问 C 程序中的数据该程序驻留在使用 numpy save 从 python 编写的文件中到目前为止我一直在寻找一种方法来调用我的C程序的numpy load的C版本但似乎没有直接访问的C版本因为numpy load使用pi
通过 SQLLDR 将多个 csv 加载到一张表中

我正在使用 SQL LOADER 在一个表中加载多个 csv 文件我发现的过程非常简单 LOAD DATA INFILE path file1 csv INFILE path file2 csv INFILE path file3 csv
依赖类型不适用于构造函数？

路径相关类型很有用 trait Sys type Global def foo S lt Sys system S global system Global 为什么这对构造函数不起作用 class Foo S lt Sys val syst
如何从文本图像OpenCV中去除非直线对角线？

我有一个包含文本的图像但上面绘制了非直线我想删除这些行而不影响删除文本中的任何内容为此我使用了霍夫概率变换 import cv2 import numpy as np def remove lines filename img c
如何将 foreach 转换为 Parallel.ForEach？

如何转换 foreach NotifyCollectionChangedEventHandler handler in delegates 对于这样的事情 Parallel ForEach NotifyCollectionChangedEv
如何计算android中每个应用程序的移动和wifi数据使用情况？

有没有可能使用 TrafficStats getUidRxBytes getUidTxBytes getTotalRxbytes getTotalTXbytes getMobileRxBytes getMobileTxBytes 方法来计算
为什么 return/redo 在调用上下文中评估结果函数，但不评估块结果？

昨晚我了解了 redo 选项当你return来自一个函数它可以让你回来another函数然后在调用站点调用该函数并从同一位置重新调用评估器 gt gt foo func a print a return redo func b pri
ExpressJS 路由正则表达式

我有路线 app get id routes action 它工作正常但我需要跳过robot txt和其他人类我创建正则表达式仅字符或数字 a z 0 10 我如何才能仅路由与此正则表达式匹配的 id 将正则表达式放在括号中如下所
MySql批量插入

我想在 MySql 数据库中插入一些 4K 行我不想触发 4k 插入查询有什么方法可以让我只触发一个插入查询来将这些 4k 行存储在数据库中我在互联网上搜索发现用户正在从文件批量插入数据库就我而言我的数据位于内存中并且我不想
在 Mac (Yosemite) 上使用 phantomjs#2.0.0 运行 casperjs 时出现问题

我正在尝试奔跑CasperJS having PhantomJS 2 0 0 on a Mac 优胜美地当尝试跑步时CasperJS我收到以下消息 CasperJS needs PhantomJS v1 x usr local Cella
Android 设备上的低功耗蓝牙 RSSI 会定期更改

我注意到 Android 上接收到的低功耗蓝牙信号强度随周期变化下图表示一个 BLE 信标在两分钟内的 RSSI 值接收机器人和信标均处于静止状态距离均为 1 米我确保干扰尽可能低 Android 是 Nexus 5 但我在其他 A
使用 jQuery 最小化/最大化 div

我基本上想最小化一些 div 我不想使用和而是想使用一些符号来自 font awesome 来最小化和最大化 div 我对此的问题如何在这段代码中插入图标的类我尝试用 attr 替换 html 部分但这没有成功多谢 Upda
如何在 OnCompleteListener Firebase 中使用异步/等待/协程

我正在构建一个客户端应用程序它使用 Firebase 来做两件事用户认证使用实时数据库我已成功在客户端和后端服务器上正确设置所有内容使用 Firebase 的 Admin SDK 并且能够正确验证用户身份并允许他们读取写入数据库
哪些代码控制 WPF 应用程序的启动？

更具体地说我怎样才能设置像这样的启动顺序在 WPF 中启动时不显示窗口但存在通知图标要运行 WPF 需要Application目的当你执行时Run在该对象上应用程序进入无限循环事件循环负责处理用户输入和任何其他操作系统信号换
为什么运行一次（并且从未加载）的 Meteor 应用程序的数据库占用了近 3GB？

UPDATE 这个问题在 Meteor v0 4 2012 之后得到了修复出于历史目的摘自du 2890768 Code Meteor QuarterTo meteor local db journal 2890772 Code Met
Dask read_csv 失败，而 pandas 则失败

尝试使用 dask 的read csv在文件中 pandas 的位置read csv像这样 dd read csv data ecommerce new csv 失败并出现以下错误 pandas errors ParserError Err
使用子类对象访问超类函数

我有一个扩展其超类的子类对象子类中有一个重写的方法可以使用该对象调用是否可以使用子类对象调用超类的函数 package supercall public class Main public static void main Strin
如何编写可以运行 x86 十六进制代码的 C 程序

我有一组十六进制代码可以转换为汇编指令我想用 C 语言创建可以执行这些指令的程序 unsigned char rawData 5356 0x4C 0x01 0x0A 0x00 0x00 0x00 0x00 0x00 0x64 0x0C
如何在 php 中从 .doc 模板创建 word .doc 文件

我需要从Word模板创建一个Word文档就像我们需要用值替换模板中的几个字符串比如变量请告诉我们如何在 PHP 或 cakePHP 中做到这一点我建议查看 phpLiveDocx http www phplivedocx org 还
存储指令是否会在缓存未命中时阻塞后续指令？

假设我们有一个具有两个核心 C0 和 C1 的处理器和一个从地址开始的高速缓存行k最初由 C0 拥有如果 C1 在第 8 行的 8 字节槽上发出存储指令k 这会影响 C1 上执行的以下指令的吞吐量吗 intel优化手册有如下一段当指令将

存储指令是否会在缓存未命中时阻塞后续指令？

存储指令是否会在缓存未命中时阻塞后续指令？ 的相关文章

随机推荐

热门标签

存储指令是否会在缓存未命中时阻塞后续指令？的相关文章