多核架构中的 CPU 和内存访问

2023-12-01

我想知道如果，例如，CPU 的 2 个核心尝试同时访问内存（通过内存控制器），“一般”如何处理内存访问？实际上，当内核和启用 DMA 的 IO 设备尝试以相同方式访问时，同样适用。

I think，内存控制器足够智能，可以利用地址总线并同时处理这些请求，但是我不确定当它们尝试访问同一位置或 IO 操作独占地址总线并且 CPU 没有移动空间时会发生什么在。

Thx

简短的回答是“这很复杂，但访问肯定可以潜在地在某些情况下同时发生”。

我认为你的问题有点太黑白分明：你可能正在寻找像“是的，多个设备可以访问内存”这样的答案。same时间”或“不，他们不能”，但现实是，首先您需要描述一些特定的硬件配置，包括一些低级实现细节和优化功能，以获得准确的答案。最后您会需要准确定义“同时”的含义。

一般来说，一个好的一阶近似是硬件能够实现appear所有硬件都可以几乎同时访问内存，但可能会由于争用而导致延迟增加和带宽减少。在非常细粒度的时序级别，一个设备的访问确实可能会推迟另一设备的访问，也可能不会，具体取决于许多因素。您极不可能需要此信息来实现软件正确地，而且您不太可能需要了解细节才能最大限度地提高性能。

也就是说，如果您确实需要了解详细信息，请继续阅读，我可以对某种理想化的笔记本电脑/台式机/服务器规模硬件给出一些一般性观察。

正如 Matthias 提到的，您首先必须考虑缓存。缓存意味着任何受缓存影响的读或写操作（包括几乎所有 CPU 请求和许多其他类型的请求）可能根本不接触内存，因此从这个意义上说，许多内核可以“访问”内存（至少是缓存）它的图像）同时进行。

If you then consider requests that miss in all cache levels, you need to know about the configuration of the memory subsystem. In general a RAM chips can only do "one thing" at a time (i.e., commands¹ such a read and write apply to the entire module) and that usually extends to DRAM modules comprised of several chips and also to a series of DRAMs connected via a bus to a single memory controller.

So you can say that electrically speaking, the combination of one memory controller and its attached RAM is likely to be doing only on thing at once. Now that thing is usually something like reading bytes out of a physically contiguous span of bytes, but that operation could actually help handle several requests from different devices at once: even though each devices sends separate requests to the controller, good implementations will coalesce requests to the same or nearby² area of memory.

此外，甚至 CPU 也可能具有这样的能力：当出现新请求时，它可以/必须注意到现有请求正在针对重叠区域进行，并将新请求与旧请求联系起来。

Still, you can say that for a single memory controller you'll usually be serving the request of one device at a time, absent unusual opportunities to combine requests. Now the requests themselves are typically on the order of nanoseconds, so many separate requests can be served in a small unit of time, so this "exclusiveness" fine-grained and not generally noticeable³.

Now above I was careful to limit the discussion to a single memory-controller - when you have multiple memory controllers⁴ you can definitely have multiple devices accessing memory simultaneously even at the RAM level. Here each controller is essentially independent, so if the requests from two devices map to different controllers (different NUMA regions) they can proceed in parallel.

这是很长的答案。

¹ In fact, the command stream is lower level and more complex than things like "read" or "write" and involves concepts such as opening a memory page, streaming bytes from it, etc. What every programmer should know about memory serves as an excellent intro to the topic.

² For example, imagine two requests for adjacent bytes in memory: it is possible the controller can combine them into a single request if they fit within the bus width.

³ Of course if you are competing for memory across several devices, the overall impact may be very noticeable: a reduction in per-device bandwidth and an increase in latency, but what I mean is that the sharing is fine-grained enough that you can't generally tell the difference between finely-sliced exclusive access and some hypothetical device which makes simultaneous progress on each request in each period.

⁴ The most common configuration on modern hardware is one memory controller per socket, so on a 2P system you'd usually have two controllers, also other rations (both higher and lower) are certainly possible.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多核架构中的 CPU 和内存访问的相关文章

WaitForSingleObject 是否充当内存屏障？

昨天一个关于双重检查锁定的问题引发了一系列的想法让我对一个简单的情况感到不确定在下面的代码中是否可以点击printf 不再同步在这个简单的示例中这些值可能位于同一缓存行上因此我认为这种可能性较小假设一开始可能性 gt 0 如果
独占锁定ConcurrentHashMap

我知道不可能锁定 ConcurrentHashMap 进行独占访问但是我找不到原因是因为构成CHM的 Segment 没有被api公开吗据推测如果是的话客户端代码可以执行交接锁定 Cheers 我知道不可能锁定 Concur
rdstate()返回值是什么意思？

istream Read istream is std string buf while is gt gt buf cout lt lt is eofbit lt lt lt lt is failbit lt lt lt lt is bad
序列化对于对象大小估计可靠吗？

我使用序列化来估计对象使用的内存量我已经读过this https stackoverflow com questions 426396 how much memory does a c net object use and this ht
在运行的 Swing 应用程序中替换 AWT EventQueue 的安全方法

我维护的 Swing 应用程序中的各种零星问题似乎是由它使用自己的自定义版本替换默认 AWT 事件队列的方式引起的Toolkit getDefaultToolkit getSystemEventQueue push new AEventQu
可以禁用“应用程序错误”对话框吗？

我使用 Hudson 作为持续集成服务器来测试 C C 代码不幸的是我在某个地方有一个错误导致内存损坏因此在某些 Windows 计算机上我有时会收到一个应用程序错误对话框解释一条指令引用了无法读取的内存弹出此对话框并基本上挂
为什么结构中“[0]byte”的位置很重要？

0 byte在golang中不应该占用任何内存空间但这两个结构体的大小不同 type bar2 struct A int 0 byte type bar3 struct 0 byte A int 那么为什么这个位置 0 byte这里重要吗
PHP 对象创建和内存使用

一个基本的虚拟类 class foo var bar 0 function foo function boo echo memory get usage echo n foo new foo echo memory get usage ec
为什么在 Linux 上字符串文字的内存地址与其他字符串文字的内存地址如此不同？

我注意到字符串文字在内存中的地址与其他常量和变量 Linux 操作系统非常不同它们有许多前导零未打印 Example const char h Hi int i 1 printf p n void h printf p n void
如何从标准输入读取一行，阻塞直到找到换行符？

我试图从命令行的标准输入一次读取任意长度的一行我不确定是否能够包含 GNU readline 并且更喜欢使用库函数我读过的文档表明getline应该可以工作但在我的实验中它不会阻塞我的示例程序 include
什么是内部类的合成反向引用

我正在寻找应用程序中的内存泄漏我正在使用的探查器告诉我寻找这些类型的引用但我不知道我在寻找什么有人可以解释一下吗 Thanks Elliott 您可以对 OUTER 类进行合成反向引用但不能对内部类实例进行合成 e g class
Guzzle 中的“并发”到底是什么？

我没有找到太多关于concurrency选项中Pool 如果这是可以在服务器上打开的 TCP 套接字数量那么问题是我可以使用多少并发来更快地处理请求我有这个使用的例子Pool I am using Laravel this is ba
Objective-C 使用字符串池吗？

我知道Java https stackoverflow com questions 3801343 what is string pool in java and C http msdn microsoft com en us librar
C 中带有指针的结构的内存开销[重复]

这个问题在这里已经有答案了我意识到当我的结构包含指针时它们会产生内存开销这里有一个例子 typedef struct int num1 int num2 myStruct1 typedef struct int p int num2
NodeJS CPU 一次飙升至 100%

我有一个用 NodeJS 编写的 SOCKS5 代理服务器我正在使用原生net and dgram打开 TCP 和 UDP 套接字的库它可以正常工作大约 2 天所有 CPU 的最大利用率约为 30 两天没有重新启动后一个 CPU 峰
跟踪 Linux 程序中活跃使用的内存

我想跟踪各种程序在特定状态下接触了多少内存例如假设我有一个图形程序最小化时它可能会使用更少的内存因为它不会重新绘制窗口这需要读取图像和字体并执行大量库函数这些对象仍然可以在内存中访问但实际上并没有被使用类似的工具top它们
Java Runtime.getRuntime().freeMemory() 问题

我搜索并看到了一些线程但没有一个能够解决我遇到的具体问题我正在尝试使用以下方式监视我的内存使用情况Runtime getRuntime freeMemory Runtime getRuntime maxMemory and Runtim
c# 通过内存地址调用方法

我正在尝试在 C 中的指定内存地址调用函数以下是我在 C 中的操作方法 typedef void do int i auto doActor do 0xAAAABEEF doActor 1 如果可能的话如何在 C 中复制这种行为对 C
ConcurrentHashMap 内部是如何工作的？

我正在阅读有关 Java 并发性的 Oracle 官方文档我想知道Collection由返回 public static
串行 I/O 与 Windows/Windows CE 重叠/不重叠

抱歉这不是一个大问题但更多的是帮助那些在这些特定问题上遇到问题的人我正在解决的问题需要使用串行 I O 但主要在 Windows CE 6 0 下运行然而最近有人问我该应用程序是否也可以在 Windows 下运行所以我开始着手解

随机推荐

smooth.spline()：拟合模型与用户指定的自由度不匹配

这是我运行的代码 fun lt function x 1 3 sin 4 pi x pi set seed 1 num samples lt 1000 x lt runif num samples y lt fun x rnorm num
如何从 PDF 中提取嵌入字体作为有效字体文件？

我知道pdftk exe实用程序可以指示 PDF 使用哪些字体以及它们是否嵌入现在的问题是假设我有嵌入字体的 PDF 文件如何才能以可作为常规字体文件重新使用的方式提取这些字体有最好是免费的工具可以做到这一点吗另外可以使用
如何动态地将列和行添加到空数据集中？

我创建了一个新数据集 DataSet local ds2 new DataSet 我尝试动态添加行和列 DataColumn dcAmount new DataColumn EmpID local ds2 Tables ACHFile Co
限制 HTML5 日期输入中的未来日期

我想限制用户只能在 HTML 日期输入中添加未来日期我想添加 HTML5 日历而不是 jQuery UI 日期选择器谁能告诉我如何将输入限制为未来日期您可以使用 HTML5 输入日期的 min 和 max 属性 HTML5代码
当 exe 失败时，python popen sdtout 无法获取所有输出

我是 python 新手并尝试在 Windows 中从 python 运行 exe 软件我写了以下代码 from subprocess import STDOUT Popen PIPE cmd r C Users lenaq Deskt
无法查看创建的架构内的任何关系

我启动了一个 postgres 容器它通过放置在 docker entrypoint 文件夹中的 sql 文件创建模式和表我的架构列在 dn 中但 dt 没有给出任何关系访问权限完好无损执行 dn 给出 List of schem
如何在 MVC WebGrid 中显示行号

我想要一个专栏row number在 MVC WebGrid 中我该怎么做这是一个非常好的方法但是当您使用排序或分页时您的RowNumber页面上的值不会从 1 开始在我的项目中我遇到了一个情况我需要知道独立于 WebGrid
JanusGraph Gremlin 使用“as”和“select”进行图遍历提供了意想不到的结果

我有两个图遍历结果如下 g V has id 2 outE knows inV gt v 4216 gt v 8312 g V has id 5 outE knows inV gt v 4216 gt v 8312 基本上两个顶点都有
ggplot 中的分组条形图

对于示例数据框 df lt structure list year c 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 imd quintile c 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Mongo 查询 Distinct 与 Sum 不起作用

在这里我更新了我的问题这是输入数据您可以使用此命令插入到本地数据库中 db pms teamleadtimesheets insertMany Text Analysis Comments 4 TaskType DELIVERY Ite
通过 CSS 使用自定义字体

我正在尝试获取自定义字体当我尝试时字体不起作用它使用自定义的 Times new Roman 这是我在样式表中的代码 font face font family ARBONNIE src url Custom ARBONNIE ttf
将回归线添加到多个散点图

环顾四周找不到我的问题的答案所以终于不再潜伏了我一直在创建多个散点图将每一列与其他列进行比较如下所示我使用了脚本 attach File plot Files c 2 3 4 5 6 7 8 但是我似乎无法正确输入命令以在图表
意外响应代码 403（但在浏览器中工作正常）

我试图从下面的 URL 获取 json 数据但是当我运行应用程序时它显示 31029 31125 E Volley 228776 NetworkUtility shouldRetryException Unexpected respons
pip install：请检查该目录的权限和所有者

在安装 pip 和 python 时我遇到了这样的情况目录 Users Parthenon Library Logs pi 或其父目录不属于当前用户并且调试日志已被禁用请检查该目录的权限和所有者如果使用 sudo 执行 pip 您
zBar 相机中的闪光灯

我正在使用 ZBAR 进行二维码扫描我已经正确实现了 ZBar 现在我想在 Zbar 中打开或关闭闪光灯在ZBar网站上我只得到有关手电筒的信息但没有有关手电筒的信息闪光是指光闪烁一瞬间火炬是指灯一直亮着的时候你确实想要
请求时间失败：java.net.socketException：协议不支持地址族

我到处寻找这个例外但找不到解决方案任何帮助将不胜感激我尝试过设置断点但它们没有被击中该错误也在 log v 中可见而不是在 log e 中可见该代码在前几次调用中有效例如 10 12 次然后变得更慢开始因此错误而失败并
API11+ 和 API11 之前版本的 Android 上 XmlPullParser.getInputEncoding() 的不同行为

我正在为我的 Android 应用程序开发一项新功能以启用数据备份和恢复我正在使用 XML 文件来备份数据这是一段设置输出文件编码的代码 XmlSerializer serializer Xml newSerializer FileW
类型错误：/ 不支持的操作数类型：“Image”和“int”

我想将 PIL Image 对象转换为 numpy 数组我尝试使用以下代码它显示错误 TypeError Traceback most recent call last
是否有与“paste”（即水平文件串联）等效的 PowerShell？ [复制]

这个问题在这里已经有答案了我想要水平地使用 PowerShell 连接一堆 CSV 文件在考虑可能的重复问题时请注意一堆不是两个 Linux 的 PowerShell 等效项是什么 paste命令几个月前我提交了一份提案
多核架构中的 CPU 和内存访问

我想知道如果例如 CPU 的 2 个核心尝试同时访问内存通过内存控制器一般如何处理内存访问实际上当内核和启用 DMA 的 IO 设备尝试以相同方式访问时同样适用 I think 内存控制器足够智能可以利用地址总线并同时处理这

多核架构中的 CPU 和内存访问

多核架构中的 CPU 和内存访问 的相关文章

随机推荐

热门标签

多核架构中的 CPU 和内存访问的相关文章