何为CPU的亲和性

2023-05-16

CPU的亲和性，进程要在某个给定的 CPU 上尽量长时间地运行而不被迁移到其他处理器的倾向性，进程迁移的频率小就意味着产生的负载小。亲和性一词是从affinity翻译来的，实际可以称为CPU绑定。

在多核运行的机器上，每个CPU本身自己会有缓存，在缓存中存着进程使用的数据，而没有绑定CPU的话，进程可能会被操作系统调度到其他CPU上，如此CPU cache（高速缓冲存储器）命中率就低了，也就是说调到的CPU缓存区没有这类数据，要先把内存或硬盘的数据载入缓存。而当缓存区绑定CPU后，程序就会一直在指定的CPU执行，不会被操作系统调度到其他CPU，性能上会有一定的提高。

另外一种使用CPU绑定考虑的是将关键的进程隔离开，对于部分实时进程调度优先级提高，可以将其绑定到一个指定CPU核上，可以保证实时进程的调度，也可以避免其他CPU上进程被该实时进程干扰。

我们可以手动地为其分配CPU核，而不会过多的占用同一个CPU，所以设置CPU亲和性可以使某些程序提高性能。

Linux操作系统的CPU亲和性特征

操作系统部分Linux的调度程序同时提供”软CPU亲和性”和”硬CPU亲和性”

软亲和性：进程要在指定的 CPU 上尽量长时间地运行而不被迁移到其他CPU。

Linux 内核进程调度器天生就具有被称为软 CPU 亲和性（affinity）的特性，因此linux通过这种软的亲和性试图使某进程尽可能在同一个CPU上运行。

硬亲和性：将进程或者线程绑定到某一个指定的cpu核运行

虽然Linux尽力通过一种软的亲和性试图使进程尽量在同一个处理器上运行，但它也允许用户强制指定进程无论如何都必须在指定的处理器上运行。

硬亲和性使用场景

硬亲和性场景：需要保持高CPU缓存命中率时、需要测试复杂的应用程序时。

保持高CPU缓存命中率：如果一个给定的进程迁移到其他地方去了，那么它就失去了利用 CPU 缓存的优势。实际上，如果正在使用的 CPU 需要为自己缓存一些特殊的数据，那么所有其他 CPU 都会使这些数据在自己的缓存中失效。因此，如果有多个线程都需要相同的数据，那么将这些线程绑定到一个特定的 CPU 上是非常有意义的，这样就确保它们可以访问相同的缓存数据（或者至少可以提高缓存的命中率）。否则，这些线程可能会在不同的 CPU 上执行，这样会频繁地使其他缓存项失效。

测试复杂的应用程序：考虑一个需要进行线性可伸缩性测试的应用程序。有些产品声明可以在使用更多硬件时执行得更好。我们不用购买多台机器（为每种处理器配置都购买一台机器），而是可以：

1.购买一台多处理器的机器；

2.不断增加分配的处理器；

3.测量每秒的事务数；

4.评估结果的可伸缩性。

在Linux操作系统中修改CPU亲和性的手段

在Linux内核中，所有的进程都有一个相关的数据结构，称为 task_struct。这个结构非常重要，其中与亲和性（affinity）相关度最高的是 cpus_allowed 位掩码。这个位掩码由 n 位组成，与系统中的 n 个逻辑处理器对应。具有 4 个物理 CPU 的系统可以有 4 位。如果这些 CPU 都启用了超线程，那么这个系统就有8个位掩码。如果为给定的进程设置了给定的位，那么这个进程就可以在相关的 CPU 上运行。因此，如果一个进程可以在任何 CPU 上运行，并且能够根据需要在处理器之间进行迁移，那么位掩码就全是 1。这是 Linux 中进程的预设状态!

Linux 内核 API 提供了一些方法，让用户可以修改位掩码或查看当前的位掩码，控制和绑定进程在特定的CPU：

sched_set_affinity() （用来修改位掩码）

sched_get_affinity() （用来查看当前的位掩码）

cpus_allowed（用于控制进程可以在哪里处理器上运行）

sched_setaffinity（用于某个进程绑定到一个特定的CPU）

文章阅读知识点：

物理CPU：机器上实际安装的CPU个数，比如说你的主板上安装了一块8核CPU，那么物理CPU个数就是1个，所以物理CPU个数就是主板上安装的CPU个数。

逻辑CPU：一般情况，我们认为一颗CPU可以有多个核，加上intel的超线程技术(HT), 可以在逻辑上再分一倍数量的CPU core出来。

超线程技术(Hyper-Threading)：就是利用特殊的硬件指令，把单个物理CPU模拟成两个CPU（逻辑CPU），实现多线程。我们常听到的双核四线程/四核八线程指的就是支持超线程技术的CPU

管理处理器的亲和性（affinity）

为什么（3 个原因）以及如何使用硬（相对于软）CPU 亲和性（affinity）

简单地说，CPU 亲和性（affinity） 就是进程要在某个给定的 CPU 上尽量长时间地运行而不被迁移到其他处理器的倾向性。Linux 内核进程调度器天生就具有被称为 软 CPU 亲和性（affinity） 的特性，这意味着进程通常不会在处理器之间频繁迁移。这种状态正是我们希望的，因为进程迁移的频率小就意味着产生的负载小。

2.6 版本的 Linux 内核还包含了一种机制，它让开发人员可以编程实现 硬 CPU 亲和性（affinity）。这意味着应用程序可以显式地指定进程在哪个（或哪些）处理器上运行。

什么是 Linux 内核硬亲和性（affinity）？

在 Linux 内核中，所有的进程都有一个相关的数据结构，称为 task_struct。这个结构非常重要，原因有很多；其中与亲和性（affinity）相关度最高的是 cpus_allowed 位掩码。这个位掩码由 n 位组成，与系统中的 n 个逻辑处理器一一对应。具有 4 个物理 CPU 的系统可以有 4 位。如果这些 CPU 都启用了超线程，那么这个系统就有一个 8 位的位掩码。

如果为给定的进程设置了给定的位，那么这个进程就可以在相关的 CPU 上运行。因此，如果一个进程可以在任何 CPU 上运行，并且能够根据需要在处理器之间进行迁移，那么位掩码就全是 1。实际上，这就是 Linux 中进程的缺省状态。

Linux 内核 API 提供了一些方法，让用户可以修改位掩码或查看当前的位掩码：

sched_set_affinity() （用来修改位掩码）
sched_get_affinity() （用来查看当前的位掩码）

注意，cpu_affinity 会被传递给子线程，因此应该适当地调用 sched_set_affinity。

回页首

为什么应该使用硬亲和性（affinity）？

通常 Linux 内核都可以很好地对进程进行调度，在应该运行的地方运行进程（这就是说，在可用的处理器上运行并获得很好的整体性能）。内核包含了一些用来检测 CPU 之间任务负载迁移的算法，可以启用进程迁移来降低繁忙的处理器的压力。

一般情况下，在应用程序中只需使用缺省的调度器行为。然而，您可能会希望修改这些缺省行为以实现性能的优化。让我们来看一下使用硬亲和性（affinity）的 3 个原因。

原因 1. 有大量计算要做

基于大量计算的情形通常出现在科学和理论计算中，但是通用领域的计算也可能出现这种情况。一个常见的标志是您发现自己的应用程序要在多处理器的机器上花费大量的计算时间。

原因 2. 您在测试复杂的应用程序

测试复杂软件是我们对内核的亲和性（affinity）技术感兴趣的另外一个原因。考虑一个需要进行线性可伸缩性测试的应用程序。有些产品声明可以在 使用更多硬件 时执行得更好。

我们不用购买多台机器（为每种处理器配置都购买一台机器），而是可以：

购买一台多处理器的机器
不断增加分配的处理器
测量每秒的事务数
评估结果的可伸缩性

如果应用程序随着 CPU 的增加可以线性地伸缩，那么每秒事务数和 CPU 个数之间应该会是线性的关系（例如斜线图 —— 请参阅下一节的内容）。这样建模可以确定应用程序是否可以有效地使用底层硬件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CPU

何为CPU的亲和性的相关文章

制作一个编译 Tensorflow 二进制文件的 Dockerfile 以使用：SSE4.1、SSE4.2 和 AVX 指令

那么 docker的目的之一就是轻松部署一个环境来测试软件对吧谁能告诉我如何编译 Tensorflow 二进制文件以在 docker 文件上使用 SSE4 1 SSE4 2 有人能指点我一个可以做到这一点的 docker 文件吗如果有
检测处理器的数量

如何检测 net 中物理处理器核心的数量 System Environment ProcessorCount 返回逻辑处理器的数量 http msdn microsoft com en us library system environm
CPU 相关代码：如何避免函数指针？

我为多个 CPU 编写了性能关键的代码我在运行时检测 CPU 并基于此为检测到的 CPU 使用适当的函数所以现在我必须使用函数指针并使用这些函数指针调用函数 void do something neon void void do so
在 C++ 中处理 CPU 异常

是否有跨平台的方法来处理 CPU 异常例如分段错误或除以零可以说我需要调用一些潜在不安全的函数例如从插件文件这可能会导致段错误或在执行之前无法测试的一些其他问题我知道 C 标准库有信号处理函数但我不知道如何使用它们来处理问题
sched_getcpu() 相当于 OS X 吗？

在 OS X 上有没有办法找出线程正在哪个 CPU 上运行 Linux 的等效函数是调度获取CPU http man7 org linux man pages man3 sched getcpu 3 html 获取当前处理器编号 http
用标签数据填充 x86_64 指针前十六位？

由于当前的 x86 64 实现仅能够使用 48 位虚拟地址空间来降低 MMU 复杂性因此前 16 位是否可用于实现安全标签数据当前的实现是否限制这种使用即使知道IP和其他段寄存器是完整的六十四位并将指针的前十六位限制为仅包含虚拟
第一个计算机程序是如何创建的？ [复制]

这个问题在这里已经有答案了可能的重复第一个编译器是如何编写的 https stackoverflow com questions 1653649 how was the first compiler written 这个问题一直困扰着我
运行 Android Studio gradle 构建时如何使用所有 CPU 核心/线程？

我正在 Android Studio 中寻找参数或配置 Gradle 它可以设置构建以便在构建期间使用我的所有 CPU 核心即如果我有一个四核 CPU 并且每个核心运行 8 个线程我如何优化构建以便它将使用它可以获得的所有资源当
GRUB 是否切换到保护模式？

我想问一下启动时将CPU切换到保护模式是GRUB还是Linux内核我还想问内核本身 vmlinuz 是 ELF 还是纯二进制格式谢谢 GRUB does让你进入保护模式 GRUB多重引导规范版本 0 6 96 第 3 2 节 ht
使用javascript检测设备CPU/GPU性能？

这个问题并不特定于 Three js 但我会用它作为例子我最近一直在使用 Three js 开发 Web 应用程序界面并在 WebGL 和 Canvas 渲染器针对桌面浏览器之间编写了一些不错的后备程序但现在的问题变成了如何正确检
FreeBSD v8.1 上的 /proc/cpuinfo 相当于什么？

相当于Linux的什么 proc cpuinfo在 FreeBSD v8 1 上我的应用程序读取 proc cpuinfo并将信息保存在日志文件中我该怎么做才能在 FreeBSD 上记录类似的信息一个样品 proc cpuinfo看起
使CPU的缓存失效

当我的程序执行具有获取语义的加载操作具有释放语义的存储操作或可能是完整栅栏时它会使 CPU 的缓存无效我的问题是缓存的哪一部分实际上失效了只有保存我使用的获取释放变量的缓存行或者整个缓存都失效了 L1 L2 L3 等等当我使
Java限制资源使用

有没有办法限制java使用的核心数量同样是否有可能限制该核心的使用量您可以在 Linux 上使用任务集您还可以降低进程的优先级但除非 CPU 繁忙否则进程将获得尽可能多的 CPU 我有一个将线程专用于核心的库称为 Java T
Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果

我正在尝试实现一个程序来测试 GPU 设备上的 Tensorflow 性能数据测试是MNIST数据使用多层感知器神经网络进行监督训练我跟着这个简单的例子 http gist github com nishidy 8176548ec
多处理和并行处理之间的比较

有人能告诉我多处理和并行处理之间的确切区别吗我有点困惑感谢您的帮助多重处理多重处理是使用两个或多个中央处理单元单个计算机系统中的 CPU 该术语还指系统支持多个处理器和或的能力在他们之间分配任务的能力并行处理在计算机中
哪个更快：x<<1 或 x<<10？

我不想优化任何东西我发誓我只是出于好奇而想问这个问题我知道在大多数硬件上都有位移位的汇编命令例如shl shr 这是一个单一命令但移位多少位从纳秒角度或从 CPU 角度角度是否重要换句话说以下任一选项在任何 CPU 上都更
如何获取 Java7 应用程序的 CPU、RAM 和网络使用情况

我找到了这篇旧文章如何在 Java 中监控计算机的 cpu 内存和磁盘使用情况 https stackoverflow com questions 47177 how to monitor the computers cpu memory
Xcode 9 - CPU 使用率高 - 风扇最大速度

自从我升级到 Xcode 9 后当我在 Xcode 上工作时我的粉丝就变得疯狂了当我使用 Storyboards 和 Interface Builder 时尤其会发生这种情况 Xcode有时会占用100 的CPU 并且名为 Inte
是否可以在VM内使用VMX CPU指令？

VM guest 内部的进程是否有可能使用 VMX AMD V VT x CPU 指令然后由外部 VMM 处理而不是直接在 CPU 上处理 Edit 假设外部VM使用VMX本身来管理其虚拟客户机即它在Ring 1中运行如果可能的话是
PHP 脚本不断执行 mmap/munmap

我的 PHP 脚本包含一个循环它只不过是回显和取消引用指针如 tab othertab i gt 中的内容直到昨天这个脚本开始变得非常慢比以前慢了 50 倍之前它一直运行良好使用 strace 后我发现 90 的情况下脚

随机推荐

当你遇到Bug该怎么办？

一问题复现稳定复现问题才能正确的对问题进行定位解决以及验证一般来说 xff0c 越容易复现的问题越容易解决 1 1 模拟复现条件有的问题存在于特定的条件下 xff0c 只需要模拟出现问题的条件即可复现对于依赖外部输入的条件 xf
增加远程访问用户

http www zhuangjiba com hardware 34023 html http www zhuangjiba com hardware 34023 html 打开管理员权限 xff1a
基于Java的“多功能五子棋”游戏的设计和实现

源码地址 xff1a http download csdn net detail clx55555 9718406 下载或转载使用请声明原著 xff1a 但求心安基于 Java的多功能五子棋游戏的设计和实现引言随着经济社会的迅速发
shell 脚本中的注释详解

单行注释 xff1a 单行注释就比较简单了 xff0c 直接在行最前端加上符号即可具体用法如下所示 xff1a this is comment test echo 34 this is comment test 34 运行结果 xff1
《演讲的本质》：如何做好一次公开演讲？

关于本书演讲的本质是一本教你通过演讲最大化自己的影响力建立信任关系的工具书 xff0c 探讨演讲的本质和价值本书从视觉听觉语言三个角度来分析如何最大程度地打动听众 xff0c 并提供了行之有效的练习方法核心内容演讲的本质与价
ubuntu系统镜像下载源

ubuntu 14 04 和16 04 快速下载由于官网服务器在国外 xff0c 下载速度奇慢 xff0c 所以我们可以利用阿里云镜像下载ubuntu ubuntu 14 04 xff1a ubuntu releases 14 04安装包
每天最重要的2小时

关于作者乔西戴维斯 xff0c 他是哥伦比亚大学的心理学博士 xff0c 主要研究神经学领域关于本书从身体效能的角度 xff0c 让我们在面对一件事情时 xff0c 怎么才能把身体调整到一种巅峰状态 xff0c 进而对时间进行高效的
【无标题】

63张图 xff0c 一步一步带你弄清 Linux 虚拟内存管理 xff0c 厉害内存管理子系统可谓是 Linux 内核众多子系统中最为复杂最为庞大的一个 xff0c 其中包含了众多繁杂的概念和原理 xff0c 通过内存管理这条主线我们把
面试时不懂得自我介绍的人，最后都被PASS掉了

做硬件维护的阿润最近后悔得直跳脚在被公司赔偿清退后 xff0c 他直接开启了HIGH玩模式 xff0c 原计划先玩2个月再做面试准备 xff0c 结果冷不丁接到心仪公司的面试邀约因为时间紧邀约急 xff0c 在没做好充分准备的前提下
开发板和电脑可以ping通但是ssh连接不上

一问题描述某集群数据节点服务器频繁无法连接 xff0c 服务器间出现可ping通但ssh无法连接的情况 xff0c 使用带外地址登录后远程控制也无法显示正常界面 xff0c 重启后会短暂恢复二排查问题重启服务器后检查服务器SSH状
你对Linux下的实时性应该多点了解

本文讲述一些有利于提高xenomai实时性的配置建议 xff0c 部分针对X86架构 xff0c 但它们的底层原理相通 xff0c 同样适用于其他CPU架构和系统 xff0c 希望对你有用希望能够帮助大家本文来自于微信公众号嵌入式Lin
怎么保证ECU的“实时性”

在最近一起有公开报道的辅助驾驶相关事故中 xff0c 由于AEB xff08 自动紧急制动系统 xff09 功能被怀疑没有起作用 xff0c 又有一家车企的高级辅助驾驶功能遭到质疑其实 xff0c 目前大多数车辆中AEB功能的生效车速区间
重磅成果丨ASAM SOVD 1.0.0正式发布

重磅成果丨ASAM SOVD 1 0 0正式发布测试行业动态汽车测试网编者寄语 xff1a 2022年6月底 xff0c ASAM SOVD 1 0 0版本正式发布为了应对智能网联汽车时代井喷的软件诊断需求 xff0c SOVD如何
2016-我在路上

2016匆匆而过 xff0c 这一年做了很多 xff0c 也错过了很多有些事情自己感觉很值得 xff0c 有些事情感觉很愧疚 xff0c 一年的酸甜苦辣尽在其中寒假 xff0c 我加入的acm实验室 xff0c 有个集训 xff0c 但
《复盘高手》

今天为你介绍的是复盘高手 xff0c 副标题是自我认识与自我精进的底层逻辑复盘本是围棋的一个术语 xff0c 说的是下完一盘棋后 xff0c 棋手在棋盘上把下棋的过程复现一遍 xff0c 看看哪些地方下得好 xff0c 哪些地方不好
Linux 进程间通信（六）共享内存

可以说 xff0c 共享内存是一种最为高效的进程间通信方式 xff0c 因为进程可以直接读写内存 xff0c 不需要任何数据的复制为了在多个进程间交换信息 xff0c 内核专门留出了一块内存区 xff0c 这段内存区可以由需要访问的进程将
对ASPICE的理解

Aspice xff08 Automotive SPICE xff09 中文翻译为汽车软件过程改进及能力评定是为保证软件质量的规范 xff0c 要求供应商按照Automotive SPICE的要求进行产品的设计与开发是汽车行业中常用于质
普通人如何改变自己的命运？

Morty 普通人改变命运的秘密 xff01 我的观点可能会颠覆你的认知哔哩哔哩 bilibili 非常感谢UP xff0c 你的每个视频我都看了 xff0c 给我启示最大的是为什么你总是那么穷 xff0c 这些年一直走背运 xff0c
指令流水线

为提高处理器执行指令的效率 xff0c 把一条指令的操作分成多个细小的步骤 xff0c 每个步骤由专门的电路完成的方式指令流水线是为提高处理器执行指令的效率 xff0c 把一条指令的操作分成多个细小的步骤 xff0c 每个步骤由专门的电路
何为CPU的亲和性

CPU的亲和性 xff0c 进程要在某个给定的 CPU 上尽量长时间地运行而不被迁移到其他处理器的倾向性 xff0c 进程迁移的频率小就意味着产生的负载小亲和性一词是从affinity翻译来的 xff0c 实际可以称为CPU绑定在多核运

何为CPU的亲和性

管理处理器的亲和性（affinity）

何为CPU的亲和性 的相关文章

随机推荐

热门标签

何为CPU的亲和性的相关文章