如何测量 Linux 中的真实 CPU 使用率？

2024-03-11

我知道有类似的工具top and ps用于测量 CPU 使用率，但他们测量 CPU 使用率的方法是测量空闲任务未运行的时间。因此，例如，即使 CPU 由于缓存未命中而出现停顿，这些工具仍然会认为 CPU 被占用。然而，我想要的是分析工具在停顿期间将 CPU 视为空闲状态。有没有什么工具可以做到这一点？

像top和ps这样的工具用于测量CPU使用率，..通过测量空闲任务没有运行的时间来测量CPU使用率。

不，他们不测量空闲，他们只是通过 /proc/stat 读取内核对其 CPU 使用情况的看法（尝试vmstat 1工具也）。您是否检查过系统范围的用户+系统时间仅由idle？我认为，内核只是导出调度程序的一些统计信息，它记录重新调度时的用户/系统状态，包括系统计时器和阻塞系统调用（可能是调用者之一）cpuacct_charge http://lxr.free-electrons.com/ident?v=3.16;i=cpuacct_charge, like update_curr - 更新当前任务的运行时统计信息。).

/proc/stat 示例：

cat /proc/stat
cpu  2255 34 2290 22625563 6290 127 456

并解码为http://www.linuxhowtos.org/System/procstat.htm http://www.linuxhowtos.org/System/procstat.htm

第一个“cpu”行聚合了所有其他“cpuN”行中的数字。这些数字标识 CPU 执行不同类型工作所花费的时间量。时间单位为 USER_HZ 或Jiffies（通常为百分之一秒）。

各列的含义从左到右如下：

user: normal processes executing in user mode
nice: niced processes executing in user mode
system: processes executing in kernel mode
idle: twiddling thumbs

当我们听到 jiffie 时，这意味着调度程序用于获取数字，而不是估计idle任务（顶部甚至看不到此任务或 pid 0 的任务）。

因此，例如，即使 CPU 由于缓存未命中而出现停顿，这些工具仍然会认为 CPU 被占用。

基本上（当没有SMT https://en.wikipedia.org/wiki/Simultaneous_multithreading与 Intel 中的 HT 类似），当您的任务由于内存访问（或无序而采取错误路径）而导致管道停顿时，CPU 就会被占用。操作系统无法运行其他任务，因为任务切换比等待这一任务的成本更高。

SMT 的情况有所不同，因为有些硬件要么在单个硬件上切换两个逻辑任务，要么甚至（在细粒度 SMT 中）将它们的指令（微操作）混合到单个流中以在共享硬件上执行。通常有SMT统计计数器来检查实际的混合情况。

然而，我想要的是分析工具在停顿期间将 CPU 视为空闲状态。有没有什么工具可以做到这一点？

性能监控单元可能有对此有用的事件。例如，perf stat报道了一些（在桑迪布里奇）

$ perf stat /bin/sleep 10

 Performance counter stats for '/bin/sleep 10':
      0,563759 task-clock                #    0,000 CPUs utilized          
             1 context-switches          #    0,002 M/sec                  
             0 CPU-migrations            #    0,000 M/sec                  
           175 page-faults               #    0,310 M/sec                  
       888 767 cycles                    #    1,577 GHz                    
       568 603 stalled-cycles-frontend   #   63,98% frontend cycles idle   
       445 567 stalled-cycles-backend    #   50,13% backend  cycles idle   
       593 103 instructions              #    0,67  insns per cycle        
                                         #    0,96  stalled cycles per insn
       115 709 branches                  #  205,246 M/sec                  
         7 699 branch-misses             #    6,65% of all branches        

  10,000933734 seconds time elapsed

因此，它表示 sleep 10 使用了 0,5 jiffie（任务时钟）。它太低，无法在经典 rusage 中计算，并且 /usr/bin/time 得到 0 jiffie 作为任务 CPU 使用率（用户 + 系统））： $ /usr/bin/时间睡眠 10 0.00user 0.00system 0:10.00elapsed 0%CPU (0avgtext+0avgdata 2608maxresident)k 0 个输入+0 个输出（0 个主要+210 个次要）页面错误 0 个交换

然后 perf 测量（在 PMU 的帮助下计数）任务执行的实际周期和实际指令（以及代表任务的内核） -cycles and instructions线。 Sleep 使用了 888k 个周期，但只完成了 593k 条有用指令，这意味着IPC https://en.wikipedia.org/wiki/Instructions_per_cycle为 0.6-0.7（30-40% 失速）。大约丢失了 30 万个周期；和桑迪桥上perf报告他们失踪的地点 -stalled-cycles-*前端事件（解码器 - 由于分支未命中或代码未预取到 L1I，CPU 不知道要执行什么）和后端事件（无法执行，因为指令需要内存中的一些数据，而这些数据在正确的时间不可用 -内存停滞）。

为什么我们在 CPU 内部看到更多的停顿，而实际上应该只有 300k 个周期而没有执行任何指令？这是因为现代处理器通常是超标量和无序的 - 它们可以在每个 CPU 时钟周期开始执行多个指令，甚至重新排序它们。如果您想查看执行端口利用率，请尝试ocperf（性能包装）来自 Andi Kleen'spmu工具 https://github.com/andikleen/pmu-tools以及一些有关 PMU 计数器的 Intel 手册。还有toplev.py脚本为“识别工作负载的微架构瓶颈“无需手动选择英特尔事件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何测量 Linux 中的真实 CPU 使用率？的相关文章

哪些 .NET 依赖注入框架值得研究？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
修改 CookieAuthenticationOptions LoginPath OnRedirectToReturnUrl 事件

我的 MVC 6 ASP NET 5 项目中有以下设置配置方法中的Startup cs app UseCookieAuthentication options gt options AuthenticationScheme Cookie
在 C# 中读取并发送 mp4 文件

我使用以下代码从服务器读取 mp4 文件并通过 http 发送它我的服务器端是 mvc4 控制器有趣的是视频在 Chrome 中渲染得很好但在 ios 设备上没有得到任何东西所以我认为这可能是响应流标头问题我缺少什么吗 var
如何设置 QTableView 中特定单元格的线条样式？

我正在使用 QT GUI 我正在使用 QTableView 实现一个简单的十六进制编辑控件我最初的想法是使用一个有十七列的表格表的每一行都有 16 个十六进制字节然后在第十七列中显示该数据的 ASCII 表示形式理想情况下我想编辑
.net 日历 - 使整个单元执行回发（可点击）

我已经启动并运行了一个 net 日历并从数据库中获取信息默认情况下天数会应用回发操作我想做的是将该操作应用于整个单元格这样用户就不需要仅单击文本链接我是 dayRenderer 操作我有以下行来尝试复制该操作但第二个参数我不
CommandBehavior.SequentialAccess 是否有任何性能提升？

我意识到我总是按照索引返回的顺序读取字段使用常量所以据我所知我的代码已经与 CommandBehavior SequentialAccess 兼容如果我打开它会有什么好处吗 DataReader 已经是只向前只读这才是真正的性能
Arduino C++ 析构函数？

我知道在Arduino中你不能使用delete 那么什么时候调用 C 类中定义的析构函数呢同样如果我想创建一个指向数组的指针我必须使用malloc and free 当对象被销毁时析构函数被调用对于自动堆栈上变量它在离开其作
C# 从视频文件的一部分中提取帧

使用 AForge ffmpeg 包装器您可以使用 VideoFileReader 类从视频中提取帧并将其保存为位图请参阅以下示例提取 avi 文件的帧 https stackoverflow com questions 178256
使用变体泛型委托类型对运算符 == 进行重载解析

重载解析的精确规则是什么两个委托类型表达式之间考虑以下代码其中using System 是需要的 static class ProgramA static void TargetMethod object obj static voi
将谓词作为参数传递给Where 子句时，EF SQL 发生了变化

EF 正在为下面列出的两个相似语句生成不同的 SQL var test dbcontext Persons GetAll Where c gt c PersonID 2 Select c gt c PersonName FirstOrDef
如何使 YY_INPUT 指向字符串而不是 Lex & Yacc (Solaris) 中的标准输入

我想要我的yylex 解析字符串而不是文件或标准输入如何使用 Solaris 提供的 Lex 和 Yacc 来做到这一点重新定义YY INPUT 这是一个工作示例使用命令编译并运行 yacc d parser y lex lexer
EF Core 5.0 中的多对多关系是否可以配置为仅保留一个导航属性（在一侧）？

我已使用以下代码配置了 DbContext EF Core 5 0 protected override void OnModelCreating ModelBuilder modelBuilder modelBuilder Entity
#region 描述编译到.net 中的.exe 中？

region endregion 指令描述是否编译到 NET 中的 EXE 中我知道注释不是但我经常在一个区域内对代码组进行分块并给出有用的描述我想确保这些描述在我编译的代码中不可见我不是在寻找混淆信息不过谢谢不他们不是
尝试返回 IQueryable 时发生转换错误

我有一个查询应该返回IQueryable
将计时器添加到 Windows 窗体应用程序

我想添加一个计时器而不是倒计时它会在什么时候自动开始表单加载开始时间应为 45 分钟一旦结束即达到 0 分钟时表单应终止并显示一条消息我怎样才能做到这一点语言最好是C 更详细一点 private void Form1 Lo
有没有办法获取正在运行或新打开的资源管理器窗口的 IExplorerBrowser 接口以供后续 BrowseToXXX 调用？

这么问是因为在上一个问题 https stackoverflow com questions 6220899 answer 6221898我是指向 IExplorerBrowser 的指针但是它创建了一个子窗口而我想模拟资源管理器的查
是否可以在 Visual Studio 2010 项目中使用多个“字符集”？

如您所知在 Visual Studio 2010 c 中我们有 noset unicode 和 MBCS 字符集我们可以通过菜单或预处理器指令如 define UNICODE 来设置它我正在开发一个项目它有一个使用 MBCS 字
C++ 使用枚举调用基类构造函数

是否可以将值和常量枚举传递给类的基本构造函数例如 enum CarBrand Volkswagen Ferrari Bugatti class Car public Car int horsePower CarBrand brand th
qt 读取就绪信号

我正在尝试与运行 1996 年处理器的设备建立串行连接这意味着数据传输回我可能需要几秒钟的时间我知道readyRead每次有新数据可用时都会生成信号但我的问题是生成多长时间这也是我可以测试就绪读取是否较低的一种方法因为如果当它们不
Xamarin Mac 中 AttributeName 的用途

我正在尝试对 Xamarin 中的 NSMutableAttributedString 中的子字符串进行着色但它似乎缺少正确的常量我应该在那里放什么 Update 这越来越接近 var s new NSMutableAttributed

随机推荐

Delphi拖拽能否“提升”为对接？

我有一个TPageControl其页面都是使用附加的各种形式ManualDock 用户应该能够通过拖动选项卡来重新排列选项卡这已经可以使用了然而也应该可以取消停靠的表单现在我有以下代码 procedure TMainForm Pag
Git 提交后挂钩：如何在 Windows 中启动 bat 文件

我有一个带有名称的bat文件jenkins bat开始在詹金斯服务器上构建进程现在我想在 git 中将这个 bat 文件作为 post commit hook 执行因此创建了以下文件post commit在文件夹中 git hooks
cd：参数太多 - 空格正确转义+引号？

使用 cygwin 终端我的 bashrc 中有以下内容 export WINHOME cygdrive c Users userName export TUTORING WINHOME Desktop Coding Projects T
如何计算OpenCV中Mat的最大像素值[重复]

这个问题在这里已经有答案了我想这应该是显而易见的但我找不到简单的方法来找到 OpenCV Mat 中所有像素中的最大值当然我可以对每种像素类型执行以下操作但一般的 max 函数仍然有用 double cvMax cv Mat m
Woocommerce：支付网关自定义感谢页面

我正在创建一个 Woocommerce 自定义支付网关插件它基本上将用户重定向到支付服务页面然后支付服务页面将用户重定向回指定的 URL 一切都按预期工作但我似乎无法创建自定义感谢页面从插件我所说的来自插件的意思是如果有人安装
使Python程序可执行

from distutils core import setup import py2exe sys os sys argv append py2exe setup options py2exe bundle files 1 windows
使用ansible复制本地文件（如果存在）

我正在一个项目中工作我们使用 ansible 来创建部署服务器集群我必须实现的任务之一是将本地文件复制到远程主机前提是该文件本地存在现在我正在尝试用这个来解决这个问题 hosts 127 0 0 1 connection local
boost::container::vector 无法使用 C++03 编译器进行编译

以下示例在使用带有 std c 0x 标志的 GCC 4 4 6 时可以正常编译但在 C 03 模式下无法编译 include
在 iOS 上读取实时摄像头流的 getUserMedia() 替代方案？

我们正在使用 QuaggaJS 构建一个移动条形码扫描仪它可以直接从设备的摄像头流中读取条形码在桌面 Android 上运行良好但在 iOS 上根本不起作用从最初的研究来看我发现 iOS 根本不支持 WebRTC getUserM
关于客户端安全，CORS 除了破坏同源策略之外还有其他作用吗？

如果没有它真的可以提高客户端安全性吗我正在考虑来自服务器 X 的脚本使用 XHR 从服务器 Y 支持 CORS 获取并运行不受信任的代码的情况显然评估不受信任的代码是不好的我根本不使用 CORS 来提高安全性我使用 CORS 访问
如何使用 iOS 版 Facebook App Invite SDK 邀请“谁”？

我一直在尝试让谁在我的应用程序上邀请某人但没有成功查看了 FB 文档却一无所获我的意思是用户邀请朋友朋友点击 FB 对话框上的安装将他带到 App Store 在那里他她安装我的应用程序安装应用程序后应用程序链
Javascript中如何判断现在是白天还是晚上？ [复制]

这个问题在这里已经有答案了我想根据浏览器的时间将不同的 CSS 表应用到我的网站例如如果是白天则显示 day css 或 night css 表示夜间我可以使用 PHP 执行此操作但它基于服务器时间而不是浏览器本地时间有没有
dbpedia SPARQL 查询获取给定城市的某些值

我确信我想做的事情非常简单但我似乎无法正确查询我在数据集中有记录其中包含城市名称等值例如纽约及其相应的国家地区代码例如美国我还可以访问完整的国家地区名称和国家地区 ISO 代码我想通过使用 where 子句从 db
pear邮件功能密件抄送不会发送

我从网站复制了 PEAR 邮件的代码并输入了我的数据有用它发送邮件但是我想使用密件抄送发送给很多人并保持他们的地址匿名并且它将发送到 to 收件人但不是 bcc 代码
如何分别删除有关 Firebase/Analytics 和 swizzing 的 Firebase 警告和控制台消息？

不知道为什么 firebase 会发出警告说我没有包含Firebase Analytics虽然我不需要它我在用着Firebase Messaging尽管我知道消息传递正在按预期工作那么我该如何删除这样的警告 Pods Firebas
Composer - 使用本地存储库

我是一名 Composer 初学者我试图使一个项目依赖于另一个项目而这两个项目仅存在于我的本地计算机上我的库项目 ProjectA 中的composer json是 name project util type library 我在这
Haskell 中是否有一个内置函数可以获取列表中大小为 n 的所有连续子序列？

例如我需要一个函数 gather Int gt a gt a gather n list where gather 3 Hello Hel ell llo ol 我有一个有效的实现 gather Int gt a gt a gather
如何为mysql中的一组记录提供相同的序列号

我是 mysql 的新手我在购物车表中有如下记录 id code 1 100 2 101 3 102 4 100 5 100 6 101 我的例外输出如下 id code serial number 1 100 1 2 101 2 3 1
Windows 7 Aero 主题进度条错误？

我在 Windows 7 上遇到了我认为是进度条错误的问题为了演示该错误我创建了一个带有按钮和进度条的 WinForm 应用程序在按钮的单击句柄中我有以下代码 private void buttonGo Click object
如何测量 Linux 中的真实 CPU 使用率？

我知道有类似的工具top and ps用于测量 CPU 使用率但他们测量 CPU 使用率的方法是测量空闲任务未运行的时间因此例如即使 CPU 由于缓存未命中而出现停顿这些工具仍然会认为 CPU 被占用然而我想要的是分析工具在停

如何测量 Linux 中的真实 CPU 使用率？

如何测量 Linux 中的真实 CPU 使用率？ 的相关文章

随机推荐

热门标签

如何测量 Linux 中的真实 CPU 使用率？的相关文章