为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？

2023-12-30

Running perf stat ls显示这个：

Performance counter stats for 'ls':

          1.388670 task-clock                #    0.067 CPUs utilized          
                 2 context-switches          #    0.001 M/sec                  
                 0 cpu-migrations            #    0.000 K/sec                  
               266 page-faults               #    0.192 M/sec                  
           3515391 cycles                    #    2.531 GHz                    
           2096636 stalled-cycles-frontend   #   59.64% frontend cycles idle   
   <not supported> stalled-cycles-backend  
           2927468 instructions              #    0.83  insns per cycle        
                                             #    0.72  stalled cycles per insn
            615636 branches                  #  443.328 M/sec                  
             22172 branch-misses             #    3.60% of all branches        

       0.020657192 seconds time elapsed

Why is 停滞周期后端显示“不支持”？我需要什么样的 CPU、硬件、内核或用户空间软件才能看到该值？

目前在 RHEL 上使用 Linux 3.12 for x86_64 尝试过此操作，并匹配perf版本，在不同的 Intel Core i5 和 i7 系统（Ivy Bridge 类型）上。他们都不支持停滞周期后端.

更多信息：

$ perf list | grep stalled
  stalled-cycles-frontend OR idle-cycles-frontend    [Hardware event]
  stalled-cycles-frontend OR cpu/stalled-cycles-frontend/ [Kernel PMU event]

$ ls /sys/devices/cpu/events/
branch-instructions  bus-cycles    cache-references  instructions  mem-stores
branch-misses        cache-misses  cpu-cycles        mem-loads     stalled-cycles-frontend

$ cat /sys/bus/event_source/devices/cpu/events/stalled-cycles-frontend
event=0x0e,umask=0x01,inv,cmask=0x01

Edit:刚刚在 AMD Phenom II X6 1045T CPU 上尝试过这个，在 Ubuntu 12.04 和 Linux 3.2（32 位）下 - 这里它确实显示了两者的值停滞的周期前端 and 停滞周期后端.

好像perf尚未更新以了解 Ivy Bridge 支持的所有性能监控事件。幸运的是，有一个通用的（尽管很麻烦）界面允许您访问性能监控事件的完整列表。我没看到stalled-cycles-backend当我快速浏览一下时，它就在列表中，但也许我错过了，或者也许他们已经通过所有可能阻碍后端的不同事件将其分解了。

我们从

perf list --help

...显示以下内容NOTE

    1. Intel(R) 64 and IA-32 Architectures Software Developer's Manual
       Volume 3B: System Programming Guide
       http://www.intel.com/Assets/PDF/manual/253669.pdf

...配备了您最终进入的 URL

http://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-software-developer-vol-3b-part-2-manual.pdf

...你想要第 19.3 节

19.3 第三代的性能监控事件英特尔® 酷睿™ 处理器第三代英特尔® 酷睿™ 处理器和英特尔至强处理器 E3-1200 v2 产品系列基于代号为 Ivy Bridge 的英特尔微架构。它们支持表 19-1 中列出的架构性能监控事件。表 19-5 列出了处理器内核中的非架构性能监控事件。表 19-5 中的事件适用于具有 DisplayFamily_DisplayModel 编码的 CPUID 签名且具有以下值的处理器：06_3AH。

...因此对于architectural您需要的事件表 19-1

19.1 架构性能监控事件英特尔酷睿单核和英特尔酷睿双核处理器中引入了架构性能事件。基于 Intel Core 微架构的处理器也支持它们。表 19-1 列出了可以使用通用性能计数器和相关事件选择寄存器进行配置的预定义架构性能事件。

**表 19-1。建筑表演活动

...现在是棘手的部分，你采取UMask Value作为上面 2 个十六进制数字和Event Num是要赋予的 4 个十六进制数字硬件寄存器号的低 2 个十六进制数字perf stat.

perf stat --help

   -e, --event=
       Select the PMU event. Selection can be a symbolic event name (use
       perf list to list all events) or a raw PMU event (eventsel+umask) in
       the form of rNNN where NNN is a hexadecimal event descriptor.

... 它说NNN但你可以给它NNNN。让我们验证一下这是否有效，让我们询问一下perf stat对于缓存未命中，既可以作为符号事件名称，也可以作为表 19-1 中的十六进制数字。我们将调用date为了简单起见，命令。

$ perf stat -e r412e -e cache-misses date

Fri Mar 28 09:28:52 CDT 2014

Performance counter stats for 'date':

          2292 r412e                                                       
          2292 cache-misses                                                

   0.003322663 seconds time elapsed

$

正如您所看到的，两者报告了相同的数字，到目前为止一切顺利。现在我们来看表 19-5 的非架构硬件寄存器，其中的寄存器太多了，这里无法列出，但我只列出一些：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？的相关文章

伊迪德信息

重新定义问题有什么方法可以获取所连接显示器的序列号吗我想收集显示器的Eid信息当我使用 logverbose 选项运行 X 时我可以从 xorg 0 log 文件中获取它但问题是如果我切换显示器拔出当前显示器然后插入另一个显
Array.indexOf 如何比 Array.some 更高效

这个问题的灵感来自于这个问题的竞争答案具有多个参数的indexOf https stackoverflow com questions 39000151 indexof with multiple arguments 用户想知道一种有效的
在 Ubuntu 16.04 上找不到 printf.c

我最近切换到Ubuntu 16 04 我在用vscode作为 Ubuntu 上的 IDE 我配置了其他语言但我无法做到这一点C C 我创建c cpp properties json launch json tasks json 当我开始编
为什么 pandas 在简单的数学运算上比 numpy 更快？

最近我观察到 pandas 的乘法速度更快我在下面的例子中向您展示了这一点如此简单的操作怎么可能做到这一点这怎么可能呢 pandas 数据帧中的底层数据容器是 numpy 数组测量我使用形状为 10k 10k 的数组数据框 i
如何让“grep”从文件中读取模式？

假设有一个很大的文本文件我只想打印与某些模式不匹配的行显然我可以使用egrep v patter1 pattern2 pattern3 现在如果所有这些模式都在一个文本文件中怎么办最好的制作方法是什么egrep从文件中读取模式 g
从 TypeScript 运行任何 Linux 终端命令？

有没有办法直接从 TypeScript 类中执行 Linux 终端命令这个想法是做类似的事情 let myTerminal new LinuxTerminal let terminalResult myTerminal run sudo
C# 中单个 & 符号的第二个含义是什么？

我在 C 中使用了单个与号来表示检查second条件语句即使第一个是false 但以下似乎是不同的意思 of 总而言之谁能解释一下如何i 1在下面的例子中有效吗 List
适用于 KDE 和 Gnome 的 Gui [重复]

这个问题在这里已经有答案了我想为一个现在是 CLI 的应用程序编写一个 gui 它需要在 KDE 和 Gnome DE 中看起来不错充分利用用户的外观设置如果我选择 Qt 或 GTK 我能够做到这一点吗它们与两个 DE 集成良好吗
通过增加索引之和来生成排序组合的有效方法

对于启发式算法我需要一个接一个地评估特定集合的组合直到达到停止标准由于它们很多目前我正在使用以下内存高效迭代器块生成它们受到 python 的启发 itertools combinations http docs python o
无需 cron 在后台发送邮件

我想知道是否有一种方法可以运行 PHP 循环以便在后台向订阅者发送几百封电子邮件我的目标是格式化新闻通讯单击发送然后关闭浏览器或更改页面当然发送电子邮件的实际过程将在后台运行不会因浏览器关闭而中断我知道这可以通过 cron
如何在特定 systemd 服务重新启动时触发自定义脚本运行

我想知道如何安排自定义脚本在重新启动服务时运行我的用例是每当重新启动 Tomcat 服务时我都必须运行多个命令我想知道是否有一种方法可以编写脚本并安排它在重新启动 Tomcat 服务时运行我已将 tomcat 脚本设置为 syst
Composer 安装要求

我正在尝试将 Composer 安装到 Laravel 项目中当我做的时候sudo composer install在项目目录中它显示了两个错误 Problem 1 Installation request for simplesoftw
Docker：处理 tar 文件时出错（退出状态 1）：设置枢轴目录时出错：不是目录

我是 Docker 新手不知道是什么原因导致此错误或如何诊断它任何有关此问题的具体帮助或有关首先检查何处以诊断此类问题的提示将不胜感激我的 Dockerfile FROM java 8 Install maven RUN apt ge
将数据从一个线程传递到另一个线程的最快可能方法

我正在使用增强spsc queue将我的东西从一个线程移动到另一个线程这是我的软件中的关键位置之一所以我想尽快完成它我写了这个测试程序 include
没有可用的符号表信息

我正在测试第三方的库它崩溃了当我想查看崩溃的原因时我的 gdb 告诉我没有可用的调试符号 Program received signal SIGSEGV Segmentation fault Switching to Thread 0
优化数据可视化 Web 应用程序的性能

我正在重写 3 年前编写的数据可视化网络工具从那时起浏览器的 JavaScript 引擎变得更快所以我正在考虑将部分工作从服务器转移到客户端在页面上数据在表格和地图或图表中可视化它使用相同的数据但以不同的方式因此准备显示
在主目录中安装库

在 Linux Ubuntu 中我尝试运行一个工具但它显示错误库丢失我无权在系统中安装任何内容或者根本无法从我的用户帐户执行 sudo 是否可以在我的主目录没有 sudo 中安装缺少的库在我的例子中为 libstdc so 6
Python——捕获异常的效率[重复]

这个问题在这里已经有答案了可能的重复 Python 常见问题解答异常有多快 https stackoverflow com questions 8107695 python faq how fast are exceptions 我记得
如何模拟ARM处理器运行环境并加载Linux内核模块？

我尝试加载我的vmlinux into gdb并使用 ARM 内核模拟器但我不明白为什么我会得到Undefined target command sim 这是外壳输出 arm eabi gdb vmlinux GNU gdb GDB 7
QFileDialog::getSaveFileName 和默认的 selectedFilter

我有 getSaveFileName 和一些过滤器我希望当用户打开保存对话框时选择其中之一 Qt 文档说明如下可以通过将 selectedFilter 设置为所需的值来选择默认过滤器我尝试以下变体 QString selFilte

随机推荐

亚马逊AWS拒绝许可

我正在尝试使用 AWS 凭证文件连接到 amazon s3 为此我做了以下操作我创造了credentials ini文件于 aws credentials 它有有效的AWSAccessKeyId and AWSSecretKey defa
'UnauthorizedAccessException' - 'Global\.net clr 网络'

我正在用户 Guest 下测试我的应用程序它因以下错误而崩溃 UnauthorizedAccessException Global net clr 网络现在我知道我可以编辑计算机上的安全策略以允许信任来宾下运行的 CLR 代码但在
冒号与数字垂直对齐

我想创建如下内容我创建了这个例子 https codepen io anon pen bvOPGE https codepen io anon pen bvOPGE 与 HTML ul li span 30 span days li li
为什么场景大纲在 VS 2012 测试资源管理器中显示为“外部”？

我有一个场景大纲也称为场景模板我希望使用 VS 2012 的测试资源管理器列出我的测试默认测试分组是通过项目名称完成的如果我坚持使用它来自场景大纲的测试将位于外部组中而不是在我的项目组下这是为什么有解决方案解决方法
如何在单个 pdf 单元格中添加两行？

我正在生成条形码现在我想将学生代码插入条形码标签下我该怎么做我的代码是 foreach GridViewRow row in grdBarcode Rows DataList dl DataList row FindControl d
内存：在表中存储多个补丁的补丁变量

我正在创建特定于海龟的表在其中存储补丁坐标模拟年份全局变量根据刻度数设置为 1 2 或 3 以及表示可用资源的补丁变量我已经成功地编写了一个表的代码该表包含当前补丁的这些值但我一直试图对其进行缩放以便海龟在每个时间步都为其所有
scala：如何建模基本的父子关系

我有一个包含多种产品的品牌类在产品类别中我想引用该品牌如下所示 case class Brand val name String val products List Product case class Product val nam
Oauth2 Spring 中的更改响应

你好我已经在这个论坛上发布了这个问题我也发在这里以便有更多机会得到回复 http forum spring io forum spring projects security oauth 745627 response of oaut
子视图显示错误

我做了一个项目并实施了文件夹项目 https github com jwilling JWFolders现在我已经设置了一个子视图它显示在文件夹上方如图所示弹出窗口上有一个图像我想这样做如果我点击该图像将显示带有整个图像的新控制
在webots中使用opencv的“imshow”绘制图像

嗨我在 webots 中使用 opencv 我想绘制图像这是控制器 include
关于如何抓取 __doPostBack('...'); 后面的页面有什么想法吗？

我正在研究这个 php 基础抓取器爬虫它工作正常直到它获得 net 生成的 Herf 链接 doPostBack 知道如何处理这个并抓取这些链接后面的页面吗不要尝试自动单击 JavaScript 按钮这需要 PHP 中的其他库而
当maven说“在MyRepo的更新间隔过去之前不会重新尝试解析”时，该间隔在哪里指定？

使用 Maven 我偶尔会遇到来自某些 3rd 方存储库的工件但我尚未构建或包含在我的存储库中我将从 Maven 客户端收到一条错误消息指出找不到工件找不到 org jfrog maven annomojo maven plugin
Android 中使用 GPS 进行虚假定位

您好我正在开发一个用于设置坐标纬度和经度的应用程序它必须显示我在该坐标处的位置它类似于位置欺骗 http www androidzoom com android applications tools location spoofe
SOAP 请求和响应使用 libcurl - C 读取文件或写入文件

我正在尝试从 xml 文件发送 SOAP 请求并发送到 SOAP 服务然后使用 libcurl 读取响应并将其保存到文件中 xml 文件中的请求示例如下
从 mainBundle 加载

在一些流行的开源 swift 项目中我注意到以下方法用于从主包加载文件 objc class TestClass NSObject let bundle NSBundle forClass TestClass self let path
如何动态反序列化Json字符串

我通过以下方式消费了调查数据SSE Stream这给了我每个人逐行回答的格式Survey X data 4482359 12526 5 5 Yes that is right 1 我把它读成List of String using Stre
在活动记录中使用本机 SQL 函数 (codeigniter)

我正在尝试获取日期大于或等于今天的所有数据这是我所做的 this gt db gt select id name this gt db gt where dr 1 this gt db gt where end gt CURDATE qu
Angular-ui 选项卡在选项卡内容中加载模板

我正在使用以下控制器使用 angular ui 中的选项卡 scope panes title Home content home active true title Settings content settings title View
如何在 Bash 中获取当前可用磁盘空间？

我正在运行一些操作这些操作不断消耗我的磁盘空间因此我希望我的计算机在磁盘空间低于 2GB 时发出声音我知道我可以通过运行获得列出可用磁盘空间的输出df h Filesystem Size Used Avail Capacity iu
为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？

Running perf stat ls显示这个 Performance counter stats for ls 1 388670 task clock 0 067 CPUs utilized 2 context switches 0 0

为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？

为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？ 的相关文章

随机推荐

热门标签

为什么 perf stat 将“stalled-cycles-backend”显示为<不支持>？的相关文章