Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
CPU缓存性能。存储未命中与加载未命中
我使用 perf 作为基本事件计数器 我正在开发一个遭受数据缓存存储未命中的程序 其中比例高达80 我知道缓存原则上是如何工作的 它会在各种未命中情况下从内存加载 并在需要时从缓存中删除数据 我不明白的是 存储未命中和加载未命中之间有什么区
performance
caching
cpucache
perf
有没有办法使用 perf 工具查找流程中各个功能的性能?
我正在尝试在流程中实现各个功能的性能 我该如何使用 perf 工具来做到这一点 还有其他工具吗 例如 假设 main 函数调用函数 A B C 我想分别获得主要功能以及功能 A B C 的性能 有没有一个很好的文档来了解 perf 源代码
Linux
function
profiling
perf
计算 Amd Zen 2 处理器上的 L3 缓存访问事件
我试图找出与 perf stat 命令一起使用的事件来计算 AMD Zen 2 处理器上的 L3 缓存访问次数 根据 PPR http developer amd com wordpress media 2017 11 54945 PPR
Linux
x86
cpucache
perf
amdprocessor
Haswell 微架构在性能中没有停滞周期后端
我在 Haswell CPU Intel Core i7 4790 上安装了 perf 但 性能列表 不包括 stalled cycles frontend 或 stalled cycles backend 我检查了http www int
intel
performancecounter
perf
MSR
记录内存访问足迹
I found mtrace https github com aclements mtrace克莱门茨博士 虽然很有用 但是在我需要的情况下却不能正常工作 我打算使用该记录来了解不同场景下的内存访问模式 有人可以分享相关经验吗 任何建议将
Linux
memory
qemu
perf
MMU
DRAM 访问的性能计数器
我想找回DRAM 存取次数在我的应用程序中 准确地说 我需要区分数据和代码访问之间 该处理器是一个Intel R Core TM i7 4720HQ CPU 2 60GHz Haswell 基于英特尔软件开发人员手册 第 3 卷 https
performancetesting
intel
performancecounter
perf
memoryaccess
如何从内核读取性能计数器?
我一直在用户空间使用Linux perf工具 我想编写代码 在每次执行上下文切换时读取线程的性能计数器 所需步骤是 1 获得一种读取性能计数器寄存器的机制 2 每次上下文切换后从调度程序调用步骤 1 我陷入了步骤 1 因为我无法弄清楚要调用
Linuxkernel
perf
intelpmu
Linux perf 中的运行时间和报告的周期计数
我在 4 核 Intel CPU 每个核心 1 个线程 上运行了单线程矩阵乘法 但 perf 中的数字没有意义 Performance counter stats for system wide 31 728 397 287 cpu cyc
performance
x8664
cpuarchitecture
matrixmultiplication
perf
有没有办法将 kptr_restrict 设置为 0?
我目前在运行 linux perf 时遇到问题 主要是因为 proc sys kernel kptr restrict当前设置为 1 但是 如果我尝试 proc sys kernel kptr restrict通过回显 0 来如下 echo
Linux
Linuxkernel
perf
了解 lfence 对具有两个长依赖链的循环的影响,以增加长度
我正在玩代码这个答案 https stackoverflow com a 50496379 5801661 稍微修改一下 BITS 64 GLOBAL start SECTION text start mov ecx 1000000 loo
performance
Assembly
x86
cpuarchitecture
perf
从 perf 获取用户空间堆栈信息
我目前正在尝试在我正在测试的 PostgreSQL 版本中追踪一些幻像 I O 它是一个多进程服务器 将磁盘 I O 关联回特定后端和查询并不简单 我还以为Linux的perf工具将是理想的选择 但我正在努力捕获块 I O 性能计数器指标并
c
Linux
Linuxkernel
perf
“perf stat”输出是什么意思?
I use perf stat 命令对一些事件进行统计 root root test perf stat a e r81d0 r82d0 v a r81d0 71800964 1269047979 1269006431 r82d0 2665
performance
perf
可以从 perf.data 文件生成 perf-stat 结果吗?
当我想使用 Linux 工具套件中的 perf stat 和 perf report 生成性能报告时perf http code google com p kernel wiki PerfUserGuide I run perf recor
Linux
performance
profiling
performancecounter
perf
在 Skylake 上展开 1 周期循环会使性能降低 25%。 uops调度问题?
TL DR我有一个循环需要 1 个周期才能在 Skylake 上执行 它执行 3 次加法 1 次增量 跳转 当我将其展开超过 2 次 无论多少次 时 我的程序运行速度会慢 25 左右 这可能与对齐有关 但我不清楚是什么 编辑 这个问题曾经询
performance
Assembly
x86
intel
perf
为什么 ls 的这些指令数相差如此之大? (ptrace vs perf vs qemu)
我想统计运行 bin ls 时执行的指令总数 我使用了 3 种方法 其结果差异很大 我不知道为什么 1 使用 ptrace 进行指令计数 我编写了一段代码 调用 ls 的实例并使用 ptrace 单步执行它 include
c
Linux
qemu
perf
ptrace
perf_event_open - 如何监视多个事件
有谁知道如何设置perf event attr可以通过以下方式触发 PMU 监视多个 类型 事件的结构perf event open Like perf record e cycles faults ls 它有两种不同的事件类型 PERF
c
Linux
intel
perf
为什么执行指针追踪时该跳转指令的开销如此之大?
我有一个程序可以执行指针追逐 https en wikichip org wiki pointer chasing我正在尝试尽可能优化指针追逐循环 我注意到perf record检测到函数中约 20 的执行时间myFunction 用于执行
pointers
Assembly
x86
cpuarchitecture
perf
PERF_TYPE_HARDWARE 和 PERF_TYPE_HW_CACHE 并发监控
我正在研究一个自定义实现perf event open系统调用 该实施旨在支持各种PERF TYPE HARDWARE PERF TYPE SOFTWARE and PERF TYPE HW CACHE活动为任何核心上的特定线程 In 英特
perf
multiplexing
intelpmu
perf 可以在内核中找到符号,但在我的程序中找不到符号。如何修复它?
你可能读过这个问题 我怎样才能在程序中找到符号 https stackoverflow com questions 10933408 how can i get perf to find symbols in my program 1 我的
Linux
performance
perf
Mac OS 的 Perf stat 等效项?
Mac OS 上有等效的性能统计吗 我想对 CLI 命令做同样的事情 但谷歌搜索没有产生任何结果 Mac OS X 中有 Instruments 工具来分析应用程序 包括硬件 PMU 默认是对 CPU 使用情况进行采样分析器 一些文档 ht
MacOS
profiling
performancecounter
perf
intelpmu
1
2
3
»