我正在寻找有关各种英特尔处理器的锁定 cmpxchg 指令的平均延迟的一些参考。我无法找到有关该主题的任何好的参考资料,任何参考资料都会有很大帮助。
Thanks.
最好的 x86 指令延迟参考可能包含在Agner 的优化手册,基于对各种 Intel/AMD/VIA 芯片的实际经验测量,并针对市场上最新的 CPU 经常更新。
不幸的是,我没有看到CMPXCHG
指令延迟表中列出了指令,但第 4 页确实指出:
带有 LOCK 前缀的指令具有较长的延迟,这取决于缓存组织和可能的 RAM 速度。如果有多个处理器或内核或直接内存访问 (DMA) 设备,则所有锁定指令将锁定高速缓存行以进行独占访问,这可能涉及 RAM 访问。即使在单处理器系统上,LOCK 前缀通常也会花费超过一百个时钟周期。这也适用于带有存储器操作数的 XCHG 指令。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)