流水线会影响时钟时间或每指令周期 (CPI)？

2023-12-20

我的书中提到“根据您所考虑的基线，减少可以被视为减少每条指令的时钟周期数（CPI），减少时钟周期时间，或作为组合。如果起点是处理器每条指令需要多个时钟周期，那么流水线通常被视为降低 CPI。”

我无法理解的是，流水线会影响 CPI 或时钟周期，因为在流水线的情况下，时钟周期被视为最大阶段延迟 + 锁存延迟，因此流水线确实会影响时钟时间。它还会影响 CPI，因为在管道化的情况下它会变成 1。我错过了一些概念吗？

执行一条指令需要一组操作。为了简单起见，假设有 5 个：获取-指令解码-执行-内存访问-写回。

这可以通过多种方案来实现。

A/ 单循环处理器

方案如下：处理器获取一条指令，将其引导至一个解码器，该解码器控制一组多路复用器，这些多路复用器将配置一个用于实现该指令的大型组合数据路径。

在此模型中，每条指令需要一个周期，并且假设所有 5 个“阶段”需要相等的时间 t，则周期将为 5t。因此CPI=1，T=5

实际上，这或多或少是 20 世纪 40 年代末早期计算机的基本模型。除此之外，还没有真正的处理器这样做，但理论上是完全可行的。

B/ 多周期处理器

与之前的模型相比，您在数据路径上引入了寄存器。第一个获取指令并将其发送到自动机的输入，该自动机将顺序应用计算“阶段”。

在这种情况下，指令需要 5 个周期（可能会稍微少一些，因为某些指令可能更简单，例如跳过内存访问）。周期为 1t（或者可能稍长一些，以考虑寄存器遍历时间）。

消费者物价指数=5，T=1

第一个“真正的”计算机就是这样实现的，这是直到 80 年代初的主要架构模型。如今，一些微控制器，或者例如更简单的 NIOS 版本，仍然依赖于这种方案。

C/管道处理器

您可以在各个阶段之间添加额外的寄存器，以便跟踪指令和所有部分结果。在这种情况下，每个阶段的执行可以是独立的，您可以在不同阶段同时执行多个指令。

CPI 变为 1，因为您可以在每个时钟周期启动一条新指令（由于存在危险，可能会多一点，但那是另一个故事了）。并且T=1。

所以CPI=1，T=1

（CPI反映了吞吐量的增加但单条指令的执行时间并没有减少）

因此，管道可以被视为减少方案 A 的周期时间，或减少方案 B 的 CPI。您还可以想象一个中间方案（例如 3 个阶段，周期为 2），其中管道将减少两者。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pipeline

cpuarchitecture

instructions

流水线会影响时钟时间或每指令周期 (CPI)？的相关文章

哪些标准 C++ 功能可用于查询机器/操作系统架构？

用于查询运行程序的硬件或操作系统功能的属性的标准 C 功能和实用程序是什么例如 std thread hardware concurrency 给出机器支持的线程数但是如何检测计算机有多少 RAM 或者进程正在使用多少 RAM 或者某
超线程/SMT 是一个有缺陷的概念吗？

HT SMT 背后的主要思想是当一个线程停止时同一核心上的另一个线程可以选择该核心的其余空闲时间并透明地与之一起运行 2013 年英特尔放弃了 SMT 转而采用乱序执行 Silvermont 处理器核心因为他们发现这可以提供更好的性
cpu 缓存行和预取策略

我读了这篇文章http igoro com archive gallery of processor cache effects http igoro com archive gallery of processor cache effec
为什么“a”是对象引用的 Java 字节码前缀？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案特定于类型的 Java 字节码指令具有单字符前缀来指定该指令相关的类型 Taken from Wikipedia s entry on J
Linux perf 中的运行时间和报告的周期计数

我在 4 核 Intel CPU 每个核心 1 个线程上运行了单线程矩阵乘法但 perf 中的数字没有意义 Performance counter stats for system wide 31 728 397 287 cpu cyc
与单进程场景相比，多进程场景中的访问时间意外缩短

我正在从program1访问共享库共享数组数据结构并找到读取该数组的所有元素的访问时间当只有 Program1 单独执行时我得到了大约 17000 个时钟周期现在当我首先在另一个选项卡中执行program2 具有空的while循
屏障/栅栏以及获取、释放语义是如何在微架构上实现的？

很多问题以及文章书籍例如https mirrors edge kernel org pub linux kernel people paulmck perfbook perfbook 2018 12 08a pdf https mirr
仅在训练折叠上使用 sklearn 的 RandomizedSearchCV 和 SMOTE 过采样

我有一个高度不平衡的数据集 99 5 0 5 我想使用以下命令对随机森林模型执行超参数调整sklearn s RandomizedSearchCV 我希望使用 SMOTE 对每个训练折叠进行过采样然后在最终折叠上评估每个测试保持原始分布
.csproj 的平台特定 ItemGroup 适用于程序集引用，但不适用于内容包含？

由于我们有三个显式 x86 和 x64 版本的程序集因此我编辑了相应的 csproj 文件以使用例如如下所示的块
为什么指令高速缓存对齐可以提高组相联高速缓存实现的性能？

我有一个关于指令缓存对齐的问题我听说对于微优化对齐循环使其适合缓存行可以稍微提高性能我不明白为什么那会有什么作用我了解缓存命中的概念及其对计算速度的重要性但似乎在组关联缓存中相邻的代码块不会映射到同一个缓存组因此如果循环跨
计算三级缓存的实际/有效CPI

a 给定一个具有两级高速缓存 L1 和 L2 的内存系统以下是规格 L1缓存命中时间 2个时钟周期一级缓存命中率 92 L2 缓存的未命中惩罚 L2 的命中时间 8 个时钟周期二级缓存命中率 86 主存丢失惩罚 37 个时钟周期暂时
当执行 uop 计数不是处理器宽度倍数的循环时，性能是否会降低？

我想知道不同大小的循环在最新的 x86 处理器上如何执行作为 uop 数量的函数这里引用 Peter Cordes 的一段话他在中中提出了非 4 倍数的问题另一个问题 https stackoverflow com a 31027
MIPS 中的影子寄存器是什么以及它们如何使用？

当我了解 MIPS 架构时我遇到了影子寄存器据说它们是通用寄存器的副本我无法理解以下内容何时使用影子寄存器 MIPS 影子寄存器用于减少处理中断时的寄存器加载存储开销分配了影子寄存器组的中断不需要保存任何现有上下文来提供空闲寄存
Azure数据工厂自动重新触发失败的管道

我想使用 If Condition Activity 动态内容自动重新触发失败的管道过程管道 1 在计划时间使用触发器 1 运行有效如果管道 1 失败计划触发器 2 将运行管道 2 有效管道 2 应包含 if 条件来检查管道
Dagster 循环实体的输出和并发处理

我有一个由两个固体组成的 Dagster 管道下面是可重现的示例首先 return some list 输出一些对象的列表第二个固体 print num 接受第一个列表不是完整列表中的元素并对该元素进行一些处理我该如何为第一个
Aarch64 什么是延迟转发？

中提到了延迟转发 Arm Neoverse E1核心软件优化指南 https developer arm com documentation swog466751 a 以及其他一些 CPU 型号的优化指南 Instruction Grou
C 易失性变量和高速缓存

缓存是由缓存硬件对处理器透明地控制的因此如果我们在C程序中使用易失性变量如何保证我的程序每次都从指定的实际内存地址读取数据而不是缓存我的理解是 Volatile 关键字告诉编译器不应优化变量引用而应按照代码中的编程方式读取变量引用
RISC-V 规范引用了“hart”一词 - “hart”是什么意思？

我找到了参考文献hart在第 35 页RISC V 2 1 规范 https content riscv org wp content uploads 2016 06 riscv spec v2 1 pdf 但是我找不到它的定义hart在
什么是微编码指令？

我看过很多参考微编码指令的文献这些是什么以及为什么使用它们 CPU 读取机器代码并将其解码为内部控制信号将正确的数据发送到正确的执行单元大多数指令映射到一个内部操作并且可以直接解码例如在 x86 上 add eax edx只是将
如何在PowerShell中从外部命令输出获取原始二进制数据？

我在这里读到当您在 powershell 中运行外部命令时它们的输出始终被解释为字符串或字符串数组 https stackoverflow com a 35980675 983442 https stackoverflow com a

随机推荐

将一个时间范围按其他时间范围分割成多个部分

我有一项复杂的任务几天来我一直在用头撞墙我已经尝试了大约 4 种不同的方法但是每种方法似乎都停滞不前并且变得非常令人沮丧我有一个时间范围例如 14 30 00 至 18 30 00 考虑某人轮班的时间范围在此时间范围内他们表
jasmine 与 jscoverage 自动化测试

一直在看 jsunit 和 jcoverage 演示单击覆盖率报告链接在新选项卡中打开此内容我想知道是否有人对 Jasmine 和 JSCoverage 做过类似的事情我有点不确定如何继续编辑我想知道有什么可以和茉莉花记者一起做
fopen b 标志是什么

在阅读中php fopen 的文档 http php net manual en function fopen php对于 php 我看到以下内容为了可移植性强烈建议您在使用以下命令打开文件时始终使用 b 标志fopen http ph
某些 lua/c++ 代码中出现 SIGSEGV 错误

以下代码以 SIGSEGV 错误结束 extern C include lua lua h include lua lualib h include lua lauxlib h int main int argc char argv lua
创建具有左偏概率分布的随机数

我想在 1 100 之间随机选择一个数字这样获得数字 60 100 的概率高于 1 59 我希望数字 1 100 的概率为左偏分布也就是说它有一个长尾和一个峰大致意思是 pers np arange 1 101 1 prob
在 IF ELSE 块中包含 InstallDir

我尝试使用以下代码 The default installation directory InstallDir PROGRAMFILES PRODUCT NAME to include x64 nsh If RunningX64 The d
css 中的图像轮播无法正常工作

我正在制作一个网站的轮播但宽度有问题我希望每个图像都占据视口的整个宽度但最后一个图像出现在第一个图像的下方即使滑块动画也无法通过在右侧滑动额外内容来正确滑动图像任何帮助将不胜感激 carousel container carou
将 Angular2 应用程序包含到 Asp.Net Webforms 页面

当我将 angular cli ng build 生成的带有 aot 配置的 js 文件包含到我的 aspx 页面中时我在 Chrome 控制台中收到一条错误消息 gt TypeError Error parameterCount is
函数式语言对于飞行模拟器来说是一个不错的选择吗？ Lisp 怎么样？

我做面向对象编程也有几年了函数式编程做的不多我对飞行模拟器很感兴趣并且对 Lisp 的函数式编程方面感到好奇在面向对象的范例中飞行模拟器或任何其他现实世界模拟器对我来说都是有意义的这是我的问题面向对象是表示现实世界模拟领域的最
.node 不是有效的 Win32 应用程序

在 Window 10 Home x64 位上我尝试在命令提示符下运行以下命令节点索引 js 错误如下 C Users cooldudeasateen OneDrive Coding sil node modules bindings
如何避免在父组件状态更新时重新渲染循环中的所有子组件

我有一个子组件它位于父组件的循环内当子组件之一更新父组件的状态时它会重新渲染所有子组件因为它是循环的我怎样才能避免每次迭代的重新渲染 function Parent const selectedChild setSelectedC
使用 React CSS 过渡组在输入时使组件错开

我想为在 ReactCssTransitionGroup 中渲染的所有子级添加交错效果但不知道如何去做我在看this https stackoverflow com questions 31394719 react transition
F# 对元组的成员约束

当我意识到我需要在某个地方提供额外的值时我在编写 F 时通常都会有一个哦耶的时刻这通常可以通过向传递的元组添加另一个值来轻松完成然而这意味着各种地图排序收集等需要更新特别是函数 fst snd 仅适用于长度为 2 的元
如何在flutter中自定义单选按钮？

我想做这样的按钮我尝试使用单选按钮但无法自定义它们你有什么想法我该怎么做吗我编写了一个可重复使用的小部件它模仿单选按钮的行为自定义无线电小部件 class CustomRadioWidget
Crystal Reports：如何将参数从子报表传递到父报表？

我有许多子报告我在其中计算总计在主要报告中我需要这些总数的总和我不知道如何访问子报告中的总计您需要考虑使用共享变量父报表及其子报表都可以读取和写入该变量例子在父报告中有一个用于初始化称为 InitTotal 的公式其中包
System.Drawing 内存不足异常

我的应用程序图形引擎抛出这些异常它们都被一个空的 catch 块消耗掉早期我发现了一个没有被困住的东西我记得与笔加宽有关我用 try 和一个空的 catch 块包围它看来这些异常对生成的绘图没有影响我已经阅读了一些相关内容但
覆盖 ListBox 的 DrawItem - 未选择的项目不会重绘

这是一个 C 桌面应用程序这DrawStyle我的财产ListBox被设定为OwnerDrawFixed 问题我重写 DrawItem 以使用不同的字体绘制文本并且它有效但是当我开始在运行时调整表单大小时所选项目会正确绘制但其
Java Thread：请澄清这个理解

public class Qn static class Friend private final String name public Friend String name this name name public String get
原因：`object` ("[object Date]") 无法序列化为 JSON。请仅返回 JSON 可序列化数据类型

我正在使用 Prisma 和 Next js 当我尝试从 Prisma 检索内容时getStaticProps它确实获取了数据但我无法将其传递给主要组件 export const getStaticProps async gt const
流水线会影响时钟时间或每指令周期 (CPI)？

我的书中提到根据您所考虑的基线减少可以被视为减少每条指令的时钟周期数 CPI 减少时钟周期时间或作为组合如果起点是处理器每条指令需要多个时钟周期那么流水线通常被视为降低 CPI 我无法理解的是流水线会影响 CPI 或时钟周期因

流水线会影响时钟时间或每指令周期 (CPI)？

流水线会影响时钟时间或每指令周期 (CPI)？ 的相关文章

随机推荐

热门标签

流水线会影响时钟时间或每指令周期 (CPI)？的相关文章