处理器流水线深度问题

2023-11-16

正面意义:

流水线的级数越多,意味着流水线切得越细,每一级流水线内容纳的硬件逻辑便越少。在两级寄存器(每一级流水线由两个寄存器组成)之间的硬件逻辑越少,则处理器能够达到更高的主频。因此现代处理器的流水线极深主要是处理器追求高频的指标所驱使。

负面意义:

(1)由于每一级流水线都由寄存器组成,因此更多的流水线级数要消耗更多的寄存器,占用更多的芯片面积。

(2)由于每一级流水线需进行握手,流水线最后一级的反压信号可能会一直串扰到最前面一级,造成严重的时序问题,因此需要高级技巧解决此类反压时序问题。

(3)由于在流水线取指令阶段无法得知条件跳转的结果是跳还是不跳,因此只能进行预测,而到了流水线末端才能通过实际的运算得知该分支是跳还是不跳。如果发现真实的结果(如该跳)与之前预测结果(如预测为不跳)不相符,则意味着预测失败,需要将所有预取的错误指令流全部丢弃掉。重新取正确的指令流的过程叫作流水线冲刷。虽然分支预测可以保证前期的分支预测尽可能准确,但是无法做到万无一失。那么,流水线的深度越深,意味着已经取了更多的错误指令流,需求将其全部抛弃,然后重启,这不仅增加了功耗,还造成性能的损失。流水线越深,浪费和损失越多;流水线越浅,浪费和损失越少。

流水线的不同深度皆有优缺点,需要根据不同的应用背景进行合理的选择。根据处理器流水线深浅的优劣与应用场景,当今处理器的流水线深度在向着两个不同极端发展,一方面级数越来越深,另一方面级数越来越浅。

流水线越来越深:追求更高的主频,获得更高的吞吐率和性能。

流水线越来越浅:在性能够用的前提下追求极低的功耗。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

处理器流水线深度问题 的相关文章

  • Unity中实现退出游戏功能

    我们要实现在编辑器环境下退出编辑器 在非编译器环境下退出游戏 提问 如何判断是否在编辑器环境中 如何退出编辑模式 如何退出程序 回答 使用预处理判断当前的环境 常用的预处理标识符 标识符 解释 UNITY EDITOR 只在编辑器中编译 U
  • mysql根据日期倒序_mysql记录根据日期字段倒序输出

    我们知道倒序输出是很简单的 select from table order by id desc 直接这样就可以 那么现在的问题在于日期字段怎么来倒序输出 这里我们用到cast 来将指定的字段转换为我们需要的类型 如下是实际项目中的sql语
  • C/C++项目:谁都爱玩的4399小游戏黄金矿工教程

    黄金矿工中文版 是一款休闲益智小游戏 游戏中你需要看准时机出钩子勾取金子或者砖石来获得金钱的累加 达到一定的金钱数才能够闯关成功 游戏十分经典 强烈推荐大家学会编写这款游戏 休闲时没网也能自己玩哦 黄金矿工道具说明 金块 按大小区分 越大越
  • Robot Framework 企业级自动化测试实战

    一 Robot Framework 变量使用 1 变量简介 变量是Robot Framework的一个不可或缺的特性 它们可以在测试数据的大多数地方使用 最常见的是 它们用于测试用例表和关键字表中关键字的参数 但所有设置都允许在其值中使用变
  • pthread信号

    信号是典型的异步事件 内核在某个信号出现时有三种处理方式 忽略信号 除了SIGKILL和SIGSTOP信号不能忽略外 其他大部分信号都可以被忽略 捕捉信号 也就是在信号发生时调用一个用户函数 注意不能捕捉SIGKILL和SIGSTOP 执行
  • 【生成模型新方向】score-based generative models

    这里写目录标题 0 前言 1 介绍 2 The score function score based models and score matching 3 Langevin dynamics朗之万动力学 4 朴素的 Naive score
  • blockly for android app 安装闪退

    java lang RuntimeException Unable to start activity ComponentInfo app robo com roboapp app robo com roboapp MainActivity
  • 上海链节科技:企业链改的价值是什么?

    企业链改并不是盲目的 它应该至少满足两个条件 第一 区块链技术是否与该行业真的契合 是否能工利用区块链和互联网的技术 完成自身系统的改造 提高自身的公信力 提供一系列对于企业当前出现的实际问题的必要回答 这样的依托于区块链改造的 基于特定公
  • 使用R语言中的epiDisplay包进行数据分析和可视化是一种常见的方法

    使用R语言中的epiDisplay包进行数据分析和可视化是一种常见的方法 epiDisplay包提供了丰富的函数和工具 用于描述性统计分析和制作各种图形 其中的summ函数可以帮助我们计算数据框中指定变量在不同分组变量下的描述性统计汇总信息
  • java自定义枚举数组转String类型转换器

    代码如下 public class LotteryActivityTypeConverter implements AttributeConverter
  • Windows中杀死占用某个端口的进程

    最近写项目 总是出现端口被占用的问题 原来傻傻的把电脑重启一下 终于有一天受不了了 想要想办法解决 刚开始从网上找了好多教程 发现不行 开始自己尝试 终于 成功的将占用端口的进程杀掉 在此记录下过程 以8080端口为例 第一步 打开cmd命
  • NLP--BPE、WordPiece、ULM、SentencePiece子词分词器总结【原理】

    序言 当我们在做英语文本任务时 机器无法理解文本 当我们将句子序列送入模型时 模型仅仅能看到一串字节 它无法知道一个词从哪里开始 到哪里结束 所以也不知道一个词是怎么组成的 所以 为了帮助机器理解文本 我们需要 将文本分成一个个小片段 然后
  • leetcode目录

    最近写的题目还没有填到本目录中 可以在去文章列表查看 本目录正在持续更新中 题目 考点 时间 分值 最大利润 贪心算法 2023 Q1 100 施肥问题 逻辑推理 2023 Q1 100 组装数组 深度优先搜索 2023 Q1 200 开租
  • android Button背景高度被拉伸问题--解决方案

    接入第三方SDK后 发现SDK提供的弹窗里 有两个按钮的高度呈被拉伸状态 而 第三方提供的demo内 这两个按钮均呈正常状态 对于第一次接触Android的菜鸟来说 这个问题颇为难解 第三方在尝试了几种方法之后 也宣告失败 这种奇葩问题 让
  • element项目中遇到的小问题总结

    在用element UI框架做项目时遇到的问题 现在总结记录下来 此文档持续更新中 1 日期选择器el date picker赋值后再次修改时页面不回显
  • JS逆向进阶案例

    前情回顾 有道翻译参数破解 百度翻译参数破解 之前 我们介绍了两种基础的JS逆向案例 今天 就继续来分享一个稍微复杂的JS逆向案例吧 目录 一 寻找加密源码 二 查漏补全JS代码 三 全部代码 爬取网址 某网站 本次爬取仅供学习 无任何商业
  • Mac上安装双系统

    写在前面 Mac用户在使用过程中 多少有的时候还会使用Windows 想装一个咋办 找某宝需要花钱150元 看这篇文章 十几分钟看明白 自己动手丰衣足食 所以本文将以图文教程教你如何安装双系统 开机随意选择 想用什么用什么 尽管我不是很喜欢
  • FFmpeg 采用源码安装 、环境配置、卸载

    https blog csdn net qq 36397240 article details 107745149 FFmpeg 采用源码安装 环境配置 卸载 验证了几种ffmpeg x264安装方法 这篇文章清晰简洁 特别是对环境配置介绍
  • AES(加密,填充,模式)新手小结

    本小结的密码学术语如填充 模式 等等 均以AES为例进行说明 举一反三 其他算法涉及的相同术语 大致也就理解是怎么回事了 吧 1 AES https nvlpubs nist gov nistpubs FIPS NIST FIPS 197

随机推荐

  • 【电子电路】五款单按键开关机电路图

    一 单按键开关机电路图 本例电路可实现通过按一次按键S1实现开机 再按一次S1实现关机的功能 整个电路的工作过程 电路中连接器P1是一个电源连接器 电源 从1 2脚输入 电源地从3 4脚输入 电路上电后 P MOS管Q1的G极和S极都是为高
  • Matatalab:编程只是大人的专利?这款儿童实物编程机器人了解一下

    转自 http www sohu com a 294483601 485557 创始人 https www tianyancha com brand b5813253827 CEO 苏荣星 MatataLab CEO 曾任职 mBot Ra
  • 基于入侵杂草算法的函数寻优算法

    文章目录 一 理论基础 1 算法简介 2 杂草特性 二 案例背景 1 问题描述 2 解题思路及步骤 1 初始化种群 2 繁殖 3 空间分布 4 竞争性排斥规则 3 算法流程 三 MATLAB程序实现 1 清空环境变量 2 问题设定 3 参数
  • 用matlab计算超调,怎样用matlab计算超调量、峰值时间

    2018 01 19 Intel Xeon E5 2697 v2的CPU的峰值计算能力和Intel Xeon E7 8870的CPU的峰值计算能力哪个强 必然Xeon E5 2697 v2运算能力强 首先 看核心数 Xeon E5 2697
  • 动态环境下基于强化学习的无人机任务路径规划

    路径规划主要是指无人机环境中存在威胁障碍物 然后 规划无人机从起点到目的地避开障碍物的最佳路线也是无人机实现自主飞行的主要因素之一 在无人机的任务分配中 主要目的是增强无人机的时间性能和环境适应性 对于无人机的路径规划水平 修改和改进算法可
  • STL--map的应用

    STL之map的应用 map定义及用途 map翻译为映射 是STL中的常用容器 其实 数组就是一种映射 比如 int a 100 就是定义了一个int到int的映射 而a 5 25 就是把5映射到25 数组总是将int类型映射到其它基本类型
  • oracle优化-----监控指标

    author skatetime 2010 03 24 昨天一个朋友问我 如何优化数据库 在想优化数据库前 首先要确认数据库是否需要优化 这就需要一些监控指标了 如 事务响应时间 数据库的逻辑读 数据库的物理读 物理写等 日常监控这些指标
  • GetProcAddress错误码127

    表现为明明loadLibrary GetProcAddress就是拿不到地址 原因是C语言的函数使用C 编译时需要加上extern C 转载于 https www cnblogs com Jacket K p 11574624 html
  • 十个经典免费软件和五★级网站!

    十个经典免费软件和五 级网站 软件非常实用 都是 免费版本 ghost 诺顿杀毒 等经典软件哪里皆可下载到 就没列出 推荐的网站则是very出色实用 lt 一 gt 软件 1 代理甭猎手 v1 0 179 KB 绿色 推荐指数 介绍 全称是
  • 【目标检测之数据集预处理】继承Dataset定义自己的数据集【附代码】

    在深度学习训练中 除了设计有效的卷积神经网络框架外 更重要的是数据的处理 在训练之前需要对训练数据进行预处理 比如在目标检测网络训练中 首先需要划分训练集和测试集 然后对标签 边界框等进行处理后才能送入网络进行训练 本文章以VOC数据集格式
  • 【设计模式学习】11种高频设计模式之建造者模式

    文章目录 相关介绍 代码介绍 常规用法 静态内部类方法 系列文章目录 参考资料 相关介绍 1 定义 将一个复杂对象的构建与它的表示分离 使得同样得构建过程可以创建不同得表示 2 作用 在用户不知道对象得建造过程和细节的情况下就可以直接创建复
  • MySQL server has gone away

    一 可能是mysql连接超时 原因 mysql长连接时 很长时间没有新的请求发起到达服务端 当这个时间超过配置的最大超时时间时 mysql就会强行关闭链接 此后再通过这个connection发起查询的时候 就会报错server has go
  • WiFiAssistant 无线承载网络设置助手的开发历程(一)

    今年6月中旬 我曾经基于MFC写过一个WiFiHelper的小程序 开启和关闭虚拟WiFi 并且能够支持定时关机 当然 真正使用虚拟WiFi还需要手动设置共享 并且 由于我的是台式机 所以并没有去升级WiFiHelper 估计是即将毕业的缘
  • 【English】十大词性之连词

    连词 文章目录 连词 前言 一 并列连词 1 1 表并列关系的并列连词 2表示选择关系的并列连词 3 表示转折关系的并列连词 4 表示因果关系的并列连词 二 从属连词 总结 前言 连词是一种虚词 在句中起连接作用 可以用来连接单词 短语 从
  • 16个车辆信息检测数据集收集汇总(简介及链接)

    16个车辆信息检测数据集收集汇总 简介及链接 目录 1 UA DETRAC 2 BDD100K 自动驾驶数据集 3 综合汽车 CompCars 数据集 4 Stanford Cars Dataset 5 OpenData V11 0 车辆重
  • Python—使用tkinter制作一个小时钟

    网上搬运的 自己又调试了一下 分享一下 coding utf 8 from tkinter import import math time def points for i in range 1 13 x 200 130 math sin
  • 矩阵的广义逆及python实践

    机器学习的代码中经常有求矩阵的广义逆 本文先从概念上总结了矩阵的广义逆 然后用python的numpy库实践 概念 矩阵的广义逆 Generalized inverse 也称为伪逆 pseudo inverse 假设一个矩阵 及另一矩阵 若
  • Unity学习记录——物理系统与碰撞

    Unity学习记录 物理系统与碰撞 前言 本文是中山大学软件工程学院2020级3d游戏编程与设计的作业6 编程题 简单打飞碟 物理引擎改进版 1 题目要求 改进飞碟 Hit UFO 游戏 游戏内容要求 按adapter模式设计图修改飞碟游戏
  • vivado bram 参数设置

    1 no output registers 没有reg 在同一周期内即可读出数据 2 at the output of the primitive output register 加了一层reg 数据读出延迟了一个周期 3 REG2 is
  • 处理器流水线深度问题

    正面意义 流水线的级数越多 意味着流水线切得越细 每一级流水线内容纳的硬件逻辑便越少 在两级寄存器 每一级流水线由两个寄存器组成 之间的硬件逻辑越少 则处理器能够达到更高的主频 因此现代处理器的流水线极深主要是处理器追求高频的指标所驱使 负