MOVDQA 和 MOVAPS x86 指令之间的区别？

2024-03-22

我正在查找英特尔数据表：英特尔® 64 和 IA-32 架构软件开发人员手册我找不到两者之间的区别

MOVDQA：移动对齐的双四字
MOVAPS：移动对齐压缩单精度

在英特尔数据表中我可以找到这两条指令：

该指令可用于从 128 位加载 XMM 寄存器内存位置，将 XMM 寄存器的内容存储到 128 位内存位置，或在两个 XMM 寄存器之间移动数据。

唯一的区别是：

要将双四字移入或移出未对齐的内存位置，请使用 MOVDQU 指令。

and

将打包单精度浮点值移入或移出未对齐的内存位置，请使用 MOVUPS 指令。

但我找不到两个不同指令的原因？

那么有人可以解释其中的区别吗？

在功能上，它们是相同的。

On some（但不是全部）微架构，由于“域交叉惩罚”而存在时间差异。因此，通常应该使用movdqa当数据与整数 SSE 指令一起使用时，以及movaps当数据与浮点指令一起使用时。有关此主题的更多信息，请参阅英特尔优化手册或 Agner Fog 的优秀微架构指南。请注意，这些延迟通常与寄存器-寄存器移动相关，而不是与加载或存储相关。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Assembly

x86

SSE

SIMD

MOV

MOVDQA 和 MOVAPS x86 指令之间的区别？的相关文章

在汇编中显示两位数？ [复制]

这个问题在这里已经有答案了我对汇编编程完全陌生在课堂作业的示例中需要将两个数字相加并显示总和我发现神秘的是当其是两位数时显示总和这是我的代码 mov al num1 mov bl num2 add al bl add ax 303
为什么这个 C++ 包装类没有被内联掉？

EDIT 我的构建系统出了问题我还在弄清楚到底是什么但是gcc产生了奇怪的结果尽管它是 cpp文件但是一旦我使用了g 然后它按预期工作对于我一直遇到麻烦的事情来说这是一个非常精简的测试用例其中使用数字包装类我认为会内联使我
优化数组压缩

假设我有一个数组k 1 2 0 0 5 4 0 我可以按如下方式计算掩码m k gt 0 1 1 0 0 1 1 0 仅使用掩码 m 和以下操作左移右移 And Or 加减乘我可以将 k 压缩为以下形式 1 2 5 4 以下是我目
在 REP MOVSW 之前 PUSH CS / POP DS 的目的是什么？

为什么在下面的代码中我们压入代码段 PUSH CS 然后将其弹出到数据段 POP DS 我将这些行明确指定为 line1 和 line2 请告诉我 MOVSW 在这里是如何工作的 IF HIGHMEMORY PUSH DS MOV BX D
为什么我可以使用 ret 退出 main？

我即将弄清楚程序堆栈到底是如何设置的我了解到用以下方式调用该函数 call pointer 实际上等同于 mov register pc programcounter add register 1 where 1 is one instr
一条指令可以同时处于两种寻址模式吗？

我在书中读到了以下内容从头开始编程处理器有多种不同的访问数据的方式称为寻址模式最简单的模式是立即模式其中要访问的数据嵌入在指令本身中例如如果我们想将寄存器初始化为 0 而不是给出计算机要从中读取 0 的地址我们将指定立即
遍历内存编辑每个字节

我正在编写汇编代码提示用户输入一串小写字符然后输出包含所有大写字符的相同字符串我的想法是迭代从特定地址开始的字节并从每个字节中减去 20H 将小写变为大写直到到达具有特定值的字节我对 Assembly 相当缺乏经验所以我不确定
为什么 SSE 对齐读取 + 随机播放在某些 CPU 上比未对齐读取慢，而在其他 CPU 上则不然？

在尝试优化有限差分代码所需的未对齐读取时我更改了未对齐的负载如下所示 m128 pm1 mm loadu ps H k 1 进入这个对齐的读取随机播放代码 m128 p0 mm load ps H k m128 pm4 mm load
什么时候汇编比C更快？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的
如何让c代码执行hex机器代码？

我想要一个简单的 C 方法能够在 Linux 64 位机器上运行十六进制字节码这是我的 C 程序 char code x48 x31 xc0 include
如何在汇编语言中换行打印多个字符串

我试图在汇编中的不同行上打印多个字符串但使用我的代码它只打印最后一个字符串我对汇编语言非常陌生所以请耐心等待 section text global start start mov edx len mov edx len1 mov
NASM 轮班操作员

您将如何在寄存器上进行 NASM 中的位移位我读了手册它似乎只提到了这些操作员 gt gt lt lt 当我尝试使用它们时 NASM 抱怨移位运算符处理标量值您能解释什么是标量值并举例说明如何使用 gt gt and lt lt 另外
Visual Studio 2017 上的简单装配程序

386 model flat c stack 100h printf PROTO arg1 Ptr Byte data msg1 byte Hello World 0Ah 0 code main proc INVOKE printf ADD
为什么 Visual Studio 使用 xchg ax,ax

我正在查看程序的反汇编因为它崩溃了并注意到很多 xchg ax ax 我用谷歌搜索了一下发现它本质上是一个 nop 但是为什么 Visual Studio 会执行 xchg 而不是 noop 该应用程序是一个C NET3 5 64位应
尝试使用 x86 程序集 GNU GAS 在数组索引处赋值时出现错误

我在用x86GNU 与 GCC 的程序集并尝试实现相当于以下内容的程序集c c int x 10 x 0 5 但是当我尝试运行使用命令 a out 我的汇编代码如下第一次编译后gcc filename s 错误Segmentatio
近调用/跳转表并不总是在引导加载程序中工作

一般问题我一直在开发一个简单的引导加载程序并在某些环境中偶然发现了一个问题在这些环境中此类指令不起作用 mov si call tbl SI Call table pointer call call tbl Call print c
两个基本的 ANTLR 问题

我正在尝试使用 ANTLR 来获取简单的语法并生成汇编输出我在 ANTLR 中选择的语言是 Python 许多教程看起来非常复杂或详细阐述与我无关的事情我真的只需要一些非常简单的功能所以我有两个问题将值从一个规则返回到另一规则
为什么当大小大于 50 时，该程序花费的时间会呈指数级增长？

所以我正在为类编写一个 ARM 汇编快速排序方法我对大部分内容都有了解除了复杂性没有意义我们将其与我们制作的另一种冒泡排序方法进行比较它对于具有 1 个参数和 10 个参数的示例表现更好然而我什至无法比较 100 个参数测试因
使用 Easy 68K (68000) 组装范围内的随机数

我正在使用 Easy 68K 模拟器创建一个简单的黑杰克游戏需要使用随机数来分配牌我的牌必须在 2 到 11 的范围内我似乎每次都得到相同的数字但它不在我预期的范围内我的卡值需要以 D3 结束因此我有以下随机数代码 CLR L
如何知道寄存器是否是“通用寄存器”？

我试图了解寄存器必须具备什么标准才能被称为通用寄存器我相信通用寄存器是一个可以用于任何用途的寄存器用于计算将数据移入移出等并且是一个没有特殊用途的寄存器现在我读到了ESP寄存器是通用寄存器我猜是ESP寄存器可以用于任何事情

随机推荐

使用非唯一索引列日期提取 Dask 数据框中的最新值

我对 pandas 数据帧非常熟悉但对 Dask 还很陌生所以我仍在尝试并行化我的代码我已经使用 pandas 和 pandarallel 获得了我想要的结果所以我想知道是否可以使用 Dask 扩大任务规模或以某种方式加快速度假设
如何使用 Windows 中的 log4net xml 配置器使用文件夹位置指定日志文件路径？

在我的 app config 中我放入
ASP.NET MVC：从视图调用控制器方法

我正在 ASP NET MVC 视图上实现分页并且我想从视图调用控制器中的方法视图中的代码 a href gt 控制器方法 public string NextPage string currentPage return int Par
如何获取 RAM 大小、引导加载程序

我想问如何在引导加载程序中获取总 RAM 大小和可用 RAM 大小截至目前我知道如何获得较低的内存但由于某种原因我无法将其打印到屏幕上因为它保存在斧头寄存器中这是我到目前为止所拥有的 BITS 16 BootLoader alwa
java编程确定对称词[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我是新来的但我很难弄清楚如何编写代
kubernetes默认自带docker吗

根据这个link https www docker com kubernetesdocker 支持 Linux Mac 和 Windows 上的 Kubernetes 我无法确定 kubernetes 是否像 swarm 一样安装在 doc
Python 3 Selenium KeyError：“value”问题不会初始化 Firefox 的 Geckodriver

我在使用 Python 3 运行 geckodriver 时遇到问题我最近使用我一直在开发的应用程序切换到 Python 3 并更新了 Firefox 53 0 Selenium 3 4 3 和 geckodriver 0 17 1 我还
如何在java中将xml标签存储为数组

在我的应用程序中我正在解析 xml 文件在 xml 文件中我有 50 个同名标签question 现在我想将所有名为问题的标签存储为数组在保存的这些标签中我只想将一个问题标签放置在文本视图中如何执行此操作请帮助我 public
为什么标准禁止部分特化的友元声明？

C 标准禁止部分特化的友元声明 14 5 3 8 友元声明不得声明部分特化例子 template
替换Java中索引之间的字符串部分[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 说我有绳子123456789 我知道
在生产中使用无双向 TLS 的 Fabric-ca？

我想知道是否强烈建议不要在生产中使用没有双向 TLS 的 Fabric ca 我计划运营一个结构网络其中将自动添加许多对等点应用程序和用户并且不会使用 cryptogen 工具相反第二个 Fabric ca 将用于颁发 TLS 证
当我滑动时，slideChangeStart 事件不会触发

在我的 Ionic 1 3 1 应用程序中我使用ion slides显示调查问卷部分的组件
当用户在 HTML 文本输入上键入退格键时，如何避免向后导航？

退格键是浏览器热键用于返回到最后一页我知道当输入获得焦点时该热键将被禁用但是我有 keyup 和 keydown 事件绑定到这个输入而我写的一些东西导致了这个问题你知道解决办法吗当您处理了来自输入元素的事件后请在返回之前取
Plotly：在 R 中的每帧中对可变数量的轨迹进行动画处理

我想对一组帧进行动画处理其中每个帧可能具有不同数量的轨迹如此处所述1 https community plotly com t animating a variable number of traces in each frame
QPainter::drawPixmap() 看起来不好看而且质量低？

我正在尝试在 a 内绘制一个图标 png QWidget with QPainter drawPixmap QPixmap source png painter setRenderHint QPainter HighQualityAntia
带offline.html 备份页面的Service Worker

我无法显示offline html 页面我不断得到The FetchEvent for https my domain com resulted in a network error response a redirected respo
开源 .Net Jabber/XMPP 服务器？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我在 Net 中见过不少 XMPP 客户端的例子也见过不少不同语言的服务器但我正在寻找 Net 版本
单个进程中的多个应用程序域

大家好我想问大家一个与应用程序域相关的问题在 Net中 appdomain充当安全边界两个应用程序可以在同一进程内的两个不同域中运行但是当我尝试运行一个exe的多个实例时它显示在任务管理器中的不同进程中为什么会这样呢为什么它不
使用正则表达式在 javascript 中进行全词搜索

我正在尝试使用以下正则表达式在 javascript 中执行整个单词搜索 str Test String C S example var regex search new RegExp b search string b g if str
MOVDQA 和 MOVAPS x86 指令之间的区别？

我正在查找英特尔数据表英特尔 64 和 IA 32 架构软件开发人员手册我找不到两者之间的区别 MOVDQA 移动对齐的双四字 MOVAPS 移动对齐压缩单精度在英特尔数据表中我可以找到这两条指令该指令可用于从 128 位加载 XM

MOVDQA 和 MOVAPS x86 指令之间的区别？

MOVDQA 和 MOVAPS x86 指令之间的区别？ 的相关文章

随机推荐

热门标签

MOVDQA 和 MOVAPS x86 指令之间的区别？的相关文章