MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？

2023-11-23

通过使用标记为 WB（回写）和 WC（写组合）的内存的指令之间的主要区别是什么：MOVDQA and MOVNTDQA，以及之间有什么不同VMOVDQA and VMOVNTDQ?

是不是，内存已标记为 WC - 指令[NT]与平常没有什么不同（没有[NT]），并且该内存被标记为 WB - 指令[NT]就像使用内存厕所一样使用它？

注意：这个答案主要讨论 NT 商店。彼得的回答更全面。

您通常会使用NT写入内存映射 IO（即 GPU 等）时的（非临时）指令，其中内存严格不可缓存并且始终直接访问。

通过定期读取和写入，CPU 将尝试缓存并在需要时将较大的块写入主内存。对于不可缓存的区域（例如 MMIO），写入必须直接写入内存，CPU 不会尝试缓存它们。使用NT指令向 CPU 提示您可能正在传输大量数据（即：到帧缓冲区等），并且当它可以填充整个缓存行时，它将尝试合并这些写入。

“非临时”部分意味着您告诉 CPU 您不打算立即进行写入，但可以在合理范围内延迟写入，直到有足够的时间为止。NT已发出指令来填充高速缓存行。

据我了解，您还可以使用NT具有常规回写内存的指令，它不会尝试缓存这些写入，但也会在可以填满一行时尝试流式传输。在写入 WB 内存的情况下，我想说应用程序将非常专业，您需要知道在管理其缓存方面您可以比 CPU 做得更好。此外，写入不会立即发生，因此之后读回的任何内容都会读取过时的数据，直到执行组合写入为止。你需要用以下方法来管理这个SFENCE如果您需要刷新任何未完成的组合写入，请参阅说明。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？的相关文章

使用 Gas 生成与位置无关的代码 (-fPIC)

我尝试在 x86 64 上创建共享库但失败问题归结为以下代码请不要介意它没有多大意义 section data newline ascii n section text globl write newline type write n
如何在 GCC C++ 中编写多行内联汇编代码？

这看起来不太友好 asm command 1 command 2 command 3 我真的必须在每一行加上双引号吗另外由于多行字符串文字在 GCC 中不起作用我也无法欺骗它我总是在互联网上找到一些例子该人手动插入制表符和换行符而
Core i3/5/7 CPU 是否提供测量 IPC 的机制？

至少过去十年中的所有英特尔 CPU 都包含一组对各种事件进行计数的性能监视器最新的 Intel CPU Core i3 i5 和 i7 又名 Nehalem 是否提供了计算每时钟指令 IPC 的机制如果有它们是如何使用的如果可能的
调用可以是 cdecl 或 stdcall 的函数

我需要编写调用外部函数的代码该函数可以是 32 位 Windows 应用程序中的 stdcall 调用或 cdecl 我的代码调用者无法提前知道其中的哪一个现在如果我尝试从定义为 stdcall 的调用站点调用 cdecl 函数
PAE（物理地址扩展）如何实现大于4GB的地址空间？

维基百科文章的摘录物理地址扩展 http en wikipedia org wiki Physical Address Extension x86 处理器硬件架构通过用于选择附加内存的附加地址线进行了增强因此物理地址大小从 32 位增加到
_mm_max_ss 在 clang 和 gcc 之间有不同的行为

我正在尝试使用 clang 和 gcc 交叉编译一个项目但在使用时发现一些奇怪的差异 mm max ss e g m128 a mm set ss std numeric limits
将 C 代码转换为 x86-64 汇编

我正在尝试将 C 代码转换为 x86 64 我的目标是反转链表传入的两个参数是 head ptr 和 offset to 以获取指针字段的地址即指向列表中下一个节点的指针据我了解 head ptr是通过rdi寄存器传入的 offset
如何在WinMobile6上启用ARMv6非对齐访问？

ARMv6 引入了一个很棒的功能未对齐的内存访问这使得代码中的某些事情变得更加简单和更快但微软只在winCE6中提供了API 现在大多数 PDA 都基于 WinMobile6 基于 CE 5 x 默认情况下禁用未对齐访问我尝试在 C
Android NDK 代码中的 SIGILL

我在市场上有一个 NDK 应用程序并获得了有关以下内容的本机崩溃报告 SIGILL信号我使用 Google Breakpad 生成本机崩溃报告以下是详细信息我的应用程序是为armeabi v7a with霓虹灯支持它在 NVIDI
一个地址有多少字节？ [复制]

这个问题在这里已经有答案了在64位机器上我们知道一个地址是8个字节然而我并不完全清楚一个地址中有多少字节的信息虚拟内存中的每个字节都有一个地址吗或者内存中的每 64 位都有一个地址还是取决于架构如果这取决于架构那么我应该如
Polygot 包含 nasm/yasm 和 C 的文件

我有一堆幻数我想将它们包含在由 nasm 或 yasm 编译的 C 程序和汇编文件中在纯 C 语言中该文件看起来像是一系列定义例如 define BLESS 55378008 define ANSWER 42 在 nasm 或 ya
从c调用汇编函数

我试图从 c 调用汇编函数但我不断收到错误 text globl integrate type integrate function integrate push ebp mov esp ebp mov 0 edi start loop
嵌入式系统：使用汇编语言时的内存布局

根据我的理解嵌入式系统运行机器代码有多种方法可以生成此代码一种是用 C 等高级语言编写程序然后使用编译器获得这样的代码另一种方法是用汇编语言为该嵌入式系统编写指令并使用汇编器将其转换为机器代码现在我们得到了加载到系统并执行的机
x86 程序集 Pushl/popl 不适用于“错误：后缀或操作数无效”

我是汇编编程的新手正在努力解决编程基础 http savannah nongnu org projects pgubook 在带有 GNU 汇编器 v2 20 1 的 Ubuntu x86 64 桌面上我已经能够汇编链接执行我的代码
汇编语言程序中连续两次相乘

我正在使用 8086 模拟器以及 DOSBOX 和 MASM 我知道当我们将 8 位与 8 位相乘时答案将是 16 位 al 8 bit ax 当我们将 16 位与 16 位相乘时答案将是 32 位 ax 16 bit dx ax 但如
如何将 asm 着色器编译为 fxo 文件？

我有一个已编译的 fxo 着色器我正在尝试对其进行稍微编辑仅调整一些常量使用 fxdis https code google com archive p fxdis d3d1x https code google com archiv
将以下机器语言代码（0x2237FFF1）翻译成MIPS汇编

到目前为止我已经翻译了这段代码但我不明白的是如何计算计算 16 位立即地址的数量 0x2237FFF1 转为二进制 0010 0010 0011 0111 1111 1111 1111 0001 现在我正在读取操作码 001000 并知
在 qemu 中将扇区加载到 RAM

我编写了一个简单的程序将扇区扇区编号 2 加载到 RAM 但什么也没打印首先我尝试了以下引导扇区代码 org 0x7c00 mov ax 0x1000 ES BX 1000 0000 mov es ax mov bx 0x00 Lo
如何在 AVX/AVX2 中递增向量

我想使用内在函数来增加 SIMD 向量的元素最简单的方法似乎是为每个元素加 1 如下所示 note vec inc之前已设置为1 vec mm256 add epi16 vec vec inc 但是是否有任何特殊指令来增加向量类似于in
如何在汇编中使用 ReadString？

mov edx offset Prompt1 call WriteString mov ecx 32 mov edx offset String1 call ReadString 现在我该如何访问String1 如何将其移入寄存器以便对其

随机推荐

Elastic Beanstalk 自定义 AMI 看不到环境变量

由于一些大型软件包的要求我正在为 Elastic Beanstalk 使用自定义 AMI 当我通过 SSH 访问 EC2 实例时我的应用程序无法使用任何环境变量在 Elastic Beanstalk Web 控制台设置中指定我在生产
获取异步方法主体中的当前任务实例

如果我有一个像这样的异步方法体 public async Task GetSomething await SendText hi await SendImage bla bmp 当等待开始时如何在将任务对象返回给用户之前获取任务对象 ie
React Fontawesome 没有 free-brands-svg-icons，因此无法显示社交媒体图标

我可以在 React 网页上使用社交媒体图标吗 import library from fortawesome fontawesome svg core import FontAwesomeIcon from fortawesome rea
悬停在另一个元素上时隐藏元素

我知道可以在JavaScript 但是我正在寻找解决方案CSS 我有三个div div hide 默认应该是可见的 show 应该是隐藏的当我将鼠标悬停在 main 上时 hide 应该隐藏 show 应该可见 div show 工作正常
是否有浏览器支持输入元素的 form 属性？

HTML5 规范允许与形式相关的元素参考他们的联系
Spring Boot应用程序启动后立即关闭

我目前正在开发一个包含 Spring 框架的项目一切都按方面进行但有一个问题当我尝试在笔记本电脑上启动应用程序时它在启动后立即关闭它在其他所有机器上都可以工作所以这个问题只发生在我的笔记本电脑上也许您知道什么会导致这个问题我
如何重新安装已安装的 Eclipse 插件？

如何将 Eclipse 插件从一个 Eclipse 安装删除或复制到另一个安装例如我安装了两个 eclipse 其中一个安装了一个插件但我没有安装程序也不容易在线获得是否可以在我的其他版本的 eclipse 上安装此插件
在浏览器中显示word/pdf/excel等文件。（ASP.NET、C#.NET 2008）

我有一个需要在浏览器中显示 Pdf Word 文档任何版本或 Excel 的要求类似于GMAIL的功能我怎样才能实现这个目标我正在使用 Asp net 代码隐藏为 C 申请时间是2008年 Try 如何使用 ASP NET 和 V
如何在使用相对 URL 时更改 http/https 协议

协议相关 URLaren t我在寻找什么我正在寻找一种绝对指定协议 http 与 https 同时保持 url 相对主机名的方法给定一个相对 URL 例如 SearchForStuff 我希望能够指定不同的协议 https 与 http
如何在 Linux 上使用 GCC 编译 C 和 Gtk+？

我搜索了又搜索但没有得到我真正想要的信息有人可以尽可能完整地从根本上解释一下在 Linux 上使用 GCC 用 C 语言编写时 Gtk 代码是如何编译的吗有些东西像反引号 c99 和 o 文件我根本不理解我也非常感谢任何学习 Gt
RealityKit - 为 ModelEntity 的不透明度设置动画？

通过设置材质的颜色model的财产ModelEntity 我可以改变对象的不透明度 alpha 但如何将其动画化呢我的目标是使对象具有完全不透明度的动画然后让它们淡入设定的不透明度例如 50 With SCNAction fadeOp
R 中 igraph 网络的输出 shapefile

你好我在 R 中有一个使用 igraph 库的网络 Vertices 616 Edges 6270 Directed TRUE No graph attributes Vertex attributes name Lat Lon Edge
为什么 JavaScript 中的匿名函数有名字？

我正在读一本很棒的书名为 JavaScript Ninja 的秘密作者是 John Resig 和 Bear Bibeaoult 3 2章中给出了一个例子 var canFly function return true 然后它说创建一
按创建顺序对哈希表进行排序

这类似于如何保持哈希表中元素的顺序 NET 除外有没有Hashtable or Dictionary在 NET 中允许您访问它的 Index条目的属性是否按照添加到集合中的顺序排列 A NameValueCollection可以通过索引
如何在 sails.js 中获取当前域名地址

我试图使用获取当前网址sails js 我尝试了以下方法 req param host and req param X Forwarded Protocol 返回未定义 req headers host 返回本地主机但我的域不是本地主机
如何获取管道中第一个命令的退出状态？ [复制]

这个问题在这里已经有答案了我做了一个简单的脚本 more test bash bin bash echo test exit 1 当我运行脚本时退出状态应该是1 tmp test bash echo 1 但是当我按以下方式运行时 tmp
如何找出我的代码在哪里导致 GLib-GObject-CRITICAL？

当 C C 应用程序失败并出现以下 CRITICAL 错误时您能否告诉我如何找出导致错误的代码在哪里我尝试在调试器中运行它尝试在程序失败时执行 bt 但它没有显示导致关键问题的代码在哪里 process 3155 GLib GObje
在 python 中，我可以将 print 函数的输出重定向到 stderr 吗？

有很多print功能 python 2 7 在我的程序中有什么方法可以添加几行然后所有输出都可以重定向到stderr 我想要的是 python 代码而不是 linux 管道例如我的程序是这样的 print hello world 我想
Python：在单词边界上分割unicode字符串

我需要获取一个字符串并将其缩短为 140 个字符目前我正在做 if len tweet gt 140 tweet re sub r s tweet normalize space footer utils shorten urls po
MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？

通过使用标记为 WB 回写和 WC 写组合的内存的指令之间的主要区别是什么 MOVDQA and MOVNTDQA 以及之间有什么不同VMOVDQA and VMOVNTDQ 是不是内存已标记为 WC 指令 NT 与平常没有什么不同

MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？

MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？ 的相关文章

随机推荐

热门标签

MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 有什么区别？的相关文章