为什么反汇编后的数据会变成指令？

2023-12-15

我需要一些帮助来理解此时此刻发生的事情这段代码“发生”：“jmp Begin”。我只知道 .com 文件可以是 64kb，因此您希望将所有内容放在一个段中。如果你想放置变量，你需要jmp。但是当我搜索它时，很多指南只是在评论中说 jmp Begin 只是跳过数据，没有其他任何内容。这是我的问题：这一刻到底发生了什么：

看来它运行这个

        mov     al, a
        mov     bl, b
        sub     al, bl

但我不明白为什么它在涡轮调试器中看起来像这样。当我将 Result 的起始值从 ?对于大于 0 的值，它会更改为其他值，当我将其更改为 90 时，它看起来完全正常。我对组装完全陌生，我似乎根本无法掌握它。这是我的整个代码：

            .MODEL TINY

Code        SEGMENT

            ORG    100h
            ASSUME CS:Code, DS:Code

Start:
                jmp     Begin
a               EQU     20
b               EQU     10
c               EQU     100
d               EQU     5
Result          DB      ?


Begin:

            mov     al, a
            mov     bl, b
            sub     al, bl
            mov     bl, c
            mul     bl
            mov     bl, d
            div     bl              
            mov     Result, al
            mov     ah, 4ch
            int     21h

Code        ENDS
            END             Start

我试着给你一个解释。

问题在于，在过去（今天仍然部分如此），处理器没有区分内存中的代码和数据字节。这意味着 .com 文件中的任何字节都可以用作代码和数据。调试器不知道哪些字节将作为代码执行以及哪些字节将用作数据。在棘手的情况下，字节实际上可以用作代码和数据......您的程序可以在内存中创建作为代码有效的数据，并且您可以跳转到它来执行它。

在许多（但不是全部）情况下，调试器实际上可以找出什么是代码，什么是数据，但是这种代码分析可能会变得非常复杂，因此大多数调试器/反汇编器根本没有这样的代码流分析器。因此，他们只是在文件/内存中选择一个偏移量（这通常是当前指令指针），并从该偏移量开始，将一系列连续字节串行解码为汇编指令不遵循任何jmp指示直到调试器的屏幕完全充满足够数量的反汇编行。愚蠢的反汇编器/调试器不关心反汇编的字节实际上是用作程序中的指令还是数据，它们将它们视为指令。

如果您正在调试程序并且调试器在断点处停止，那么它将获取当前指令指针，并使用原语“填充调试器屏幕”方法从该偏移量开始再次执行哑反汇编。

这种连续字节的串行反汇编是一种在大多数情况下都有效的简单方法。如果您串行解码非jmp指令彼此跟随，您几乎可以确定处理器将按此顺序执行它们。然而，一旦你到达并解码jmp指令您无法确定以下字节作为代码是否有效。但是，您可以尝试将它们解码为指令，希望代码中间没有混合数据（是的，在大多数情况下，在jmp（或类似的控制流指令），这就是为什么调试器给你一个愚蠢的反汇编作为“可能有用的预测”）。事实上，大多数代码通常充满了条件跳转和反汇编它们之后的字节，因为代码对调试器来说是非常有用的帮助。跳转指令后的代码中间有数据的情况非常罕见，我们可以将其视为边缘情况。

假设您有一个简单的 .com 程序，它只是跳过一些数据，然后存在一个int 20h:

    jmp start
    db  90h
start:
    int 20h

反汇编程序可能会通过从偏移量 0000 开始反汇编来告诉您类似以下内容：

--> 0000   eb 01        jmp short 0003
    0002   90           nop
    0003   cd 20        int 20h

酷，这看起来和我们的 asm 源代码一模一样……现在让我们稍微改变一下程序：让我们改变数据……

    jmp start
    db  cdh
start:
    int 20h

现在反汇编程序将向您展示：

--> 0000   eb 01        jmp short 0003
    0002   cd cd        int cdh
    0004   20 ...... whatever...

问题是某些指令由超过 1 个字节组成，调试器并不关心字节是否代表代码或数据。在上面的示例中，如果反汇编器从偏移量 0000 到程序末尾（包括数据）连续反汇编字节，那么您的 1 字节数据将反汇编为 2 字节指令（“窃取”实际代码的第一个字节），因此调试器尝试反汇编的下一条指令将位于偏移量 0004 而不是 0003 处，您的位置jmp正常情况下会跳。在第一个示例中，我们没有遇到这样的问题，因为数据被反汇编为 1 字节指令，并且偶然反汇编程序的数据部分后，调试器要反汇编的下一条指令位于偏移量 0003 处，这正是您的目标jmp.

然而，幸运的是，调试器在这种情况下向您显示的内容并不是程序执行时会发生的情况。通过执行一条指令，程序实际上会跳转到偏移量 0003，调试器将再次执行愚蠢的反汇编，但这次从偏移量 0003 开始，该偏移量位于上一个错误反汇编指令的中间...

假设您调试第二个示例程序并逐一执行其中的所有指令。当您使用指令指针 == 0000 启动程序时，调试器会显示以下内容：

--> 0000   eb 01        jmp short 0003
    0002   cd cd        int cdh
    0004   20 ...... whatever...

然而，当您触发“step”命令来执行一条指令时，指令指针（IP）将更改为 0003，并且调试器从偏移量 0003 再次执行“哑反汇编”，直到调试器屏幕被填满，因此您将看到以下内容：

--> 0003   cd 20      int 20h
    0005   ...... whatever...

结论：如果您有愚蠢的反汇编程序，并且将数据混合到代码中间（使用jmps 围绕数据），那么愚蠢的反汇编程序会将您的数据视为代码，这可能会导致您遇到的“小”问题。

具有流分析功能的高级反汇编程序（如 Ida Pro）将按照跳转指令进行反汇编。拆解你的后jmp在偏移量 0000 处，它会发现下一条要反汇编的指令是jmp在 0003 处，它会拆卸int 20h作为下一步。它将标记db cdh偏移量 0002 处的字节作为数据。

补充说明：

正如您已经注意到的（相当过时的）8086 指令集中的指令可以是 1-6 个字节长之间的任何位置，但jmp or call可以以字节粒度跳转到内存中的任何位置。指令的长度通常可以根据指令的前 1 或 2 个字节来确定。然而，仅当处理器以其特殊IP（指令指针寄存器）定位指令的第一个字节并尝试在给定偏移处执行字节时，字节才会“粘在一起”到指令中。让我们看一个棘手的例子：内存中偏移量 0000 处有字节 eb ff 26 05 00 03 00，然后逐步执行它。

--> 0000   eb ff        jmp short 0001
    0002   26 05 00 03  es: add ax, 300h
    0006   00 ...... whatever...

处理器指令指针 (IP) 指向偏移量 0000，因此它对指令进行解码，并且其中的字节在执行时“粘在一起形成一条指令”。（处理器在 0000 处执行指令解码。）由于第一个字节是 eb，因此它知道指令长度是 2 个字节。调试器也知道这一点，因此它会为您解码指令，并根据错误的假设生成一些额外的错误反汇编，即处理器在某些时候会在偏移量 0002 处执行指令，然后在偏移量 0006 处执行指令，等等...你会发现这不是真的，处理器会将字节以完全不同的偏移量组合成指令。

正如你所看到的，我棘手的字节代码包含一个jmp跳转到偏移量0001，即执行的中间位置jmp指令本身！！！然而，这根本不是问题。处理器并不关心它，而是愉快地跳转到偏移量 0001，因此下一步它将尝试解码那里的指令（或“将字节粘在一起”）。让我们看看处理器会在0001处找到什么样的指令：

--> 0001   ff 26 05 00  jmp word ptr [5]
    0005   03 00        add ax, word ptr [bx+si]

正如你所看到的，我们的下一条指令位于 0001，调试器向我们展示了偏移量 0005 处的一些垃圾反汇编，这是基于处理器将在某个时刻到达该偏移量的错误假设......

0001 处的指令告诉处理器从偏移量 0005 处拾取一个字，并将其解释为跳转到那里的偏移量。正如你看到的价值word ptr [5]是 3（作为小端 16 位值），因此处理器将 3 放入其 IP 寄存器（跳转到 0003）。让我们看看它在偏移 0003 处找到了什么：

--> 0003   05 00 03     add ax, 300h

以调试器的方式显示我棘手的字节代码 eb ff 26 05 00 03 00 的反汇编是很困难的，因为处理器执行的实际指令位于重叠的内存区域中。处理器首先执行字节0000-0001，然后执行0001-0004，最后执行0003-0005。

在一些较新的 RISC 架构中，指令的长度是固定的，它们必须位于对齐的内存区域上，并且不可能跳转到任何地方，因此调试器的工作比 x86 的情况要容易得多。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么反汇编后的数据会变成指令？的相关文章

为什么我可以使用 ret 退出 main？

我即将弄清楚程序堆栈到底是如何设置的我了解到用以下方式调用该函数 call pointer 实际上等同于 mov register pc programcounter add register 1 where 1 is one instr
汇编指令陷阱有什么作用？

当程序需要时程序通常会发出软件陷阱由操作系统提供服务通用异常处理程序操作系统确定陷阱的原因并做出响应适当地汇编指令 trap 和 BASIC 中的 TRAP 指令一样吗答案似乎是肯定的你能接受还是拒绝我的结论不中断的代码
遍历内存编辑每个字节

我正在编写汇编代码提示用户输入一串小写字符然后输出包含所有大写字符的相同字符串我的想法是迭代从特定地址开始的字节并从每个字节中减去 20H 将小写变为大写直到到达具有特定值的字节我对 Assembly 相当缺乏经验所以我不确定
预取双类成员需要转换为 char*？

我有一个正在使用的课程 mm prefetch 预先请求包含 double 类型的类成员的缓存行 class MyClass double getDouble return dbl other members double dbl othe
为 Visual Studio 应用程序设置平台目标的目的是什么？

对于任何 VS 项目都可以在该项目的构建属性中设置平台目标您可以将其设置为任何 CPU x86 x64 或 Itanium 我的问题是如果我将此值设置为 x86 是否意味着我无法在 x64 计算机上运行该项目如果是这样为什么还要使
即使我确实为变量设置了初始值，数据段也没有被初始化

我已经编写了一个代码该代码应该生成某种数字列表但是即使我为它们分配了初始值我的数据段变量也没有被初始化 This is how DS 0000 looks when I run it 这是我的代码但数据段只保留垃圾值 MODEL s
如何让c代码执行hex机器代码？

我想要一个简单的 C 方法能够在 Linux 64 位机器上运行十六进制字节码这是我的 C 程序 char code x48 x31 xc0 include
为什么不能执行 mov [eax], [ebx] [重复]

这个问题在这里已经有答案了我可以做这个 mov eax ebx 和这个 mov eax ebx 甚至这个 mov eax ebx 但不是这个错误C2415 mov eax ebx 只是wtf 为什么它与 ptr1 ptr2 相同为什
在 x86 Intel VT-X 非根模式下，是否可以在每个指令边界传递中断？

除了不将中断传送到虚拟处理器的某些正常指定条件 cli if 0 等之外客户机中的所有指令实际上都是可中断的吗也就是说当传入的硬件中断先传递给 LAPIC 然后传递给处理器时据说会发生一些内部魔法将其转换为虚拟中断给来宾使用虚
NASM 轮班操作员

您将如何在寄存器上进行 NASM 中的位移位我读了手册它似乎只提到了这些操作员 gt gt lt lt 当我尝试使用它们时 NASM 抱怨移位运算符处理标量值您能解释什么是标量值并举例说明如何使用 gt gt and lt lt 另外
Visual Studio 2017 上的简单装配程序

386 model flat c stack 100h printf PROTO arg1 Ptr Byte data msg1 byte Hello World 0Ah 0 code main proc INVOKE printf ADD
奇怪的 MSC 8.0 错误：“ESP 的值未在函数调用中正确保存...”

我们最近尝试将一些 Visual Studio 项目分解为库并且在测试项目中一切似乎都编译和构建得很好其中一个库项目作为依赖项然而尝试运行该应用程序给我们带来了以下令人讨厌的运行时错误消息运行时检查失败 0 ESP 的值未在函数调
为什么 Visual Studio 使用 xchg ax,ax

我正在查看程序的反汇编因为它崩溃了并注意到很多 xchg ax ax 我用谷歌搜索了一下发现它本质上是一个 nop 但是为什么 Visual Studio 会执行 xchg 而不是 noop 该应用程序是一个C NET3 5 64位应
在linux x86平台上学习ARM所需的工具[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 x86 linux 机器在阅读一些关于 ARM 的各种信息时我很好奇现在我想花一些时间学
汇编8086监听键盘中断

我有与此完全相同的问题边画边听键盘 https stackoverflow com questions 13970325 8086 listen to keyboard while drawing 但第一个答案接受的答案只听键盘一次
为什么在强度降低乘法和循环进位加法之后，这段代码的执行速度会变慢？

我正在读书阿格纳雾 https en wikipedia org wiki Agner Fog s 优化手册 https en wikipedia org wiki Agner Fog Optimization 我遇到了这个例子 doub
“rep stos”x86 汇编指令序列有什么作用？

我最近偶然发现了以下汇编指令序列 rep stos dword ptr edi For ecx重复存储内容eax到哪里edi指向递增或递减edi 取决于方向标志每次 4 个字节通常这用于memset型操作通常该指令简单地写成r
AVX-512CD（冲突检测）与原子变量访问有何不同？

所以我在看他们展示了如何 void Histogram const float age int const hist const int n const float group width const int m const float o
如何在 Linux x86_64 上模拟 iret

我正在编写一个基于 Intel VT 的调试器由于当 NMI Exiting 1 时 iret 指令在 vmx guest 中的性能发生了变化所以我应该自己处理vmx主机中的NMI 否则 guest会出现nmi可重入错误我查了英特尔手
“mov (%ebx,%eax,4),%eax”如何工作？ [复制]

这个问题在这里已经有答案了一直在从事装配作业并且在很大程度上我对装配非常了解或者至少对于这项任务来说足够好但这个 mov 的声明让我很困惑如果有人能解释这个 mov 语句如何操作寄存器值我将非常感激 mov ebx eax 4

随机推荐

如何将另一个站点的所有产品导入到magento站点

嗨任何人都可以帮助我吗我已经在实时服务器上安装了magento 现在我想导入已准备好实时运行的网站的所有产品和类别我该怎么做请提供帮助请参阅 Magento 维基如何使用导入导出工具添加编辑删除产品 Magento 比较特
重载 Haskell 中的内置函数

在 Haskell 中如何重载内置函数例如我最初是想弄清楚如何重载内置函数通过自己的数据类型来支持具体来说属于以下类型 a gt Int gt a 我想保留它的现有功能但也能够在其类型签名看起来更像的地方调用它 MyType1
关于 C# 使用 foreach 循环添加对象到列表

foreach string f in fileName if list Where p gt p FileName Trim Equals f Trim StringComparison OrdinalIgnoreCase Count 0
为什么我无法在标准机器学习中比较实数？

为什么不1 0 2 0工作不是real平等类型它给出了错误 Error operator and operand don t agree equality type required operator domain Z Z operan
iPhone 中的 mailto 链接添加加号而不是空格

我现在正在构建一个网络应用程序需要使用 mailto 链接作为告诉朋友部分消息正文对于 URL 来说太长因此我将其置于隐藏表单中并通过 jQuery 发送该表单一切都工作得很好除了在空格应该去的地方添加了号我尝试过取消转
如何在 MS Access 查询中设置日期格式以防止美国/英国问题

在访问查询中过滤日期时如何确保选择正确数量的记录 SELECT ID REF SalesDate DCount ID tblRecords Ref Ref AND SalesDate format SalesDate yyyy mm dd
通过引用传递 IDisposable 对象会导致错误？

我正在尝试创建一个通用方法来处理实现的对象I一次性称为DisposeObject 为了确保我正在处理原始引用指向的对象我尝试通过引用传递对象但我收到一个编译错误上面写着 ref 参数类型与参数类型不匹配在下面的简化的代码中两
SharePoint 2010 / IIS 7.5 字节范围请求响应整个文件

我在让 SharePoint 2010 IIS 7 5 尊重字节范围请求时遇到问题我正在使用 Silverlight 开发 SharePoint 2010 Web 部件并尝试检索存储在 SharePoint 中的部分文档当我在 Sha
jquery UI 可通过表格和 tr 宽度进行排序

我正在使用 jQuery UI sortable 来使我的表格网格可排序该代码似乎工作正常但因为我没有添加宽度tds 当我拖动tr它缩小了内容例如如果我的表格行是 500 像素当我开始拖动时它会变成 300 像素我认为发生这种
如何在鼠标悬停时暂停 Bootstrap 轮播并在鼠标移开时恢复它？

我的网站上有一个 Bootstrap 轮播当用户将鼠标悬停在某个元素上时 formcontainer 我想暂停轮播当我悬停时我想继续旋转木马的循环第一部分可以与以下代码配合使用但第二部分则不行有人可以帮忙吗 document r
您的内容必须有一个 id 属性为“android.R.id.list”的 ListView

我创建了一个像这样的 xml 文件
Python 列表字典中的最小值

抱歉问题重新发布了我应该首先编辑这个问题为模组标记了新的抱歉添麻烦了由于要求发生变化不得不重新编写问题我有一本字典如下所示 d a 4 2 b 3 4 c 4 3 d 4 3 e 4 f 4 g 4 我想获取与字典 d 中
在另一个视图中更新核心数据实体后，SwiftUI 列表视图未更新

我有一个存储在核心数据中的课程实体其变量之一是存储课程是否完成这些课程列在 SwiftUI 列表中选择后会转到游戏所在的视图游戏完成后 complete 变量将更新为 true 应该发生的情况是列表视图显示列出的游戏并在游戏旁边显
无法在centOS中运行sshpass命令[关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案正在研究 CentOS 6 3 最终版系统并尝试使用 ssh 另一台机器sshpass实用程序喜欢 sshpass p password ssh user host 但它给了我这
通过 Random.Next() 排序

In 这个问题其中一个建议是通过 Random Next 对列表进行排序我认为也许是错误的他是在建议这个 public static IEnumerable
如果我使用 Mockito，我还需要 Guice 吗？

我一直在学习依赖注入例如 Guice 在我看来主要驱动因素之一可测试性已经被 Mocking 例如 Mockito 很好地涵盖了依赖注入和模拟框架之间的区别 Ninject vs RhinoMock 或 Moq 是对依赖注入和 M
在JSSOR中，如何通过Javascript访问当前标题？

我想将 JSSOR 幻灯片中的值传递到 DOM 的其他部分 Markup div class slide img src bilder bild2 jpg div class caption p Caption text p div div
在构建 Android 应用程序之前，将 jar 从其他目录拉到 libs 文件夹

我有一个 Android 项目它依赖于外部 jar 文件即A jar 我已经配置了我的安卓build gradle首先构建构建的项目A jar 然后 Android 构建将继续 jar 构建后将 jar 从其构建文件夹复制到 andr
FireFox 警告“未知伪类或伪元素‘隐藏’”不断运行

我最近发现 Firefox 中出现一个警告 Warning 未知的伪类或伪元素隐藏这是页面http eleven23 net eleven23 beta work web lounge22 php 当到达具有 img hidden 的
为什么反汇编后的数据会变成指令？

我需要一些帮助来理解此时此刻发生的事情这段代码发生 jmp Begin 我只知道 com 文件可以是 64kb 因此您希望将所有内容放在一个段中如果你想放置变量你需要jmp 但是当我搜索它时很多指南只是在评论中说 jmp Begi

为什么反汇编后的数据会变成指令？

补充说明：

为什么反汇编后的数据会变成指令？ 的相关文章

随机推荐

热门标签

为什么反汇编后的数据会变成指令？的相关文章