GDB调试技巧实战--为优化版release版本的函数寻找参数值

2023-05-16

在上一篇《GDB调试技巧实战–为release版本的函数寻找参数值》中,我们探讨了一种为函数找参数的办法,
但是,那是最理想的情况 -

  1. 编译时没有使用-fomit-frame-pointer。
  2. 编译时没有开启优化。

还是接着用上节的c代码,让我们详细看看call1函数在不同编译条件下的汇编代码。

  • 没使用-fomit-frame-pointer,没优化
    一切都很完美(rbp是栈基,rsp是占顶,使用edi/esi等寄存器传参,没用的变量也分配了空间):
gcc release_core_csdn.c
(gdb) disass call1
Dump of assembler code for function call1:
   0x00000000004007df <+0>:     push   %rbp
   0x00000000004007e0 <+1>:     mov    %rsp,%rbp
   0x00000000004007e3 <+4>:     sub    $0x20,%rsp
   0x00000000004007e7 <+8>:     mov    %edi,-0x14(%rbp)
   0x00000000004007ea <+11>:    mov    %esi,-0x18(%rbp)
   0x00000000004007ed <+14>:    movl   $0x6c6c6163,-0x10(%rbp)  //eye_catcher
   0x00000000004007f4 <+21>:    movw   $0x31,-0xc(%rbp)
   0x00000000004007fa <+27>:    mov    -0x18(%rbp),%edx
   0x00000000004007fd <+30>:    mov    -0x14(%rbp),%eax
   0x0000000000400800 <+33>:    mov    %eax,%esi
   0x0000000000400802 <+35>:    mov    $0x4009ae,%edi
   0x0000000000400807 <+40>:    mov    $0x0,%eax
   0x000000000040080c <+45>:    callq  0x4005c0 <printf@plt>
   0x0000000000400811 <+50>:    mov    $0x16,%esi
   0x0000000000400816 <+55>:    mov    $0x15,%edi
   0x000000000040081b <+60>:    callq  0x400799 <call2>
   0x0000000000400820 <+65>:    leaveq
   0x0000000000400821 <+66>:    retq

  • 仅仅使用编译选项-fomit-frame-pointer
    rbp不再是栈基(function prolog变了), 其它都正常。
gcc release_core_csdn.c  -fomit-frame-pointer
(gdb) disass call1
Dump of assembler code for function call1:
   0x00000000004007ee <+0>:     sub    $0x28,%rsp
   0x00000000004007f2 <+4>:     mov    %edi,0xc(%rsp)
   0x00000000004007f6 <+8>:     mov    %esi,0x8(%rsp)
   0x00000000004007fa <+12>:    movl   $0x6c6c6163,0x10(%rsp)
   0x0000000000400802 <+20>:    movw   $0x31,0x14(%rsp)
   0x0000000000400809 <+27>:    mov    0x8(%rsp),%edx
   0x000000000040080d <+31>:    mov    0xc(%rsp),%eax
   0x0000000000400811 <+35>:    mov    %eax,%esi
   0x0000000000400813 <+37>:    mov    $0x4009ce,%edi
   0x0000000000400818 <+42>:    mov    $0x0,%eax
   0x000000000040081d <+47>:    callq  0x4005c0 <printf@plt>
   0x0000000000400822 <+52>:    mov    $0x16,%esi
   0x0000000000400827 <+57>:    mov    $0x15,%edi
   0x000000000040082c <+62>:    callq  0x4007a1 <call2>
   0x0000000000400831 <+67>:    add    $0x28,%rsp
   0x0000000000400835 <+71>:    retq
  • 开启优化-O1, 一眼看上去指令少了很多,函数变短了;rbp也不用了;没用过得变量如eye_catcher被优化没了。
gcc release_core_csdn.c -O1
(gdb) disass call1
Dump of assembler code for function call1:
   0x000000000040074e <+0>:     sub    $0x8,%rsp
   0x0000000000400752 <+4>:     mov    %esi,%edx
   0x0000000000400754 <+6>:     mov    %edi,%esi
   0x0000000000400756 <+8>:     mov    $0x4008ce,%edi
   0x000000000040075b <+13>:    mov    $0x0,%eax
   0x0000000000400760 <+18>:    callq  0x400590 <printf@plt>
   0x0000000000400765 <+23>:    mov    $0x16,%esi
   0x000000000040076a <+28>:    mov    $0x15,%edi
   0x000000000040076f <+33>:    callq  0x400727 <call2>
   0x0000000000400774 <+38>:    add    $0x8,%rsp
   0x0000000000400778 <+42>:    retq
  • 开启优化-O2:除了O1优化项外,还把call2内联了进来,少了调用call2需要的额外成本。
$ gcc *csdn.c -O2
(gdb) disass call1
Dump of assembler code for function call1:
   0x00000000004007d0 <+0>:     sub    $0x8,%rsp
   0x00000000004007d4 <+4>:     mov    %esi,%edx
   0x00000000004007d6 <+6>:     xor    %eax,%eax
   0x00000000004007d8 <+8>:     mov    %edi,%esi
   0x00000000004007da <+10>:    mov    $0x4008ee,%edi
   0x00000000004007df <+15>:    callq  0x400590 <printf@plt>
   0x00000000004007e4 <+20>:    mov    $0x16,%edx
   0x00000000004007e9 <+25>:    mov    $0x15,%esi
   0x00000000004007ee <+30>:    mov    $0x4008d0,%edi
   0x00000000004007f3 <+35>:    xor    %eax,%eax
   0x00000000004007f5 <+37>:    callq  0x400590 <printf@plt> //call2
   0x00000000004007fa <+42>:    movl   $0x5,0x0
   0x0000000000400805 <+53>:    add    $0x8,%rsp
   0x0000000000400809 <+57>:    retq

一般用C/C++发布的包都是经过编译器优化的,这样的程序已经不能用rbp追踪每层的栈基了,只能从最后的rsp结合每个函数的汇编代码一层层的往上加offset(如sub $0x8,%rsp,offset就是8,还要注意额外的push/pop指令)找到每层的栈基。这是一个很痛苦的过程!

最佳实践:
细心的读者可能已经注意到每个函数中都有一个字符串eye_catcher, 如果它没被优化掉便可以通过查找内存的办法直接找到这个字符串,从而找到对应函数的栈。为了防止eye_cather被优化点,建议声明为:

volatile char eye_catcher[]="call1";

另外,建议每个数据结构的开头也放一个eye_catcher, 看到这个字符串从而一下就知道是某个数据结构。这样当你怀疑某个地址是某个参数时,特别是复杂数据结构的指针时,方便验证你的想法。

struct XXX{
	char eye_catcher[4];
	...
};

还有一个好处:通过观察eye_catcher,如果不是预期值,很有可能发生了内存overflow。内存问题可是占了C/C++程序总BUG数的70%。
会牺牲一点点performance, 但是值得!
最后简单看下O2条件下,崩溃时的栈,大致能看出从哪到哪是哪个函数的栈:

(gdb) where
#0  0x000000000040085d in call1 ()
#1  0x00000000004008a4 in call0 ()
#2  0x0000000000400629 in main ()
(gdb) x /64s $rsp
0x7fffffffe0b0: "call1"
0x7fffffffe0b6: ""
0x7fffffffe0b7: ""
0x7fffffffe0b8: "h\352\377\367\377\177"
0x7fffffffe0bf: ""
0x7fffffffe0c0: "call2"
0x7fffffffe0c6: ""
0x7fffffffe0c7: ""
0x7fffffffe0c8: "P\341\377\367\377\177"
0x7fffffffe0cf: ""
0x7fffffffe0d0: "\003"
0x7fffffffe0d2: ""
0x7fffffffe0d3: ""
0x7fffffffe0d4: ""
0x7fffffffe0d5: ""
0x7fffffffe0d6: ""
0x7fffffffe0d7: ""
0x7fffffffe0d8: "\244\b@"
0x7fffffffe0dc: ""
0x7fffffffe0dd: ""
0x7fffffffe0de: ""
0x7fffffffe0df: ""
0x7fffffffe0e0: "call0"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

GDB调试技巧实战--为优化版release版本的函数寻找参数值 的相关文章

随机推荐

  • 无监督学习论文阅读

    无监督学习论文阅读 刚开始接触这方面的内容 xff0c 仅供参考 Diversity Transfer Network for Few Shot Learning xff08 AAAI2020 xff09 1 这篇文章提出了一种新的深度聚类
  • 控制教程 —— 介绍篇:3.PID控制器设计

    承接上一篇 控制教程 介绍篇 xff1a 2 系统分析 介绍完系统建模和基本的系统分析后 xff0c 我们已经了解了被控对象的特性 xff0c 这时 xff0c 就需要用一个合理的控制器 xff0c 让这个被控对象在该控制器下按照指定的给定
  • FreeRTOS —— 4.队列管理

    4 1 本章介绍与适用范围 队列 提供了任务到任务 xff0c 任务到中断以及中断到任务的通信机制 范围 本章旨在使读者更好地理解 xff1a 如何创建队列 队列如何管理其包含的数据 如何将数据发送到队列 如何从队列接收数据 阻塞队列意味着
  • LSTM一般最多堆叠多少层

    一 LSTM一般最多堆叠多少层 在大规模翻译任务的经验中 简单的堆叠LSTM层最多可以工作4层 很少工作6层 超过8层就很差了 Redisual connection有助于梯度的反向传播 xff0c 能够帮助lstm堆叠更多层 xff0c
  • 华为机试在线训练-牛客网(23)判断两个IP是否属于同一子网

    题目描述 子网掩码是用来判断任意两台计算机的IP地址是否属于同一子网络的根据 子网掩码与IP地址结构相同 xff0c 是32位二进制数 xff0c 其中网络号部分全为 1 和主机号部分全为 0 利用子网掩码可以判断两台主机是否中同一子网中
  • APISIX Dashboard中文文档(二)

    2022年7月6日14 31 51 APISIX Dashboard中文文档 一 APISIX Dashboard中文文档 二 APISIX Dashboard中文文档 三 基本部署 在 Linux 上安装 Apache APISIX Da
  • FreeRTOS 任务调度原理(基于cortexM内核)

    目录 默认FreeRTOS调度策略 xff08 单核 xff09 FreeRTOS调度策略的实现 任务创建 任务调度的4种情景 xff1a 1 第一次启动任务调度器 2 任务主动触发调度 3 SystemTick时钟触发调度 4 因为中断而
  • Centos7命令行安装图形用户界面

    安装完成Centos7后 xff0c 重启后发现是命令行界面 xff0c 于是就想改成图形用户界面 安装了图形用户界面的话 xff1a 1 查看系统里是否已经安装了图形用户界面 使用ctrl 43 alt 43 fx xff0c x为123
  • STM32G070 DMA+SPI+LCD显示

    SPI HandleTypeDef hspi1 DMA HandleTypeDef hdma spi1 tx 描述 xff1a LCD的SPI引脚初始化 参数 xff1a 无 返回 xff1a 无 void LCD SPI Init voi
  • Linux 开启VNCSERVER

    尽管我们可以使用 SSH连接远程通过字符界面来操作Linux xff0c 但是对于更多熟悉图形人来说是很不方便的 xff0c 因此开启Linux的远程桌面还是很有必要的 目前有两种比较流行的方式 xff1a XDM X display ma
  • Ubuntu 代号引发的“崩溃”

    写这篇文章主要是因为在前几天 xff0c 因为向来不关心ubuntu代号的我而引发的一次 崩溃 xff08 人崩溃 xff09 xff0c 正如我们所知Ubuntu 每半年都会更新一个版本 xff0c 每两年都会发布一个TLS xff08
  • Prometheus(二)部署Prometheus和node_exporter

    软件包列表 Prometheus安装 解压部署 rm rf prometheus 2 28 1 linux amd64 tar xvf prometheus 2 28 1 linux amd64 tar gz rm usr local pr
  • Python学习之路_day_02(编程语言介绍及变量)

    一 编程语言介绍 1 机器语言 直接用二进制编程 xff0c 直接控制硬件 xff0c 需要掌握硬件的操作细节 优点 xff1a 执行效率高 缺点 xff1a 开发效率低 2 汇编语言 xff1a 用英文标签取代二进制指令去编写程序 xff
  • 解决linux系统read only system 解决办法

    首先确认系统属于非硬盘物理坏道引起 其次确认是否有root权限 下面我要阐述一个恢复实例 xff1a 一现象 xff1a 1 没有root权限 2 由于磁盘空间满溢导致分区表损坏 xff08 非物理坏道引起 xff09 3 重启后已经无法进
  • 哈希查找效率及应用场景

    数组的特点是 xff1a 寻址容易 xff0c 插入和删除困难 xff1b 而链表的特点是 xff1a 寻址困难 xff0c 插入和删除容易 那么我们能不能综合两者的特性 xff0c 做出一种寻址容易 xff0c 插入删除也容易的数据结构
  • 四位比较器

    四位比较器 一 xff0c 实验目的 通过使用比较四位二进制判断它的相对大小 二 xff0c 实验内容 四位比较器的实验 三 xff0c 实验代码 module Comp 2 str output A gt B A lt B A eq B
  • 程序员玩游戏之三--天天爱消除非暴力脚本

    评论 xff1a 此款游戏成功在其好友排名上 好友的分数超过了你无疑会增加你的斗志 中级策略 xff1a 七手八脚多人一起点 这相当于多个CPU处理一个大任务了 xff0c 哈哈 终极策略 xff1a 自动化 机器总是比人快的多 你两个人一
  • 程序员玩游戏之四--娱网棋牌大连打滚子记牌器

    话说大连人都爱打滚子 xff0c 所以本人就做了一个打滚子记牌器 基本原理同 程序员玩游戏之一 自动对对碰 xff0c 故此处不再赘述 xff0c 只留下一张截图吧 代码请见资源地址 xff1a http download csdn net
  • 为SIGSEGV设置handler有用吗?

    背景 最近几天看到先辈们30年前留下了一块代码 xff0c 为SIGSEGV设置了handler xff0c 所以心中有了两个疑问 xff1a 为SIGSEGV设置handler有没有用 xff1f 能否跳过引起崩溃的那一句指令 xff1f
  • GDB调试技巧实战--为优化版release版本的函数寻找参数值

    在上一篇 GDB调试技巧实战 为release版本的函数寻找参数值 中 xff0c 我们探讨了一种为函数找参数的办法 xff0c 但是 xff0c 那是最理想的情况 编译时没有使用 fomit frame pointer 编译时没有开启优化