我在用着 '回溯()' and 'backtrace_symbols_fd()' 信号处理程序中的函数,用于生成用于调试的回溯(GDB 不可用)。
它们在 x86 桌面 (Ubuntu) 上运行良好,但是在目标设备(基于 ARM)上,Abort 信号的回溯(由于双重释放错误)仅显示三帧:信号处理程序和 libc 中的两个,这对于调试我们的代码没有用! SEGV 上的回溯(例如使用错误的指针)确实会产生良好的回溯。
为什么我无法在 ARM 上获得有用的 ABRT 信号回溯?
[为清楚起见编辑问题]
这是一个演示该问题的简单测试程序:
#include <execinfo.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
// Signal hangler to catch seg fault:
void handler_segv(int sig) {
// get void*'s for all entries on the stack
void *array[10];
size_t size;
size = backtrace(array, 10);
fprintf(stderr, "Error: Signal %d; %d frames found:\n", sig, size);
// print out all the frames to stderr
backtrace_symbols_fd(array, size, STDERR_FILENO);
exit(1);
}
void crashme()
{
// Deliberate Error: Abort (double free):
char *test_ptr = malloc(1);
free(test_ptr);
free(test_ptr);
// Deliberate Error #2: Seg fault:
//char * p = NULL;
//*p = 0;
}
void foo()
{
fprintf(stdout, "---->About to crash...\n");
crashme();
fprintf(stdout, "---->Crashed (shouldn't get to here)...\n");
}
// Main entry point:
int main(int argc, char *argv[])
{
fprintf(stdout, "Application start...\n");
// Install signal handlers:
fprintf(stdout, "-->Adding handler for SIGSEGV and SIGABRT\n");
signal(SIGSEGV, handler_segv);
signal(SIGABRT, handler_segv);
fprintf(stdout, "-->OK. Causing Error...\n");
foo();
fprintf(stdout, "-->Test finished (shouldn't get to here!)\n");
return 0;
}
这是针对 x86 编译的,如下所示:
gcc -o test test-backtrace-simple.c -g -rdynamic
对于 ARM:
arm-none-linux-gnueabi-gcc -o test-arm test-backtrace-simple.c -g -rdynamic -O0 -mapcs-frame -funwind-tables -fasynchronous-unwind-tables
我已经使用了 ARM 的各种编译器选项,如与在 ARM 上生成回溯相关的其他帖子中所述。
当在 x86 桌面上运行时,它会生成带有大量调试的预期输出,结尾为:
Error: Signal 6; 10 frames found:
./test(handler_segv+0x19)[0x80487dd]
[0xb7745404]
[0xb7745428]
/lib/i386-linux-gnu/libc.so.6(gsignal+0x4f)[0xb75b0e0f]
/lib/i386-linux-gnu/libc.so.6(abort+0x175)[0xb75b4455]
/lib/i386-linux-gnu/libc.so.6(+0x6a43a)[0xb75ed43a]
/lib/i386-linux-gnu/libc.so.6(+0x74f82)[0xb75f7f82]
./test(crashme+0x2b)[0x8048855]
./test(foo+0x33)[0x804888a]
./test(main+0xae)[0x8048962]
(即由我的处理程序生成的回溯,我的函数调用位于底部)。
但是,当在 ARM 平台上运行时,我得到:
Application start...
-->Adding handler for SIGSEGV and SIGABRT
-->OK. Causing Error...
---->About to crash...
*** Error in `/opt/bin/test-arm': double free or corruption (fasttop): 0x015b6008 ***
Error: Signal 6; 3 frames found:
/opt/bin/test-arm(handler_segv+0x24)[0x8868]
/lib/libc.so.6(__default_sa_restorer_v2+0x0)[0xb6e6c150]
/lib/libc.so.6(gsignal+0x34)[0xb6e6af48]
backtrace() 只找到 3 个帧,它们只是信号处理程序和 libc 中的东西(没有用)!
我发现一个邮件列表帖子说:
如果您链接调试 C 库 -lc_g,您将获得调试
返回过去 abort() 的信息。
这可能是相关的,但 -lc_g 在我的编译器上不起作用(ld:找不到 -lg_c)。
如果我生成一个段错误,则回溯在 ARM 上工作正常(例如,将 crashme() 函数更改为使用“char *p = NULL; *p = 0;”而不是 double free。
对于其他获取回溯的方法有什么想法或建议吗?
[ - 编辑 - ]
我按照评论中的建议尝试了一些 MALLOC_CHECK_ 选项,但唯一的效果是更改是否生成中止。以下是 ARM 上三个运行的输出:
# MALLOC_CHECK_=0 /opt/bin/test-arm
Application start...
-->Adding handler for SIGSEGV and SIGABRT
-->OK. Causing Error...
---->About to crash...
---->Crashed (shouldn't get to here)...
-->Test finished (shouldn't get to here!)
# MALLOC_CHECK_=1 /opt/bin/test-arm
Application start...
-->Adding handler for SIGSEGV and SIGABRT
-->OK. Causing Error...
---->About to crash...
*** Error in `/opt/bin/test-arm': free(): invalid pointer: 0x015b2008 ***
---->Crashed (shouldn't get to here)...
-->Test finished (shouldn't get to here!)
# MALLOC_CHECK_=2 /opt/bin/test-arm
Application start...
-->Adding handler for SIGSEGV and SIGABRT
-->OK. Causing Error...
---->About to crash...
Error: Signal 6; 3 frames found:
/opt/bin/test-arm(handler_segv+0x24)[0x8868]
/lib/libc.so.6(__default_sa_restorer_v2+0x0)[0xb6e24150]
/lib/libc.so.6(gsignal+0x34)[0xb6e22f48]
#
MALLOC_CHECK_=0:没有错误消息(双释放被忽略!)
MALLOC_CHECK_=1:错误消息,但程序继续
MALLOC_CHECK_=2:错误消息和ABRT信号;生成无用的回溯(这是默认行为!)
我的交叉编译器报告:
gcc 版本 4.6.1(Sourcery CodeBench Lite 2011.09-70)
目标设备的 Linux 内核版本为 3.8.8