glibc 已弃用的 __malloc_hook 功能的替代方案

2024-04-26

我正在为 C 编写一个内存分析器，并为此拦截对malloc, realloc and free通过 malloc_hooks 函数。不幸的是，这些已被弃用，因为它们在多线程环境中表现不佳。我找不到描述实现相同目标的替代最佳实践解决方案的文档，有人可以启发我吗？

我读过一个简单的#define malloc(s) malloc_hook(s)可以解决这个问题，但这不适用于我想要的系统设置，因为它对原始代码库的侵入太大，不适合在分析/跟踪工具中使用。对于任何像样的分析器来说，必须手动更改原始应用程序代码都是一个杀手。最佳情况下，我正在寻找的解决方案应该通过链接到可选的共享库来启用或禁用。例如，我当前的设置使用一个声明为的函数__attribute__ ((constructor))安装拦截malloc hooks.

Thanks

在尝试了一些事情之后，我终于弄清楚了如何做到这一点。

首先，在glibc, malloc被定义为弱符号，这意味着它可以被应用程序或共享库覆盖。因此，LD_PRELOAD不一定需要。相反，我在共享库中实现了以下函数：

void*
malloc (size_t size)
{
  [ ... ]
}

由应用程序调用而不是glibcs malloc.

现在，相当于__malloc_hook的功能，仍然缺少一些东西。

1.) 调用者地址

除了原来的参数malloc, glibcs __malloc_hooks还提供了调用函数的地址，实际上就是where的返回地址malloc会回到。为了达到同样的目的，我们可以使用__builtin_return_addressgcc 中可用的函数。我没有研究过其他编译器，因为无论如何我都仅限于 gcc，但是如果您碰巧知道如何可移植地执行此类操作，请给我留言:)

Our malloc函数现在看起来像这样：

void*
malloc (size_t size)
{
  void *caller = __builtin_return_address(0);
  [ ... ]
}

2.) 访问`glibc`s malloc 从你的钩子中

由于我的应用程序仅限于 glibc，因此我选择使用__libc_malloc访问原始的 malloc 实现。或者，dlsym(RTLD_NEXT, "malloc")可以使用，但该函数使用可能存在陷阱calloc第一次调用时，可能会导致无限循环，从而导致段错误。

完整的 malloc 钩子

我的完整挂钩函数现在如下所示：

extern void *__libc_malloc(size_t size);

int malloc_hook_active = 0;

void*
malloc (size_t size)
{
  void *caller = __builtin_return_address(0);
  if (malloc_hook_active)
    return my_malloc_hook(size, caller);
  return __libc_malloc(size);
}

where my_malloc_hook看起来像这样：

void*
my_malloc_hook (size_t size, void *caller)
{
  void *result;

  // deactivate hooks for logging
  malloc_hook_active = 0;

  result = malloc(size);

  // do logging
  [ ... ]

  // reactivate hooks
  malloc_hook_active = 1;

  return result;
}

当然，钩子calloc, realloc and free工作方式类似。

动态和静态链接

有了这些函数，动态链接就可以开箱即用。链接包含 malloc 挂钩实现的 .so 文件将导致所有调用malloc来自应用程序以及所有要通过我的钩子路由的库调用。但静态链接是有问题的。我还没有完全理解它，但在静态链接中 malloc 不是一个弱符号，导致链接时出现多重定义错误。

如果您出于某种原因需要静态链接，例如通过调试符号将第 3 方库中的函数地址转换为代码行，那么您可以静态链接这些第 3 方库，同时仍然动态链接 malloc 挂钩，从而避免多重定义问题。我还没有找到更好的解决方法，如果你知道，请随时给我留言。

这是一个简短的例子：

gcc -o test test.c -lmalloc_hook_library -Wl,-Bstatic -l3rdparty -Wl,-Bdynamic

3rdparty将被静态链接，同时malloc_hook_library将动态链接，从而产生预期的行为以及函数的地址3rdparty可通过调试符号进行翻译test。很整洁，是吧？

结论

上面的技术描述了一种未弃用的、几乎等效的方法__malloc_hooks，但有一些明显的限制：

__builtin_caller_address仅适用于gcc

__libc_malloc仅适用于glibc

dlsym(RTLD_NEXT, [...])是一个 GNU 扩展glibc

链接器标志-Wl,-Bstatic and -Wl,-Bdynamic特定于 GNU binutils。

换句话说，这个解决方案是完全不可移植的，如果要将钩子库移植到非 GNU 操作系统，则必须添加替代解决方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)