深入理解C语言中的malloc,malloc() 与 free() 原理图解

2023-05-16

点击蓝字

dd55bfa13d2b6a90cc0b35cac7767a2d.png

关注我们

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享

来源于网络,侵删

本文分为三个等级自顶向下地分析了glibc中内存分配与回收的过程。本文不过度关注细节,因此只是分别从arena层次、bin层次、chunk层次进行图解,而不涉及有关指针的具体操作。

前言

在展开本文之前,先解释一下本文中会提到的三个重要概念:arena,bin,chunk。三者在逻辑上的蕴含关系一般如下图所示(图中的chunk严格来说应该是Free Chunk)。

ed8e844638ebcf4cdf17dfd10381d615.png

三者概念的解释如下:

arena:通过sbrk或mmap系统调用为线程分配的堆区,按线程的类型可以分为2类:

  • main arena:主线程建立的arena;

  • thread arena:子线程建立的arena;

chunk:逻辑上划分的一小块内存,根据作用不同分为4类:

  • Allocated chunk:即分配给用户且未释放的内存块;

  • Free chunk:即用户已经释放的内存块;

  • Top chunk

  • Last Remainder chunk

bin:一个用以保存Free chunk链表的表头信息的指针数组,按所悬挂链表的类型可以分为4类:

  • Fast bin

  • Unsorted bin

  • Small bin

  • Large bin

在这里读者仅需明白arena的等级大于bin的等级大于(free)chunk的等级即可,即A>B>C。

tips:

实际内存中,main arena和thread arena的图示如下(单堆段)。

bd770c3699cd7f012cfc2ef1fd82a8f6.png

其中malloc_state的数据结构描述在源代码中发现该数据结构中保存着fastbinsY、top、last_remainder、bins这四个分别表示Fast bin、Top chunk、Last Remainder chunk、bins(Unsorted bin、 Small bin、Large bin)的数据。

Arena级分析

此处从Arena的层次分析内存分配与回收的过程。

main arena中的内存申请

main arena中的内存申请的流程如下图所示:

a69320b2d466f9b1fdcf4bc67ef69697.png

第一次申请

  • 根据申请内存空间大小是否达到mmap这一系统调用的分配阈值,决定是使用sbrk系统调用 还是mmap系统调用申请堆区。一般分配的空间比申请的要大,这样可以减少后续申请中向操作系统申请内存的次数。

  • 举例而言,用户申请1000字节的内存,实际会通过sbrk系统调用产生132KB的连续堆内存区域。

  • 然后将用户申请大小的内存返回。(本例中将返回1000字节的内存。)

后续申请

  • 根据arena中剩余空间的大小决定是继续分配还是扩容,其中包含扩容部分的为top chunk。

  • 然后将用户申请大小的内存返回。

tips:top chunk不属于任何bin!只有free chunk依附于bin!分配阈值具有默认值,但会动态调整;扩容具体过程见库函数sYSMALLOc 。

thread arena中的申请

thread arena中的内存申请的流程如下图所示:

228a8676bc545468585d4b5fe65594aa.png

其流程类似于main arena的,区别在于thread arena的堆内存是使用mmap系统调用产生的,而非同主线程一样可能会使用sbrk系统调用。

tips:Arena的数量与线程之间并不一定是一一映射的关系。如,在32位系统中有着“ Number of arena = 2 * number of cores + 1”的限制。

内存回收

b705acd2493037c6e771a5d71ddbfa66.jpeg

线程释放的内存不会直接返还给操作系统,而是返还给’glibc malloc’。

bin级分析

此处从bin的层次分析内存分配与回收的过程。考虑到内存回收的过程比内存分配的过程要复杂,因此这里先分析内存回收的过程,再分析内存分配的过程。

内存回收

内存回收的流程如下图所示:

6a553978a730bb342a7a04446e60bde0.png

bin可以分为4类:Fast bin、Unsorted bin、Small bin和 Large bin。保存这些bin的数据结构为fastbinsY以及bins:

fastbinsY:用以保存fast bins。(可索引大小16~64B的内存块)

bins:用以保存unsorted、small以及large bins,共计可容纳126个:

  • Bin 1 – unsorted bin

  • Bin 2 to Bin 63 – small bin(可索引大小<512B的内存块)

  • Bin 64 to Bin 126 – large bin(可索引大小≥512B的内存块)

在内存被释放的时候,被释放内存块会根据其大小而被添加入对应的bin中:

  • 16~64B的内存块会被添加入fastbinY中

  • samll及large的会添加在bins中的unsorted bins中。

tips:small bins和large bins中索引的内存块是在内存分配的过程中被添加在相应的bin中的。

内存分配

内存分配的流程如下图所示:

4f439ccb408f455f1d284788a18e63f0.png

我们知道,内存分配的最终目的在于分配出合适大小的内存块返回给用户。在实现中即为在bin或top chunk中找到(并分割出)所需内存块,其检索的优先级从高到低分别是:

  1. fastbinY

  2. small bins

  3. unsorted bins

  4. large bins

  5. top bins

tips: Fast bin、Unsorted bin、Small bin和 Large bin中保存的都是用户曾经释放的内存块(可能经过合并);top chunk包含Arena扩容的部分,不属于任何bin!

chunk级分析

本文不过度关注操作细节,因此有关内存回收的过程就不赘述了。下图即内存分配的详细过程图:

349cdc3d10c940ed68b32fb10211df9f.png

tips:保存或新窗口打开图片可以查看原图。

具体分配说明参见下列引用内容:

1、获取分配区的锁,为了防止多个线程同时访问同一个分配区,在进行分配之前需要取得分配区域的锁。线程先查看线程私有实例中是否已经存在一个分配区,如果存在尝试对该分配区加锁,如果加锁成功,使用该分配区分配内存,否则,该线程搜索分配区循环链表试图获得一个空闲(没有加锁)的分配区。如果所有的分配区都已经加锁,那么ptmalloc会开辟一个新的分配区,把该分配区加入到全局分配区循环链表和线程的私有实例中并加锁,然后使用该分配区进行分配操作。开辟出来的新分配区一定为非主分配区,因为主分配区是从父进程那里继承来的。开辟非主分配区时会调用mmap()创建一个sub-heap,并设置好top chunk。

2、将用户的请求大小转换为实际需要分配的chunk空间大小。

3、判断所需分配chunk的大小是否满足chunk_size <= max_fast (max_fast 默认为 64B),如果是的话,则转下一步,否则跳到第5步。

4、首先尝试在fast bins中取一个所需大小的chunk分配给用户。如果可以找到,则分配结束。否则转到下一步。

5、判断所需大小是否处在small bins中,即判断chunk_size < 512B是否成立。如果chunk大小处在small bins中,则转下一步,否则转到第6步。

6、根据所需分配的chunk的大小,找到具体所在的某个small bin,从该bin的尾部摘取一个恰好满足大小的chunk。若成功,则分配结束,否则,转到下一步。

7、到了这一步,说明需要分配的是一块大的内存,或者small bins中找不到合适的 chunk。于是,ptmalloc首先会遍历fast bins中的chunk,将相邻的chunk进行合并,并链接到unsorted bin中,然后遍历unsorted bin中的chunk,如果unsorted bin只有一个chunk,并且这个chunk在上次分配时被使用过,并且所需分配的chunk大小属于small bins,并且chunk的大小大于等于需要分配的大小,这种情况下就直接将该chunk进行切割,分配结束,否则将根据chunk的空间大小将其放入small bins或是large bins中,遍历完成后,转入下一步。

8、到了这一步,说明需要分配的是一块大的内存,或者small bins和unsorted bin中都找不到合适的 chunk,并且fast bins和unsorted bin中所有的chunk都清除干净了。从large bins中按照“smallest-first,best-fit”原则,找一个合适的 chunk,从中划分一块所需大小的chunk,并将剩下的部分链接回到bins中。若操作成功,则分配结束,否则转到下一步。

9、如果搜索fast bins和bins都没有找到合适的chunk,那么就需要操作top chunk来进行分配了。判断top chunk大小是否满足所需chunk的大小,如果是,则从top chunk中分出一块来。否则转到下一步。

10、到了这一步,说明top chunk也不能满足分配要求,所以,于是就有了两个选择: 如果是主分配区,调用sbrk(),增加top chunk大小;如果是非主分配区,调用mmap来分配一个新的sub-heap,增加top chunk大小;或者使用mmap()来直接分配。在这里,需要依靠chunk的大小来决定到底使用哪种方法。判断所需分配的chunk大小是否大于等于 mmap分配阈值,如果是的话,则转下一步,调用mmap分配,否则跳到第12步,增加top chunk 的大小。

11、使用mmap系统调用为程序的内存空间映射一块chunk_size align 4kB大小的空间。然后将内存指针返回给用户。

12、判断是否为第一次调用malloc,若是主分配区,则需要进行一次初始化工作,分配一块大小为(chunk_size + 128KB) align 4KB大小的空间作为初始的heap。若已经初始化过了,主分配区则调用sbrk()增加heap空间,分主分配区则在top chunk中切割出一个chunk,使之满足分配需求,并将内存指针返回给用户。


  

  

eb60067d2f93e9524bb0e0fe159dbcd5.gif

如果你年满18周岁以上,又觉得学【C语言】太难?想尝试其他编程语言,那么我推荐你学Python,现有价值499元Python零基础课程限时免费领取,限10个名额!
▲扫描二维码-免费领取

推荐阅读

C语言和C++的区别和联系,大多数人都说错了

C语言进阶之 回调函数详解

C语言断言函数的应用,清晰明了!

c语言结构体学习整理(结构体初始化,结构体指针)

戳“阅读原文”我们一起进步

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深入理解C语言中的malloc,malloc() 与 free() 原理图解 的相关文章

随机推荐

  • Linux驱动开发(十七)---树莓派PWM驱动

    前文回顾 Linux驱动开发 xff08 一 xff09 环境搭建与hello world Linux驱动开发 xff08 二 xff09 驱动与设备的分离设计 Linux驱动开发 xff08 三 xff09 设备树 Linux驱动开发 x
  • Gazebo仿真中.sdf/.world文件标签

    sdf 文件 详细代码 xff1a lt xml version 61 34 1 0 34 gt lt sdf version 61 34 1 5 34 gt lt model name 61 34 cafe 34 gt lt static
  • Jetson TX2核心板系统烧录、烧写

    1 从官网https developer nvidia com embedded jetpack 中下载sdkmanager xff0c 需登录事先在官网注册的账号 xff08 免费 xff09 xff0c 但Jetpack4 3版本一直无
  • C语言实现汉诺塔详细步骤(递归与非递归)及代码

    前言 C语言汉诺塔问题是一个经典的问题 xff0c 在学习编程的初学者中非常流行 它涉及到了递归的思想 xff0c 能够帮助我们理解递归的基本原理 首先 xff0c 我们来了解一下汉诺塔的问题 汉诺塔问题是指 xff1a 有三根柱子A B
  • C语言 | 输出月份的英文

    要成为绝世高手 xff0c 并非一朝一夕 xff0c 除非是天生武学奇才 xff0c 但是这种人 万中无一 包租婆 这道理放在C语言学习上也一并受用 在编程方面有着天赋异禀的人毕竟是少数 xff0c 我们大多数人想要从C语言小白进阶到高手
  • C语言实例:3个数从小到大排序

    需求 任意输入3个整数 xff0c 对这3个整数由小到大进行排序 xff0c 并将排序后的结果输出 源码 64 author 冲哥 64 date 2021 5 7 13 37 64 description 实现对这3个整数由小到大进行排序
  • C 预处理指令

    C 预处理指令 C语言 C 语言的预处理器 用于在编译器处理程序之前预扫描源代码 xff0c 完成头文件的包含 宏扩展 条件编译 行控制 xff08 line control xff09 等操作 编译的四个阶段 C语言标准规定 xff0c
  • c语言怎么输入3个数输出最大值

    方法 xff1a 首先使用scanf 接收从键盘输入的三个数 xff1b 然后使用 if else 语句比较三个数的大小 xff0c 获得最大值 xff1b 最后使用print 函数将最大值输出即可 c语言输入3个数输出最大值 includ
  • C 运算符中不能重载的是哪些

    C 运算符中不能重载的有 xff1a 1 条件运算符 xff1b 2 成员访问运算符 xff1b 3 域运算符 xff1b 4 长度运算符 sizeof xff1b 5 成员指针访问运算符 gt 和 重载 xff1a 让操作符可以有新的语义
  • scanf在c语言中的作用是什么?

    scanf 函数 scanf 是C语言中的一个输入函数 与printf函数一样 xff0c 都被声明在头文件stdio h里 xff0c 因此在使用scanf函数时要加上 include xff08 在有一些实现中 xff0c printf
  • C语言中字符串的结束标志是什么

    C语言中字符串的结束标志是 39 0 39 C语言中没有专门的字符串变量 xff0c 通常用一个字符数组来存放一个字符串 xff0c 字符串总是以 39 0 39 作为结束符 39 0 39 就是8位的00000000 xff0c 因为字符
  • Linux驱动开发(十八)---网络(网卡)驱动学习

    前文回顾 Linux驱动开发 xff08 一 xff09 环境搭建与hello world Linux驱动开发 xff08 二 xff09 驱动与设备的分离设计 Linux驱动开发 xff08 三 xff09 设备树 Linux驱动开发 x
  • c语言源文件经过编译后生成文件的后缀是什么?

    c语言源文件经过编译后 xff0c 生成文件的后缀是 obj C语言源文件后缀名是 c xff0c 编译生成的文件后缀名是 obj xff0c 连接后可执行文件的后缀名是 exe C语言创建程序的步骤 xff1a 编辑 xff1a 就是创建
  • C语言strcmp函数用法

    C语言strcmp函数用法 strcmp函数语法为 int strcmp char str1 char str2 xff0c 其作用是比较字符串str1和str2是否相同 xff0c 如果相同则返回0 xff0c 如果不同 xff0c 前者
  • C++ 空指针和野指针

    点击蓝字 关注我们 来源于网络 xff0c 侵删 1 空指针 指针变量指向内存中编号为0的空间为空指针 空指针指向的内存空间是不可以访问的 代码 xff1a include lt iostream gt using namespace st
  • 如何用C++实现动态放烟花(附源码)

    点击蓝字 关注我们 来源于网络 xff0c 侵删 一 前言 C 43 43 实现的放烟花程序 用到了EGE图形库 xff0c 没有的需要自行安装 可调项 xff1a 背景图和背景音乐 粒子模糊度 亮度以及上升速度的参数 实现的动态烟花非常好
  • C语言内存泄漏问题及其检视方法

    点击蓝字 关注我们 来源于网络 xff0c 侵删 通过介绍内存泄漏问题原理及检视方法 xff0c 希望后续能够从编码检视环节就杜绝内存泄漏导致的网上问题发生 本文通过介绍内存泄漏问题原理及检视方法 xff0c 希望后续能够从编码检视环节就杜
  • C语言进阶之 回调函数详解

    点击蓝字 关注我们 因公众号更改推送规则 xff0c 请点 在看 并加 星标 第一时间获取精彩技术分享 来源于网络 xff0c 侵删 在讲回调函数之前 xff0c 我们需要了解函数指针 我们都知道 xff0c C语言的灵魂是指针 xff0c
  • C语言和C++的区别和联系,大多数人都说错了

    点击蓝字 关注我们 因公众号更改推送规则 xff0c 请点 在看 并加 星标 第一时间获取精彩技术分享 来源于网络 xff0c 侵删 C语言和C 43 43 到底是什么关系 xff1f 首先C 43 43 和C语言本来就是两种不同的编程语言
  • 深入理解C语言中的malloc,malloc() 与 free() 原理图解

    点击蓝字 关注我们 因公众号更改推送规则 xff0c 请点 在看 并加 星标 第一时间获取精彩技术分享 来源于网络 xff0c 侵删 本文分为三个等级自顶向下地分析了glibc中内存分配与回收的过程 本文不过度关注细节 xff0c 因此只是