jmap 文件解析_干货分享丨jvm系列:dump文件深度分析

2023-10-29

摘要:java内存dump是jvm运行时内存的一份快照,利用它可以分析是否存在内存浪费,可以检查内存管理是否合理,当发生OOM的时候,可以找出问题的原因。那么dump文件的内容是什么样的呢?

JVM dump

java内存dump是jvm运行时内存的一份快照,利用它可以分析是否存在内存浪费,可以检查内存管理是否合理,当发生OOM的时候,可以找出问题的原因。那么dump文件的内容是什么样的呢?我们一步一步来

获取JVM dump文件

获取dump文件的方式分为主动和被动


i.主动方式:
1.利用jmap,也是最常用的方式:jmap -dump:[live],format=b,file=
2.利用jcmd,jcmd GC.heap_dump
3.使用VisualVM,可以界面操作进行dump内存
4.通过JMX的方式

MBeanServer server = ManagementFactory.getPlatformMBeanServer();
HotSpotDiagnosticMXBean mxBean = ManagementFactory.newPlatformMXBeanProxy(server, "com.sun.management:type=HotSpotDiagnostic", HotSpotDiagnosticMXBean.class);
mxBean.dumpHeap(filePath, live);

参考(https://www.baeldung.com/java-heap-dump-capture)


ii.被动方式:
被动方式就是我们通常的OOM事件了,通过设置参数-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=

dump文件分析

结构示意图

结构详解

dump文件是堆内存的映射,由文件头和一系列内容块组成

文件头

由musk, 版本,identifierSize, 时间4部分组成

1、musk:4个byte,内容为'J', 'A', 'V', 'A'即JAVA

2、version:若干byte,值有以下三种

" PROFILE 1.00",
" PROFILE 1.0.10",
" PROFILE 1.0.20"

3、identifierSize:4个byte数字,值为4或者8,表示一个引用所占用的byte数

4、time:8个byte,dump文件生成时间

说明:java一个类的成员变量有两种类型

  1. 基本类型(8种基本类型),它们占用byte数固定不变,每生成一个对象它们就需要给它们赋初始值,分配空间
  2. 是引用类型,表示一个对象,在类中只有一个引用,引用只是一个数值,所占用的空间大小为identifierSize,被引用对象即将在堆中的另一个地方
    例如定义一个类
public class Person {
 private int age;//4个byte
 private String name;//identifierSize个byte
 private double weight;//8个byte
}

当我们在new Person()的时候
它就需要申请一个空间,空间大小为 对象头大小+4+identifierSize+8个byte

对象大小的测量:
jdk提供一个测试对象占用内存大小的工具Instrumentation,但是Instrumentation没法直接引用到,需要通过agent来引用到
定义一个Premain类, javac Premain.java

//Premain.java
public class Premain {
    public static java.lang.instrument.Instrumentation inst;
    public static void premain(String args, java.lang.instrument.Instrumentation inst) {
        Premain.inst = inst;
    }
}

编写一个Manifest文件

manifest.mf
Manifest-Version: 1.0
Premain-Class: Premain
Can-Redefine-Classes: true
Can-Retransform-Classes: true

打包

jar -cmf manifest.mf premain.jar Premain.class

定义一个执行类, javac PersonTest.java

//PersonTest.java
public class PersonTest {
    public static void main(String[] args) throws Exception {
        Class clazz = Class.forName("Premain");
        if (clazz != null) {
            Person p = new Person();
            java.lang.instrument.Instrumentation inst = (java.lang.instrument.Instrumentation)clazz.getDeclaredField("inst").get(null);
            System.out.println("person size:[" + inst.getObjectSize(p) + "]B");
            System.out.println("class size:[" + inst.getObjectSize(p.getClass()) + "]B");
        }
    }
}

带agent执行

java -javaagent:premain.jar PersonTest

结果:

person size:[32]B
class size:[504]B

内容块

每个块都是块头和块体组成

块头

块头由1个byte的块类型,4个byte的时间time,4个byte的长度表示此内容块占用byte数
type类型一般有5种,字符串,类,栈桢,栈,及dump块

  1. 字符串,由identifierSize个byte的字符串id,后面是(length-identifierSize)个byte的字符串内容(后续对字符串是直接引用的这里面的id)
  2. 类,由4个byte的类序列(在栈桢中使用),identifierSize个byte的类id(解析类的时候用到),4个byte的序列id(暂未使用),identifierSize个byte的类名id
  3. 栈桢,由identifierSize个byte的桢id,identifierSize个byte的方法名id,identifierSize个byte的方法标识id,identifierSize个byte的类文件名id,4个byte的类序列,4个byte的行号
  4. 栈,由4个byte的栈序号,4个byte的线程序号,4个byte的桢数量,后面就是若干个identifierSize个byte的桢id
  5. dump块就是所有对象的内容了,每个对象由1个byte的子类型,和对象内容结成,子类型有6种,gc root, 线程对象,类,对象,基本类型数组,对象数组

gc root

gc root有4种结构,8种类型

  1. identifierSize个byte的对象id,类型有SYSTEM_CLASS,BUSY_MONITOR, 及未UNKNOWN
  2. identifierSize个byte的对象id,4个byte的线程序列号,类型有NATIVE_STACK,THREAD_BLOCK
  3. identifierSize个byte的对象id,4个byte的线程序列号,4个byte的栈桢深度,类型有JAVA_LOCAL,NATIVE_LOCAL
  4. identifierSize个byte的对象id,identifierSize个byte的global refId(暂未使用),类型有NATIVE_STATIC

gc root示意图

gc root为垃圾收集追溯的源头,每个gc root都指向一个初始对象,无法追溯的对象是要被回收掉的

系统类,只有classLoader为null的类才是gc root,每个类都是一个gc root
线程栈,线程中方法参数,局部变量都是gc root,每个对象都是一个gc root
系统保留对象,每个对象都是一个gc root

类对象

1、基本信息:

  1. identifierSize个byte的类对象id
  2. 4个byte的栈序列号,
  3. identifierSize个byte的父类对象id,
  4. identifierSize个byte的classLoader对象id,
  5. identifierSize个byte的Signer对象id,
  6. identifierSize个byte的protection domain对象id,
  7. identifierSize个byte的保留id1和id2,
  8. 4个byte的类实例对象大小,
  9. 2个byte的常量个数,后面是每个常量的,2个byte的下标,1个byte的常量类型,和若干个byte的内容,内容根据类型来决定(boolean/byte为1个byte, char/short为2个byte,float/int为4个byte, double/long为8个byte,引用类型为identifierSize个byte)
  10. 2个byte的静态变量个数,后面是每个静态变量的,identifierSize个byte的变量名id, 1个byte的变量类型,和若干个byte的内容,内容根据类型来决定(见类对象基本信息的第9条)
  11. 2个byte的成员变量个数,后面是每个成员变量的,identifierSize个byte的变量名id,1个byte的变量类型

2、说明:
(1)类里面的常量很多地方都没有用上,所以常量个数一般为0
(2)类的静态变量的名称类型及值是放在类对象里面的,成员变量的名称和类型也是放在类对象里面的,但是实例的值是放在实例对象里面的

实例对象

1、基本信息:

  1. identifierSize个byte的实例对象id
  2. 4个byte的栈序列号
  3. identifierSize个byte的类id
  4. 4个byte的占用字节数
  5. 实例的变量的值

2、说明:

  1. 实例的值为实例对象的成员变量值,顺序为当前类的变量值,顺序为类对象基本信息中第11条中的顺序,然后是父类的变量值
  2. 变量的值基本类型都有默认值,引用类型默认值为0,占用字节数(见类对象基本信息的第9条)

基本类型数组

1、基本信息:

  1. identifierSize个byte的数组对象id
  2. 4个byte的栈序列号
  3. 4个byte的数组长度
  4. 1个byte的元素类型
  5. 元素的值列表

2、说明:

  1. 元素的值(见类对象基本信息的第9条)

对象数组

1、基本信息:

  1. identifierSize个byte的数组对象id
  2. 4个byte的栈序列号
  3. 4个byte的数组长度
  4. identifierSize个byte的元素类id
  5. 元素的值列表

内存分配

当一个线程启动的时候,进程会去系统内存生成一个线程栈
每当发生一次方法调用,就会向栈中压入一个栈桢,当方法调用完之后,栈桢会退出
在运行过程中,如果有对象的new操作的时候,进程会去堆区申请一块内存
关于运行时内存的详细情况,可以查找相关的资料

内存回收规则

如果一个对象不能骑过gc root引用可达,那么这个对象就可能要被回收
对象回收规则包括

  1. 实例属性被实例引用,只有当实例被回收了实例属性才能被回收(只针对强引用)
  2. 类对象被实例引用,只有当一个类的所有实例都被回收了,类才能被回收
  3. 类对象的父类,classLoader对象,signer对象, protection domain对象被类引用,只有当类被回收了,这些才能被回收
  4. 局部变量(线程栈中)的作用域为一个大括号
public void test(){
Object a = new Object();//obj 1
Object b = new Object();//obj 2
{
Object c = new Object();//obj 3
a = null;//obj 1可以被回收了
}//obj 3可以回收了
}//obj 2可以被回收了

分析工具简介

分析dump文件,我们可以用jdk里面提供的jhat工具,执行

jhat xxx.dump

jhat加载解析xxx.dump文件,并开启一个简易的web服务,默认端口为7000,可以通过浏览器查看内存中的一些统计信息

一般使用方法

1、浏览器打开http:/127.0.0.1:7000

会列出一些功能,包括package下面各个类的概览,及各个功能导航


2、点击页面的堆内存统计

有一个表格,对象类型,实例个数,实例所占用内存大小,哪种类型的对象占用了内存最多一目了然

3、点击其中认为内存消耗太多的类名查看类详情

主要展现该类下面各个实例的大小,以及一些链接导航


4、点击references summary by type

如果某种类型的对象太多,那么有可能是引用它的那个类的对象太多

基本上一些简单页面的查询,结合原代码,就可以初步定位内存泄漏的地方

综上,dump文件结构还是比较简单的,这对于分析线程的执行情况非常有用,也是每一个Java程序员必须掌握的高级技能之一,你学会了吗?

点击关注,第一时间了解华为云新鲜技术~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

jmap 文件解析_干货分享丨jvm系列:dump文件深度分析 的相关文章

随机推荐

  • java之IO流总结及图解

    java之IO流总结及图解 IO流 字节流 字节输入流 InputStream int read 一次读取一个字节 int read byte bys 一次读取一个字节数组
  • VisionOn 一款集流程图、思维导图、白板于一体的轻量级在线制图工具

    Vision On 一款集流程图 思维导图 白板于一体的轻量级在线图形工具 在工作和学习过程中 通过可视化的图形 有助于清晰高效地表达我们的灵感 想法 思想 工欲善其事 必先利其器 目前 思维导图软件已经有 Xmind Mindnode M
  • 【转载】亚信科技亮相中国高速公路信息化大会,与云南云通数联达成战略合作

    3月30至31日 我国交通行业颇具影响力的第25届中国高速公路信息化大会暨技术产品博览会 在福州市海峡国际会展中心盛大举办 数百家产业链企业齐聚 共谋高速公路数智化发展 亚信科技携系列数智化创新成果亮相展会 大会期间 亚信科技 南京 有限公
  • jQuery 的设置属性值,和获取属性值,attr()和prop();

    jQuery 的设置属性值 和获取属性值 attr 和prop attr 属性 获取属性值 attr 属性 属性值 设置属性的属性值 prop 属性 获取属性值 prop 属性 属性值 设置属性的属性值 两者的区别 attr可以获得和定义自
  • Chrome 89 更新 js 事件触发顺序,导致99%的文章都错了(包括MDN)

    大家好 我是秋风 嗯 我又来了 这次又是在 楠溪和的讨论中产生的问题 那事情是怎么样的呢 起因 最近楠溪在看事件相关的文章 然后就跑来和我讨论说以下代码的执行效果和网上的文章不一致 代码如下 div div
  • verdaccio内网离线搭建npm私有仓库

    使用场景 前端项目的编译运行开发中报下载经常出错 项目场景 通常我们前端项目开发搭建过程中通过npm管理前端js库 新建项目或内网开发过程中经常出现环境搭建的问题 例如常见错误Failed at the chromedriver 2 37
  • QT学习一:利用QT QAxObject读取Excel表格数据的两种方法比较

    目录 QAxObject QVariant 1 逐单元格读取表格内容 2 一次性读取工作表使用范围 利用QT的 QAxObject读取Excel表格数据的两种方法比较 完整的QT源码到此下载 ReadExcel rar 嵌入式文档类资源 C
  • 计算机视觉与深度学习-经典网络解析-VGG-[北邮鲁鹏]

    目录标题 VGG 参考 VGG网络贡献 使用尺寸更小的 3 times 3 卷积串联来获得更大的感受野 放弃使用 11 times 11 和 5 times 5 这样的大尺寸卷积核 深度更深 非线性更强 网络的参数也更少 去掉了AlexNe
  • 黑马并发编程JUC总结

    并发编程总结1 并发编程 2 进程和线程 2 1定义 2 2并发和并行 2 3应用 异步调用 并发应用 3 java线程 3 1线程创建 创建线程方法1 创建方法2 Thread和Runable的区别 创建方法3 3 2线程运行 3 3线程
  • [Coursera 数字图像和视频处理基础]第一周

    开始跟Coursera上的数字图像和视频处理基础这门课 这次学习笔记记录下第一周的学习内容 第一周的内容很少 介绍了一些非常基础的知识 概括如下 并且记录了最后的答题作业 课程主页截图 1 模拟VS数字信号 首先是信号的定义 我搜了一点资料
  • 稠密连接网络(DenseNet)

    ResNet极大地改变了如何参数化深层网络中函数的观点 稠密连接网络 DenseNet Huang et al 2017 在某种程度上是ResNet的逻辑扩展 让我们先从数学上了解一下 1 从ResNet到DenseNet 回想一下任意函数
  • python: 字典 (dict) 的使用

    摘要 在刷 leecode 的题目时 会经常使用哈希表 在 python 中称为字典 dict 由于本人平时不怎么多使用字典 在真正运用时经常忘记其常规用法 特别是其成员函数的使用 因此 本人根据自己在刷 leecode 时经常使用字典的方
  • 深度学习与计算机视觉系列(8)_神经网络训练与注意点

    作者 寒小阳 时间 2016年1月 出处 http blog csdn net han xiaoyang article details 50521064 声明 版权所有 转载请联系作者并注明出处 1 训练 在前一节当中我们讨论了神经网络静
  • Memcache查看列出所有key方法

    Memcached查看列出所有key方法 测试的过程中 发现Memcached没有一个比较简单的方法可以直接象redis那样keys 列出所有的Session key 并根据key get对应的session内容 具体操作如下 登录MemC
  • bugkuctf-Simple_SSTI_2

    方法一 tplmap 直接扫 python2 tplmap py u http 114 67 175 224 10589 flag 可以注入 使用 os shell提权 python2 tplmap py u http 114 67 175
  • 7.recurrent_neural_network

    device torch device cuda if torch cuda is available else cpu sequence length 28 input size 28 hidden size 128 num layers
  • windows环境与Linux环境下调用c++程序

    在此之前 需要在java编译软件IDEL中配置本地的Maven仓库等 可自行网上搜索配置 一 在Windows系统下调用c 软件生成的dll文件 1 在IDEL中创建Maven工程 配置下载jna包等 在pom文件中写入如下配置即可
  • 软件测试2019:第三次作业

    一 单元测试的任务有哪些 1 模块接口测试 2 模块局部数据结构测试 3 模块边界条件测试 4 模块中所有独立执行通路测试 5 模块的各条错误处理通路测试 二 代码评审方法有哪些 你认为哪一种比较有效 理由是什么 代码评审方法分为代码走查和
  • 什么时候开始使用Redis

    思考这个问题的本质就是要学会取舍和选型 技术选型非常重要 大多人为了技术而技术 这是不可取的 就想小彬认为微服务必须解决分布式事务一样 但他却不知道为什么要用分布式事务 从而不知道什么时候要用分布式事务 就想Redis一样 什么时候要用Re
  • jmap 文件解析_干货分享丨jvm系列:dump文件深度分析

    摘要 java内存dump是jvm运行时内存的一份快照 利用它可以分析是否存在内存浪费 可以检查内存管理是否合理 当发生OOM的时候 可以找出问题的原因 那么dump文件的内容是什么样的呢 JVM dump java内存dump是jvm运行