JVM常用命令整理以及CPU过高排查实战
共 32888字,需浏览 66分钟
·
2024-06-16 19:16
来源:juejin.cn/post/7141352186587381773
推荐:https://t.zsxq.com/WNaa3
有一种爱,叫父爱如山;有一颗心,叫父子连心;有一份情,叫情深似海。有一个节日,叫父亲节。在这个感恩的日子里,祝天下所有的父亲:节日快乐。
图论
概述
先概括几个命令:
-
jps(JVM Process Status Tool):显示指定系统内所有的HotSpot虚拟机进程。 -
jstat(JVM statistics Monitoring):用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。 -
jmap(JVM Memory Map):用于生成heap dump文件,如果不使用这个命令,还可以使用-XX:+HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候·自动生成dump文件。 -
jhat(JVM Heap Analysis Tool):命令是与jmap搭配使用,用来分析jmap生成的dump,jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看
命令详解
jps
描述:显示指定系统内所有的HotSpot虚拟机进程。 命令格式:jps [options] [hostid]
标题 | 注释 |
---|---|
-l | 输出主类全名或jar路径 |
-q | 只输出LVMID |
-m | 输出JVM启动时传递给main()的参数 |
-v | 输出JVM启动时显示指定的JVM参数 |
实例:在下图可以看到,类的路径,以及启动时配置的JVM参数。
$ jps -l -m
1711535 jdk.jcmd/sun.tools.jps.Jps -l -m
1540987 /var/www/xxx/xxx-service.jar --server.port=8090 --spring.profiles.active=pre --swagger.enable=false --logging.config=./logback-spring.xml --server.tomcat.max-threads=1500 --server.tomcat.max-connections=10000
jstat
描述:用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据
命令格式:jstat [option] LVMID [interval] [count]
标题 | 注释 |
---|---|
option | 操作参数 |
LVMID | 本地虚拟机进程ID |
interval | 连续输出的时间间隔 |
count | 连续输出的次数 |
option参数总览:
option | 描述 |
---|---|
class | class loader的行为统计。Statistics on the behavior of the class loader. |
compiler | HotSpt JIT编译器行为统计。Statistics of the behavior of the |
HotSpot Just-in-Time compiler. | |
gc | 垃圾回收堆的行为统计。Statistics of the behavior of the garbage collected heap. |
gccapacity | 各个垃圾回收代容量(young,old,perm)和他们相应的空间统计。Statistics of the capacities of the generations and their corresponding spaces. |
gcutil | 垃圾回收统计概述。Summary of garbage collection statistics. |
gccause | 垃圾收集统计概述(同-gcutil),附加最近两次垃圾回收事件的原因。Summary of garbage collection statistics (same as -gcutil), with the cause of the last and |
gcnew | 新生代行为统计。Statistics of the behavior of the new generation. |
gcnewcapacity | 新生代与其相应的内存空间的统计。Statistics of the sizes of the new generations and its corresponding spaces. |
gcold | 年老代和永生代行为统计。Statistics of the behavior of the old and permanent generations. |
gcoldcapacity | 年老代行为统计。Statistics of the sizes of the old generation. |
gcpermcapacity | 永生代行为统计。Statistics of the sizes of the permanent generation. |
printcompilation | HotSpot编译方法统计。HotSpot compilation method statis |
实例(-class)
描述:监视类装载、卸载数量、总空间以及耗费的时间
$ jstat -class 15408
Loaded Bytes Unloaded Bytes Time
19057 35755.7 0 0.0 9.33
解析:
列名 | 描述 |
---|---|
Loaded | 加载class的数量 |
Bytes | class字节大小 |
Unloaded | 未加载class的数量 |
Bytes | 未加载class的字节大小 |
Time | 加载时间 |
实例(-compiler)
描述:输出JIT编译过的方法数量耗时等
$ jstat -compiler 15408
Compiled Failed Invalid Time FailedType FailedMethod
14524 5 0 43.33 1 org/springframework/core/annotation/AnnotationsScanner processMethodHierarchy
解析:
列名 | 描述 |
---|---|
Compiled | 编译数量 |
Failed | 编译失败数量 |
Invalid | 无效数量 |
Time | 编译耗时 |
FailedType | 失败类型 |
FailedMethod | 失败方法的全限定名 |
实例(-gc)
描述:垃圾回收堆的行为统计
$ jstat -gc 1540987
S0C S1C S0U S1U EC EU OC OU MC MU CCSC CCSU YGC YGCT FGC FGCT CGC CGCT GCT
- - - - - - 3932160.0 153600.0 113152.0 111545.7 0.0 0.0 - - - - - - 0.000
解析:
列名 | 描述 |
---|---|
S0C | survivor0区的总容量 |
S1C | survivor1区的总容量 |
S0U | survivor0区已使用的容量 |
S1C | survivor1区已使用的容量 |
EC | Eden区的总容量 |
EU | Eden区已使用的容量 |
OC | Old区的总容量 |
OU | Old区已使用的容量 |
PC | 当前perm的容量 (KB) |
PU | perm的使用 (KB) |
YGC | 新生代垃圾回收次数 |
YGCT | 新生代垃圾回收时间 |
FGC | 老年代垃圾回收次数 |
FGCT | 老年代垃圾回收时间 |
GCT | 垃圾回收总消耗时间 |
如下命令,意思是每隔2000ms输出15408的gc情况,一共输出20次
jstat -gc 15408 2000 20
实例(-gccapacity)
描述:同-gc,不过还会输出Java堆各区域使用到的最大、最小空间。
$ jstat -gccapacity 15408
NGCMN NGCMX NGC S0C S1C EC OGCMN OGCMX OGC OC MCMN MCMX MC CCSMN CCSMX CCSC YGC FGC CGC
- - - - - - 3932160.0 3932160.0 3932160.0 3932160.0 0.0 114688.0 113152.0 0.0 0.0 0.0 - - -
解析:
列名 | 描述 |
---|---|
NGCMN | 新生代占用的最小空间 |
NGCMX | 新生代占用的最大空间 |
OGCMN | 老年代占用的最小空间 |
OGCMX | 老年代占用的最大空间 |
OGC | 当前年老代的容量 (KB) |
OC | 当前年老代的空间 (KB) |
PGCMN | perm占用的最小空间 |
PGCMX | perm占用的最大空间 |
实例(-gcutil)
描述:同-gc,不过输出的是已使用空间占总空间的百分比
$ jstat -gcutil 15408
S0 S1 E O M CCS YGC YGCT FGC FGCT CGC CGCT GCT
- - - 3.06 92.21 - - - - - - - 0.000
实例(-gccause)
$ jstat -gccause 15408
S0 S1 E O M CCS YGC YGCT FGC FGCT CGC CGCT GCT LGCC GCC
- - - 3.06 98.21 - - - - - - - 0.000 Proactive No GC
解析:
列名 | 描述 |
---|---|
LGCC | 最近垃圾回收的原因 |
GCC | 当前垃圾回收的原因 |
实例(-gcnew)
描述:统计新生代的行为
$ jstat -gcnew 15408
S0C S1C S0U S1U TT MTT DSS EC EU YGC YGCT
419392.0 419392.0 52231.8 0.0 6 6 209696.0 3355520.0 1172246.0 4 0.242
解析:
列名 | 描述 |
---|---|
T | Tenuring threshold(提升阈值) |
MTT | 最大的tenuring threshold |
DSS | survivor区域大小 (KB) |
实例(–gcnewcapacity)
描述:新生代与其相应的内存空间的统计
$ jstat -gcnewcapacity 15408
NGCMN NGCMX NGC S0CMX S0C S1CMX S1C ECMX EC YGC FGC
4194304.0 4194304.0 4194304.0 419392.0 419392.0 419392.0 419392.0 3355520.0 3355520.0 4 0
解析:
列名 | 描述 |
---|---|
NGC | 当前年轻代的容量 (KB) |
S0CMX | 最大的S0空间 (KB) |
S0C | 当前S0空间 (KB) |
ECMX | 最大eden空间 (KB) |
EC | 当前eden空间 (KB) |
实例(–gcold)
描述:统计旧生代的行为
$ jstat -gcold 15408
PC PU OC OU YGC FGC FGCT GCT
10485723.0 12122.7 344345.0 0.0 4 0 0.000 0.242
实例(-gcoldcapacity)
描述:统计旧生代的大小和空间
$ jstat -gcoldcapacity 15408
OGCMN OGCMX OGC OC YGC FGC FGCT GCT
6291456.0 6291456.0 6291456.0 6291456.0 4 0 0.000 0.242
jmap
描述:
-
用于生成heap dump文件. -
如果不使用jmap,还可以以使用-XX:+HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候,自动生成dump文件。 -
jmap不仅能生成dump文件,还可以查询finalize执行队列、Java堆和永久代的详细信息,如当前使用率、当前使用的是哪种收集器等。
命令格式: jmap [option] LVMID
option | 描述 |
---|---|
dump | 生成堆转储快照 |
finalizerinfo | 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象 |
heap | 显示Java堆详细信息 |
histo | 显示堆中对象的统计信息 |
permstat | to print permanent generation statistics |
F | 当-dump没有响应时,强制生成dump快照 |
实例(-dump)
描述:dump堆到文件,format指定输出格式,live指明是活着的对象,file指定文件名,为了后续可以直接用MAT(Memory Anlysis Tool)打开。
命令格式:-dump:live,format=b,file=<filename> pid
$ jmap -dump:live,format=b,file=dump.hprof 32390
Dumping heap to /home/xxx/dump.hprof ...
Heap dump file created
实例(-finalizerinfo)
描述:打印等待回收对象的信息
$ jmap -finalizerinfo 32390
Attaching to process ID 32390, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 24.71-b01
Number of objects pending for finalization: 0
实例(-heap)
描述:打印heap的概要信息,GC使用的算法,heap的配置及wise heap的使用情况,可以用此来判断内存目前的使用情况以及垃圾回收情况。
$ jmap -heap 32390
Attaching to process ID 32390, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 24.71-b01
using thread-local object allocation.
Parallel GC with 4 thread(s)//GC 方式
Heap Configuration: //堆内存初始化配置
MinHeapFreeRatio = 0 //对应jvm启动参数-XX:MinHeapFreeRatio设置JVM堆最小空闲比率(default 40)
MaxHeapFreeRatio = 100 //对应jvm启动参数 -XX:MaxHeapFreeRatio设置JVM堆最大空闲比率(default 70)
MaxHeapSize = 2082471936 (1986.0MB) //对应jvm启动参数-XX:MaxHeapSize=设置JVM堆的最大大小
NewSize = 1310720 (1.25MB)//对应jvm启动参数-XX:NewSize=设置JVM堆的‘新生代’的默认大小
MaxNewSize = 17592186044415 MB//对应jvm启动参数-XX:MaxNewSize=设置JVM堆的‘新生代’的最大大小
OldSize = 5439488 (5.1875MB)//对应jvm启动参数-XX:OldSize=<value>:设置JVM堆的‘老生代’的大小
NewRatio = 2 //对应jvm启动参数-XX:NewRatio=:‘新生代’和‘老生代’的大小比率
SurvivorRatio = 8 //对应jvm启动参数-XX:SurvivorRatio=设置年轻代中Eden区与Survivor区的大小比值
PermSize = 21757952 (20.75MB) //对应jvm启动参数-XX:PermSize=<value>:设置JVM堆的‘永生代’的初始大小
MaxPermSize = 85983232 (82.0MB)//对应jvm启动参数-XX:MaxPermSize=<value>:设置JVM堆的‘永生代’的最大大小
G1HeapRegionSize = 0 (0.0MB)
Heap Usage://堆内存使用情况
PS Young Generation
Eden Space://Eden区内存分布
capacity = 33030156 (31.5MB)//Eden区总容量
used = 1524042 (1.4534378051757812MB) //Eden区已使用
free = 315061046 (30.04656219482422MB) //Eden区剩余容量
4.614088270399305% used //Eden区使用比率
From Space: //其中一个Survivor区的内存分布
capacity = 5242880 (5.0MB)
used = 0 (0.0MB)
free = 5242880 (5.0MB)
0.0% used
To Space: //另一个Survivor区的内存分布
capacity = 5242880 (5.0MB)
used = 0 (0.0MB)
free = 5242880 (5.0MB)
0.0% used
PS Old Generation //当前的Old区内存分布
capacity = 86507520 (82.5MB)
used = 0 (0.0MB)
free = 86507520 (82.5MB)
0.0% used
PS Perm Generation//当前的 “永生代” 内存分布
capacity = 22020096 (21.0MB)
used = 2496528 (2.3808746337890625MB)
free = 19523568 (18.619125366210938MB)
11.337498256138392% used
670 interned Strings occupying 43720 bytes.
实例(-histo)
描述:打印堆的对象统计,包括对象数、内存大小等等 (因为在dump:live前会进行full gc,如果带上live则只统计活对象,因此不加live的堆大小要大于加live堆的大小 )
$ jmap -histo:live 32390 | more
num #instances #bytes class name
----------------------------------------------
1: 83616 12012249 <constMethodKlass>
2: 23868 11450288 [B
3: 83618 10716066 <methodKlass>
4: 76288 10412128 [C
5: 8226 9021178 <constantPoolKlass>
6: 8222 5830258 <instanceKlassKlass>
7: 7036 5156488 <constantPoolCacheKlass>
8: 736272 1767048 java.lang.String
9: 2262 1348848 <methodDataKlass>
10: 8858 849296 java.lang.Class
B byte C char D double F float I int J long Z boolean[ 数组,如[I表示int[] [L+类名 其他对象
实例(-permstat)
描述:打印Java堆内存的永久保存区域的类加载器的智能统计信息
$ jmap -permstat 32390
Attaching to process ID 32390, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 24.71-b01
finding class loader instances ..done.
computing per loader stat ..done.
please wait.. computing liveness.liveness analysis may be inaccurate ...
class_loader classes bytes parent_loader alive? type
<bootstrap> 3111 18154296 null live <internal>
0x0000000600905cf8 1 1888 0x0000000600087f08 dead sun/reflect/DelegatingClassLoader@0x00000007800500a0
0x00000006008fcb48 1 1888 0x0000000600087f08 dead sun/reflect/DelegatingClassLoader@0x00000007800500a0
0x00000006016db798 0 0 0x00000006008d3fc0 dead java/util/ResourceBundle$RBClassLoader@0x0000000780626ec0
0x00000006008d6810 1 3056 null dead sun/reflect/DelegatingClassLoader@0x00000007800500a0
jhat
描述:命令是与jmap搭配使用,用来分析jmap生成的dump,jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看。
jhat [dumpfile]
命令 | 描述 |
---|---|
-stack false | true |
-refs false,true | 关闭对象引用跟踪(tracking of references to objects)。 默认值为 true. 默认情况下, 返回的指针是指向其他特定对象的对象,如反向链接或输入引用(referrers or incoming references), 会统计/计算堆中的所有对象。> |
-port port-number | 设置 jhat HTTP server 的端口号. 默认值 7000.> |
-exclude exclude-file | 指定对象查询时需要排除的数据成员列表文件(a file that lists data members that should be excluded from the reachable objects query)。 例如, 如果文件列列出了 java.lang.String.value , 那么当从某个特定对象 Object o 计算可达的对象列表时, 引用路径涉及 java.lang.String.value 的都会被排除。> |
-baseline exclude-file | 指定一个基准堆转储(baseline heap dump)。 在两个 heap dumps 中有相同 object ID 的对象会被标记为不是新的(marked as not being new). 其他对象被标记为新的(new). 在比较两个不同的堆转储时很有用.> |
-debug int | 设置 debug 级别. 0 表示不输出调试信息。 值越大则表示输出更详细的 debug 信息.> |
-version | 启动后只显示版本信息就退出> |
-J< flag > | 因为 jhat 命令实际上会启动一个JVM来执行, 通过 -J 可以在启动JVM时传入一些启动参数. 例如, -J-Xmx512m 则指定运行 jhat 的Java虚拟机使用的最大堆内存为 512 MB. 如果需要使用多个JVM启动参数,则传入多个 -Jxxxxxx. |
实例:
$ jhat -J-Xmx512m dump.hprof
eading from dump.hprof...
Dump file created Fri Mar 11 17:13:42 CST 2016
Snapshot read, resolving...
Resolving 271678 objects...
Chasing references, expect 54 dots......................................................
Eliminating duplicate references......................................................
Snapshot resolved.
Started HTTP server on port 7000
Server is ready.
中间的-J-Xmx512m是在dump快照很大的情况下分配512M内存去启动HTTP服务器,运行完之后就可在浏览器打开Http://localhost:7000
进行快照分析
jstack
描述:jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。
命令:jstack [option] LVMID
option | 描述 |
---|---|
-F | 当正常输出请求不被响应时,强制输出线程堆栈 |
-l | 除堆栈外,显示关于锁的附加信息 |
-m |
$ jstack -l 11494|more
2016-07-28 13:40:04
Full thread dump Java HotSpot(TM) 64-Bit Server VM (24.71-b01 mixed mode):
"Attach Listener" daemon prio=10 tid=0x00007febb0002000 nid=0x6b6f waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
Locked ownable synchronizers:
- None
"http-bio-8005-exec-2" daemon prio=10 tid=0x00007feb94028000 nid=0x7b8c waiting on condition [0x00007fea8f56e000]
java.lang.Thread.State: WAITING (parking)
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000000cae09b80> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
at java.util.concurrent.locks.LockSupport.park(LockSupport.java:186)
at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2043)
at java.util.concurrent.LinkedBlockingQueue.take(LinkedBlockingQueue.java:442)
at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:104)
at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:32)
at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1068)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1130)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61)
at java.lang.Thread.run(Thread.java:745)
Locked ownable synchronizers:
- None
.....
jinfo
描述:是实时查看和调整虚拟机运行参数。
命令:jinfo [option] [args] LVMID
option | 描述 |
---|---|
-flag | 输出指定args参数的值 |
-flags | 不需要args参数,输出所有JVM参数的值 |
-sysprops | 输出系统属性,等同于System.getProperties() |
实战cpu过高线程堆栈定位
定位进程
登录服务器,执行top命令,查看CPU占用情况:
$top
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
66529 root 20 0 4289m 874m 13312 S 150.0 10.9 10:39.73 java
top
命令查看所有进程占系统CPU的排序,它是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器,如果要排序 shift+p
快捷键
标题符具体代表含义:
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES RES — 进程使用的、未被换出的物理内存大小,单位kb。
RES=CODE+DATA
SHR — 共享内存大小,单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比 TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)
通过执行top
命令,我看到,进程ID为66529的Java进程的CPU占用率达到了150%,基本可以定位到是我们的Java应用导致整个服务器的CPU占用率飙升。
定位线程
当然,Java是单进程多线程的,那么,接下来我就看了这个PID=66529的这个Java进程中的各个线程的CPU使用情况,同样是用top命令:
$top -Hp 66529
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
6680 root 20 0 4289m 874m 13312 S 16.2 10.9 3:02.96 java
通过执行top -Hp 66529
命令,我发现,在66529这个进程中,ID为6680的线程占用CPU最高。
定位代码
通过top命令,我定位到了导致CPU使用率较高的具体线程, 接下来就要看一下具体是哪一行代码存在问题。
首先,我把6680这个线程转成16进制:
$printf %x 6680
1a18
接下来,根据该16进制值去打印的堆栈日志内查询,查看该线程所驻留的方法位置。并通过jstack
命令,查看栈信息
$jstack 66529 |grep -A 200 1a18
"System Clock" #28 daemon prio=5 os_prio=0 tid=0x00007efc19e8e800 nid=0xae24 waiting on condition [0x00007efbe0d91000]
java.lang.Thread.State: TIMED_WAITING (sleeping)
at java.lang.Thread.sleep(Native Method)
at java.lang.Thread.sleep(Thread.java:340)
at java.util.concurrentC.TimeUnit.sleep(TimeUnit.java:386)
at com.*.order.Controller.ManagerController.detail(OrderController.java:37) //业务代码阻塞点
通过以上代码,我们可以清楚的看到,ManagerController.java
的第37行是有可能存在问题的。
然后我找到项目中ManagerController.java
的第37行。
总结
以上就是本次问题排查的整个过程。主要用到的有:top
,printf
,jstack
等指令。
-
使用 top
指令查看当前占用CPU较高的进程PID; -
查看当前进程消耗资源的线程PID: top -Hp PID
-
将线程PID转为16进制,根据该16进制值去打印的堆栈日志内查询,查看该线程所驻留的方法位置。 -
通过 jstack
命令,查看栈信息,这步基本上已经能够定位大多数问题了。