Java编译和反编译那些事
共 3354字,需浏览 7分钟
·
2021-10-26 01:22
每个人都注定要体验生命的美好,也要体验其不可避免的暗黑之处:幻灭、衰老、疾病、孤独、丧失、无意义、痛苦的选择和死亡
前言
挺久没更文章了,之前有一个月在面试,后来写了篇面经,有一些朋友找我交流问题,所以一直没时间写技术文章,估计以后更新文章频率不会那么高了,不过还是会定期分享的,我的目的还是希望我的每篇文章大家都能学到点东西
基本概念
我们可以通过javac
命令将Java程序的源代码编译成Java字节码,即我们常说的class文件,这是我们通常意义上理解的编译
但是,字节码并不是机器语言,要想让机器能够执行,还需要把字节码翻译成机器指令,这个过程是通过解释器实现的,叫解释执行
注意:大家别把编译和解释执行混淆了,而后面所说的后端编译过程是JVM为提高效率做的优化
在不同的虚拟机实现中,执行引擎在执行字节码的时候,通常会有解释执行(通过解释器执行)和编译执行(通过即时编译器产生本地代码执行)两种选择,也可能两者兼备
所以大家可以思考下,Java到底是属于编译型语言还是解释器语言呢
那为什么java不直接编译成可执行文件呢
为了实现跨平台
Java源码通过编译成字节码,然后通过不同平台的虚拟机解释执行,从而实现 一次编译,到处运行的跨平台的效果
编译原理
Java语言的编译期分为前端编译和后端编译两个阶段
前端编译
前端编译是指把*.java
文件转变成*.class
文件的过程
包括词法分析、语法分析、语义分析与中间代码生成
主要有下面几个步骤:
后端编译
在部分商用虚拟机中,Java程序最初是通过解释器进行解释执行的,当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为热点代码
为了提高热点代码的执行效率,在运行时, 虚拟机将会把这些代码编译成与本地平台相关的机器码
完成这个任务的后端编译器称为即时编译器(JIT编译器)
反编译
什么是反编译
既然Java 编译是指将 Java 源码编译成 Java 字节码的过程
那么Java 反编译简单说就是指根据 Java 字节码翻译成源码的过程
为什么要有反编译
首先这个源码是字符编码,字节码是二进制字节流,并且源码是给人看的,字节码是给虚拟机看的
因此如果想给人看,需要将字节码转为源码。如果想给虚拟机执行,需要将源码编译成字节码,当我们有类文件想看源码时,可以采用反编译的方式实现
比如想了解某个 Java 语法糖编译后,再反编译是什么样的;别人给你发一个 jar 包,你需要看其中某个类是怎么写的,等此类情况都可以考虑是用 Java 反编译
反编译工具
在线反编译工具
1.http://www.decompiler.com/
2.http://www.javadecompilers.com/,该网站的主要优势在于有多种反编译器可供选择
离线反编译工具
JD-GUI
GitHub :https://github.com/java-decompiler/jd-gui
官网:http://java-decompiler.github.io/
下载后将类文件或者 jar 包直接拖动到界面即可
Luyten
下载地址:https://github.com/deathmarine/Luyten/releases
Arthas
官网:https://arthas.aliyun.com/doc/
可以使用 jad 命令将 JVM 中运行的 class 的 byte code 反编译成 java 代码
这个工具很好用,强烈推荐
其他工具
javap
javap是jdk自带的一个工具,可以对代码反编译,也可以查看java编译器生成的字节码
直接通过javap -help
查看其用法
用法: javap
其中, 可能的选项包括:
-help --help -? 输出此用法消息
-version 版本信息
-v -verbose 输出附加信息
-l 输出行号和本地变量表
-public 仅显示公共类和成员
-protected 显示受保护的/公共类和成员
-package 显示程序包/受保护的/公共类
和成员 (默认)
-p -private 显示所有类和成员
-c 对代码进行反汇编
-s 输出内部类型签名
-sysinfo 显示正在处理的类的
系统信息 (路径, 大小, 日期, MD5 散列)
-constants 显示最终常量
-classpath 指定查找用户类文件的位置
-cp 指定查找用户类文件的位置
-bootclasspath 覆盖引导类文件的位置
基本使用:
javac Test.java
javap -c Test.class
jclasslib
jclasslib 是一种可视化的字节码查看工具,可以直接在 IDEA 插件安装
安装以后,在 IDEA 编译源码后,可以选择 View” ->“Show Bytecode With Jclasslib
即可查看字节码
可以直观地看到 class 文件包含基本信息、常量池、接口信息、字段信息、方法信息和属性信息
其中方法信息又包含行号表、局部变量表,异常表等
要读懂字节码指令涉及的知识很多,之后的文章会通过案例详细讲解class文件结构和字节码指令的执行过程
推荐两本非常经典的图书:《深入理解 Java 虚拟机》、《Java 虚拟机规范》
大家也可以通过 Oracle 的 Java 标准 网页里浏览和下载《Java 语言规范》、《Java 虚拟机规范》
反编译示例
下面看一个简单和常见的案例:
public class ForEachDemo {
public static void main(String[] args) {
List data = new ArrayList<>();
data.add("a");
data.add("b");
for (String str : data) {
System.out.println(str);
}
}
}
我们直接在 IDEA 对该类文件进行编译,然后再 target 目录中寻找该类,双击打开,得到下面的反编译源码:
public class ForEachDemo {
public ForEachDemo() {
}
public static void main(String[] args) {
List data = new ArrayList();
data.add("a");
data.add("b");
Iterator var2 = data.iterator();
while(var2.hasNext()) {
String str = (String)var2.next();
System.out.println(str);
}
}
}
从上述反编译代码可以清楚地看到,原始代码中没有编写构造方法时,编译器会自动生成一个默认构造方法;foreach 循环来遍历 list 时,底层通过 iterator 来实现