一、概述
java语言的“编译器”其实是一段“不确定”的操作过程,因为他可能是指一个前端编译器把.java文件转变成.class文件,也可能是指虚拟机后端运行期编译器(JIT编译器)把字节码变成机器码的过程,还可能是指静态提前编译器(AOT编译器)直接把.java文件编译成本地机器代码的过程,下面来具体说说
- 前端编译器:Sun的javac、Eclipse JDT中的增量式编译器
- JIT编译器LHotSpot VM的C1、C2编译器
- AOT编译器:GNU Compiler for the Java(GCJ)、Excelsior JET
本章节所说的编译器指的是第一种,因为javac这类编译器对代码的运行效率几乎没有任何优化措施,所以虚拟机的设计团队把对性能的优化集中到了后端的即时编译器中,这样可以让那些不是由javac产生的Class文件(如JRuby、Groovy等语言的Class文件)也同样能享受编译器优化所带来的好处。但是javac做了许多针对java语言编译过程的优化措施来改善程序员的编码风格和提高编码效率,下面来看具体看看javac。
二、Javac编译器
Javac编译器是由java语言编写的程序,所以这为纯java程序员了解他的编译过程带来了极大的便利。
1.Javac的源码与调试
从Sun Javac的代码来看,编译的过程主要是下面3个阶段
- 解析与填充符号表过程
- 插入式注解处理器的注解处理过程
- 分析与字节码生成过程
2.解析与填充符号表
- 词法分析、语法分析:词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。语法分析是根据Token序列构造抽象语法树的过程,抽象语法树是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构。
- 填充符号表:符号表是由一组符号地址和符号信息构成的表格,读者可以把它想象成哈希表中的K-V值对的形式,符号表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义检查和产生中间代码。在目标代码生成阶段,当对符号名进行地址分配时,符号表是地址分配的依据。
3.注解处理器
在JDK1.5之后,Java语言提供了对注解的支持,这些注解与普通的Java代码一样,是在运行期间发挥作用的,在JDK1.6中实现了JSR-269规范,提供一组插入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看做是一组编译器的插件,在这些插件里,可以读取、修改、添加抽象语法树中的任意元素。如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止,每一次循环称为一个Round。
4.语义分析和字节码生成
语法分析之后,编译器获得了程序码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但是无法保证源程序是符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查。
- 标注检查:标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。
- 数据及控制流分析:是对程序上下文逻辑的更进一步验证,它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受检查异常都能被正确处理了的问题。
- 解语法糖:语法糖,也称糖衣语法,指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更加方便程序员使用,通常来说,使用语法糖能够增加程序的可读性,从而减少程序代码出错的机会。而不支持这些语法,就是解语法糖。
- 字节码生成:字节码生成是Javac编译过程的最后一个阶段,字节码生成阶段不仅仅是把前面的各个步骤所生成的信息转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。
三、Java语法糖的味道
1.泛型与类型擦除
泛型本质上是参数化类型的应用,这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。其实泛型知识存在于源码中,编译后字节码文件中就已经替换成了原生类型,并在相应的地方插入了强制转型代码,如果利用反编译工具进行编译后,发现泛型不见了,这就是泛型擦除。
2.自动装箱、拆箱与遍历循环
这些可以说是java语言中使用最多的语法糖,但是不见得什么情况用都是合适的。
3.条件编译
java语言中条件编译的实现,也是java语言中的一颗语法糖,根据布尔常量值的真假,编译器将会把分支中不成立的代码消除掉,这一工作将在编译器接触语法糖阶段。
四、实战
略