读郑雨迪《深入拆解Java虚拟机》 -- 第五讲 JVM是如何执行方法调用的？（下）

2019年3月10日 372次阅读来源: java虚拟机

本文转自https://time.geekbang.org/column/article/12098

这里我们来聊一聊Java虚拟机中虚方法调用的具体实现。

首先，我们来看一个模拟出国边检的小例子

abstract class 乘客{
    abstract void 出境();
    @Override
    public String toString(){...}
}

class 外国人 extends 乘客{
    @Override
    void 出境(){/*进外国人通道*/}
}
class 中国人 extends 乘客{
    @Override
    void 出境() {/* 进中国人通道 */}
    void 买买买() {/*逛免税店*/}
}

乘客 某乘客 = ...
某乘客.出境();

这列我们定义了一个抽象类，叫做“乘客”，这个类中有一个名为“出境”的抽象方法，以及重写值Object类的toString方法

然后，我们将“乘客”粗暴底分为两种：“中国人”以及“外国人”。这两个类分别实现了“出境”这个方法，具体来说，就是中国人走中国人通道，外国人走外国人通道。由于咱们储蓄比较多，所以在“中国人”这个类中，还特意加了一个叫做“买买买”的方法。

虚方法调用

我们知道，Java中所有非私有实例方法调用都会被编译成invokevirtual指令，而接口方法调用会被编译成invokeinterface指令。这两种指令，均属于Java虚拟机中的虚方法调用。

在绝大多数情况下，Java虚拟机需要根据调用者的动态类型，来确定虚方法调用的目标方法。这个过程我们称之为动态绑定。那么，相对于静态绑定的非虚方法调用来说，虚方法调用更加耗时。

在Java虚拟机中，静态绑定包括用于调用静态方法的invokestatic指令，和调用构造器、私有实例方法以及超类非私有实例方法的invokespecial指令。如果虚方法调用指向一个标记为final的方法，那么Java虚拟机也可以静态绑定该虚方法调用的目标方法。

Java虚拟机中采用了一种用空间换区时间的策略来实现动态绑定。它为每个类生成一个方法表，用以快速定位目标方法。

方法表

类加载的准备阶段，它除了为静态字段分配内存之外，还会构造与该类相关联的方法表。

这个数据结构，便是Java虚拟机实现动态绑定的关键所在。invokeinterface所使用的接口方法表（interface method table, itable）稍微比invokevirtual所使用的虚方法表（virtual method table, vtable）复杂些，但是原理是类似的。

方法表本质上是一个数组，每个数组元素指向一个当前类及其祖先类的非私有实例方法。

这些方法可能是具体的、可执行的方法，也可能是没有相应字节码的抽象方法。方法表满足两个特质：

子类方法表中包含父类方法表中的所有方法
子类方法在方法表中的索引值，与它所重写的分类方法的索引值相同

方法调用指令中的符号引用会在执行之前解析成实际引用。对于静态绑定的方法调用而言，实际引用将指向具体的目标方法。对于动态绑定的方法调用而言，实际引用则是方法表的索引值（实际上不仅是索引值）。

在执行过程中，Java虚拟机将获取调用者的实际类型，并在该实际类型的虚方法表中，根据索引值获得目标方法。这个过程便是动态绑定。

《读郑雨迪《深入拆解Java虚拟机》 -- 第五讲 JVM是如何执行方法调用的？（下）》

在我们的例子中，“乘客”类的方法表包括两个方法：“toString”以及“出境”，分别对应0号以及1号。

之所以方法表调换了“toString”和“出境方法的位置，是因为”toString”方法的索引值需要与Object类中同名方法的索引值一致。为了保持简洁，这里我们不考虑Object类的其它方法。

“外国人”的方法表同样有两行。其中0号方法指向继承而来的“乘客”类的“toString”方法。1号方法则指向自己重写的“出境”方法。

“中国人”的方法则包括三个方法，除了继承而来的“乘客”类的“toString”方法，自己重写的“出境”方法之外，还包括独有的“买买买”方法。

乘客 某乘客 = ...
某乘客.出境();

这里,Java虚拟机的工作可以想象为导航员。每当来了一个乘客需要出境，导航员会先问是中国人还是外国人（获取动态类型），然后放出中国人/外国人对应的小册子（获得动态类型的方法表），小册子的第1页便写着应该到哪条通道办理出境手续（用1作为索引来查找方法表所对应的目标方法）。

实际上，使用了方法表的动态绑定与静态绑定相比，仅仅多出几个内存解引用的操作：

访问栈上的调用者
读取调用者的动态类型
读取该类型的方法表
读取方法表中某个索引值所对应的目标方法。

这几个内存解引用的开销为《读郑雨迪《深入拆解Java虚拟机》 -- 第五讲 JVM是如何执行方法调用的？（下）》，简直可以忽略不计。

但是虚方法的调用对性能还是有影响的，上述游湖的效果看上去十分美好，但实际上仅存在于解释执行中，或者即时编译代码的最坏情况中。这是因为即时编译还拥有两种更好的优化手段：内联缓存(inlining cache)和方法内联(method inlining)。

内联缓存

内联缓存是一种加快动态绑定的优化技术。它能够缓存虚方法调用中调用者的动态类型，以及该类型中所对应的目标方法。在之后的执行过程中，如果碰到已缓存的类型，内联缓存便会直接调用该类型的目标方法。如果没有碰到已缓存的类型，内联缓存则会退化至基于方法表的动态绑定。

在例子中，这相当于导航员记住了上一个出境乘客的国籍和对应的通道。

在针对多态的优化手段中，我们通常会提及以下三个术语：

单态（monomorphic）指的是仅有一种状态的情况。
多态（polymorphic）指的是有限数量种状态的情况。二态（bimorphic）就是多态的其中一种。
超多态（megamorphic）指定是更多种状态的情况。通常我们用一个具体阈值来区分多态和超多态。在这个阈值之下，我们称之为多态，否则，我们称之为超多态

对于内联缓存来说，我们也有对应的单态内联缓存、多态内联缓存和超多态内联缓存。单态内联缓存，顾名思义，便是只缓存了一种动态类型以及它所对应的目标方法。它的实现非常简单：比较所缓存的动态类型，如果命中，则直接调用对应的目标方法。多态内联缓存则缓存了多个动态类型及其目标方法。它需要逐个将所缓存的动态类型与当前动态类型进行比较，如果命中，则调用对应的目标方法。一般来说，我们会将更加热门的动态类型放在前面。在实践中，大部分的虚方法调用均是单态的，也就是只有一种动态类型。为了节省内存空间，Java虚拟机只采用单态内联缓存。

前面提到，当内联缓存没有命中的情况下，Java虚拟机需要重新使用方法表进行动态绑定。对于内联缓存中的内容，我们有两种选择。

替换单态内联缓存中的记录。这种做法就好比CPU中的数据缓存，它对数据的局部性有要求，即在替换内联缓存之后的一段时间内，方法调用的调用者的动态内心应当保持一致，从而能够有效地利用内联缓存。因此，在最坏的情况下，我们用两种不同类型的调用者，轮流执行该方法调用，那么每次进行方法调用豆浆替换内联缓存。也就是说，只有写缓存的额外开销，而没有用缓存的性能提升。
劣化为超多态状态。这也是Java虚拟机的具体实现方式。处于这种状态下的内联缓存，实际上放弃了优化的机会。它将直接访问方法表，来动态绑定目标方法。与替换内联缓存记录的做法相比，它牺牲了优化的机会，但是节省了写缓存的额外开销。

方法内联

虽然内联缓存附带内联二字，但是它并没有内联目标方法。这里需要明确的是，任何方法调用除非被内联，否则都会有固定开销。这些开销来源于保存程序在该方法中的执行位置，以及新建、压入和弹出新方法所使用的栈帧。

对于极其简单的方法而言，比如说getter/setter，这部分固定开销占据的CPU时间甚至超过了方法本身。此外，在即时编译中，方法内联不仅仅能够消除方法调用的固定开销，而且还增加了进一步优化的可能性。

本次我们来观测一下单态内联缓存和超多态内联缓存的性能差距。为了消除方法内联的影响，请使用java -XX:CompileCommand=’dontinline,*. depart’ Passenger

public abstract class Passenger{
	abstract void depart();

	public static void main(String[] args){
		Passenger a = new Chinese();
		Passenger b = new Foreigner();
		long current = System.currentTimeMillis();
		for(int i = 0;i < 2000000000;i++){
			if(i % 100000000 == 0){
				long temp = System.currentTimeMillis();
				System.out.println(temp - current);
				current = temp;
			}
			Passenger c = i < 1000000000 ? a : b;
			c.depart();
		}
	}
}

class Chinese extends Passenger{
	@Override
	public void depart(){}
}

class Foreigner extends Passenger{
	@Override
	public void depart(){}
}

我们进行编译并运行

javac Passenger.java 
java Passenger
0
326
437
468
402
428
464
442
429
459
461
560
515
473
481
452
454
437
443
437
java -XX:CompileCommand='dontinline,*. depart' Passenger
CompilerOracle: dontinline *.depart
0
905
805
781
792
799
834
794
823
788
783
896
884
873
860
881
911
881
935
862

由此可见，内联缓存对于简单方法提升了一倍的速度。

此文从极客时间专栏《深入理解Java虚拟机》搬运而来，撰写此文的目的：

对自己的学习总结归纳
此篇文章对想深入理解Java虚拟机的人来说是非常不错的文章，希望大家支持一下郑老师。

    原文作者：java虚拟机
    原文地址: https://blog.csdn.net/Ti_an_Di/article/details/81773331
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。

虚方法调用

方法表

内联缓存

方法内联

由此可见，内联缓存对于简单方法提升了一倍的速度。

此文从极客时间专栏《深入理解Java虚拟机》搬运而来，撰写此文的目的：

对自己的学习总结归纳

此篇文章对想深入理解Java虚拟机的人来说是非常不错的文章，希望大家支持一下郑老师。