读《深入理解java虚拟机》(三)垃圾回收器

垃圾收集(Garbage Collection, GC),可以回收堆上的对象,还可以回收方法区的“废弃常量”和“无用的类”。

部分转自

https://blog.csdn.net/xiaoxiaoyusheng2012/article/details/52895253

https://blog.csdn.net/wen7280/article/details/54428387

1、判断对象是否存活

       GC在对堆进行回收之前,第一件事就是确定哪些对象可以回收。

       方案一:引用计数算法(Reference Counting)

       过程是:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器都为0的对象就是不可能再被使用的,可以回收。

        引用计数方案最大的问题是:很难解决对象之间的相互循环引用的问题。当两个对象没有其他对象引用,只是它们之间相互引用对方,此时这两个对象已经不能再被访问,但是引用计数都不为0;

一个简单的循环引用问题描述:

对象A和对象B,对象A中含有对象B的引用,对象B中含有对象A的引用。此时对象A和B的引用计数器都不为0,但是系统中却不存在任何第三个对象引用A和B。也就是说A和B是应该被回收的垃圾对象,但由于垃圾对象间的互相引用使得垃圾回收器无法识别,从而引起内存泄漏(由于某种原因不能回收垃圾对象占用的内存空间)。

如下图:不可达对象出现循环引用,它的引用计数器不为0,

 《读《深入理解java虚拟机》(三)垃圾回收器》

 

注意:由于引用计数器算法存在循环引用以及性能的问题,java虚拟机并未使用此算法作为垃圾回收算法

       方案二:根搜索算法(GC Roots Tracing)

       思路是:通过一系列的名为“GC Roots”的对象作为起始点,从这些节点开始向下搜素,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。

 《读《深入理解java虚拟机》(三)垃圾回收器》

       在Java语言里,可作为GC Roots的对象包括以下几种:

       ** 虚拟机栈(栈帧中的本地变量表)中的引用的对象

       ** 方法区中的类静态属性引用的对象

       ** 方法区中的常量引用的对象。

       ** 本地方法栈中JNI(即一般说的Native方法)的引用的对象。

2、引用

       在JDK 1.2之前, Java中引用的定义时:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。

       在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种。这四种引用强度依次逐渐减弱。

        ** 强引用,就是指在程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用存在,垃圾回收器永远不会回收掉被引用的对象。

        ** 软引用, 是指一些有用,但并非必需的对象,对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。

        ** 弱引用,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。

        ** 虚引用,一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。

 

3、关于对象的死亡的二次标记

       要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行根搜索后发现是不可达的,那么它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法或者finalize()方法已经被虚拟机调用过,这两种情况将被视为“没有必要执行finalize()”。

       如果一个对象被判定为有必要执行finalize()方法,那么这个对象将会被放置在一个名为F-Queue的队列中,并在稍后由一条由虚拟机自动建立的、低优先级的Finalizer线程去执行调用finalize(),稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象在finalize()中又重新关联到了GC Roots对象,那么第二次标记时它将被移除出“即将回收”的集合,否则,对象将被回收。

任何一个对象的finalize()方法都只会被系统自动调用一次,第二次面临回收时,它的finalize()方法不会再被调用。

注意:建议尽量避免使用finalize()方法,因为它的运行代价高昂,不确定性大,无法保证各个对象的调用顺序。

 

4、回收方法区

      Java虚拟机规范中并没有要求必须在方法区实现垃圾回收,在方法区进行垃圾收集的“性价比”一般比较低:在堆中,常规应用进行一次垃圾回收一般可以回收70%~80%的空间,而代码区(永久代)的垃圾回收效率远低于此。

      代码区回收的内容有:废弃常量和无用的类。

      回收废弃常量的方法与回收堆中的对象非常类似,常量池中的其他类(接口)、方法、字段的符号引用也与此类似。

      回收“无用的类”的条件是:同时满足以下3个条件的类才算是“无用的类”:

      ** 该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例

      ** 加载该类的ClassLoader已经被回收。

      ** 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

    

注:是否对类进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制,还可以使用-verbose:class及-XX:+TraceClassLoading、-XX:+TraceClassUnLoading查看类的加载和卸载信息。

六、垃圾回收算法

 

1、标记-清除算法

      “标记-清除”算法是最基础的垃圾回收算法,之所以说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进得到的。

      该算法分为两个阶段:“标记”和“清除”,首先标记出所有需要回收的对象,然后在标记完成后统一回收掉所有被标记的对象。

      主要缺点有两个:

             一个是效率问题,标记和清除过程的效率都不高;

             另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另外一次垃圾回收动作。

       标记-清除算法的执行过程如下图所示:

《读《深入理解java虚拟机》(三)垃圾回收器》

 

2、复制算法

      为了解决效率问题,出现了“复制”的收集算法。

      思路是:将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

      优点是:内存分配时不用考虑内存碎片等复杂情况,实现简单,运行高效

      缺点是:可利用的内存空间缩小为原来的一半,内存利用率低。

 

      复制算法的执行过程如下:

《读《深入理解java虚拟机》(三)垃圾回收器》

               

注:现在的商业虚拟机中都采用这种回收算法来回收新生代(关于新生代、老年代参看:http://www.cnblogs.com/E-star/p/5556188.html)。IBM的专门研究表明,新生代中的对象98%是朝生夕死的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中的一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地拷贝到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor的空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1,也就是每次新生代中可用的内存空间为整个新生代容量的90%(80%+10%),只有10%的内存时会被“浪费”的。当然,实际中当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handel Promotion)。

 

3、标记-整理算法(Mark-Compact)

      复制收集算法在对象存活率较高时就要执行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保。

算法思路:标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

算法示意图如下:

《读《深入理解java虚拟机》(三)垃圾回收器》

 

4、分代收集算法(Generational Collection)

       该算法只是根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适合的收集算法。新生代中,每次来及收集时都发现有大批对象死去,只有少量存活,就选用复制算法。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或“标记-整理”算法来回收。

 

不同的垃圾收集器

      不同厂商、不同版本的虚拟机锁提供的垃圾收集器都可能会有很大的差别。并且一般都会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。

下图是HotSpot虚拟机1.6版Undate 22d的所有收集器:

《读《深入理解java虚拟机》(三)垃圾回收器》

注;如果两个收集器之间存在连线,就说明它们可以搭配使用。

 

1、Serial收集器

      Serial是一个新生代收集器,曾经是JDK1.3.1之前新生代唯一的垃圾收集器。采用复制算法。

      Serial是一个单线程收集器,会使用一个CPU、一条线程去完成垃圾回收,并且在进行垃圾回收的时候必须暂停其他所有的工作线程,直到垃圾收集结束(这被称为“Stop The World”)。

      Serial收集器仍然是虚拟机运行在Client模式下的默认新生代收集器。它的优点是:简单而高效(与其他收集器的单线程比)。对于限定单个CPU的环境来说,Seria收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。

      Serial/Serial Old收集器运行示意图如下:

 

 

    《读《深入理解java虚拟机》(三)垃圾回收器》  

 

2、ParNew收集器

     ParNew收集器也是一个新生代收集器,是Serial收集器的多线程版本。也采用复制算法。除了使用多条线程进行垃圾回收之外,其他行为与Serial收集器一样。

     ParNew收集器在单CPU的环境中效果不会比Serial收集器更好,甚至由于存在线程交互的开销,性能可能会更差。

     ParNew收集器在多CPU环境下是更高效的,它默认开启的收集线程数与CPU的数量相同。

     ParNew/Serial Old收集器运行示意图如下:

《读《深入理解java虚拟机》(三)垃圾回收器》

3、Parallel Scavenge收集器

        Parallel Scavenge收集器也是一个新生代收集器。也是用复制算法,同时也是并行的多线程收集器。

        Parallel Scavenge收集器的特点是关注点与其他收集器不同,Parallel Scavenge的关注点是“吞吐量(Throughput)”,吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)。其他收集器关注的是“垃圾收集时的停顿时间”。

       停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户的体验; 而高吞吐量则可以最高效率地利用CPU时间,尽快地完成程序的运算任务,适合在后台运算不需要太多交互的任务。

       Parallel Scavenge收集器可以通过参数控制最大垃圾收集停顿时间和吞吐量大小。注意:GC停顿时间缩短是以牺牲吞吐量和新生代空间来换取的。因为:系统把新生代空间调小一些,收集的速度就快一些,也就导致垃圾收集要更频繁(空间不够用),比如原来10秒收集一次,一次停顿100毫秒,现在5秒收集一次,每次停顿70毫秒,停顿时间的确在下降,但吞吐量也降下来了。

       此外Parallel Scavenge收集器可通过参数开关控制GC自动动态调整参数来提供最合适的停顿时间或最大吞吐量,这种调节方式称为GC自适应的调节策略(GC Ergonomics)。

       自适应调节策略也是Parallel Scavenge收集器与ParNew收集器的一个重要区别。

注:Parallel Scavenge收集器无法与CMS收集器配合使用。(原因是Parallel Scavenge收集器及G1收集器都没有使用传统的GC收集器代码框架,而是另外独立实现的)

 

4、Serial Old收集器

       Serial Old是Serial收集器的老年代版本。同样是一个单线程收集器,使用“标记-整理”算法。这个收集器的主要意义是被Client模式下的虚拟机使用。在Server模式下,它主要还有两大用途:一个是在JDK1.5及以前的版本中与Parallel Scavenge收集器搭配使用,另外一个就是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure的时候使用。

 

5、Parallel Old收集器

       Parallel Old是Parallel Scavenge收集器的老年代版本。使用多线程和“标记-整理”算法。单线程的老年代Serial Old收集器在服务端性能比较差,即使新生代使用了Parallel Scavenge收集器也未必能在整体应用上获得吞吐量最大化的效果。

       在注重吞吐量及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge收集器加上Parallel Old收集器组合使用。

Parallel Scavenge/ Parallel Old收集器运行示意图如下:

《读《深入理解java虚拟机》(三)垃圾回收器》

 

6、CMS收集器

        CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。最符合重视服务响应速度。希望系统停顿时间最短的应用。

该收集器是基于“标记-清除”算法实现的。过程分为4个步骤:

       初始标记(CMS initial mark)、并发标记(CMS concurrent mark)、重新标记(CMS remark)、并发清除(CMS concurrent sweep).

       其中初始标记、重新标记这两个步骤仍然需要“Stop The World”。初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,并发标记阶段就是进行GC Roots Tracing的过程,而重新标记阶段则是为了修正并发标记期间,因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。

       Concurrent Mark Sweep收集器运行示意图如下:

《读《深入理解java虚拟机》(三)垃圾回收器》



      CMS是以款并发收集、低停顿的收集器,缺点是:对CPU资源非常敏感、无法处理浮动垃圾、基于“标记-清除”算法导致收集结束会产生大量空间碎片。

 

    原文作者:java虚拟机
    原文地址: https://blog.csdn.net/baiyan3212/article/details/81450975
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞