G1垃圾回收流程

img

G1的垃圾回收流程主要是从新生代回收开始,新生代回收与并发标记再到混合回收,接下来我们就先来说第一个新生代回收。

G1 Yong Collection

当我们的程序启动刚开始的时候会默认分配新生代5%的空间,这里我们假设分配了8个Region给Eden,1个Region给Survior(只是为了画图方便,实际可能Eden对应了有好几十甚至上百个Region),那么对应的初始内存分配如下:

img

那么当我们的Eden区域装满,还是会触发新生代的GC,那么新生代的GC还是会通过复制算法来进行垃圾回收,同时系统进入“Stop the World”状态,然后把Eden区中的对应的Region里存活的对象拷贝到S1对应的Region中,接着回收掉Eden对应的Region中的垃圾对象。

img

那么新生代对象什么时候进入老年代呢?跟之前一样,还是这么几个条件: 1)对象在新生代躲过了多次的垃圾回收,达到了一定的年龄,就会进入老年代。可以通过参数“-XX:MaxTenuringThreshold”进行年龄的设置

**2)动态年龄规则判断,如果一旦发现某个新生代GC过后,同年龄的存活对象超过了Survior的50%**,比如此时有1岁的,2岁的,3岁的,5岁的,发现3岁的对象大小总和已经超过了Survior的50%。那么3岁及以上的对象都会全部进入老年代

所以经过一段时间新生代的使用和垃圾回收后,总有一些对象会进入老年代,如下图:

img

此时大家可能会疑惑?之前不是说我们有大对象根据JVM的空间担保原则也会直接进入老年代吗?

实际根据G1的分配原则,G1会提供专门的Region来存放大对象,而不是让大对象直接进入老年代的Region中,G1中如何判断大对象是根据Region的大小来的,如果一个对象的大小已经超过Region大小的50%了,那么就会被放入大对象专门的Region中,这种Region我们叫humongous,如下图:

img

那肯定会有人问了,这个humongous区域的大对象什么时候被回收呢?它既不属于新生代与不属于老年代,什么时候触发垃圾回收进行回收?

其实很简单,在新生代和老年代回收的时候,就会顺带着对大对象一并回收了,所以这就是G1内存模型下对大对象的分配和回收的策略。

注意:

在G1进行新生代垃圾回收的同时还会做一件事情就是“初始标记”::仅仅只是标记一下GC Roots能直接关联到的对象,为下一阶段并发标记做准备(跟之前的CMS垃圾回收过程类似)

G1 Yong Collection + Concunrrent Mark

当G1新生代垃圾回收结束后,紧接着开始进入并发标记阶段:从GC Root开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行。

而且JVM会对并发标记阶段对对象做出的一些修改记录起来,比如哪个对象被新建了,哪个对象失去引用了,如下图:

img

G1 Mixed Collection

G1有一个参数:“-XX:InitiatingHeapOccupancyPercent”,默认值是45%

也就是说,当老年代的大小占据了堆内存的45%的Region时,此时就会触发一个新生代和老年代的混合回收阶段,对E S 0 H进行全面回收

该阶段一旦触发会导致系统进入STW,同时进行最后一个标记:

  • 最终标记阶段:会根据并发标记阶段记录的对象修改,最终标记哪些对象是存活,哪些对象是垃圾

此时老年代也是根据标记-复制算法来进行回收的,会将标记存活的对象拷贝到新的Region中作为老年代区域:

img

注意我们上面说过一个参数:**-XX:MaxGCPauseMillis=time** 指定收集的停顿时间,默认是200ms

由于混合回收是一个比较耗时的操作,那么根据G1的特点可以指定收集停顿时间,为了保证停顿时间这个目标,JVM会从新生代、老年代、以及大对象H区挑选一部分Region进行拷贝回收,如果回收不完,后续再进行回收,一部分一部分回收直到回收完毕。但是一次回收停顿的时长保证再200ms。

这里有一个参数:“-XX:G1MixedGCCountTarget”,可以设置在一次混合回收的过程中,最后一个阶段执行几次混合回收,默认值是8次!这样设置的目的也是能让每次回收停顿的时长记得到保证同时又能间隙的让系统接着运行。

同时还有一个参数:“-XX:G1HeapWastePercent”,默认值是5%,意思是当混合回收的时候,一旦空闲出来的Region数量达到了堆内存的5%,此时就会立即停止混合回收。

Full GC

当在进行混合回收的过程中,由于无论是新生代还是老年代都是基于复制算法进行的,都需要将各个Region中的存活对象拷贝到别的Region中,此时如果一旦出现拷贝的过程中发现没有空闲的Region可以进行存储了,就会触发一次失败!那么这个时候系统会立马切换为我们的Seiral收集器进行单线程的标记、清理和压缩整理,该过程就变得非常的慢了!

这里我们可以小结下各个收集器的FullGC:

  • SerialGC
    新生代内存不足发生的垃圾收集 - minor gc
    老年代内存不足发生的垃圾收集 - full gc
  • ParallelGC
    新生代内存不足发生的垃圾收集 - minor gc
    老年代内存不足发生的垃圾收集 - full gc
  • CMS
    新生代内存不足发生的垃圾收集 - minor gc
    老年代内存不足,触发Concurrent Mode Failure时触发Full GC
  • G1
    新生代内存不足发生的垃圾收集 - minor gc
    老年代内存不足,无多余Region可供拷贝,触发FullGC