深入理解java虚拟机读书笔记(二): 运行时数据区域

深入理解java虚拟机读书笔记(二): 运行时数据区域

程序计数器

程序计数器(Program Counter Register) 是一块较小的内存,它可以看作程序执行指令的行号。在虚拟机的概念模型中, 字节码解释器工作时就是通过改变这个计数器的值来选取下一条要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过CPU的时间片轮换进行切换执行的,这里只是说的是需要cpu参与的部分。所以每个线程执行的位置都不同,所以需要此部分为线程私有的,独立存储。
如果线程正在执行一个Java方法,那么存储的是虚拟机字节码指定的地址。如果执行的是native方法,这个计数器值为空(Undefined)。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemeoryError情况的区域。

Java虚拟机栈

  与程序计数器一样,Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型: 每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程就对应着一个栈帧在虚拟机中入栈到出栈的过程。

经常有人把Java内存区分为堆内存(Heap)和栈内存(Stack), 这种奋发比较粗糙,Java内存区域的划分实际上远比这复杂。这种划分方式的流行只能说明大多数程序最关注的、与对象内存分配关系最密切的内存区域是这两块。这之中的栈就是虚拟机栈,或者说是虚拟机栈中局部变量表部分。

局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、long、double)、对象引用(reference类型,它不等同与对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress(指向了一条字节码指定的地址)。
其中64位长度的long和double类型的数据,会占用两个局部变量空间(Slot), 其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量是完全确定的,在方法运行期间不会改变局部变量表的大小。

在Java虚拟机规范中这个区域规定了两种异常情况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常,如果虚拟机栈可以动态扩展(当前大部分的java虚拟机都可动态口占,只不过Java虚拟机规范中也允许固定长度的虚拟机栈), 如果扩展的时候无法申请到足够的内存,就会抛出OutOfMemoryError异常。

本地方法栈

本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常相似的。它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。在虚拟机规范中对本地方法栈中方法使用的语言、使用方式和数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(比如Sun HotSpot)直接就把虚拟机栈和本地方法栈合为一个。与虚拟机栈一样,本地方法区域也会抛出StackOverflowError和OutOfMemoryError异常。

Java堆

对大多数应用来讲,Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建,此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。这一点在Java虚拟机规范中的描述是: 所有的对象实例以及数组都要在堆上分配,但是随着JIT编译器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化发生,所有的对象都分配在堆上也渐渐变得不是那么绝对了。

根据Java虚拟机规范的规定, Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时, 既可以是实现固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(-Xms和-Xmx来决定的)。如果在堆中没有内存完成实例分配,并且堆也无法扩展,就会报出OOM异常。

方法区

方法区(Method Area)与Java堆一样, 是各个线程共享的区域, 它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却又一个别名非堆(NON-HEAP),主要是为了和Java Heap区分开来。(也是常说的Perm Gen)

根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时, 将抛出OutOfMemoryError异常。

* 运行时常量池  
    运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用来存放编译期生成的各种字面量和符号引用,这部分内容在类加载后进入方法区的运行时常量池中存放。也会抛出OutOfMemeoryError异常。

直接内存

直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域。但是这部分内存在频繁地使用,而且也可能导致OutOfMemeoryError异常出现。
在JDK1.4种新加入NIO, 引入了一种基于channel和Buffer的I/O方式, 它可以使用Native函数直接分配堆外内存, 然后通过一个存储在Java堆中的DirectByteBuffer对象作为对这块内存的使用。在某些场景下,会显著提高性能。

这一部分内存不会受到Java堆的限制,但是会受到主机总内存的限制,也会抛出来OutOfMemoryError异常。

对象创建的时候内存分配

在类加载检查方法通过后,JVM就会将新生对象分配内存。一般来说,有两种方式进行分配:
* Bump the Pointer
这类分配是基于规整的内存模型的, 就是未使用的内存和使用的内存是连续并且分开明显的。在分配的时候将已使用内存的指针向未使用的方向移动对象的size大小。

  • free list
    这类存储就是内存的使用和未使用是不连续的,不能简单的移动指针。需要以一个list的方式记录哪些是未分配的。这里比较像oracle分配空间的方法。

在真正的环境下,分配内存是很频繁的行为。所以就会产生并发的情况,可能出现并发问题。那么目前的解决方案有两种:
* CAS 加 失败重试的方式来保证更新操作的成功执行
* 内存分配先预留在head中留出一小部分区域,称为本地线程分配缓冲(Thread Local Allocation Buffer, TLAB), 哪个线程需要分配先在哪个TLAB中分配,只有TLAB用完才会分配新的TLAB时,才需要同步锁定。虚拟机可以通过参数-XX:+/-UseTLAB进行设定

对象的内存布局

在HotSpot虚拟机中,对象在内存中存储的布局可以分为三个部分:
* 对象头 (Header)
* 用于存储对象自身的运行数据, 包括哈希码,GC分代年龄,锁状态标识、线程持有的锁、偏向线程ID、偏向时间戳等。这部分被称为“Mark Word”, 在32位和64位的虚拟机中分别为32bit和64bit
* 类型指针,即对象指向它的类元数据的指针。虚拟机通过这dddddddddddddddddddddddddddddddddddddddddddd个指针来确定这个对象是哪个类的实例。如果对象是一个java数组,那么还会保存这个数组的长度信息。因为虚拟机对普通Java对象的元数据可以知道Java对象的大小,但是数据不能,所以必须要不能存下来。
* 实例数据(Instance Data)
是对象真正的数据,包括定义各种字段的内容。包括父类和本身的,存储顺序收到虚拟机分配策略和Java定义的顺序的影响。
* 对齐填充(Padding)
这部分并不是一定存在。只是起到占位符的作用。由于Hotspot VM要求起始地址必须是8字节的整数倍,所以要padding

对象的访问定位

建立对象是为了使用对象,我们的java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类在java虚拟机规范中只规范了一个引用,并没有指定具体的何种方式来实现。所以这个可以根据虚拟机自己来实现这个引用。目前主流的方式有两种:

  • 句柄。在Java堆中将划分一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。
    Java栈中的引用-> 句柄池中的 实例数据指针和 到对象类型指针 -> 实例对象和实例类型
  • 直接指针访问。那么Java对象的布局就必须考虑如何放置访问类型数据的相关信息,erreference中存储的直接就是对象地址。
    原文作者:java虚拟机
    原文地址: https://blog.csdn.net/kang389110772/article/details/72615429
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞