基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程

2024年1月19日 338次阅读来源: JUC

许多以Java多线程开发为主题的技术书籍，都会把对Java虚拟机和Java内存模型的讲解，作为讲授Java并发编程开发的主要内容，有的还深入到计算机系统的内存、CPU、缓存等予以说明。实际上，在实际的Java开发工作中，仅仅了解并发编程的创建、启动、管理和通信等基本知识还是不够的。一方面，如果要开发出高效、安全的并发程序，就必须深入Java内存模型和Java虚拟机的工作原理，从底层了解并发编程的实质；更进一步地，在现今大数据的时代，要开发出高并发、高可用、考可靠的分布式应用及各种中间件，更需要深入到计算机工作原理的底层去进行代码开发。

本文尝试以一个较为全面的角度，以Java虚拟机工作原理和Java内存模型为切入，配合一些计算机CPU缓存的知识，深入理解Java多线程开发中的难点，包括线程安全和线程通信等内容。

如果需要先行了解Java并发编程的基础知识，可参考以下随笔：

1. Java并发编程之线程创建和启动(Thread、Runnable、Callable和Future)

2. Java并发编程之线程生命周期、守护线程、优先级、关闭和join、sleep、yield、interrupt

3. Java并发编程之线程安全、线程通信

4. Java并发编程之ThreadGroup

CPU缓存模型

逻辑上来说，大部分计算机系统的高级编程语言及其编译器、虚拟机等构件，都是来源于计算机硬件系统的原理和要求，而不是相反。Java虚拟机和并发编程原理也不例外，因此第一部分先介绍一下困扰许多初学者的Java多线程开发的源头——CPU缓存模型。

计算机中，所有的计算都是在CPU寄存器中完成，而指令完成所需要的数据读取和写入，都需要从RAM主存获取。受硬件工艺的影响，现在的CPU处理速度已经远远超过主存的访问速度，差额基本是成千上万的差距。

因此，CPU缓存设计应运而生。如下为CPU缓存架构图和CPU缓存与主存的速度对比：

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

使用CPU缓存来处理数据的步骤大致为：

1. 把需要的数据从主存复制一份到CPU缓存中；

2. CPU从缓存中读取数据并计算；

3. 计算完成的数据刷新到主存中。

“缓存一致性问题”

如上的工作机制，会在多线程环境下导致缓存不一致的问题。为此，使用“总线加锁”（已淘汰）和“缓存一致性协议”来解决，它大致的思想是：

当CPU操作缓存中的数据时，如果发现该变量是一个共享变量，意味着其它缓存中也会有这个变量的副本，然后——

1. 如果是读操作，不做任何处理，只是从缓存中读取数据到寄存器

2. 如果是写操作，发出信号通知其它CPU将该变量的cache line置为无效状态，其它CPU在运行该变量读取的时候需要从主存更新数据。

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

Java虚拟机

受许多资料和书籍讲述不严谨所致，很多初学者往往简单地把Java虚拟机理解为类似编译器甚至解释器的存在，把Java虚拟机当做黑盒，认为输入了Java源代码，就可以输出计算机直接跑的程序了；因为JVM在不同操作系统上都有实现，所以可以做到“一份代码，多种机器运行的效果”。这样理解对小白或者外行人来说可能OK，但对于有想法深入学习Java的小伙伴，是远远不够的。

事实上，Java虚拟机有自己完善的硬体架构，如处理器、堆栈、寄存器等，还具有相应的指令系统。包括编译器以及JRE在内的整套体系，构成了完整的JVM。JVM原生支持包括Java、Scala、Kotlin在内的语言编译后运行。而其中，JRE又是JVM的核心部分。JRE的体系结构图如下：

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

程序计数器：线程私有，每个线程都有独立的程序计数器，用于存放当前线程接下来将要执行的字节码指令、分支、循环、跳转、异常处理等信息。

Java虚拟机栈：线程私有，生命周期与线程相同。线程运行中，执行方法时都会创建“栈帧”，用于存放局部变量表、操作栈、动态链接、方法出口等信息。虚拟机栈的大小可以通过-xss来配置，需要特别注意的是：方法的调用是栈帧被压入和弹出的过程。在一定的容量之下，如果局部变量表等占用的内存越小，则可被压入的栈帧就越多，反之亦然。栈帧的内存大小称为宽度，栈帧的数量则称为深度，两者成反比。

本地方法栈：线程私有，JVM为本地方法(Java Native Interface, C/C++实现的程序)所划分的内存区域，用于被线程调用诸如网络通信、文件操作等方法。

堆：所有线程共享，Java运行期间几乎所有对象都存储于此。堆内存也会被细分为新生代、老生代等子堆。

方法区：多个线程共享，存储那些在类的加载阶段(详见下文)已经被JVM加载的类信息、常量、静态变量、即时编译器JIT编译后的代码等数据。Java8中，改区的持久代内存改为元空间。

特别地，Java程序中线程的数量，受Java虚拟机栈和堆影响较大，可以粗略地认为：一个Java进程的内存大小=堆内存 + 线程数量 * 线程私有栈内存。结合操作系统特性，可以明确一个计算线程数量的公式：线程数=(最大地址空间MaxProcessMemory – JVM堆内存 – 系统保留内存ReservedOsMemory)/ThreadStackSize(XSS)

JVM的类加载过程

当Java源文件经过javac编译完成，生成类文件之后，首先会被类加载器即ClassLoader加载。ClassLoader的主要职责是加载编译好的类文件，在对应的内存区域中生成该类的各个数据结构。类的加载分为加载、连接和初始化三个阶段，如图：

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

1. 加载：加载类的class文件

2. 连接

2.1 验证：确保class文件的正确性，如版本、魔术因子等

2.2 准备：为类的静态变量分配内存，并且初始化默认值

2.3 解析：把类中的符号引用转为直接引用

3. 初始化：为类的静态变量赋代码编写阶段锁赋的值

需要注意的是：类的加载实施的是懒加载，即用的时候才加载，并且在同一个运行时包下，一个类只会被初始化一次。

类的完整的生命周期，除了类加载，还包括使用和卸载。

关于使用，JVM定义了6种主动使用类的场景，会导致类的加载和初始化

new对象；访问类的静态变量(静态常量不会！)；访问类的静态方法；使用反射；初始化子类会初始化父类；启动类

注意初始化一个类为元素的数组不会加载类。

类加载的最终产物，是堆内存中的Class对象。而对于同一个ClassLoader，不管类被加载多少次，指向的都是同一个Class对象

类被加载后在栈内存中的分布情况如图

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

Java内存模型

通过CPU缓存和JVM工作模式的介绍，是为了引入Java内存模型的概念。Java内存模型（Java Memory Mode, JMM）定义了JVM如何与计算机的主存进行工作，理解JMM对正确理解Java多线程开发是十分重要的。JMM模型如下图所示：

《基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程》

Java内存模型的工作逻辑，与上面介绍到的CPU缓存一致性工作逻辑十分相似，其关于多线程的工作要点如下：

1. 共享变量存储于主内存中，每个线程都可以访问。

2. 每个线程都有私有的工作内存，或称本地内存。这只是个逻辑概念，其实质是涵盖了寄存器、缓存、编译器优化和硬件等。

3. 共享变量只以副本的形式，存储在本地内存中。

4. 线程不能直接操作主内存，只有操作了本地内存中的副本，才能刷新到主内存中。

5. 每个线程也不能操作其它线程的私有的本地内存

Java线程安全的实现

Java并发编程安全需要具备的三大特性：原子性、可见性和有序性。下面将介绍，基于JMM模型和Java线程安全的实现方式，是如何确保三大特性的。

原子性

在Java并发编程中，简单的读取和赋值操作是原子性的，但是多个原子操作并在一起就不是了，比如将一个变量赋值给另外一个变量的操作。
JMM只保证了简单读取和赋值的原子性。因此，并发编程中需要用到synchronized实现同步，或者使用Lock接口的实现类加锁；对于基本数据类型如int的自增操作，也可以使用JUC包下的java.util.concurrent.atomic.*包下的原子类型。而volatile修饰的变量，不具备原子性。

可见性

基于JMM模型，对于线程读取共享变量：首次只要从主内存读取到工作内存，以后都在工作内存中读取即可；对于修改共享变量，新值先更新在工作内存中，再刷新到主存中。但什么时候刷新是不确定的。因此，Java并发编程中，要确保共享变量在多线程中同步更新，可以采取如下方式：

通过synchronized关键字同步，可以确保在锁释放之前，对变量的修改刷新到主内存中；
通过Lock接口实现类实现同步，同样可以在锁unlock之前，把修改刷新到主内存中；
使用volatile关键字，当某线程修改了工作内存中的共享变量副本，会直接刷新主存中的值，并且其它线程会立刻收到本地内存中共享变量副本失效的信息，从而及时从主内存中更新值。

有序性

在JMM模型中，为了充分利用硬件性能，编译器和指令器有可能会对程序指令进行重排序。单线程下，这不会有什么问题，但多线程下则可能带来意想不到的状况。

关于并发编程的有序性，JMM基于一套原生Happens-before原则，来确保了多线程下一定程度的有序性。具体说来：

程序次序规则：即便发生了重排序，在一个线程内最终的运行结果会与程序编写顺序的结果一致。
锁定规则：先unlock再lock。即一个锁是锁定状态，需要先解锁才能再加锁。
volatile规则：如果一个线程对volatile变量读，另一个线程对该变量写，那么写操作一定发生在读操作之前。
传递规则：如果操作A先于B，B先于C，那么A肯定先于C。
线程启动规则：线程的start方法先于其它操作。
线程中断规则：必须是先有interrupt()方法调用，才有中断信号的捕获。
线程终结规则：线程的所有操作都必须先于线程死亡。
对象终结规则：一个对象的初始化先于对象GC之前。

此外，在并发编程中，比较常用的是使用synchronized关键字和Lock接口同步，或者volatile关键字，来确保多线程下的有序性。

    原文作者：JUC
    原文地址: https://www.cnblogs.com/leoliu168/p/9926239.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。