JVM学习之java内存模型
以下blog内容来自《深入理解Java虚拟机_JVM高级特性与最佳实践》感谢作者!!
java虚拟机规范定义了一种java内存模型(JMM)来屏蔽不同硬件和操作系统的差异,达到跨平台运行效果,内存模型的定义一个宗旨就是并发内存访问操作不会产生歧义。
类似C和C++等主流语言直接使用物理硬件和操作系统的内存模型,因此会由于不同平台内存模型的差异导致程序在一个平台上开发并发访问运行正常,在另外一个平台上并发访问却经常出错,所以要不同平台编写不同的代码。
1 主内存和工作内存
java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存取出变量这样的底层细节。此处变量不同于java编程过程中的变量,包括实例字段,静态字段和构成数组对象的元素,但不包括局部变量和方法参数等线程私有的变量,不存在竞争问题。
java内存模型规定了所有的变量都存储在主内存(Main Memory)中,此处的主内存是逻辑概念。每条线程还有自己的工作内存(Working Memory),线程的工作内存保存了被该线程使用到的变量的主内存的副本拷贝,线程所有的对变量的操作(读取,赋值等)都是在工作内存中进行,而不能直接读写主内存中的变量。
总结:主内存保存了线程共享的变量,工作内存保存了用到的主内存的变量的副本拷贝,线程操作的都是工作内存中的变量,线程间变量值得传递需要通过主内存,这里就可以感觉到多线程操作会存在问题,因为可能同时在自己的工作内存修改了变量,主内存存储的变量就可能发生问题。
为什么如此设计?
每个线程只操作自己的私有工作内存,和每次都从主内存取值效率一定更高。
对应JVM运行时数据区,主内存主要对应堆区,工作内存则对应虚拟机栈。
2 内存间交互操作
内存间的交互操作主要是主内存与工作内存之间具体的交互协议,也就是一个变量如何从主内存拷贝到工作内存,如何从工作内存同步回主内存的细节。java内存模型定义了八种操作来实现,每种操作都是原子的,不可再分的。
- lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占的状态。
- unclock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存的变量,把一个变量的值从主内存传输到线程的工作内存,以便随后的load动作使用。
- load(载入):作用于工作内存的变量,把read操作从主内存中得到的变量值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,把工作内存中一个变量的值传递给执行引擎。
- assign(赋值):作用于工作内存的变量,把执行引擎接收到的值赋给工作内存的变量。
- store(存储):作用于工作内存的变量,把工作内存中一个变量的值传送给主内存中,以便随后的write操作使用。
- write(写入):作用于主内存的变量,把store操作从工作内存中得到的变量的值放入主内存的变量中。
利用上面指令 进行操作的规则:
- 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存中读取了但工作内存不接受,或者工作内存发起了回写但主内存不接受的情况出现。
- 不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步到主内存。
- 不允许一个线程无原因地(没有发生任何assign操作)把数据从线程的工作内存同步到主内存。
- 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说,就是对一个变量use、store操作之前,必须先执行过了assign和load操作。
- 一个变量在同一时刻只允许一个线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unclock操作,变量才会被解锁。
- 如果对一个变量执行lock操作,那么会清空工作内存次变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
- 如果对一个变量执行lock操作,那么会清空工作内存次变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
- 对一个变量执行unclock之前,必须先把此变量同步回主内存中(执行store、write操作)。
通过以上规则进行主内存和工作内存的交互。
上面的规则是通用普通规则,jmm还规定了一系列特殊规则,请看下文:
(1)volatile 的实现原理这里不特别说明(另有文章阐述),只说作用:
(1)变量定义为volatile之后,保证此变量对所有线程的可见性,可见性指一条线程修改了变量的值,新值对于其他线程来说可以立即得知。普通变量的值在线程间传递需要通过主内存来完成。
(2)volatile变量会禁止指令重排优化,可以保证变量的操作和代码顺序一致。
指令重排:我们都知道变量的赋值不是一个原子操作,举个例子一个线程进行一系列操作后对变量A赋值,另外一个线程取变量A的值,指令重排是对指令执行的优化,最终导致的结果就是可能没有进行一系列操作时A已经被赋值,另外一个线程读到的A就是错误的。(java内存模型中描述了“线程内表现为串行的语义”)
volatile变量被误认为并发下是线程安全的是不对的,因为volatile只能保证可见性,却不能保证原子性,类似一个i++自增操作其实是分成了好几条指令执行的(取值,add,赋值),可能没有执行add指令之前,i的值已经被修改了,所示还是需要添加同步处理。
既然volatile不能保证并发安全,它主要用在什么地方呢?
当多线程操作中多个线程受一个变量的控制,改变变量则线程都立刻受到影响,此时就很适合使用volatile。
volatile原理是在指令中添加了内存屏障。
(2)long和double类型变量的特殊规则
java内存模型中的八种操作都具有原子性,但是对64位的数据结构,则规定允许虚拟机将没有被volatile修饰的64位数据的读写操作划分为两次32位的操作来进行,所以64位数据结构就可能不是原子操作。
3 原子性,可见性,有序性
java内存模型就是围绕着并发过程中如何处理原子性,可见性,有序性三个特征来建立的,下面逐一介绍三个操作的特性:
3.1、原子性(Atomicity)
原子性是指在一个操作中不可被中断操作,要不执行完成,要不就不执行,具有原子性在多线程并发下不会出问题。
一个操作是原子操作,那么我们称它具有原子性。java的concurrent包下提供了一些原子类,AtomicInteger、AtomicLong、AtomicReference等。
内存模型8中操作中能保证原子性的操作包括read、load、use、assign、store,write,大致可以认为基础数据类型的访问和读写是具备原子性的(long,double特殊情况除外)。lock和unlock操作也可以保证一段代码的原子性。
3.2、可见性(Visibility)
可见性就是指当一个线程修改了线程共享变量的值,其它线程能够立即得知这个修改。
Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方法来实现可见性的,无论是普通变量还是volatile变量都是如此,普通变量与volatile变量的区别是volatile的特殊规则保证了新值能立即同步到主内存,以及每使用前立即从内存刷新。
3.3、有序性(Ordering)
Java内存模型中的程序天然有序性可以总结为一句话:如果在本线程内观察,所有操作都是有序的;如果在一个线程中观察另一个线程,所有操作都是无序的。前半句是指“线程内表现为串行语义”,后半句是指“指令重排序”现象和“工作内存中主内存同步延迟”现象。
Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身就包含了禁止指令重排序的语义,而synchronized则是由“一个变量在同一时刻只允许一条线程对其进行lock操作”这条规则来获得的,这个规则决定了持有同一个锁的两个同步块只能串行地进入。