Java并发编程：JMM (Java内存模型) 以及与volatile关键字详解

2019年3月10日 215次阅读来源: xue无止境

计算机系统的一致性

在现代计算机操作系统中，多任务处理几乎是一项必备的功能，因为嵌入了多核处理器，计算机系统真正做到了同一时间执行若干个任务，是名副其实的多核系统。在多核系统中，为了提升CPU与内存的交互效率，一般都设置了一层 “高速缓存区” 作为内存与处理器之间的缓冲，使得CPU在运算的过程中直接从高速缓存区读取数据，一定程度上解决了性能的问题。但是，这样也带来了一个新问题，就是“缓存一致性”的问题。比如，多核的情况下，每个处理器都有自己的缓存区，数据如何保持一致性。针对这个问题，现代的计算机系统引入多处理器的数据一致性的协议，包括MOSI、Synapse、Firely、DragonProtocol等。

当处理器通过高速缓存区与主内存发生交互时，对数据的读写必须遵循协议规定的标准，用一张关系图表示的话大概如下：
《Java并发编程：JMM (Java内存模型) 以及与volatile关键字详解》

而Java的内存模型 (JMM) 可以说与硬件的一致性模型很相似，采用的是共享内存的线程通信机制。

Java内存模型

Java内存模型规定了所有的变量都存储在主内存中，每个线程拥有自己的工作内存，工作内存中保存了被该线程使用的变量的主内存副本拷贝，线程只能操作自己工作内存的变量副本，操作完变量后会更新到主内存，通过主内存来完成与其他线程间变量值的传递。此模型的交互关系如下图所示：
《Java并发编程：JMM (Java内存模型) 以及与volatile关键字详解》

然而，Java的内存模型只是反映了虚拟机内部的线程处理机制，并不保证程序本身的并发安全性。

举一个例子，在程序中对一个共享变量做自增操作：

i++；

假设初始化的时候i=0，当跑到此程序时，线程首先从主内存读取i的值，然后复制到自己的工作内存，进行i++操作，最后将操作后的结果从工作内存复制到主内存中。如果是两个线程执行i++的程序，预期的结果是2。但真的是这样吗？答案是否定的。

假设线程1读取主内存的i=0，复制到自己的工作内存，在进行i++的操作后还没来得及更新到主内存，这时线程2也读取i=0，做了同样的操作，那么最终得到的结果为1，而不是2。

这是典型的关于多线程并发安全例子，也是Java并发编程中最值得探讨的话题之一，一般来说，处理这种问题有两种手段：

加锁，比如同步代码块的方式。保证同一时间只能有一个线程能执行i++这条程序。
利用线程间的通信，比如使用对象的wait和notify方法来。

因为本文主要是探究 JMM 和 volatile 关键字的知识，具体怎么实现并发处理就不做深入探讨了，改天看看抽个时间再写篇博文专门讲解好了。

内存模型的3个重要特征

初步了解完什么是JMM后，我们来进一步了解它的重要特征。值得说明的是，在Java多线程开发中，遵循着三个基本特性，分别是原子性、可见性和有序性，而Java的内存模型正是围绕着在并发过程中如何处理这三个特征建立的。

原子性

原子性是指操作是原子性的，不可中断的。举个例子：

String s="abc";

这个操作是直接赋值，是原子性操作。而类似下面这段代码就不是原子性了：

i++;

当执行i++时，需要先获取i的值，然后再执行i+1，相当于包含了两个操作，所以不是原子性。

可见性

可见性是指共享数据的时候，一个线程修改了数据，其他线程知道数据被修改，会重新读取最新的主存的数据。就像前面说的两个线程处理i++的问题，线程1改完后没有更新到主内存，所以线程2是不知道的。

有序性

是指代码执行的有序性，对于一个线程执行的代码，我们可以认为代码是依次执行的，但并发中可能就会出现乱序，因为代码有可能发生指令重排序（Instruction Reorder），重排后的指令与原指令的顺序未必一致。

指令重排序

编译器能够自由的以优化的名义去改变指令顺序。在特定的环境下，处理器可能会次序颠倒的执行指令。是为指令的重排序，尤其是并发的情况下。

java提供了volatile和synchronized来保证线程之间操作的有序性。volatile含有禁止指令重排序的语义(即它的第二个语义)，synchronized规定一个变量在同一时刻只允许一条线程对其lock操作，也就是说同一个锁的两个同步块只能串行进入。禁止了指令的重排序。

volatile关键字

说到了volatile，我们就有必要了解一下这个关键字是做什么的。

准确来说，volatile是java提供的轻量的同步机制。它有两个特性：

保证修饰的变量对所有线程的可见性。
禁止指令的重排序优化。

保证可见性和防止指令重排

简单写段代码说明一下：

public class VolatileDemo {
    
    private static boolean isReady;
    private static int number;
    
    private static class ReaderThread extends Thread{
        @Override
        public void run() {
            while (!isReady);
            System.out.println("number = "+number);
        }
    }

    public static void main(String[] args) {
        new ReaderThread().start();
        try {
            Thread.sleep(1000);
            number = 42;
            isReady = true;
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

在上面的代码中，ReaderThread只有在isReady 为 true 时才会打印出 number 的值，然而，真实的情况有可能是打印不出来(可能性比较小，但还是有)，因为线程ReaderThread线程无法看到主线程中对isReady的修改，导致while循环永远无法退出，同时，因为有可能发生指令重排，导致下面的代码不能按顺序执行：

number = 42;
isReady = true;

也就是能打印的话，number值可能是0，不是42。如果在变量加上volatile关键字，告诉Java虚拟机这两个变量可能会被不同的线程修改，那么就可以防止上述两种不正常的情况的发生。

不能保证原子性

volatile能保证可见性和有序性，但无法保证原子性，比如下面的例子：

public class VolatileDemo {

    public static volatile int i = 0;

    public static void increase() {
        i++;
    }

    public static void main(String[] args) throws InterruptedException {
        VolatileDemo test = new VolatileDemo();
        for (int i = 0; i < 10; i++) {
            new Thread(() -> {
                for (int j = 0; j < 1000; j++)
                    test.increase();
            }).start();
        }      
        Thread.sleep(1000);
        System.out.println(test.i);
    }
}

正常情况下，我们期望上面的main函数执行完后输出的结果是10000，但你会发现，结果总是会小于10000，因为increase()方法中的i++操作不是原子性的，分成了读和写两个操作。假设当线程1读取了 i 的值，还没有修改，线程2这时也进行了读取。然后，线程1修改完了，通知线程2重新读取 i 的值，可这时它不需要读取 i，它仍执行写操作，然后赋值给主线程，这时数据就会出现问题。

所以，一般针对共享变量的读写操作，还是需要用锁来保证结果，例如加上 synchronized关键字。

参考：

《Java高并发程序设计》

《深入理解Java虚拟机》

    原文作者：xue无止境
    原文地址: https://www.cnblogs.com/yeya/p/10194238.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。