Java中锁的实现与内存语义

2023年9月17日 170次阅读来源: java锁

1. 概述

锁在实际使用时只是明白锁限制了并发访问, 但是锁是如何实现并发访问的, 同学们可能不太清楚, 下面这篇文章就来揭开锁的神秘面纱.

2. 锁的内存语义

当线程获取锁时, JMM会把线程对应的本地内存置为无效. 从而使得被监视器保护的临界区的变量必须从主内存中读取.
当线程释放锁时, JMM会把该线程对应的本地内存中的共享变量刷新到主内存中(并不是不释放锁就不刷新到主内存, 只是释放锁时把未刷新到主内存中的数据刷新到主内存).

锁的内存语义与volatile的内存语义

锁获取与volatile读有相同的内存语义.
锁释放与volatile写有相同的内存语义.

内存语义总结

线程A释放一个锁, 实质上是线程A向接下来将要获取这个锁的某个线程发出了(线程A对共享变量所做修改的)消息.
线程B获取一个锁, 实质上是线程B接收了之前某个线程发出的(在释放这个锁之前对共享变量所做修改的)消息.
线程A释放锁, 随后线程B获取这个锁, 这个过程实质上是线程A通过主内存向线程B发送消息.

3. 锁内存语义的实现

下面以ReentrantLock为例, 获取到锁就是把state改为1(不考虑重入), 释放锁时改为0.

而加锁的关键代码就是

protected final boolean compareAndSetState(int expect, int update) {
    return unsafe.compareAndSwapInt(this, stateOffset, expect, update);
}

该方法以原子操作的方式更新state变量, 本文把Java的compareAndSet()方法简称为CAS. JDK文档对该方法的说明如下: 如果当前状态值等于预期值, 则以原子方式将同步状态设置为给定的更新值. 此操作具有volatile读和写的内存语义.

这里我们分别从编译器和处理器的角度来分析: CAS如何同时具有volatile读和volatile写的内存语义.

我们知道, 编译器不会对volatile读与volatile读后面的任意内存操作重排序; 编译器不会对volatile写与volatile写前面的任意内存操作重排序. 组合这两个条件, 意味着为了同时实现volatile读和volatile写的内存语义, 编译器不能对CAS与CAS前面和后面的任意内存操作重排序.

下面我们来分析在常见的intel X86处理器中, CAS是如何同时具有volatile读和volatile写的内存语义的.

下面是sun.misc.Unsafe类的compareAndSwapInt()方法的源代码.

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

可以看到, 这是一个本地方法调用. 这个本地方法在openjdk中依次调用的c++代码为: unsafe.cpp, atomic.cpp 和 atomic_windows_x86.inline.hpp. 这个本地方法的最终实现在openjdk的如下位置: openjdk-7-fcs-src-b147-
27_jun_2011\openjdk\hotspot\src\os_cpu\windows_x86\vm\atomic_windows_x86.inline.hpp(对应于
Windows操作系统, X86处理器). 下面是对应于intel X86处理器的源代码的片段.

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {
    // alternative for InterlockedCompareExchange
    int mp = os::is_MP();
    __asm {
        mov edx, dest
        mov ecx, exchange_value
        mov eax, compare_value
        LOCK_IF_MP(mp)
        cmpxchg dword ptr [edx], ecx
    }
}

如上面源代码所示, 程序会根据当前处理器的类型来决定是否为cmpxchg指令添加lock前缀. 如果程序是在多处理器上运行, 就为cmpxchg指令加上lock前缀(Lock Cmpxchg). 反之, 如果程序是在单处理器上运行, 就省略lock前缀(单处理器自身会维护单处理器内的顺序一致性, 不需要lock前缀提供的内存屏障效果).

intel的手册对lock前缀的说明如下.

确保对内存的读-改-写操作原子执行. 在Pentium及Pentium之前的处理器中, 带有lock前缀的指令在执行期间会锁住总线, 使得其他处理器暂时无法通过总线访问内存. 很显然, 这会带来昂贵的开销. 从Pentium 4、Intel Xeon及P6处理器开始, Intel使用缓存锁定(Cache Locking)
来保证指令执行的原子性. 缓存锁定将大大降低lock前缀指令的执行开销.
禁止该指令, 与之前和之后的读和写指令重排序.
把写缓冲区中的所有数据刷新到内存中.

上面的第2点和第3点所具有的内存屏障效果, 足以同时实现volatile读和volatile写的内存语义.

经过上面的分析, 现在我们终于能明白为什么JDK文档说CAS同时具有volatile读和volatile写的内存语义了.

从本文对ReentrantLock的分析可以看出, 锁释放-获取的内存语义的实现至少有下面两种方式.

利用volatile变量的写-读所具有的内存语义.
利用CAS所附带的volatile读和volatile写的内存语义.

4. 总结

对于锁, 可以这么理解, N个线程去通过CAS去修改一个volatile变量, 但是由于CPU提供的机制, 只能有一个线程修改成功, 修改成功的线程获得锁, 其它线程以及后来的线程要么自旋一会儿, 要么直接挂起, 等待获取锁的线程释放锁时去唤醒. 就是这么个过程.

    原文作者：java锁
    原文地址: https://www.cnblogs.com/wuqinglong/p/9962142.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。