本文主要内容
- Unsafe类介绍
- Unsafe的主要功能
- 总结
1、Unsafe类介绍
第一次看到这个类时被它的名字吓到了,居然还有一个类自名Unsafe?读完本文,大家也能发现Unsafe类确实有点不那么安全,它能实现一些不那么常见的功能。
Unsafe类使Java拥有了像C语言的指针一样操作内存空间的能力,同时也带来了指针的问题。过度的使用Unsafe类会使得出错的几率变大,因此Java官方并不建议使用的,官方文档也几乎没有。Oracle正在计划从Java 9中去掉Unsafe类,如果真是如此影响就太大了。
2、Unsafe的主要功能
我们先来看看Unsafe的初始化方法,这是一个单例模式:
private Unsafe() {}
private static final Unsafe theUnsafe = new Unsafe();
public static Unsafe getUnsafe() {
Class cc = sun.reflect.Reflection.getCallerClass(2);
if (cc.getClassLoader() != null)
throw new SecurityException("Unsafe");
return theUnsafe;
}
方法中,限制了它的 ClassLoader,如果这个方法的调用实例不是由Boot ClassLoader加载的,则会报错。可以做一个实验,因为Java源码中的类,除扩展包都是由Boot ClassLoader加载的,如果我们new一个Object对象,查看Object对象的ClassLoader,它一定是null。所以,正常情况下开发者无法直接使用Unsafe ,如果需要使用它,则需要利用反射:
private static Unsafe getUnsafe(){
try {
Field field = Unsafe.class.getDeclaredField("theUnsafe");
field.setAccessible(true);
Unsafe unsafe = (Unsafe) field.get(null);
return unsafe;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
从Unsafe的方法入手,发现Unsafe主要有以下几个方面的功能:
- 操纵对象属性
- 操纵数组元素
- 线程挂起与恢复、CAS
我们一项项的分析它。
2.1 操纵对象属性
操纵对象属性,主要落在这个方法上:
public native long objectFieldOffset(Field f);
通过此方法,可以获取对象中某个属性的内存偏移地址,然后可根据偏移地址直接对属性进行修改,属性是否可读都无所谓,都能修改。
Field name = user.getClass().getDeclaredField("name");
long nameOffset = unsafe.objectFieldOffset(name);
unsafe.putObject(user, nameOffset, "jim");
2.2 操作数组元素
操纵数组元素,主要涉及两个接口。
public native int arrayBaseOffset(Class arrayClass);
public native int arrayIndexScale(Class arrayClass);
arrayBaseOffset,获取数组第一个元素的偏移地址。arrayIndexScale,获取数组中元素的增量地址。arrayBaseOffset与arrayIndexScale配合起来使用,就可以定位数组中每个元素在内存中的位置
索引为 i 的元素可以使用如下代码定位:
int baseOffset = unsafe.arrayBaseOffset(array.getClass());
int indexScale = unsafe.arrayIndexScale(array.getClass());
baseOffset + i*indexScale
在ReentrantLock的源码中我又发现了一种新的元素定位方式:
int ssfit = 31 - Integer.numberOfLeadingZeros(indexScale);
(i << ssfit) + baseOffset
查看Integer的源码,发现 numberOfLeadingZeros 方法里注释如下:
floor(log2(x)) = 31 – numberOfLeadingZeros(x)
如果这是一个int型数组,indexScale 等于4,那么 ssfit 值为2,所以乘以4和向左移2位,结果是一样的。
不过第1种方法比较容易理解。想象下,这是在c语言中,如果已知数组第1个元素指针,每个元素占用的字节数也已知,那么计算其它元素的位置就和第1种方法是一样的。
for (int i = 0; i < array.length; i++) {
//unsafe.putInt(array, baseOffset + i*indexScale, i);
unsafe.putInt(array, (i << ssfit) + baseOffset, i);
}
所以,通过如上代码就可以更改数组的元素了。
2.3 线程挂起与恢复、CAS
如果我们使用 ReentrantLock 进行多线程开发,当一个线程抢占锁失败时,线程将被挂起,实现线程挂起的正是Unsafe类。
将一个线程进行挂起是通过park方法实现的,调用 park后,线程将一直阻塞直到超时或者中断等条件出现。unpark可以终止一个挂起的线程,使其恢复正常。整个并发框架中对线程的挂起操作被封装在 LockSupport类中,LockSupport类中有各种版本pack方法,但最终都调用了Unsafe.park()方法。
CAS,一种乐观锁机制,如果对象当前值和期望值一样,那么则将对象的值设置成新值。和悲观锁不一样,它不需要抢占锁,它是一种尝试性的,能有效地提高效率,它的全称是 compareAndSwap ,依赖于硬件的原子操作实现。详细的CAS请参考 线程安全 一文。
总结
之前也没有想过总结Unsafe类,不过在看 ConcurrentHashMap 源码时,涉及到 ReentrantLock 类,而 ReentrantLock 类中又涉及到了 Unsafe类,所以总结一下,现在全部打通关了,美滋滋。
Unsafe类中,还有一些有意思的方法没有介绍了,比如 allocateInstance,调用此方法可以生成一个新对象,有意思的是,生成新对象时可以避过此对象的构造函数。即使是反射,最后也是要调用对象的构造函数的。所以Unsafe这个能力还是非常有意思的。
多看源码或者说多看代码,不同的代码中体现出的不同思维,真的很能启发人。