Jdk1.7 JUC源码增量解析(1)-FutureTask
作者:大飞
功能简介:
- FutureTask是一种异步任务(或异步计算),举个栗子,主线程的逻辑中需要使用某个值,但这个值需要负责的运算得来,那么主线程可以提前建立一个异步任务来计算这个值(在其他的线程中计算),然后去做其他事情,当需要这个值的时候再通过刚才建立的异步任务来获取这个值,有点并行的意思,这样可以缩短整个主线程逻辑的执行时间。
- 与1.6版本不同,1.7的FutureTask不再基于AQS来构建,而是在内部采用简单的Treiber Stack来保存等待线程。
源码分析:
- 老规矩,先看内部结构:
public class FutureTask<V> implements RunnableFuture<V> {
/**
* 内部状态可能得迁转过程:
* NEW -> COMPLETING -> NORMAL //正常完成
* NEW -> COMPLETING -> EXCEPTIONAL //发生异常
* NEW -> CANCELLED //取消
* NEW -> INTERRUPTING -> INTERRUPTED //中断
*/
private volatile int state;
private static final int NEW = 0;
private static final int COMPLETING = 1;
private static final int NORMAL = 2;
private static final int EXCEPTIONAL = 3;
private static final int CANCELLED = 4;
private static final int INTERRUPTING = 5;
private static final int INTERRUPTED = 6;
/** 内部的callable,运行完成后设置为null */
private Callable<V> callable;
/** 如果正常完成,就是执行结果,通过get方法获取;如果发生异常,就是具体的异常对象,通过get方法抛出。 */
private Object outcome; // 本身没有volatile修饰, 依赖state的读写来保证可见性。
/** 执行内部callable的线程。 */
private volatile Thread runner;
/** 存放等待线程的Treiber Stack*/
private volatile WaitNode waiters;
内部结构很明确,重点看下WaitNode的结构吧:
static final class WaitNode {
volatile Thread thread;
volatile WaitNode next;
WaitNode() { thread = Thread.currentThread(); }
}
这个也很简单,就是包含了当前线程对象,并有指向下一个WaitNode的指针,所谓的Treiber Stack就是由WaitNode组成的(一个单向链表)。
- 然后按照FutureTask的运行过程来分析源码:
经常使用FutureTask的话一定会非常熟悉它的运行过程:
1.创建任务,实际使用时,一般会结合线程池(ThreadPoolExecutor)使用,所以是在线程池内部创建FutureTask。
2.执行任务,一般会有由工作线程(对于我们当前线程来说的其他线程)调用FutureTask的run方法,完成执行。
3.获取结果,一般会有我们的当前线程去调用get方法来获取执行结果,如果获取时,任务并没有被执行完毕,当前线程就会被阻塞,直到任务被执行完毕,然后获取结果。
4.取消任务,某些情况下会放弃任务的执行,进行任务取消。
下面就按照这个过程来分析,首先看下创建过程:
public FutureTask(Callable<V> callable) {
if (callable == null)
throw new NullPointerException();
this.callable = callable;
this.state = NEW; // ensure visibility of callable
}
public FutureTask(Runnable runnable, V result) {
this.callable = Executors.callable(runnable, result);
this.state = NEW; // ensure visibility of callable
}
可见,构造一个FutureTask很简单,可以通过一个Callable来构建,也可以通过一个Runnable和一个result来构建。
这里要注意的是必须把state的写放到最后,因为state本身由volatile修饰,所以可以保证callable的可见性。(因为后续读callable之前会先读state,还记得这个volatile写读的HB规则吧)。
接下来看下执行任务过程,也就是运行相关方法,先看下run方法:
public void run() {
//如果state不为null,尝试设置runner为当前线程,失败就退出。
if (state != NEW ||
!UNSAFE.compareAndSwapObject(this, runnerOffset,
null, Thread.currentThread()))
//如果state不等于null,直接退出。
return;
try {
Callable<V> c = callable;
if (c != null && state == NEW) {
V result;
boolean ran;
try {
//执行任务。
result = c.call();
ran = true;
} catch (Throwable ex) {
result = null;
ran = false;
//如果发生异常,设置异常。
setException(ex);
}
if (ran)
set(result); //如果正常执行完成,设置执行结果。
}
} finally {
// runner必须在设置了state之后再置空,避免run方法出现并发问题。
runner = null;
// 这里还必须再读一次state,避免丢失中断。
int s = state;
if (s >= INTERRUPTING)
//处理可能发生的取消中断(cancel(true))。
handlePossibleCancellationInterrupt(s);
}
}
看下run过程中,正常完成后调用的set方法:
protected void set(V v) {
if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) {
outcome = v;
UNSAFE.putOrderedInt(this, stateOffset, NORMAL); // final state
//唤醒Treiber Stack中所有等待线程。
finishCompletion();
}
}
set过程中,首先尝试将当前任务状态state从NEW改为COMPLETING。如果成功的话,再设置执行结果到outcome。然后将state再次设置为NORMAL,注意这次使用的是putOrderedInt,其实就是原子量的LazySet内部使用的方法。为什么使用这个方法?首先LazySet相对于Volatile-Write来说更廉价,因为它没有昂贵的Store/Load屏障,只有Store/Store屏障(x86下Store/Store屏障是一个空操作),其次,后续线程不会及时的看到state从COMPLETING变为NORMAL,但这没什么关系,而且NORMAL是state的最终状态之一,以后不会在变化了。 上述过程最后还调用了一个finishCompletion方法:
private void finishCompletion() {
for (WaitNode q; (q = waiters) != null;) {
//尝试将waiters设置为null。
if (UNSAFE.compareAndSwapObject(this, waitersOffset, q, null)) {
//然后将waiters中的等待线程全部唤醒。
for (;;) {
Thread t = q.thread;
if (t != null) {
q.thread = null;
LockSupport.unpark(t);
}
WaitNode next = q.next;
if (next == null)
break;
q.next = null; // unlink to help gc
q = next;
}
break;
}
}
//回调下钩子方法。
done();
//置空callable,减少内存占用
callable = null;
}
可见,finishCompletion主要就是在任务执行完毕后,移除Treiber Stack,并将Treiber Stack中所有等待获取任务结果的线程唤醒,然后回调下done钩子方法。 看完了set,再看下run过程中如果发生异常,调用的setException方法:
protected void setException(Throwable t) {
if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) {
outcome = t;
UNSAFE.putOrderedInt(this, stateOffset, EXCEPTIONAL); // final state
finishCompletion();
}
}
和set方法一个套路。 最后看下run过程中最后调用的handlePossibleCancellationInterrupt方法:
/**
* 确保cancel(true)产生的中断发生在run或runAndReset方法过程中。
*/
private void handlePossibleCancellationInterrupt(int s) {
// 如果当前正在中断过程中,自旋等待一下,等中断完成。
if (s == INTERRUPTING)
while (state == INTERRUPTING)
Thread.yield(); // wait out pending interrupt
// 这里的state状态一定是INTERRUPTED;
// 这里不能清除中断标记,因为没办法区分来自cancel(true)的中断。
// Thread.interrupted();
}
小总结一下执run方法:
1.只有state为NEW的时候才执行任务(调用内部callable的run方法)。执行前会原子的设置执行线程(runner),防止竞争。
2.如果任务执行成功,任务状态从NEW迁转为COMPLETING(原子),设置执行结果,任务状态从COMPLETING迁转为NORMAL(LazySet);如果任务执行过程中发生异常,任务状态从NEW迁转为COMPLETING(原子),设置异常结果,任务状态从COMPLETING迁转为EXCEPTIONAL(LazySet)。
3.将Treiber Stack中等待当前任务执行结果的等待节点中的线程全部唤醒,同时删除这些等待节点,将整个Treiber Stack置空。
4.最后别忘了等一下可能发生的cancel(true)中引起的中断,让这些中断发生在执行任务过程中(别泄露出去)。
看完了run方法,再看下runAndReset方法(周期性任务的时候用到):
protected boolean runAndReset() {
if (state != NEW ||
!UNSAFE.compareAndSwapObject(this, runnerOffset,
null, Thread.currentThread()))
return false;
boolean ran = false;
int s = state;
try {
Callable<V> c = callable;
if (c != null && s == NEW) {
try {
c.call(); // don't set result
ran = true;
} catch (Throwable ex) {
setException(ex);
}
}
} finally {
// runner must be non-null until state is settled to
// prevent concurrent calls to run()
runner = null;
// state must be re-read after nulling runner to prevent
// leaked interrupts
s = state;
if (s >= INTERRUPTING)
handlePossibleCancellationInterrupt(s);
}
return ran && s == NEW;
}
可见runAndReset与run方法的区别只是执行完毕后不设置结果、而且有返回值表示是否执行成功。
看完了执行任务过程,再看下获取执行结果的方法,先看下get():
public V get() throws InterruptedException, ExecutionException {
int s = state;
if (s <= COMPLETING)
s = awaitDone(false, 0L); //如果任务还没执行完毕,等待任务执行完毕。
return report(s); //如果任务执行完毕,获取执行结果。
}
看下awaitDone方法:
private int awaitDone(boolean timed, long nanos)
throws InterruptedException {
//先算出到期时间。
final long deadline = timed ? System.nanoTime() + nanos : 0L;
WaitNode q = null;
boolean queued = false;
for (;;) {
if (Thread.interrupted()) {
//如果当前线程被中断,移除等待节点q,然后抛出中断异常。
removeWaiter(q);
throw new InterruptedException();
}
int s = state;
if (s > COMPLETING) {
//如果任务已经执行完毕
if (q != null)
q.thread = null; //如果q不为null,将q中的thread置空。
return s; 返回任务状态。
}
else if (s == COMPLETING)
Thread.yield(); //如果当前正在完成过程中,出让CPU。
else if (q == null)
q = new WaitNode(); //创建一个等待节点。
else if (!queued)
//将q(包含当前线程的等待节点)入队。
queued = UNSAFE.compareAndSwapObject(this, waitersOffset,
q.next = waiters, q);
else if (timed) {
nanos = deadline - System.nanoTime();
if (nanos <= 0L) {
//如果超时,移除等待节点q
removeWaiter(q);
//返回任务状态。
return state;
}
//超时的话,就阻塞给定时间。
LockSupport.parkNanos(this, nanos);
}
else
//没设置超时的话,就阻塞当前线程。
LockSupport.park(this);
}
}
再看下awaitDone方法中调用的removeWaiter:
private void removeWaiter(WaitNode node) {
if (node != null) {
//将node的thread域置空。
node.thread = null;
//下面过程中会将node从等待队列中移除,以thread域为null为依据,
//如果过程中发生了竞争,重试。
retry:
for (;;) {
for (WaitNode pred = null, q = waiters, s; q != null; q = s) {
s = q.next;
if (q.thread != null)
pred = q;
else if (pred != null) {
pred.next = s;
if (pred.thread == null) // check for race
continue retry;
}
else if (!UNSAFE.compareAndSwapObject(this, waitersOffset,
q, s))
continue retry;
}
break;
}
}
}
再看下get方法中获取结果时调用的report:
private V report(int s) throws ExecutionException {
Object x = outcome;
if (s == NORMAL)
return (V)x;
if (s >= CANCELLED)
throw new CancellationException();
throw new ExecutionException((Throwable)x);
}
看完了get方法,再看下get(long timeout, TimeUnit unit)方法:
public V get(long timeout, TimeUnit unit)
throws InterruptedException, ExecutionException, TimeoutException {
if (unit == null)
throw new NullPointerException();
int s = state;
if (s <= COMPLETING &&
(s = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING)
throw new TimeoutException();
return report(s);
}
小总结一下执get方法:
1.首先检查当前任务的状态,如果状态表示执行完成,进入第2步。
2.获取执行结果,也可能得到取消或者执行异常,get过程结束。
3.如果当前任务状态表示未执行或者正在执行,那么当前线程放入一个新建的等待节点,然后进入Treiber Stack进行阻塞等待。
4.如果任务被工作线程(对当前线程来说是其他线程)执行完毕,执行完毕时工作线程会唤醒Treiber Stack上等待的所有线程,所以当前线程被唤醒,清空当前等待节点上的线程域,然后进入第2步。
5.当前线程在阻塞等待结果过程中可能被中断,如果被中断,那么会移除当前线程在Treiber Stack上对应的等待节点,然后抛出中断异常,get过程结束。
6.当前线程也可能执行带有超时时间的阻塞等待,如果超时时间过了,还没得到执行结果,那么会除当前线程在Treiber Stack上对应的等待节点,然后抛出超时异常,get过程结束。
最后在看下取消任务的方法cancel:
public boolean cancel(boolean mayInterruptIfRunning) {
if (state != NEW)
return false; //如果任务已经执行完毕,返回false。
if (mayInterruptIfRunning) {
//如果有中断任务的标志,尝试将任务状态设置为INTERRUPTING
if (!UNSAFE.compareAndSwapInt(this, stateOffset, NEW, INTERRUPTING))
return false;
//上面设置成功的话,这里进行线程中断。
Thread t = runner;
if (t != null)
t.interrupt();
//最后将任务状态设置为INTERRUPTED,注意这里又是LazySet。
UNSAFE.putOrderedInt(this, stateOffset, INTERRUPTED); // final state
}
//如果没有中断任务的标志,尝试将任务状态设置为CANCELLED。
else if (!UNSAFE.compareAndSwapInt(this, stateOffset, NEW, CANCELLED))
return false;
//最后唤醒Treiber Stack中所有等待线程。
finishCompletion();
return true;
}
取消方法中要重点注意一点:
在设置mayInterruptIfRunning为true的情况下,内部首先通过一个原子操作将state从NEW转变为INTERRUPTING,然后中断执行任务的线程,然后在通过一个LazySet的操作将state从INTERRUPTING转变为INTERRUPTED,由于后面这个操作对其他线程并不会立即可见,所以handlePossibleCancellationInterrupt才会有一个自旋等待state从INTERRUPTING变为INTERRUPTED的过程。
- 最后还有查看任务状态的方法:
public boolean isCancelled() {
return state >= CANCELLED;
}
public boolean isDone() {
return state != NEW;
}
这些方法很简单,不分析了。
- 最后,看一下为什么这个FutureTask不像1.6那样基于AQS构建了。
首先,前面贴代码了时候故意去掉了一些注释,避免读代码的时候受影响,现在我们来看一下关键的一段:
/*
* Revision notes: This differs from previous versions of this
* class that relied on AbstractQueuedSynchronizer, mainly to
* avoid surprising users about retaining interrupt status during
* cancellation races.
*/
主要是这句:mainly to avoid surprising users about retaining interrupt status during cancellation races。
大概意思是:使用AQS的方式,可能会在取消发生竞争过程中诡异的保留了中断状态。这里之所以没有采用这种方式,是为了避免这种情况的发生。
具体什么情况下会发生呢?
ThreadPoolExecutor executor = ...;
executor.submit(task1).cancel(true);
executor.submit(task2);
看上面的代码,虽然中断的是task1,但可能task2得到中断信号。
原因是什么呢?看下JDK1.6的FutureTask的中断代码:
boolean innerCancel(boolean mayInterruptIfRunning) {
for (;;) {
int s = getState();
if (ranOrCancelled(s))
return false;
if (compareAndSetState(s, CANCELLED))
break;
}
if (mayInterruptIfRunning) {
Thread r = runner;
if (r != null) //第1行
r.interrupt(); //第2行
}
releaseShared(0);
done();
return true;
}
结合上面代码例子看一下,如果主线程执行到第1行的时候,线程池可能会认为task1已经执行结束(被取消),然后让之前执行task1工作线程去执行task2,工作线程开始执行task2之后,然后主线程执行第2行(我们会发现并没有任何同步机制来阻止这种情况的发生),这样就会导致task2被中断了。更多的相关信息参考这个Bug说明。
所以现在就能更好的理解JDK1.7 FutureTask的handlePossibleCancellationInterrupt中为什么要将cancel(true)中的中断保留在当前run方法运行范围内了吧! JDK1.7的FutureTask的代码解析完毕! 参见:
Jdk1.6 JUC源码解析(16)-FutureTask