线程池的底层实现你了解吗?线程池模块总结【上篇】
线程池的核心理念是什么?
由我的第一篇关于线程的文章中提到的,我们服务器的线程资源是宝贵且有限的,因此我们在某些场景下需要尽可能的复用线程,不让线程频繁的创建与销毁。因此就引出了我们线程池的第一个核心理念:线程资源复用。
那么除开线程资源复用之外,我们还希望能对线程资源的使用情况进行一些控制,例如最少要有几个线程在跑,最多能创建多少个线程。那么就引出了我们线程池第二个核心理念:线程资源控制。
线程池的核心功能是如何实现的呢?
线程资源复用的实现原理
为了彻底了解线程池的工作原理,肯定是要从源码开始说起的。本文选取的核心类是ThreadPoolExecutor,这个也是《Java并发编程之美》书中用来讲解的类。首先我们从核心函数 void execute(Runnable command) 开始看起。
下面的源码看起来实在枯燥,我还是在最前面先概述一下原理,让读者能有个大概印象,然后画图阐述下具体执行流程。至于下面的代码块,可以在各位读者阅读源码的时候,再来结合这里的说明进行理解。
线程池对核心线程的复用,主要是通过内部Worker线程+生产者消费者模式去实现的,传入的线程被内部Worker线程调用run函数执行。让内部的Worker线程去消费Task,并且长期存活,用以达到线程复用的效果。
而内部的Worker线程如何长期存活的呢?主要就是通过队列的take函数阻塞住Worker线程内部的while循环,并且在各个阶段去检查是否Worker线程数量小于了设置的核心线程数。 具体代码执行流程示意图如下:
源码说明如下:
// 这个函数中有详细的文档说明,读者可以自行阅读。这里主要是逐行写下我的理解。 public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
// 获取当前线程池的状态值
int c = ctl.get();
// 如果工作线程数量小于核心线程数就创建新的核心线程
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
c = ctl.get();
}
// 如果所有的核心线程都在执行Task,那么就将新来的任务放到队列中
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
// 如果队列也放不下了,就再次创建Worker线程,直到达到Max的限制
else if (!addWorker(command, false))
// 如果达到了Max限制,还有新的任务来,就执行对应的拒绝策略。
reject(command);
}
上面这一段代码,其实就是面试官常问的,线程池执行过程。我们可以从上面的代码中看到,比较重要的一个函数就是addWorker,顾名思义,这个函数就是用来创建新的内部Worker线程的。具体代码如下:
// 分成两部分: // 上半部分:通过CAS操作增加线程数(ctl)
// 下半部分:将传入的Task与Worker通过构造函数绑定,并添加到workers中,最后启动worker这个内部线程。
private boolean addWorker(Runnable firstTask, boolean core) {
// 上半部分:通过CAS操作增加线程数(ctl)
retry:
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
for (;;) {
int wc = workerCountOf(c);
// 这里配合上面的execute最后一个分支去看,会发现这里如果达到了Max限制会返回false。
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // Re-read ctl
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
// 下半部分:将传入的Task与Worker通过构造函数绑定,并添加到workers中,最后启动worker这个内部线程。
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
// 绑定
w = new Worker(firstTask);
// 这里拿到的其实就是Worker本身,因为Worker实现了Runnable
final Thread t = w.thread;
if (t != null) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int rs = runStateOf(ctl.get());
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
// 添加到workers中
workers.add(w);
int s = workers.size();
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) {
// 启动worker线程
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
上面这段代码很长,有很多保证线程安全的细节不用去在意,我们只需要理解它这个函数所做的主要的事情,一个就是通过CAS修改ctl状态值,第二个就是通过Worker的构造函数去将传入的Task与新创建的Worker进行绑定,然后添加到workers这个set中,最后启动这个Worker线程。下面我们看具体的构造函数:
Worker(Runnable firstTask) { setState(-1); // inhibit interrupts until runWorker
// 将传入的Task赋值给自己的成员变量
this.firstTask = firstTask;
// 将自己变成一个thread并赋值给自己的成员变量
this.thread = getThreadFactory().newThread(this);
}
完成绑定之后,最后就会执行: t.start();启动内部的这个Worker线程,那么就会走到Worker内部的run函数,代码下:
final void runWorker(Worker w) { Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
// 控制内部Worker线程不被回收,生产者消费者模型
while (task != null || (task = getTask()) != null) {
w.lock();
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
beforeExecute(wt, task);
Throwable thrown = null;
try {
// 显式调用run函数消费掉task
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown);
}
} finally {
task = null;
w.completedTasks++;
w.unlock();
}
}
completedAbruptly = false;
} finally {
// 退出循环后,该线程执行完毕,最后调用后置清理函数
processWorkerExit(w, completedAbruptly);
}
}
可以根据上图知道,决定内部的Worker线程会不会被回收的,就是这里的while循环和getTask函数,源码如下:
private Runnable getTask() { boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
// 1、timed在worker数量大于core时为true
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
// 3、那么这里,就会因为timed && timedOut为true,然后队列为空,返回一个null,
// 让worker线程内部的循环退出。最终被回收掉。
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
// 2、这里就会因为timed为true后,空闲了keepAliveTime后修改timedOut = true;
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
我们可以看到,如果当前Worker线程数量小于核心线程数,就会调用 workQueue.take();被阻塞住,不让Worker线程被清理掉。从而达到持久存在的目的。而最后就是在runWorker中的后置函数,主要是清理执行完成的Worker以及再次检查核心线程数。源码如下:
private void processWorkerExit(Worker w, boolean completedAbruptly) { if (completedAbruptly) // If abrupt, then workerCount wasn"t adjusted
decrementWorkerCount();
// 清理worker线程
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
completedTaskCount += w.completedTasks;
workers.remove(w);
} finally {
mainLock.unlock();
}
tryTerminate();
int c = ctl.get();
if (runStateLessThan(c, STOP)) {
if (!completedAbruptly) {
int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
if (min == 0 && ! workQueue.isEmpty())
min = 1;
if (workerCountOf(c) >= min)
return; // replacement not needed
}
// 如果当前worker数量小于核心线程数,那么在这里也调用addWorker去创建
// 最终Worker会调用take函数阻塞住而长久存在。
addWorker(null, false);
}
}
通过以上流程图以及源码的说明,我想各位读者应该可以清晰的了解到这个线程池底层的执行流程,我们也可以知道线程池如何实现的线程复用,为什么保证一定有corePoolsize数量的核心线程数,以及传入的线程是如何被调用(消费)的等等这些问题。
线程资源控制的实现原理
如果你能耐心的看完上面那个小节,我想这个资源控制的实现原理也应该有了一个具体的理解了。回想一下我们平时如何使用线程池的呢?设置一堆参数,让线程池最少要有多少个核心线程数;最多能有多少个工作线程数;能够空闲多少秒;放进什么类型的Queue中;以及如果任务处理不过来应该执行什么样的拒绝策略。
那么我们设置的这些参数其实就是对线程池资源的量化控制,而他们其中的一些参数,例如corePoolSize、maximumPoolSize、keepAliveTime等参数在什么时候生效,都在上文中被提到了,显而易见的,这些参数都是实例变量,也就是我们调用构造器的时候去指定的——在创建线程池的时候,通过构造器去指定对应的参数,然后线程池在运行过程中去不断检查线程池的运行状态,从而达到线程资源控制的目的。 最后贴上其中一个构造函数的代码:
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.acc = System.getSecurityManager() == null ?
null :
AccessController.getContext();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
这里代码就不加说明了,就是一系列的赋值操作。因为代码段实在太长了,看起来很费力,所以关于【线程池模块】会分成多篇进行总结,后续会再分析线程池是如何关闭的,有什么区别;以及拒绝策略的设置;理论上线程池参数该如何设置等等。
以上是 线程池的底层实现你了解吗?线程池模块总结【上篇】 的全部内容, 来源链接: utcz.com/z/514266.html