Java 多线程 线程池使用

在Java中,通过多线程并发可以提高程序对机器资源利用率,提高程序的执行效率。有多种方式可以让我们的程序并发运行,你可以自己手动一个一个的创建多个线程,也可以使用线程池一次性得到多个线程。接下来介绍不同的方式的使用方式以及应用场景。

1
2
3
4
//AbstractExecutorService实现了ExecutorService接口
public class ThreadPoolExecutor extends AbstractExecutorService {
......
}

使用单个线程

想让程序具有多线程并发运行的能力,最基本也是最底层的方式是自己手动逐个创建各个线程,并自己亲自管理线程的生命周期。这种方式最灵活,但是灵活伴随着复杂性,如果你不是并发编程大牛或者不够细心,很容易写出有bug的多线程程序,例如发生死锁或者线程的同步运行逻辑不符合预期。

  1. 继承Thread类,并重写该类的run方法,run方法的方法体就代表了线程要完成的任务。因此把run()方法称为**执行体(线程体)**。因此创建Thread子类的实例,即创建了线程对象。最后调用线程对象的start()方法来启动该线程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    public class FirstThreadTest extends Thread{  
    int i = 0;
    //重写run方法,run方法的方法体就是现场执行体
    public void run()
    {
    for(;i<100;i++){
    log.info(getName()+" "+i);
    }
    }

    public static void main(String[] args)
    {
    for(int i = 0;i< 100;i++)
    {
    log.info(Thread.currentThread().getName()+" : "+i);
    if(i==20)
    {
    new FirstThreadTest().start();
    new FirstThreadTest().start();
    }
    }
    }
    }
  2. 定义runnable接口的实现类,并重写该接口的run()方法,该run()方法的方法体同样是该线程的线程执行体。创建 Runnable实现类的实例,并以此实例作为Thread的target来创建Thread对象,该Thread对象才是真正的线程对象。调用线程对象的start()方法来启动该线程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    public class RunnableThreadTest implements Runnable  
    {

    private int i;
    public void run()
    {
    for(i = 0;i <100;i++)
    {
    log.info(Thread.currentThread().getName()+" "+i);
    }
    }

    public static void main(String[] args)
    {
    for(int i = 0;i < 100;i++)
    {
    log.info(Thread.currentThread().getName()+" "+i);
    if(i==20)
    {
    RunnableThreadTest runner= new RunnableThreadTest();
    new Thread(runner,"新线程1").start();
    new Thread(runner,"新线程2").start();
    }
    }
    }
    }
  3. 此外,还可以通过CallableFuture创建线程。创建Callable接口的实现类,并实现call()方法,该call()方法将作为线程执行体,并且有返回值。创建Callable实现类的实例,使用FutureTask类来包装Callable对象,该FutureTask对象封装了该Callable对象的call()方法的返回值。(FutureTask是一个包装器,它通过接受Callable来创建,它同时实现了Future和Runnable接口。)使用FutureTask对象作为Thread对象的target创建并启动新线程。调用FutureTask对象的get()方法来获得子线程执行结束后的返回值。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    public interface Callable
    {
      V call() throws Exception;
    }

    public class CallableThreadTest implements Callable<Integer> {

    public static void main(String[] args)
    {
    CallableThreadTest ctt = new CallableThreadTest();
    FutureTask<Integer> ft = new FutureTask<>(ctt);
    for(int i = 0;i < 100;i++)
    {
    log.info(Thread.currentThread().getName()+" 的循环变量i的值"+i);
    if(i==20)
    {
    new Thread(ft,"有返回值的线程").start();
    }
    }
    try
    {
    log.info("子线程的返回值:"+ft.get());
    } catch (InterruptedException e)
    {
    e.printStackTrace();
    } catch (ExecutionException e)
    {
    e.printStackTrace();
    }

    }

    @Override
    public Integer call() throws Exception
    {
    int i = 0;
    for(;i<100;i++)
    {
    log.info(Thread.currentThread().getName()+" "+i);
    }
    return i;
    }
    }

使用线程池

前面说过,通过new单个线程来实现并发,灵活性较大,可以让你“随心所欲”的组织程序的并发逻辑,但也要亲自管理线程的销毁、阻塞以及同步问题,稍有不慎就容易造成并发逻辑错误或者线程死锁。因此,在实际业务处理中,非常不建议单纯使用继承Thread或者实现Runnable接口的方式来创建线程,这个时候引入线程池比较合理,方便线程任务的管理。

线程池的参数

开始构建线程池之前,需要先了解一下线程池的几个重要属性:

  • corePoolSize:核心线程数,线程池维护的最小线程数量,核心线程创建后不会被回收(注意:设置allowCoreThreadTimeout=true后,空闲的核心线程超过存活时间也会被回收)。
  • maximumPoolSize:最大线程数,线程池允许创建的最大线程数量。
  • keepAliveTime:空闲线程存活时间,当一个可被回收的线程的空闲时间大于keepAliveTime,就会被回收。
  • timeUnit:keepAliveTime的时间单位:
  • workQueue:工作队列,存放待执行任务的队列:当提交的任务数超过核心线程数大小后,再提交的任务就存放在工作队列,任务调度时再从队列中取出任务。它仅仅用来存放被execute()方法提交的Runnable任务。
  • 线程工厂:创建线程的工厂,可以设定线程名、线程编号等。
  • 拒绝策略:当线程池线程数已满,并且工作队列达到限制,新提交的任务使用拒绝策略处理。

在创建线程池时,根据自己的需求,为线程池指定这些参数。

线程池的创建

Java的线程池名叫ThreadPoolExcutor,涉及到线程池的相关类均在 jdk 1.5 开始的java.util.concurrent包中,涉及到的几个核心类及接口包括:Executor、Executors、ExecutorService、ThreadPoolExecutor、FutureTask、Callable、Runnable等。最基本的,可以使用两种方式创建线程池:

  • 直接 new ThreadPoolExcutor()
  • 使用 Excutors.静态方法()

其中使用Excutors.静态方法()底层也是调用的 new ThreadPoolExcutor(),只不过不用我们去手动指定构造函数的参数。拿吃午餐举例来说,使用new ThreadPoolExcutor()来创建线程池就好比自己随意搭配吃哪些菜,而使用Excutors.静态方法()就是直接吃别人给你搭配好的套餐。

1、使用 Excutors.静态方法()

JDK 自动创建线程池的几种方式都封装在Executors工具类中:

  • newFixedThreadPool

    构造方式为

    1
    new ThreadPoolExecutor(var0, var0, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue())

    设置了corePoolSize=maxPoolSize,keepAliveTime=0(此时该参数没作用),无界队列,任务可以无限放入,当请求过多时(任务处理速度跟不上任务提交速度造成请求堆积)可能导致占用过多内存或直接导致OOM异常。

  • newSingleThreadExector

    构造方式为

    1
    new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue(), var0)

    基本同 newFixedThreadPool,但是将线程数设置为了1,单线程,弊端和newFixedThreadPool 一致。

  • newCachedThreadPool

    构造方式为

    1
    new ThreadPoolExecutor(0, 2147483647, 60L, TimeUnit.SECONDS, new SynchronousQueue())

    corePoolSize=0maxPoolSize为很大的数,同步移交队列,也就是说不维护常驻线程(核心线程),每次来请求直接创建新线程来处理任务,也不使用队列缓冲,会自动回收多余线程,由于将maxPoolSize设置成Integer.MAX_VALUE,当请求很多时就可能创建过多的线程,导致资源耗尽OOM。

  • newScheduledThreadPool

    构造方式为

    1
    new ThreadPoolExecutor(var1, 2147483647, 0L, TimeUnit.NANOSECONDS, new ScheduledThreadPoolExecutor.DelayedWorkQueue())

    支持定时周期性执行,注意一下使用的是延迟队列,弊端同newCachedThreadPool一致。

上述的各个静态方法在实现上是使用的 new ThreadPoolExcutor(),只不过它们默认为我们确定了线程池的几个参数,使得得到的线程池具有各自的特性。阿里开发手册不建议使用这种方式新建线程池,而是根据自己需求去指定各个参数的设置。但有的网友评论到:

阿里开发手册中明确禁止使用Executors创建线程池,那是因为它的项目可能有上千万的并发,这种情况下的确需要精确的控制线程。但是对于大多数小公司,又有多少上万的并发呢,这种情况Executors完全够用了。所以这根本不是一锤定音的事,具体选择哪种需要根据你公司的用户量和项目的并发量来决定的。

因此,到底该不该使用这种“套餐”的方式创建线程池,主要还看自己的业务需求。生产环境要怎么去配置自己的线程池才是合理的呢?需要对症下药,建立自己的线程工厂类,灵活设置关键参数,那就需要直接使用 new ThreadPoolExcutor()并手动指定各个参数了。

2、使用ThreadPoolExcutor自定义专属线程池

2.1、ThreadPoolExecutor 类

要自定义线程池,需要使用ThreadPoolExecutor类。

ThreadPoolExecutor类的构造方法:

1
public ThreadPoolExecutor(int coreSize,int maxSize,long KeepAliveTime,TimeUnit unit,BlockingQueue queue,ThreadFactory factory,RejectedExectionHandler handler)

上述构造方法共有七个参数,这七个参数的含义分别是:

  • corePoolSize: 核心线程数,也是线程池中常驻的线程数,线程池初始化时默认是没有线程的,当任务来临时才开始创建线程去执行任务
  • maximumPoolSize: 最大线程数,在核心线程数的基础上可能会额外增加一些非核心线程,需要注意的是只有当workQueue队列填满时才会创建多于corePoolSize的线程(线程池总线程数不超过maxPoolSize)
  • keepAliveTime: 非核心线程的空闲时间超过keepAliveTime就会被自动终止回收掉,注意当corePoolSize=maxPoolSize时,keepAliveTime参数也就不起作用了(因为不存在非核心线程);
  • unit: keepAliveTime的时间单位
  • workQueue: 用于保存任务的队列,可以为无界、有界、同步移交三种队列类型之一,当池子里的工作线程数大于corePoolSize时,这时新进来的任务会被放到队列中
  • threadFactory: 创建线程的工厂类,默认使用Executors.defaultThreadFactory(),也可以使用guava库的ThreadFactoryBuilder来创建
  • handler: 线程池无法继续接收任务(队列已满且线程数达到maximunPoolSize)时的饱和策略,取值有AbortPolicy、CallerRunsPolicy、DiscardOldestPolicy、DiscardPolicy

2.2、线程池配置相关

(1) 线程池大小的设置

首先针对于这个问题,我们必须要明确我们的需求是计算密集型还是IO密集型,只有了解了这一点,我们才能更好的去设置线程池的数量进行限制。

  • 计算密集型

    顾名思义就是应用需要非常多的CPU计算资源,在多核CPU时代,我们要让每一个CPU核心都参与计算,将CPU的性能充分利用起来,这样才算是没有浪费服务器配置,如果在非常好的服务器配置上还运行着单线程程序那将是多么重大的浪费。对于计算密集型的应用,完全是靠CPU的核数来工作,所以为了让它的优势完全发挥出来,避免过多的线程上下文切换,比较理想方案是:

    线程数 = CPU核数+1,也可以设置成CPU核数*2,但还要看JDK的版本以及CPU配置(服务器的CPU有超线程)。

    一般设置CPU * 2即可。

  • IO密集型

    我们现在做的开发大部分都是WEB应用,涉及到大量的网络传输,不仅如此,与数据库,与缓存间的交互也涉及到IO,一旦发生IO,线程就会处于等待状态,当IO结束,数据准备好后,线程才会继续执行。

    因此从这里可以发现,对于IO密集型的应用,我们可以多设置一些线程池中线程的数量,这样就能让在等待IO的这段时间内,线程可以去做其它事,提高并发处理效率。那么这个线程池的数据量是不是可以随便设置呢?当然不是的,请一定要记得,线程上下文切换是有代价的。目前总结了一套公式,对于IO密集型应用:

    线程数 = CPU核心数/(1-阻塞系数) 这个阻塞系数一般为0.8~0.9之间,也可以取0.8或者0.9。

    套用公式,对于双核CPU来说,它比较理想的线程数就是20,当然这都不是绝对的,需要根据实际情况以及实际业务来调整:final int poolSize = (int)(cpuCore/(1-0.9))

    针对于阻塞系数,《Programming Concurrency on the JVM Mastering》即《Java 虚拟机并发编程》中有提到一句话:

    对于阻塞系数,我们可以先试着猜测,抑或采用一些性能分析工具或java.lang.management API 来确定线程花在系统/IO操作上的时间与CPU密集任务所耗的时间比值。

(2) 其他相关参数配置

  • 第一,一定不要选择没有上限限制的配置项。

    这也是为什么不建议使用 Executors 中创建线程的方法。

    例如,Executors.newCachedThreadPool 的设置与无界队列的设置因为某些不可预期的情况,线程池会出现系统异常,导致线程暴增的情况或者任务队列不断膨胀,内存耗尽导致系统崩溃和异常。

    推荐使用自定义线程池来避免该问题,这也是在使用线程池规范的首要原则!

  • 第二,合理设置线程数量、和线程空闲回收时间,

    根据具体的任务执行周期和时间去设定,避免频繁的回收和创建,虽然我们使用线程池的目的是为了提升系统性能和吞吐量,但是也要考虑下系统的稳定性,不然出现不可预期问题会很麻烦!

  • 第三,根据实际场景,选择适用于自己的拒绝策略。

    进行补偿,不要乱用JDK支持的自动补偿机制!尽量采用自定义的拒绝策略去进行兜底!

  • 第四,线程池拒绝策略,自定义拒绝策略可以实现RejectedExecutionHandler接口。

    JDK自带的拒绝策略如下:

    • AbortPolicy:直接抛出异常阻止系统正常工作。
    • CallerRunsPolicy:只要线程池未关闭,该策略直接在调用者线程中,运行当前被丢弃的任务。
    • DiscardOldestPolicy:丢弃最老的一个请求,尝试再次提交当前任务。
    • DiscardPolicy:丢弃无法处理的任务,不给予任何处理。

2.3、利用Hook

利用Hook,留下线程池执行轨迹:

ThreadPoolExecutor提供了protected类型可以被覆盖的钩子方法,允许用户在任务执行之前会执行之后做一些事情。我们可以通过它来实现比如初始化ThreadLocal、收集统计信息、如记录日志等操作。这类Hook如beforeExecuteafterExecute。另外还有一个Hook可以用来在任务被执行完的时候让用户插入逻辑,如rerminated

如果hook方法执行失败,则内部的工作线程的执行将会失败或被中断。

我们可以使用beforeExecuteafterExecute来记录线程之前前和后的一些运行情况,也可以直接把运行完成后的状态记录到ELK等日志系统。

2.4、关闭线程池

当线程池不再被引用并且工作线程数为0的时候,线程池将被终止。我们也可以调用shutdown来手动终止线程池。如果我们忘记调用shutdown,为了让线程资源被释放,我们还可以使用keepAliveTimeallowCoreThreadTimeOut来达到目的!

当然,稳妥的方式是使用虚拟机Runtime.getRuntime().addShutdownHook方法,手工去调用线程池的关闭方法。

2.5、可优化事项

  • 设置线程池中线程为Daemon

    一般情况下,关闭线程池后,线程池会自行将其中的线程结束掉。但针对一些自己伪装或直接new Thread()的这种线程,则仍会阻塞进程关闭。

    按照,java进程关闭判定方法,当只存在Daemon线程时,进程才会正常关闭。因此,这里建议这些非主要线程均设置为 daemon,即不会阻塞进程关闭。

  • 正确命名Thread

    在使用线程池时,一般会接受 ThreadFactory 对象,来控制如何创建thread。在java自带的ExecutorService时,如果没有设置此参数,则会使用默认的 DefaultThreadFactory。效果就是,你会在线程栈列表中,看到一堆的 pool-x-thread-y,在实际使用 jstack时,根本看不清这些线程每个所属的组,以及具体作用。

  • 丢弃不再可用周期性任务

    一般情况下,使用 java 自带的 ScheduledThreadPoolExecutor, 调用 scheduleAtFixedRatescheduleWithFixedDelay 均会将任务设置为周期性的(period)。在线程池关闭时,这些任务均可以直接被丢弃掉(默认情况下). 但如果使用 schedule 添加远期的任务时,线程池则会因为其不是周期性任务而不会关闭所对应的线程

    如 spring 体系中 TriggerTask(包括CronTask), 来进行定时调度的任务,其最终均是通过 schedule 来实现调度,并在单个任务完成之后,再次 schedule 下一次任务的方式来执行。这种方式会被认为并不是 period. 因此,使用此调度方式时,尽管容器关闭时,执行了 shutdown 方法,但相应底层的 ScheduledExecutorService 仍然不会成功关闭掉(尽管所有的状态均已经设置完)。最终效果就是,会看到一个已经处于shutdown状态的线程池,但线程仍然在运行(状态为 wait 任务)的情况.

    为解决此方法,java 提供一个额外的设置参数 executeExistingDelayedTasksAfterShutdown, 此值默认为true,即 shutdown 之后,仍然执行。可以通过在定义线程池时将其设置为 false,即线程池关闭之后,不再运行这些延时任务。

参考 CSDN CSDN 一行Java CSDN