面试官:听说你很懂线程池?

用Executors工具类,可以很方便地创建各种线程池,它可以创建多种类型的线程池,每种线程池都有不
首页 新闻资讯 行业资讯 面试官:听说你很懂线程池?

什么是线程池

就是一种池化技术,类似的还有jdbc连接池,对象池。所谓线程池,就是提前创建一堆线程,放到内存(池子)中,需要的时候取一个出来用。

14606e16897576dffdf2272649a2a0f0d243fb.webp

如上图,最顶层的接口就是Executor,实现ExecutorService接口的类,就是对应的线程池类。

如何创建线程池

用Executors工具类,可以很方便地创建各种线程池。(但是实际开发我们不推荐,阿里巴巴的开发手册严令禁止使用Executors,应该用ThreadPoolExecutor)Executors 类可以创建多种类型的线程池,每种线程池都有不同的特点和适用场景。

(1) FixedThreadPool(固定大小线程池):

  • 使用 Executors.newFixedThreadPool(int nThreads) 方法创建。

  • 具有固定大小的线程池,即线程数量固定不变。

  • 适用于需要控制线程数量的场景,例如服务器端处理请求。

(2) CachedThreadPool(缓存线程池):

  • 使用 Executors.newCachedThreadPool() 方法创建。

  • 具有自动调整线程数量的线程池,根据需要创建新线程,空闲线程会被回收。

  • 适用于执行大量短期异步任务的场景,例如异步IO操作。

(3) SingleThreadPool(单线程线程池):

  • 使用 Executors.newSingleThreadExecutor() 方法创建。

  • 只有一个工作线程的线程池,所有任务按顺序执行。

  • 适用于需要保证顺序执行的任务场景,例如日志处理。

(4) ScheduledThreadPool(定时任务线程池):

  • 使用 Executors.newScheduledThreadPool(int corePoolSize) 方法创建。

  • 具有定时执行任务的功能,可以按固定的频率执行任务。

  • 适用于需要定时执行任务的场景,例如定时任务调度。

(5) WorkStealingPool(工作窃取线程池):

  • 使用 Executors.newWorkStealingPool(int parallelism) 方法创建。

  • 基于ForkJoinPool实现的线程池,每个线程都有自己的任务队列,可以窃取其他线程的任务来执行。

  • 适用于需要处理大量并行任务的场景,例如并行计算任务。

为什么不推荐用Executors创建?

773af3e076a1bf2fa4a91130e6c7eb39444e5e.webp

线程池底层原理

我们以ThreadPoolExecutor为例,它是ExecutorService的一种实现。

e59d85123a0531504a51596306d6795ae70bc8.webp

一般我们根据一个类的构造器,可以看出里面的大致思路:

publicThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue<Runnable>workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler){if(corePoolSize<0||maximumPoolSize<=0||maximumPoolSize<corePoolSize||keepAliveTime<0)thrownewIllegalArgumentException();if(workQueue==null||threadFactory==null||handler==null)thrownewNullPointerException();this.corePoolSize=corePoolSize;this.maximumPoolSize=maximumPoolSize;this.workQueue=workQueue;this.keepAliveTime=unit.toNanos(keepAliveTime);this.threadFactory=threadFactory;this.handler=handler;}

参数很多,但是我们每一个都必须要记住。 这个 ThreadPoolExecutor 的构造函数接受以下参数:一个线程池就好比一家公司,甲方员工干不完需求的时候,就要招一些外包人员驻场开发,如果活干完了,就让外包撤场,只留下自己的员工。

  • corePoolSize(核心线程数):线程池中保持活跃的线程数量,即使它们处于空闲状态。当提交任务时,线程池会尝试保持至少这么多数量的线程处于活跃状态。 就是公司正式员工的数量。

  • maximumPoolSize(最大线程数):线程池中允许的最大线程数量。当任务队列已满且核心线程都处于活跃状态时,线程池会创建新的线程,直到达到这个最大线程数。 就是公司甲方员工+外包员工的总数,不能超过这个数量。

  • keepAliveTime(线程空闲时间):非核心线程在空闲状态下的最长存活时间。超过这个时间,多余的非核心线程将被终止,直到线程数量不超过核心线程数。 如果外包员工长时间没需求,就通知乙方撤人,裁掉这个非核心人员。当然,甲方爸爸是不会裁的。

  • unit(时间单位):用于指定 keepAliveTime 参数的时间单位,通常是秒、毫秒、微秒等。

  • workQueue(工作队列):用于保存等待执行的任务的阻塞队列。当所有线程都处于忙碌状态时,新提交的任务会被放入这个队列中等待执行。 当需求多到加上外包员工都做不完了,就只能往后排期了。

  • threadFactory(线程工厂):用于创建新线程的工厂。每个新创建的线程都是通过这个工厂创建的。** 就是定义员工的属性,即工牌,这个员工属于哪个公司的。**

  • handler(拒绝策略):当任务无法被执行时(通常是由于线程池已关闭或者任务队列已满),用于处理被拒绝的任务的策略。常见的拒绝策略包括抛出异常、丢弃任务或者在调用者线程中执行任务。 默认是不处理。

这些参数可以用于配置 ThreadPoolExecutor 对象,以满足不同的线程管理需求。

线程池本质就是一个HashSet,所以是无序的。有新的任务提交进来,如果池子还有线程,就直接拿去处理,池子满了就放入阻塞队列,等待有线程空闲。

线程数怎么设置比较合理?

这个是没有银弹的,我们一般认为CPU密集型的应用,设置为CPU核数N+1。所谓CPU密集型,就是这个程序计算量比较多,还比较频繁,计算时间长,也就是所谓的比较吃配置,比如是一个专门做算法的服务(组托,配载运算之类的)。

对于IO密集型的应用,设置为2N+1,什么是IO密集型的应用呢,就是提供数据服务比较多,吞吐量比较大,等待时间长的应用,大部分业务系统都属于此类。

除此之外,线程数还跟jvm,机器cpu是否可以超线程(云服务器一般没法超线程),我们看到的cpu核数一般不是真实的,所以我们推荐先根据常规设置一个线程数量,上线后根据具体情况再调整就行了。