一文浅析Nginx线程池！

2023-03-23 21:32 作者:补给站Linux内核 0人读过 | 我要投稿

Nginx通过使用多路复用IO（如Linux的epoll、FreeBSD的kqueue等）技术很好的解决了c10k问题，但前提是Nginx的请求不能有阻塞操作，否则将会导致整个Nginx进程停止服务。

但很多时候阻塞操作是不可避免的，例如客户端请求静态文件时，由于磁盘IO可能会导致进程阻塞，所以将会导致Nginx的性能下降。为了解决这个问题，Nginx在1.7.11版本中实现了线程池机制。

下面我们将会分析Nginx是怎么通过线程池来解决阻塞操作问题。

启用线程池功能

要使用线程池功能，首先需要在配置文件中添加如下配置项：

上面定义了一个名为“default”，包含32个线程，任务队列最多支持65536个请求的线程池。如果任务队列过载，Nginx将输出如下错误日志并拒绝请求：

如果出现上面的错误，说明线程池的负载很高，这是可以通过添加线程数来解决这个问题。当达到机器的最高处理能力之后，增加线程数并不能改善这个问题。

一切从“源”开始

下面主要通过剖析Nginx的源码来了解线程池机制实现原理。现在先来了解Nginx线程池的两个重要数据结构ngx_thread_pool_t和ngx_thread_task_t。

ngx_thread_pool_t结构体

下面解释下每个字段的用途：

mtx: 互斥锁，用于锁定任务队列，避免竞争状态。
queue: 任务队列。
waiting: 有多少个任务正在等待处理。
cond: 用于通知线程池有任务需要处理。
name: 线程池名称。
threads: 线程池由多少个线程组成（线程数）。
max_queue: 线程池最大能处理的任务数。

ngx_thread_task_t结构体

下面解释下每个字段的用途：

mtx: 互斥锁，用于锁定任务队列，避免竞争状态。
queue: 任务队列。
waiting: 有多少个任务正在等待处理。
cond: 用于通知线程池有任务需要处理。
name: 线程池名称。
threads: 线程池由多少个线程组成（线程数）。
max_queue: 线程池最大能处理的任务数。

【文章福利】小编推荐自己的Linux内核技术交流群:【749907784】整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面，有需要的可以自行添加哦！！！（含视频教程、电子书、实战项目及代码)

ngx_thread_task_t结构体

下面解释下每个字段的用途：

next: 指向下一个任务。
id: 任务ID。
ctx: 任务的上下文。
handler: 处理任务的函数句柄。
event: 跟任务关联的事件对象（当线程池处理成任务之后将会由主线程调用event对象的handler回调函数）。

线程池初始化

下面介绍下线程池的初始化过程。

在Nginx启动的时候，首先会调用ngx_thread_pool_init_worker()函数来初始化线程池。ngx_thread_pool_init_worker()函数最终会调用ngx_thread_pool_init()，源码如下：

ngx_thread_pool_init()最终调用pthread_create()函数创建线程池中的工作线程，工作线程会从ngx_thread_pool_cycle()函数开始执行。

ngx_thread_pool_cycle()函数源码如下：

ngx_thread_pool_cycle()函数的主要工作是从待处理的任务队列中获取一个任务，然后调用任务对象的handler()函数处理任务，完成后把任务放置到完成队列中，并通过ngx_notify()通知主线程。

添加任务到任务队列

通过上面的分析，我们知道了线程池是怎么从任务队列获取任务并处理。但任务队列的任务从哪里来的呢？因为Nginx的使命是处理客户端请求，所以可以知道任务是通过客户端请求产生的。也就是说，任务是主线程创建的（主线程负责处理客户端请求）。

主线程通过ngx_thread_task_post()函数向任务队列中添加一个任务，代码如下：

ngx_thread_task_post()函数首先调用ngx_thread_cond_signal()通知线程池的线程有任务需要处理，然后把任务添加到任务队列中。可能有人会问，先通知线程池在添加任务到任务队列中会不会有顺序问题。其实这样做是没问题的，这是因为只要主线程不调用ngx_thread_mutex_unlock()把互斥锁解开，线程池中的工作线程是不会从ngx_thread_cond_wait()返回的。

收尾工作

当线程池把任务处理完后会把其放置到完成队列中（ngx_thread_pool_done），然后调用ngx_notify()通知主线程有任务完成了。主线程收到通知后，会在事件模块中进行收尾工作：调用task.event.handler()。task.event.handler由任务创建者设置，例如在ngx_http_copy_filter模块的ngx_http_copy_thread_handler()函数：

task.event.handler被设置为ngx_http_copy_thread_event_handler，就是说当任务处理完成后，主线程将会调用ngx_http_copy_thread_event_handler来进行收尾工作。

哪些操作会使用线程池

那么哪些操作会使用线程池去处理。一般来说，磁盘IO会使用线程池来处理。在ngx_http_copy_filter模块中，会调用ngx_thread_read()读取文件的内容（当启用了线程池时），而ngx_thread_read()会把读取文件内容的操作让线程池去处理。ngx_thread_read()代码如下：

从上面的代码看到，task的handler被设置为ngx_thread_read_handler，也就是说在线程池中将会调用ngx_thread_read_handler()去读取文件内容。而file->thread_handler()将会调用ngx_thread_task_post()，前面已经分析过，ngx_thread_task_post()会把任务添加到任务队列中。

图解

最后用一张图来解释Nginx线程池机制的原理吧。

原文作者：Linux内核那些事

标签：

一文浅析Nginx线程池！

启用线程池功能

一切从“源”开始

ngx_thread_pool_t结构体

ngx_thread_task_t结构体

ngx_thread_task_t结构体

线程池初始化

添加任务到任务队列

收尾工作

哪些操作会使用线程池

图解