3.2.3 ngx_list_t数据结构

ngx_list_t是Nginx封装的链表容器,它在Nginx中使用得很频繁,例如HTTP的头部就是用ngx_list_t来存储的。当然,C语言封装的链表没有C++或Java等面向对象语言那么容易理解。先看一下ngx_list_t相关成员的定义:


typedef struct ngx_list_part_s ngx_list_part_t;

struct ngx_list_part_s{

void*elts;

ngx_uint_t nelts;

ngx_list_part_t*next;

};

typedef struct{

ngx_list_part_t*last;

ngx_list_part_t part;

size_t size;

ngx_uint_t nalloc;

ngx_pool_t*pool;

}ngx_list_t;


ngx_list_t描述整个链表,而ngx_list_part_t只描述链表的一个元素。这里要注意的是,ngx_list_t不是一个单纯的链表,为了便于理解,我们姑且称它为存储数组的链表,什么意思呢?抽象地说,就是每个链表元素ngx_list_part_t又是一个数组,拥有连续的内存,它既依赖于ngx_list_t里的size和nalloc来表示数组的容量,同时又依靠每个ngx_list_part_t成员中的nelts来表示数组当前已使用了多少容量。因此,ngx_list_t是一个链表容器,而链表中的元素又是一个数组。事实上,ngx_list_part_t数组中的元素才是用户想要存储的东西,ngx_list_t链表能够容纳的元素数量由ngx_list_part_t数组元素的个数与每个数组所能容纳的元素相乘得到。

这样设计有什么好处呢?

❑链表中存储的元素是灵活的,它可以是任何一种数据结构。

❑链表元素需要占用的内存由ngx_list_t管理,它已经通过数组分配好了。

❑小块的内存使用链表访问效率是低下的,使用数组通过偏移量来直接访问内存则要高效得多。

下面详述每个成员的意义。

(1)ngx_list_t

❑part:链表的首个数组元素。

❑last:指向链表的最后一个数组元素。

❑size:前面讲过,链表中的每个ngx_list_part_t元素都是一个数组。因为数组存储的是某种类型的数据结构,且ngx_list_t是非常灵活的数据结构,所以它不会限制存储什么样的数据,只是通过size限制每一个数组元素的占用的空间大小,也就是用户要存储的一个数据所占用的字节数必须小于或等于size。

❑nalloc:链表的数组元素一旦分配后是不可更改的。nalloc表示每个ngx_list_part_t数组的容量,即最多可存储多少个数据。

❑pool:链表中管理内存分配的内存池对象。用户要存放的数据占用的内存都是由pool分配的,下文中会详细介绍。

(2)ngx_list_part_t

❑elts:指向数组的起始地址。

❑nelts:表示数组中已经使用了多少个元素。当然,nelts必须小于ngx_list_t结构体中的nalloc。

❑next:下一个链表元素ngx_list_part_t的地址。

事实上,ngx_list_t中的所有数据都是由ngx_pool_t类型的pool内存池分配的,它们通常都是连续的内存(在由一个pool内存池分配的情况下)。下面以图3-2为例来看一下ngx_list_t的内存分布情况。

3.2.3 ngx_list_t数据结构 - 图1

图 3-2 ngx_list_t的内存分布

图3-2中是由3个ngx_list_part_t数组元素组成的ngx_list_t链表可能拥有的一种内存分布结构,读者可以从这种较为常见的内存分布中看到ngx_list_t链表的用法。这里,pool内存池为其分配了连续的内存,最前端内存存储的是ngx_list_t结构中的成员,紧接着是第一个ngx_list_part_t结构占用的内存,然后是ngx_list_part_t结构指向的数组,它们一共占用size*nalloc字节,表示数组中拥有nalloc个大小为size的元素。其后面是第2个ngx_list_part_t结构以及它所指向的数组,依此类推。

对于链表,Nginx提供的接口包括:ngx_list_create接口用于创建新的链表,ngx_list_init接口用于初始化一个已有的链表,ngx_list_push接口用于添加新的元素,如下所示:


ngx_list_tngx_list_create(ngx_pool_tpool,ngx_uint_t n,size_t size);

static ngx_inline ngx_int_t

ngx_list_init(ngx_list_tlist,ngx_pool_tpool,ngx_uint_t n,size_t size);

voidngx_list_push(ngx_list_tlist);


调用ngx_list_create创建元素时,pool参数是内存池对象(参见3.7.2节),size是每个元素的大小,n是每个链表数组可容纳元素的个数(相当于ngx_list_t结构中的nalloc成员)。ngx_list_create返回新创建的链表地址,如果创建失败,则返回NULL空指针。ngx_list_create被调用后至少会创建一个数组(不会创建空链表),其中包含n个大小为size字节的连续内存块,也就是ngx_list_t结构中的part成员。

下面看一个简单的例子,我们首先建立一个链表,它存储的元素是ngx_str_t,其中每个链表数组中存储4个元素,代码如下所示:


ngx_list_t*testlist=ngx_list_create(r->pool,4,sizeof(ngx_str_t));

if(testlist==NULL){

return NGX_ERROR;

}


ngx_list_init的使用方法与ngx_list_create非常类似,需要注意的是,这时链表数据结构已经创建好了,若ngx_list_init返回NGX_OK,则表示初始化成功,若返回NGX_ERROR,则表示失败。

调用ngx_list_push表示添加新的元素,传入的参数是ngx_list_t链表。正常情况下,返回的是新分配的元素首地址。如果返回NULL空指针,则表示添加失败。在使用它时通常先调用ngx_list_push得到返回的元素地址,再对返回的地址进行赋值。例如:


ngx_str_t*str=ngx_list_push(testlist);

if(str==NULL){

return NGX_ERROR;

}

str->len=sizeof("Hello world");

str->value="Hello world";


遍历链表时Nginx没有提供相应的接口,实际上也不需要。我们可以用以下方法遍历链表中的元素:


//part用于指向链表中的每一个ngx_list_part_t数组

ngx_list_part_t*part=&testlist.part;

//根据链表中的数据类型,把数组里的elts转化为该类型使用

ngx_str_t*str=part->elts;

//i表示元素在链表的每个ngx_list_part_t数组里的序号

for(i=0;/void/;i++){

if(i>=part->nelts){

if(part->next==NULL){

//如果某个ngx_list_part_t数组的next指针为空,

//则说明已经遍历完链表

break;

}

//访问下一个ngx_list_part_t

part=part->next;

header=part->elts;

//将i序号置为0,准备重新访问下一个数组

i=0;

}

//这里可以很方便地取到当前遍历到的链表元素

printf("list element:%*s\n",str[i].len,str[i].data);

}