varch/doc/list.md

## 介绍

list容器是对C语言的链表进行通用化的封装，list支持任意数据类型（int，char，struct等等），封装了链表常用的增删改查方法（这里的查是随机访问），可以直接当作普通的容器来使用，也可以在此基础上二次封装。

## 接口

### 创建和删除list对象
```c
list_t list_create(int dsize);
void list_delete(list_t list);
#define list(type) // 为了更简便的使用，对list_create套一层宏定义
#define _list(list) // 对list_delete套一层宏定义，并在list删除后置为空
```
其中**list_t**为list的结构体，创建方法则会返回一个空的list对象，创建失败则返回NULL，其中`dsize`传入数据的大小。删除方法则是删除传入的list对象。创建方法和删除应该成对使用，创建出来在结束使用应该删除掉。
```c
void test(void)
{
    list_t list = list(int); // 定义并创建一个int型的list
    _list(list); // 成对使用，用完即删除
}
```

### list的插入和移除
```c
void* list_insert(list_t list, int index, void* data);
int list_erase(list_t list, int index, int num);
```
list的巨大优势就是其插入和移除的效率，不用数据移位只需修改链表指向。
插入的方法是在指定索引的位置插入指定地址的数据（在其中，data传入NULL时则只是开辟空间，不进行赋值），插入成功后返回插入后的数据的地址，插入失败则是返回NULL。而移除则是移除指定索引的num个数据，返回实际移除了的个数。
```c
void test(void)
{
    list_t list = list(int);  // 定义并创建一个int型的list
    int i = 0;
    void *data;

    /* 插入数据 */
    for (i = 0; i < 6; i++)
    {
        data = list_push_back(list, &i); // 尾插 0~5
        if (data) printf("insert %d\r\n", *(int*)data); // 插入后打印出来
    }

    _list(list); // 成对使用，用完即删除
}
```
结果：
```
insert 0
insert 1
insert 2
insert 3
insert 4
insert 5
```
通过插入和移除方法还延伸出了，以下的宏定义方法
```c
#define list_push_front(list, data)
#define list_push_back(list, data)
#define list_pop_front(list)
#define list_pop_back(list)
#define list_clear(list)
```

### list数据的读写
```c
void* list_data(list_t list, int index);
#define list_at(list, type, i)
```
`list_data`方法就是根据索引来获取数据的地址，返回的则是指定的数据的地址，NULL则是失败。而`list_at`则是在`list_data`的基础上加多类型。
list的随机访问和连续地址的数组或者vector不太一样，数组是可以直接定位到指定索引的地址，而链表要进行随机访问，就得从表头开始通过链接指针一步步的指向到指定位置，而在此过程就会花费比较多的时间去一步步指向。varch的list增加了内置迭代器，可以记录当前访问的位置，当下次再访后面的位置时，就不必再从链表头开始指向了，而从当前位置开始指向到指定位置，如此有着很高的正向遍历效率。
```c
void test(void)
{
    list_t list = list(int);
    int i = 0;

    for (i = 0; i < 6; i++)
    {
        list_push_back(list, &i);
    }

    for (i = 0; i < 6; i++) // 正向遍历
    {
        printf("list[%d] = %d\r\n", i, list_at(list, int, i));
    }

    _list(list);
}
```
结果：
```
list[0] = 0
list[1] = 1
list[2] = 2
list[3] = 3
list[4] = 4
list[5] = 5
```

### list的大小和和数据大小
```c
int list_size(list_t list);
int list_dsize(list_t list);
```
list的`size`很好理解，也就是像数组那样的大小，`dsize`也就是创建时候传入的数据的大小。
```c
void test(void)
{
    list_t list = list(int);
    int i = 5;
    while (i--) list_push_back(list, NULL); // 尾插5个空数据，也就是只开辟空间，但不赋值
    printf("size = %d, data size = %d\r\n", list_size(list), list_dsize(list));
    _list(list);
}
```
结果：
```
size = 5, data size = 4
```

## 参考例子

```c
typedef struct {
    char *name;
    int age;
} STUDENT;

void test(void)
{
    list_t list_int = list(int); // 定义并创建int型list
    list_t list_student = list(STUDENT); // 定义并创建结构体STUDENT型list
    char *name[3] = { // 定义三个名字
        "ZhangSan",
        "LiSi",
        "WangWu",
    };
    int i = 0;

    for (i = 0; i < 3; i++)
    {
        STUDENT s = {name[i], 18 + i};
        list_push_back(list_student, &s); // 插入三个STUDENT
        list_push_back(list_int, &i); // 依次插入 0 1 2
    }

    i= 1024; list_insert(list_int, 1, &i); // 在索引1的位置插入1024
    for (i = 0; i < list_size(list_int); i++)
    {
        printf("list_int[%d] = %d\r\n", i, list_at(list_int, int, i)); // 正向遍历
    }

    for (i = 0; i < list_size(list_student); i++)
    {
        printf("list_student[%d]: name=%s, age=%d\r\n", i, list_at(list_student, STUDENT, i).name, list_at(list_student, STUDENT, i).age);
    }

    // 结束使用该list后就删除
    _list(list_int);
    _list(list_student);
}
```
结果：
```
list_int[0] = 0
list_int[1] = 1024
list_int[2] = 1
list_int[3] = 2
list_student[0]: name=ZhangSan, age=18
list_student[1]: name=LiSi, age=19
list_student[2]: name=WangWu, age=20
```
例子里面使用函数很多没有对返回值进行判断，实际应用需对返回值进行判断。

## 源码解析

### list结构体

list容器的所有结构体都是隐式的，也就是不能直接访问到结构体成员的，这样子的方式保证了模块的独立与安全，防止外部调用修改结构体的成员导致list存储结构的破坏。所以list解析器只留了唯一一个list的声明在头文件，然后结构体的定义都在源文件。只能使用list容器提供的方法对list对象进行操作。
list类型声明
```c
typedef struct LIST *list_t;
```
使用时候，只是用`list_t`即可。

```c
/* type of list */
typedef struct LIST
{
	NODE* base;					/* address of base node */
	NODE* iterator;				/* iterator of list */
	int size;					/* size of list */
	int dsize;					/* data size */
	int index;					/* index of iterator */
} LIST;
```
`LIST`结构体中包含了5个成员，base（链式结构的基结点，也就是表头），iterator（当前指向的结点），size（list的大小，也就是list的长度），dsize（每个数据的大小），index（iterator所在的索引）。
```c
/* type of list node */
typedef struct _NODE_
{
	struct _NODE_ *next; /* next node */
} NODE;
#define data(node) ((node)+1) /* data of node */
```
在`NODE`结构体当中，显式的成员也就只有next（指向下一个结点，形成链式结构），那数据存在哪里呢？这是varch的list的一个兼容所有数据结构的一个特性，因为每种数据类型的大小不太一致，如果规定结构体里面跟着的固定长度，那么就兼容不了不同长度的数据类型。然而，在这个`NODE`结构体当中，把实际的数据分配了在结构体末尾的空间，具体多长就由`LIST`的`dsize`来决定，然后把这个`data`成员称为隐式成员（不直接在结构体中体现）。那么要获取`data`成员的地址也很简单，就是在结点地址`+1`偏移`NODE`的size即可，如此，可以减少再一级指针指向data的指针空间了。
当创建`int`型list时候，`NODE`的数据可以理解为如下了：
```c
typedef struct _NODE_
{
	struct _NODE_ *next; /* next node */
    char data[sizeof[int]];
} NODE;
```

### 迭代器的随机访问

前面说到`list`内置了迭代器，那这个迭代器是怎么回事呢？
看下源码：
```c
static NODE* list_node(list_t list, int index) // 传入list和索引
{
	if (!list) return NULL;
	if (index < 0 || index >= list->size) return NULL;  // 判断索引有没有越界

    /*
    这个一步是重置迭代，也就是将迭代器定位回到链表首位
    满足其中3个条件之一都重置迭代器
    1、因为单向链表，不能反向指向，所以目标索引小于迭代器的索引时候，就要重置，然后从链表首位迭代到指定索引
    2、迭代器指针为空时，为空则没有指向具体的结点，当然得重置迭代，所以外部想重置迭代器，只需将迭代器指向置NULL即可
    3、目标索引index为0时，主动获取第0位，也就是首位
    */
	if (index < list->index || !list->iterator || index == 0)
	{
		list->index = 0;
		list->iterator = list->base;
	}

    /*
    循环将迭代器迭代到指定的索引位置
    单向链表索引正向递增，所以正向遍历时候时间复杂度O(n)，反向遍历还是O(n^2)
    */
	while (list->iterator && list->index < index)
	{
		list->iterator = list->iterator->next;
		list->index++;
	}

    /* 返回迭代器指向的结点 */
	return list->iterator;
}
```
在varch的list提供的所有api中，只要是传入索引的，都会调用上述访问进行链表的定位，所以在同一个索引操作时，是不需要重新进行指向定位的，而可以快速返回。