Linux内核 | 进程管理 - 世至其美

1. 进程和线程

1.1 定义

有一段 可执行程序代码 。
有一段进程专用的 系统堆栈空间 和 系统空间堆栈 。
有 进程描述符 ，用于描述进程的相关信息。
有 独立的存储空间 ，也就是专有的用户空间，相应的又会有 用户空间堆栈 。

Linux系统对于线程实现非常特殊，他并不区分线程和进程，线程只是一种特殊的进程罢了。从上面四点要素来看，拥有前三点而缺第四点要素的就是线程，如果完全没有第四点的用户空间，那就是系统线程，如果是共享用户空间，那就是用户线程。

1.2 主要区别

进程作为分配资源的基本单位，而把线程作为独立运行和独立调度的基本单位，由于线程比进程更小，基本上不拥有系统资源，故对它的调度所付出的开销就会小得多，能更高效的提高系统多个程序间并发执行的程度。

进程和线程的主要差别在于它们是不同的操作系统资源管理方式。进程有独立的地址空间，一个进程崩溃后，在保护模式下不会对其它进程产生影响，而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量，但线程之间没有单独的地址空间，一个线程死掉就等于整个进程死掉，所以多进程的程序要比多线程的程序健壮，但在进程切换时，耗费资源较大，效率要差一些。但对于一些要求同时进行并且又要共享某些变量的并发操作，只能用线程，不能用进程。

总结：linux中，进程和线程唯一区别是有没有独立的地址空间。

2. 进程描述符及任务结构

32位机器上，大约有1.7KB，进程描述符完整描述一个正在执行的进程的所有信息。

任务队列（双向循环链表）

进程描述符struct task_struct（源代码 | linnux/sched.h | v5.4 ）

struct task_struct {
    volatile long state;    // -1为不可运行, 0为可运行, >0为已中断
    int lock_depth;        // 锁的深度
    unsigned int policy; // 调度策略：一般有FIFO，RR，CFS
    pid_t pid;   // 进程标识符,用来代表一个进程
    struct task_struct *parent;    // 父进程
    struct list_head children;    // 子进程
    struct list_head sibling;   // 兄弟进程
}

2.1 分配进程描述符

2.1.1 slab分配器

linux采用slab分配器分配task_struct结构

目的：对象复用和缓存着色。

slab分配器动态生成task_struct，只需在栈底（相对于向下增长的栈）或栈顶（相对于向上增长的栈）创建一个新结构struct thread_info。

2.1.2 进程描述符存放

PID最大值默认为32768（short int 短整形的最大值<linux/threads.h>）可通过修改/proc/sys/kernel/pid_max提高上限。

current宏查找当前正在运行进程的进程描述符。

x86系统中，current把栈指针后13个有效位屏蔽掉，用来计算出thread_info的偏移。

current_thread_info函数

movl $-8192,%eax
andl %esp,%eax

陷入内核执行

系统调用
异常处理程序

2.1.4 进程家族树

init进程

所有进程都是PID为1的init进程的后代
内核在系统启动的最后阶段启动init进程。

init进程目的：读取系统的初始化脚本，并执行其他的相关程序，最终完成系统启动的整个过程。

task_struct中记录父子进程

parent指针（指向父进程）
children子进程链表

3. 进程创建

其他操作系统提供产生（spawn）进程机制，首先在新地址空间里创建进程，读入可执行文件，最后开始执行。

UNIX将上述机制流程分成两步fork()和exec()

fork()拷贝当前进程创建一个子进程
exec()负责读取可执行文件，并将其入地址空间

4. 线程创建

线程创建和进程创建基本一致，通过调用clone()函数传递的参数标志，指明需要共享的资源。

创建线程

clone(CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND, 0);
// CLONE_VM : 地址空间
// CLONE_FS : 文件系统
// CLONE_FILES : 文件描述符
// CLONE_SIGHAND : 信号处理程序及被阻断的信号

创建进程（等同fork()函数）

clone(SIGCHLD,0);

创建进程（等同vfork()函数）

clone(CLONE_VFORK | CLONE_VM | SIGCHLD, 0)

4.1 内核线程

内核线程只在内核空间执行，从不切换到用户空间。

内核线程和普通进程的区别：内核线程没有独立的地址空间。（task_struct的mm指针被设置为NULL）

内核线程只能由其他内核线程创建，通过kthreadd内核线程衍生出所有新的内核线程。（kthreadd是所有内核线程的祖宗）

4.1.1 kthreadd内核线程

kthreadd内核线程是在内核初始化时被创建，循环执行kthreadd函数，它的作用是管理调度其它的内核线程。

kthreadd函数的作用是运行kthread_create_list全局链表中维护的 kthread 。可以调用kthread_create函数创建一个 kthread ，它会被加入到 kthread_create_list 链表中，同时kthread_create函数会唤醒kthreadd_task。kthreadd在执行kthread会调用老的接口，kthreadd内核线程在运行kthread时，会调用老接口kernel_thread，它会运行一个名为“kthread”的内核线程，去运行创建kthread，被执行的kthread会从kthread_create_list链表中删除，并且kthreadd会不断地调用scheduler让出CPU，这个线程不能关闭。

创建内核线程，不运行

kthread_create函数（源代码 | linux/kthread.h | v5.4 ）是通过clone()系统调用，创建一个内核线程，但新创建的线程处于不可运行状态。

struct task_struct * kthread_create(threadfn, data, namefmt, arg...)

创建内核线程，并运行

kthread_run函数（源代码 | linux/kthread.h | v5.4 ），通过调用kthread_create函数创建内核线程，然后调用wake_up_process()进行唤醒。

#define kthread_run(threadfn, data, namefmt, ...)               \
({                                       \