Linux进程在内核眼中是什么样子的?

良许Linux

共 4628字,需浏览 10分钟

 · 2020-10-06


点击「阅读原文」查看良许原创精品视频。


本篇算是进程管理的的揭幕篇,简单介绍一个进程在内核眼里的来龙去脉,为接下来的进程创建,进程调度,进程管理等篇章做好学习准备。


从程序到进程再到内核

啥是程序,啥是进程,一张图可以给我们解释:



我们转换镜头,站在内核OS的视角看什么是程序,什么是进程。
ELF可执行文件送给内核后,OS是如何看待它的呢?换句话讲,内核OS眼里只有进程:





通过 top 命令我们可以看到 linux 的各种进程(即上右图)。


内核通过 task_struct 描述进程

用命令 pstree 可以让内核以树形的结构把进程之间的关系列出来,如下图:





这是进程在内核中的结构形式,那么内核是如何来以树形结构管理描述这些进程的呢?用来描述进程的数据结构,可以理解为进程的属性。比如进程的状态、进程的标识(PID)等,都被封装在了进程描述符这个数据结构中,一起来看下今天的主角—— task_struct 结构体。
struct task_struct {volatile long state;  //说明了该进程是否可以执行,还是可中断等信息 -1 unrunnable, 0 runnable, >0 stoppedunsigned long flags;  //Flage 是进程号,在调用fork()时给出int sigpending;    //进程上是否有待处理的信号mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同                        //0-0xBFFFFFFF for user-thead                        //0-0xFFFFFFFF for kernel-thread//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度volatile long need_resched;int lock_depth;  //锁深度long nice;       //进程的基本时间片//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHERunsigned long policy;struct mm_struct *mm; //进程内存管理信息int processor;//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新unsigned long cpus_runnable, cpus_allowed;struct list_head run_list; //指向运行队列的指针unsigned long sleep_time;  //进程的睡眠时间//用于将系统中所有的进程连成一个双向循环链表, 其根是init_taskstruct task_struct *next_task, *prev_task;struct mm_struct *active_mm;struct list_head local_pages;       //指向本地页面      unsigned int allocation_order, nr_local_pages;struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式int exit_code, exit_signal;int pdeath_signal;     //父进程终止时向子进程发送的信号unsigned long personality;//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序int did_exec:1; pid_t pid;    //进程标识符,用来代表一个进程pid_t pgrp;   //进程组标识,表示进程所属的进程组pid_t tty_old_pgrp;  //进程控制终端所在的组标识pid_t session;  //进程的会话标识pid_t tgid;int leader;     //表示进程是否为会话主管struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;struct list_head thread_group;   //线程链表struct task_struct *pidhash_next; //用于将进程链入HASH表struct task_struct **pidhash_pprev;wait_queue_head_t wait_chldexit;  //供wait4()使用struct completion *vfork_done;  //供vfork() 使用unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值struct timer_list real_timer;   //指向实时定时器的指针struct tms times;      //记录进程消耗的时间unsigned long start_time;  //进程创建的时间//记录进程在每个CPU上所消耗的用户态时间和核心态时间long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; int swappable:1; //表示进程的虚拟地址空间是否允许换出int ngroups; //记录进程在多少个用户组中gid_t groups[NGROUPS]; //记录进程所在的组//进程的权能,分别是有效位集合,继承位集合,允许位集合kernel_cap_t cap_effective, cap_inheritable, cap_permitted;int keep_capabilities:1;struct user_struct *user;struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息unsigned short used_math;   //是否使用FPUchar comm[16];   //进程正在运行的可执行文件名 //文件系统信息int link_count, total_link_count;//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空struct tty_struct *tty;unsigned int locks;//进程间通信信息struct sem_undo *semundo;  //进程在信号灯上的所有undo操作struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作//进程的CPU状态,切换时,要保存到停止进程的task_struct中struct thread_struct thread;  //文件系统信息struct fs_struct *fs;  //打开文件信息struct files_struct *files;  //信号处理函数spinlock_t sigmask_lock;struct signal_struct *sig; //信号处理函数sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位struct sigpending pending;  //进程上是否有待处理的信号......};
内核就是通过list_head链表把各个进程关系以树形结构管理起来的。

task_struct 结构体内容太多,这里只列出部分成员变量,感兴趣的读者可以去源码 include/linux/sched.h头文件查看。
task_struct 中的主要信息分类:


1. 标示符:描述本进程的唯一标识符,用来区别其他进程。

2. 状态:任务状态,退出代码,退出信号等 

3. 优先级:相对于其他进程的优先级 

4. 程序计数器:程序中即将被执行的下一条指令的地址 

5. 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针 

6. 上下文数据:进程执行时处理器的寄存器中的数据 

7. I/O状态信息:包括显示的I/O请求,分配的进程I/O设备和进程使用的文件列表 

8. 记账信息:可能包括处理器时间总和,使用的时钟总和,时间限制,记帐号等


这些信息每类都可以单独开个章节去讲解,这里先简单描述下任务状态的转换,以后篇章再深入介绍各个分类。


任务状态转换

上面可以看到变量定义后面的注释,它说明变量内容<0是不运行的,=0是运行状态,>0是停止状态。
下面我们介绍几个常用的取值:






任务状态在不同情况下的状态转换如下:



图来源于https://www.lagou.com/lgeduarticle/96239.html



内核如何存放 task_struct 

我们知道一个进程所占的栈空间有用户栈和内核栈,用户栈的分布方式见之前的文章《C语言在ARM中函数调用时,栈是如何变化的?》。那么内核栈是如何存放进程描述符的呢?

内核栈对于应用程序是不可见的,因为它位于内核空间中。在应用程序执行过程中,如果发生异常、中断或系统调用的话,应用程序会被暂停,系统进入内核态,转去执行异常响应等代码,这个时候所使用的栈就是内核栈。





为了节省空间,linux把内核栈和紧挨着task_struct的thread_info放在一起,如上所示,thread_info中存放了进程/线程(内核不大区分进程与线程)的一些数据,其中包括指向task_struct结构的指针。数组stack即内核栈,stack占据8K/4K(依配置不同)空间。
union thread_union {#ifndef CONFIG_THREAD_INFO_IN_TASK  struct thread_info thread_info;#endif  unsigned long stack[THREAD_SIZE/sizeof(long)];};


最后

到这里应该已经了解了一个程序如何转换为进程,内核如何描述进程,又如何存储进程,当然还有很多关于进程的描述没有介绍,比如进程的调度,优先级,内存管理等等,这些会在以后的文章里单独分开详细介绍。但这些所有的信息都存储在今天的主角里——task_struct。

良许个人微信


添加良许个人微信即送3套程序员必读资料


→ 精选技术资料共享

→ 高手如云交流社群





本公众号全部博文已整理成一个目录,请在公众号里回复「m」获取!

推荐阅读:

Linux 常用监控指标总结

就是要让你搞懂Nginx,这篇就够了!

好玩、有趣的 Linux 命令学习神器 kmdr!


5T技术资源大放送!包括但不限于:C/C++,Linux,Python,Java,PHP,人工智能,单片机,树莓派,等等。在公众号内回复「1024」,即可免费获取!!


浏览 27
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报