高级操作系统——进程管理

编程

一、进程描述符

进程控制块PCB:是OS控制进程运行用的数据结构,是一个task_struct结构体。

PCB包括:进程标识信息(进程标识符PID等)、执行现场信息(CPU现场,进程切换时需要保存现场信息)、进程映像信息(进程地址空间,即进程在运行时代码、数据、栈放在什么位置,方便OS对地址空间进行管理)(现场与地址空间比较重要)、进程资源信息、信号信息。

对PCB,说其中几个重要的字段:

mm_struct:有一个成员mm,标明了进程的地址空间;

thread:记录了进程的现场,最后一个字段;

thread_info在4.4.6版本中改成了stack,包括内核栈(即进程进入内核工作时需要的栈和用户栈是分开的)和一些需要快速访问的数据。

 

 

在4.4.6版本中,stack占用了两个页面,即8k,大部分是放内核栈的,低端约10k存放快速访问的信息。CPU若想访问当前进程的快速访问数据的话,只需要拿到当前的栈指针,即ESP寄存器的值,可以推算出数据所在的位置来,因此在查找他的地址的时候,访问速度可以很快。这部分数据可以看作是进程描述符的一部分,在空间上不是连续的,但相互之间有指针,可以相互找得到。

 

 

进程状态转换图,可自行搜索。

在4.4.6中,增加了被跟踪和僵死撤销状态。

进程描述符是管理进程的重要数据结构,故他的组织方式非常重要。0号进程的描述符是由init_task这个变量所存储的。从他出发,所有进程描述符构成了双向链表。task_struct中包含一个成员,叫tasts,tasks类型是list_head类型,tasts本身是嵌入在进程描述符里面的,知道tasks的地址,只要送减去620就能得到进程描述符的首地址。在Linux中有很多这样的技巧,即通过嵌入的地址,反推结构体的地址,进而找到结构体的其他成员。

 

 

进程与线程关系

多个线程构成线程组,共享内存,不共享栈。

一个会话对应一个终端,在终端中敲一个命令相当于创建了一个进程组来执行。

下面进行演示,建立一个文件命名为0.gdb,文件内容如下,直接运行

1 target remote localhost:1234

2 dir ~/aos/lab/busybox

3 add-symbol-file ~/aos/lab/busybox/busybox_unstripped 0x8048400

4 display $lx_current().pid

5 display $lx_current().comm

6b start_kernel

7b ls_main

8 c

 

 

执行含有下列代码的文件

 1#include <stdio.h>

2#include <stdlib.h>

3#include <pthread.h>

4

5void loop(){

6while(1);

7}

8

9 void *p1(){

10 printf("thread-1 starting

");

11 loop();

12}

13

14 void *p2(){

15 printf("thread-2 starting

");

16 loop();

17}

18

19void main(){

20 int pid1, pid2;

21 pthread_t t1,t2;

22 void *thread_result;

23

24 printf("main starting

");

25

26if (!(pid1 = fork())){

27 printf("child-1 starting

");

28 loop();

29 exit(0);

30 }

31

32if (!(pid2 = fork())){

33 printf("child-2 starting

");

34 loop();

35 exit(0);

36 }

37

38 pthread_create(&t1, NULL, p1, NULL);

39 pthread_create(&t2, NULL, p2, NULL);

40

41 pthread_join(t1, &thread_result);

42 pthread_join(t2, &thread_result);

43

44 int status;

45 waitpid(pid1, &status, 0);

46 waitpid(pid2, &status, 0);

47 printf("main exiting

");

48 exit(0);

49 }

 可以看到do-fork可执行文件创建了三个进程,976、977、978

 

 

 

979、980是新创建的两个线程

 

 再执行一次,可以看到后台运行了两个

 

 新创建的三个进程是刚创建的

 

 fg %+序号将指定的进程放到前台,ctrl+z放到后台

 

 

用以下三条命令依次查看线程组、进程组和会话的leader

命令的意思是根据进程的描述符,找到线程组leader的描述符,里面对应的字段就是要显示的ID

p $lx_task_by_pid(977).group_leader->pids[0].pid->numbers.nr

p $lx_task_by_pid(977).group_leader->pids[1].pid->numbers.nr

p $lx_task_by_pid(977).group_leader->pids[2].pid->numbers.nr

987和988是984创建的,他们处于同一个线程组,leader是976

 

二、进程调度算法

每个进程属于某一个调度器类,每个调度器类都有一个进程队列,不同的队列有不同的调度算法。

先调度硬实时的,软实时次之,普通进程最后。

普通进程使用CFS(完全公平)调度算法:

虚拟时钟,调度器总是选时钟最小的那个进程来执行。

优先级高的进程时钟增长得慢。

所有可运行的进程被放在一个红黑树中。

 

下面进行演示:

再次运行0.gdb,在终端输入ls,使其被捕获

 

 

 

建立文件demo-2-2.gdb,内容如下

 1break __schedule//进程调度的时候执行这个函数

2

3break __switch_to//调度时如果切换进程就会调用这个函数

4 commands

5 printf "next_p->pid: %d

", next_p->pid

6 printf "next_p->se.vruntime: "

7 print next_p->se.vruntime

8end

9

10break enqueue_task_fair//如果有新进程要进入到CFS队列时,执行这个函数

11 commands

12 printf "p->pid: %d

", p->pid

13 printf "p->se.vruntime: "

14 print p->se.vruntime

15end

16

17 display $lx_current().state//显示当前进程的状态

18 display $lx_current().se.vruntime

19 display $lx_per_cpu("runqueues").nr_running//CPU里面有多少个进程在运行

20

21 display ((struct sched_entity *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x8))->vruntime//CFS队列里最左边的节点,即虚拟时钟最小的信息

22 display ((struct task_struct *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x4c))->pid

 

 

  由上图可以看到,当前正在运行的是975号进程,当前的虚拟时钟可以从runtime那里看到,state=0表示其当前的状态是就绪的或正在运行,树最左边目前还没有进程。由于enqueue_task_fair函数的作用是往进程队列里面加入新进程,现在已经有一个,可以看到,要加的是7号进程,下面一行的虚拟时钟是个负值,现在还暂时看不到,继续执行。

 

 可以看到7号进程的虚拟时钟小于975号的,下次如果要调度,应该选7号。即将创建的是3号进程。

 

 由上图,975号进程的虚拟时钟增加了,在这两个断点时间,存在中断,这才导致了时钟的增加。运行有一定的随机性,虚拟机在虚拟的时候有一定的随机性。继续

 

 运行了切换函数,下一步要切换7号进程。继续

 

 7号时钟的进程的时钟比之前也增加了,需要注意当前正在运行的进程不放在树里面,但放在了队列里面,队列里面进程就是树里面的进程加当前进程。继续若干次

 

 下一步要创建的是4号进程。

 

除了普通进程有队列之外,其他的硬实时和软实时都有各自的队列。

红黑树的某个节点可以是另外一个树,共用一个时钟。

 

三、进程调度的时机

内核程序的入口,系统调用总控函数,异常处理函数,中断处理函数、内核线程主函数,用bt查看栈顶层,根据函数的种类来确定是哪种内核调用。

以上是 高级操作系统——进程管理 的全部内容, 来源链接: utcz.com/z/514483.html

回到顶部