【linux】当执行fork()函数的时候,到底发生了什么
fork函数是unix系统中实现多进程的一个基本函数,它看起来非常特殊。首先它创建了一个或多个自身进程的自进程,并且继承了当前进程的上下文资源。
这一个过程具体是怎么完成的?它是如何做到多个进程同时监听一个资源的,比如有一个tcp连接进来,那么到底应该是哪个子进程去响应这个请求呢?如果子进程再次fork自己会发生什么,可以不停这样下去吗?
回答
先说一下fork,fork会生成一个和当前进程相同的副本,称为子进程。原进程的所有资源都以适当的方式复制到子进程,因此该系统调用之后,原来的进程就有了两个独立的实例。这两个实例的联系包括:同一组打开文件、同样的工作目录、内存中同样的数据(两个进程各有一份副本)。当然Linux使用了copy on write,也就是说只有新的进程对内存页执行write操作的时候才会复制内存页面。
具体如何完成:
首先要了解一下task_struct
这个数据结构。Linux内核很多涉及进程的部分都围绕这个数据结构(数据结构定义在include/sched.h中,有兴趣去看一下)。数据结构里面的成员非常多,下面会按照几个部分介绍一下。
- 状态和执行信息,如待决信号、使用的二进制格式(和其他系统二进制格式的任何仿真信息)、进程ID号(pid)、到父进程及其他有关进程的指针、优先级和程序执行有关的时间信息(例如CPU时间)。
- 有关已经分配的虚拟内存的信息。
- 进程身份凭据,如用户ID、组ID以及权限等。可使用系统调用查询(或修改)这些数据。
- 使用的文件包含程序代码的二进制文件,以及进程所处理的所有文件的文件系统信息,这些都必须保存下来。
- 线程信息记录该进程特定于CPU的运行时间数据(该结构的其余字段与所使用的硬件无关)。
- 在与其他应用程序协作时所需的进程间通信有关的信息。
- 该进程所用的信号处理程序,用于响应到来的信号。
fork之后,操作系统会copy当前进程的task_struct
机构体,除了id号不一样之外,其余完全一样。fork之后如果没有调用exec()
,那么仅仅只是生成多个当前的进程,提升并发的能力,比如说nginx。nginx的进程都是master进程fork
出来的,所以他们有相同的监听句柄。至于是哪个worker进程去响应,nginx有自己的竞争方式。
最后关于子进程fork自己会发生什么。请看下图:
linux启动时候只有一个init进程,剩下的题主自行理解。
fork并不算是基本函数,它调用的clone,而clone函数有参数可以进行更灵活的配置。
其实主要就这三个区别:
1.fork之后父子进程将共享代码文本段,但是各自拥有不同的栈段、数据段及堆段拷贝。子进程的栈、数据从fork一瞬间开始是对于父进程的完全拷贝、每个进程可以更改自己的数据,而不要担心相互影响!
2.fork之后父子进程同时开始从fork点向下执行代码,具体fork之后CPU会调度到谁?不一定!
3.执行fork之后,子进程将拷贝父进程的文件描述符副本,指向同一个文件句柄(包含了当前文件读写的偏移量等信息)。
《UNIX系统编程》第24章进程的创建讲的也非常清楚,这本书也非常推荐读,时间驱动也讲的很好。
https://www.cnblogs.com/zhaoy... 这篇文章是一个朋友写的,对fork的理解也很到位
《UNIX系统编程》《The Linux Programming Interface》的pdf版本在他的博客也下载
以上是 【linux】当执行fork()函数的时候,到底发生了什么 的全部内容, 来源链接: utcz.com/a/83647.html