【linux】当执行fork()函数的时候，到底发生了什么

Z时代
2024-01-10
分类：技术分享

fork函数是unix系统中实现多进程的一个基本函数，它看起来非常特殊。首先它创建了一个或多个自身进程的自进程，并且继承了当前进程的上下文资源。

这一个过程具体是怎么完成的？它是如何做到多个进程同时监听一个资源的，比如有一个tcp连接进来，那么到底应该是哪个子进程去响应这个请求呢？如果子进程再次fork自己会发生什么，可以不停这样下去吗？

回答

先说一下fork，fork会生成一个和当前进程相同的副本，称为子进程。原进程的所有资源都以适当的方式复制到子进程，因此该系统调用之后，原来的进程就有了两个独立的实例。这两个实例的联系包括：同一组打开文件、同样的工作目录、内存中同样的数据（两个进程各有一份副本）。当然Linux使用了copy on write，也就是说只有新的进程对内存页执行write操作的时候才会复制内存页面。

具体如何完成：

首先要了解一下task_struct这个数据结构。Linux内核很多涉及进程的部分都围绕这个数据结构（数据结构定义在include/sched.h中，有兴趣去看一下）。数据结构里面的成员非常多，下面会按照几个部分介绍一下。

状态和执行信息，如待决信号、使用的二进制格式（和其他系统二进制格式的任何仿真信息）、进程ID号（pid）、到父进程及其他有关进程的指针、优先级和程序执行有关的时间信息（例如CPU时间）。

有关已经分配的虚拟内存的信息。

进程身份凭据，如用户ID、组ID以及权限等。可使用系统调用查询（或修改）这些数据。

使用的文件包含程序代码的二进制文件，以及进程所处理的所有文件的文件系统信息，这些都必须保存下来。

线程信息记录该进程特定于CPU的运行时间数据（该结构的其余字段与所使用的硬件无关）。

在与其他应用程序协作时所需的进程间通信有关的信息。

该进程所用的信号处理程序，用于响应到来的信号。

fork之后，操作系统会copy当前进程的task_struct机构体，除了id号不一样之外，其余完全一样。fork之后如果没有调用exec()，那么仅仅只是生成多个当前的进程，提升并发的能力，比如说nginx。nginx的进程都是master进程fork出来的，所以他们有相同的监听句柄。至于是哪个worker进程去响应，nginx有自己的竞争方式。

最后关于子进程fork自己会发生什么。请看下图：

【linux】当执行fork()函数的时候，到底发生了什么

linux启动时候只有一个init进程，剩下的题主自行理解。

fork并不算是基本函数，它调用的clone，而clone函数有参数可以进行更灵活的配置。

其实主要就这三个区别：
1.fork之后父子进程将共享代码文本段，但是各自拥有不同的栈段、数据段及堆段拷贝。子进程的栈、数据从fork一瞬间开始是对于父进程的完全拷贝、每个进程可以更改自己的数据，而不要担心相互影响！
2.fork之后父子进程同时开始从fork点向下执行代码，具体fork之后CPU会调度到谁？不一定！
3.执行fork之后，子进程将拷贝父进程的文件描述符副本，指向同一个文件句柄（包含了当前文件读写的偏移量等信息）。

《UNIX系统编程》第24章进程的创建讲的也非常清楚，这本书也非常推荐读，时间驱动也讲的很好。
https://www.cnblogs.com/zhaoy... 这篇文章是一个朋友写的，对fork的理解也很到位

《UNIX系统编程》《The Linux Programming Interface》的pdf版本在他的博客也下载

以上是【linux】当执行fork()函数的时候，到底发生了什么的全部内容，来源链接： utcz.com/a/83647.html