淺談Linux環(huán)境下并發(fā)編程中C語言fork()函數的使用
由fork創(chuàng)建的新進程被稱為子進程(child process)。fork函數被調用一次,但返回兩次。子進程的返回值是0,而父進程的返回值則是新進程的進程ID。將子進程ID返回給父進程的理由是:因為一個進程的子進程可以有多個,并且沒有一個函數使一個進程可以獲得其所有子進程的進程ID。fork使子進程得到返回值0的理由是:一個進程只會有一個父進程,所以子進程總是可以調用getpid以獲得其父進程的進程ID。
使fork失敗的兩個主要原因是:系統中已經有了太多的進程,或者該實際用戶ID的進程總數超過了系統限制。
fork有下面兩種用法:
(1)一個父進程希望復制自己,使父、子進程同時執(zhí)行不同的代碼段。這在網絡服務進程中是常見的--父進程等待客戶端的服務請求。當這種請求到達時,父進程調用fork,使子進程處理此請求。父進程則繼續(xù)等待下一個服務請求到達。
(2)一個進程要執(zhí)行一個不同的程序。這對shell是常見的情況。子進程從fork返回后立即調用exec。
歸結起來說就是是實現多線程。C語言多線程實現需要自己控制來實現,這個比Java要復雜。
注意:fork確實創(chuàng)建了一個子進程并完全復制父進程,但是子進程是從fork后面那個指令開始執(zhí)行的。對于原因也很合乎邏輯,如果子進程也從main開頭到尾執(zhí)行所有指令,那么它執(zhí)行到fork指令時也必定會創(chuàng)建一個子子進程,子子孫孫無窮盡也,如此下去,這個小小的程序就可以創(chuàng)建無數多個進程可以把你的電腦搞癱瘓,所以fork作者肯定不會這么做。
原來剛剛開始做Linux下面的多進程編程的時候,對于下面這段代碼感到很奇怪,
#include<unistd.h> #include<stdio.h> #include<string.h> #include<stdlib.h> #include<stdarg.h> #include<errno.h> #define LEN 2 void err_exit(char *fmt,...); int main(int argc,char *argv[]) { pid_t pid; int loop; for(loop=0;loop<LEN;loop++) { if((pid=fork()) < 0) err_exit("[fork:%d]: ",loop); else if(pid == 0) { printf("Child process\n"); } else { sleep(5); } } return 0; }
為什么這段程序會創(chuàng)建3個子進程,而不是兩個,為什么在第20行后面加上一個return 0;就創(chuàng)建的又是兩個子進程了?原來一直搞不明白,后來了解了C語言程序的存儲空間布局以及在fork之后父子進程是共享正文段(代碼段CS)之后才明白這其中的緣由!具體原理是啥,且容我慢慢道來!
首先得明白一個東西就是C程序的存儲空間布局,如下圖所示:
當一個C程序執(zhí)行之后,它會被加載到內存之中,它在內存中的布局如上圖,分為這么幾個部分,環(huán)境變量和命令行參數、棧、堆、數據段(初始化和未初始化的)、正文段,下面挨個來說明這幾段分別代表了什么:
環(huán)境變量和命令行參數:這些指的就是Unix系統上的環(huán)境變量(比如$PATH)和傳給main函數的參數(argv指針所指向的內容)。
數據段:這個是指在C程序中定義的全局變量,如果沒有初始化,那么就存放在未初始化的數據段中,程序運行時統一由exec賦值為0。否則就存放在初始化的數據段中,程序運行時由exec統一從程序文件中讀取。(了解匯編的朋友們想必知道匯編語言中的數據段DS,這和匯編中的數據段其實是一個東西)。
堆:這一部分主要用來動態(tài)分配空間。比如在C語言中用malloc申請的空間就是在這個區(qū)域申請的。
正文段:C語言代碼并不是直接執(zhí)行的,而是被編譯成了機器指令才能夠在電腦上執(zhí)行,最終生成的機器指令就是存放在這個區(qū)域(匯編中的代碼段CS指的就是這片區(qū)域)。
棧:個人感覺這是C程序內存布局最關鍵的部分了。這個部分主要用來做函數調用。具體而言怎么說呢,程序剛開始棧中只有main這一個函數的內容(即main的棧幀),如果main函數要調用func函數,那么func函數的返回地址(main函數的地址),func函數的參數,func函數中定義的局部變量,還有func函數的返回值等等這些都會被壓入棧中,這時棧中就多了func函數的內容(func的棧幀)。然后func函數運行完了之后再來彈棧,把它原來壓的內容去掉(即清除掉func棧幀),此時棧中又只剩下了main的棧幀。(這片區(qū)域就是匯編中的棧段SS)
OK,這就是C程序的存儲器布局。這里我聯想到另外一點,就是全局變量和靜態(tài)變量是存儲在數據段中的,而局部變量是存儲在棧中的,棧中數據在函數調用完之后一彈棧就沒了,這就是為什么全局變量的生存周期比局部變量的生存周期要長的原因。
了解了C程序在存儲器的布局之后,我們再來了解fork的內存復制機制,關于這個,我們只需要了解一句話就夠了,“子進程復制父進程的數據空間(數據段)、棧和堆,父、子進程共享正文段?!币簿褪钦f,對于程序中的數據,子進程要復制一份,但是對于指令,子進程并不復制而是和父進程共享。具體來看下面這段代碼(這是我在上面那段代碼上稍微添加了一點東西):
/* 這個程序會創(chuàng)建3個子進程,理解這句話,父子進程復制數據段、棧、堆,共享正文段 * */ #include<unistd.h> #include<stdio.h> #include<string.h> #include<stdlib.h> #include<stdarg.h> #include<errno.h> #define BUFSIZE 512 #define LEN 2 void err_exit(char *fmt,...); int main(int argc,char *argv[]) { pid_t pid; int loop; for(loop=0;loop<LEN;loop++) { printf("Now is No.%d loop:\n",loop); if((pid=fork()) < 0) err_exit("[fork:%d]: ",loop); else if(pid == 0) { printf("[Child process]P:%d C:%d\n",getpid(),getppid()); } else { sleep(5); } } return 0; }
為什么上面那段代碼會創(chuàng)建三個子進程?我們來具體分析一下它的執(zhí)行過程:
首先父進程執(zhí)行循環(huán),通過fork創(chuàng)建一個子進程,然后sleep5秒。
再來看父進程創(chuàng)建的這個子進程,這里我們記為子進程1.子進程1完全復制了這個父進程的數據部分,但是需要注意的是它的正文段是和父進程共享的。也就是說,子進程1開始執(zhí)行代碼的部分并不是從main的 { 開始執(zhí)行的,而是主函數執(zhí)行到哪里了,它就接著執(zhí)行,具體而言就是它會執(zhí)行fork后面的代碼。所以子進程1首先會打印出它的ID和它的父進程的ID。然后繼續(xù)第二遍循環(huán),然后這個子進程1再來創(chuàng)建一個子進程,我們記為子進程11,子進程1開始sleep。
子進程11接著子進程1執(zhí)行的代碼開始執(zhí)行(即fork后面),它也是打印出它的ID和父進程ID(子進程1),然后此時loop的值再加1就等于2了,所以子進程2直接就返回了。
那個子進程1sleep完了之后也是loop的值加1之后變成了2,所以子進程1也返回了!
然后我們再返回去看父進程,它僅僅循環(huán)了一次,sleep完之后再來進行第二次循環(huán),這次又創(chuàng)建了一個子進程我們記為子進程2。然后父進程開始sleep,sleep完了之后也結束了。
那么那個子進程2怎么樣了呢?它從fork后開始執(zhí)行,此時loop等于1,它打印完它的ID和父進程ID之后,就結束循環(huán)了,整個子進程2就直接結束了!
這就是上面那段代碼的運行流程,進程間的關系如下圖所示:
上圖中那個loop=%d就是當這個進程開始執(zhí)行的時候loop的值。上面那段代碼的運行結果如下圖:
這里這個3498進程就是我們的主進程,3499就是子進程1,3500就是子進程11,3501就是子進程2。
最后,我們再來回答一下我們開始的時候提出的那個問題,為什么在子進程的處理部分“ if(pid == 0) ”最后加一個return 0,就會創(chuàng)建兩個子進程了,就是因為子進程1運行到這里直接就結束了,不再進行第二遍循環(huán)了,所以就不會再去創(chuàng)建那個子進程11了,所以最后一共就是創(chuàng)建了兩個子進程啊!
欄 目:C語言
本文標題:淺談Linux環(huán)境下并發(fā)編程中C語言fork()函數的使用
本文地址:http://mengdiqiu.com.cn/a1/Cyuyan/2224.html
您可能感興趣的文章
- 01-10APUE筆記之:進程環(huán)境詳解
- 01-10淺談C/C++中的static與extern關鍵字的使用詳解
- 01-10深入解析Linux下\r\n的問題
- 01-10Linux線程管理必備:解析互斥量與條件變量的詳解
- 01-10Linux C 獲取進程退出值的實現代碼
- 01-10解析Linux下的時間函數:設置以及獲取時間的方法
- 01-10深入探討linux下進程的最大線程數、進程最大數、進程打開的文
- 01-10基于linux下獲取時間函數的詳解
- 01-10linux c 查找使用庫的cflags與libs的方法詳解
- 01-10深入探討Linux靜態(tài)庫與動態(tài)庫的詳解(一看就懂)


閱讀排行
本欄相關
- 04-02c語言函數調用后清空內存 c語言調用
- 04-02func函數+在C語言 func函數在c語言中
- 04-02c語言的正則匹配函數 c語言正則表達
- 04-02c語言用函數寫分段 用c語言表示分段
- 04-02c語言中對數函數的表達式 c語言中對
- 04-02c語言編寫函數冒泡排序 c語言冒泡排
- 04-02c語言沒有round函數 round c語言
- 04-02c語言分段函數怎么求 用c語言求分段
- 04-02C語言中怎么打出三角函數 c語言中怎
- 04-02c語言調用函數求fibo C語言調用函數求
隨機閱讀
- 08-05dedecms(織夢)副欄目數量限制代碼修改
- 08-05織夢dedecms什么時候用欄目交叉功能?
- 01-10C#中split用法實例總結
- 01-11ajax實現頁面的局部加載
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-10SublimeText編譯C開發(fā)環(huán)境設置
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 04-02jquery與jsp,用jquery
- 01-10delphi制作wav文件的方法