羨慕火影忍者里鳴人的影分身么?沒(méi)錯(cuò),php程序是可以開動(dòng)影分身的!想完成任務(wù),又覺(jué)得一個(gè)進(jìn)程太慢,那么,試試用多進(jìn)程來(lái)搞吧。這篇文章將會(huì)介紹一下php多進(jìn)程的基本需求,如何創(chuàng)建多進(jìn)程以及基本的信號(hào)控制,暫時(shí)不會(huì)告訴你如何進(jìn)行進(jìn)程間通信和信息共享。
1. 準(zhǔn)備
在動(dòng)手之前,請(qǐng)確定你用的不是m$ windows平臺(tái)(因?yàn)槲覜](méi)有windows)。linux / bsd / unix應(yīng)該都是沒(méi)問(wèn)題的。確認(rèn)好了工作環(huán)境以后一起來(lái)看看我們需要的php模塊是否都有。打開終端輸入下面的命令:
代碼如下:
$ php -m
這個(gè)命令檢查并打印當(dāng)前php所有開啟的擴(kuò)展,看一下pcntl和posix是否在輸出的列表中。
1.1. pcntl
如果找不到pcntl,八成是編譯的時(shí)候沒(méi)把這個(gè)擴(kuò)展編譯進(jìn)去。如果你和我一樣是編譯安裝的php,那么需要重新編譯安裝php。在配置的時(shí)候記得加上--enable-pcntl參數(shù)即可。
代碼如下:
$ cd /path/to/php_source_code_dir
$ ./configure [some other options] --enable-pcntl
$ make && make install
1.2. posix
這貨一般默認(rèn)就會(huì)裝上,只要你編譯的時(shí)候沒(méi)有加上--disable-posix。
2. 預(yù)備知識(shí)
在繼續(xù)之前,你還需要對(duì)linux多進(jìn)程有一點(diǎn)了解。多進(jìn)程是咋回事呢?這里可跟火影忍者里的影分身稍微有點(diǎn)不同。首先,鳴人從小長(zhǎng)到大,比如16歲,咳。有一天他發(fā)動(dòng)了影分身,分出了5個(gè)他。顯然,這些分身也是16歲的鳴人而不是剛出生啥也不懂就會(huì)哭的嬰兒(那叫克隆)。然后,不一樣的地方來(lái)了:分身們變成了獨(dú)立的人各自去做各自的事,互相之間不再知道其他分身和原身都做了什么(當(dāng)然不會(huì)像動(dòng)畫片里一樣積累經(jīng)驗(yàn)給原身啦)。除非,他們互相之間有交流,不然,只有16歲之前的事情才是他們共同的記憶。
有同學(xué)說(shuō)了,老大你這不坑爹呢么?我又沒(méi)看過(guò)火影忍者!那你去看一遍好了……
最后,預(yù)備知識(shí)完了,就是大致了解一下主進(jìn)程開出來(lái)的子進(jìn)程是怎么回事。子進(jìn)程的代碼和主進(jìn)程是完全一樣的,還有一部分一樣的東西就是直到發(fā)動(dòng)影分身之前執(zhí)行的所有內(nèi)容。
3. 影分身之術(shù)
所以呢,沒(méi)有點(diǎn)基礎(chǔ)知識(shí)怎么能理解卷軸里的內(nèi)容呢?打開卷軸首先看到了一個(gè)單詞:fork。
3.1. fork
叉子?叉子是分岔的,一個(gè)變多個(gè)嘛!差不多就是這個(gè)意思。創(chuàng)建子進(jìn)程就用這個(gè)命令。這里需要用到pcntl_fork()函數(shù)。(可以先簡(jiǎn)單看一下php手冊(cè)關(guān)于這個(gè)函數(shù)的介紹。)創(chuàng)建一個(gè)php腳本:
代碼如下:
$pid = pcntl_fork(); // 一旦調(diào)用成功,事情就變得有些不同了
if ($pid == -1) {
die('fork failed');
} else if ($pid == 0) {
} else {
}
pcntl_fork()函數(shù)創(chuàng)建一個(gè)子進(jìn)程,子進(jìn)程和父進(jìn)程唯一的區(qū)別就是pid(進(jìn)程id)和ppid(父進(jìn)程id)不同。在終端下查看進(jìn)程用ps命令(問(wèn)問(wèn)man看ps怎么用:man ps)。當(dāng)函數(shù)返回值為-1的時(shí)候,說(shuō)明fork失敗了。試試在if前面加一句:echo $pid . php_eol;。運(yùn)行你的腳本,輸出可能像下面這樣(結(jié)果說(shuō)明子進(jìn)程和父進(jìn)程的代碼是相同的):
代碼如下:
67789 # 這個(gè)是父進(jìn)程打印的
0 # 這個(gè)是子進(jìn)程打印的
pcntl_fork()函數(shù)調(diào)用成功后,在父進(jìn)程中會(huì)返回子進(jìn)程的pid,而在子進(jìn)程中返回的是0。所以,下面直接用if分支來(lái)控制父進(jìn)程和子進(jìn)程做不同的事。
3.2. 分配任務(wù)
然后我們來(lái)說(shuō)說(shuō)鳴人16歲那次影分身的事兒,給原身和分身分配兩個(gè)簡(jiǎn)單的輸出任務(wù):
代碼如下:
$parentpid = getmypid(); // 這就是傳說(shuō)中16歲之前的記憶
$pid = pcntl_fork(); // 一旦調(diào)用成功,事情就變得有些不同了
if ($pid == -1) {
die('fork failed');
} else if ($pid == 0) {
$mypid = getmypid(); // 用getmypid()函數(shù)獲取當(dāng)前進(jìn)程的pid
echo 'i am child process. my pid is ' . $mypid . ' and my father's pid is ' . $parentpid . php_eol;
} else {
echo 'oh my god! i am a father now! my child's pid is ' . $pid . ' and mine is ' . $parentpid . php_eol;
}
輸出的結(jié)果可能是這樣:
代碼如下:
oh my god! i am a father now! my child's pid is 68066 and mine is 68065
i am child process. my pid is 68066 and my father's pid is 68065
再?gòu)?qiáng)調(diào)一下,pcntl_fork()調(diào)用成功以后,一個(gè)程序變成了兩個(gè)程序:一個(gè)程序得到的$pid變量值是0,它是子進(jìn)程;另一個(gè)程序得到的$pid的值大于0,這個(gè)值是子進(jìn)程的pid,它是父進(jìn)程。在下面的分支語(yǔ)句中,由于$pid值的不同,運(yùn)行了不同的代碼。再次強(qiáng)調(diào)一下:子進(jìn)程的代碼和父進(jìn)程的是一樣的。所以就要通過(guò)分支語(yǔ)句給他們分配不同的任務(wù)。
3.3. 子進(jìn)程回收
剛剛有man ps么?一般我習(xí)慣用ps aux加上grep命令來(lái)查找運(yùn)行著的后臺(tái)進(jìn)程。其中有一列stat,標(biāo)識(shí)了每個(gè)進(jìn)程的運(yùn)行狀態(tài)。這里,我們關(guān)注狀態(tài)z:僵尸(zombie)。當(dāng)子進(jìn)程比父進(jìn)程先退出,而父進(jìn)程沒(méi)對(duì)其做任何處理的時(shí)候,子進(jìn)程將會(huì)變成僵尸進(jìn)程。oops,又跟火影里的影分身不一樣了。鳴人的影分身被干死了以后就自動(dòng)消失了,但是這里的子進(jìn)程分身死了話還留著一個(gè)空殼在,直到父進(jìn)程回收它。僵尸進(jìn)程雖然不占什么內(nèi)存,但是很礙眼,院子里一堆躺著的僵尸怎么都覺(jué)得怪怪的。(別忘了它們還占用著pid)
一般來(lái)說(shuō),在父進(jìn)程結(jié)束之前回收掛掉的子進(jìn)程就可以了。在pcntl擴(kuò)展里面有一個(gè)pcntl_wait()函數(shù),它會(huì)將父進(jìn)程掛起,直到有一個(gè)子進(jìn)程退出為止。如果有一個(gè)子進(jìn)程變成了僵尸的話,它會(huì)立即返回。所有的子進(jìn)程都要回收,所以多等等也沒(méi)關(guān)系啦!
3.4. 父進(jìn)程先掛了
如果父進(jìn)程先掛了怎么辦?會(huì)發(fā)生什么?什么也不會(huì)發(fā)生,子進(jìn)程依舊還在運(yùn)行。但是這個(gè)時(shí)候,子進(jìn)程會(huì)被交給1號(hào)進(jìn)程,1號(hào)進(jìn)程成為了這些子進(jìn)程的繼父。1號(hào)進(jìn)程會(huì)很好地處理這些進(jìn)程的資源,當(dāng)它們結(jié)束時(shí)1號(hào)進(jìn)程會(huì)自動(dòng)回收資源。所以,另一種處理僵尸進(jìn)程的臨時(shí)辦法是關(guān)閉它們的父進(jìn)程。
4. 信號(hào)
一般多進(jìn)程的事兒講到上面就完了,可是信號(hào)在系統(tǒng)中確實(shí)是一個(gè)非常重要的東西。信號(hào)就是信號(hào)燈,點(diǎn)亮一個(gè)信號(hào)燈,程序就會(huì)做出反應(yīng)。這個(gè)你一定用過(guò),比如說(shuō)在終端下運(yùn)行某個(gè)程序,等了半天也沒(méi)什么反應(yīng),可能你會(huì)按 ctrl+c 來(lái)關(guān)閉這個(gè)程序。實(shí)際上,這里就是通過(guò)鍵盤向程序發(fā)送了一個(gè)中斷的信號(hào):sigint。有時(shí)候進(jìn)程失去響應(yīng)了還會(huì)執(zhí)行kill [pid]命令,未加任何其他參數(shù)的話,程序會(huì)接收到一個(gè)sigterm信號(hào)。程序收到上面兩個(gè)信號(hào)的時(shí)候,默認(rèn)都會(huì)結(jié)束執(zhí)行,那么是否有可能改變這種默認(rèn)行為呢?必須能啊!
4.1. 注冊(cè)信號(hào)
人是活的程序也是活的,只不過(guò)程序需要遵循人制定的規(guī)則來(lái)運(yùn)行?,F(xiàn)在開始給信號(hào)重新設(shè)定規(guī)則,這里用到的函數(shù)是pcntl_signal()(繼續(xù)之前為啥不先查查php手冊(cè)呢?)。下面這段程序?qū)⒔osigint重新定義行為,注意看好:
代碼如下:
// 定義一個(gè)處理器,接收到sigint信號(hào)后只輸出一行信息
function signalhandler($signal) {
if ($signal == sigint) {
echo 'signal received' . php_eol;
}
}
// 信號(hào)注冊(cè):當(dāng)接收到sigint信號(hào)時(shí),調(diào)用signalhandler()函數(shù)
pcntl_signal(sigint, 'signalhandler');
while (true) {
sleep(1);
// do something
pcntl_signal_dispatch(); // 接收到信號(hào)時(shí),調(diào)用注冊(cè)的signalhandler()
}
執(zhí)行一下,隨時(shí)按下 ctrl+c 看看會(huì)發(fā)生什么事。
4.2. 信號(hào)分發(fā)
說(shuō)明一下:pcntl_signal()函數(shù)僅僅是注冊(cè)信號(hào)和它的處理方法,真正接收到信號(hào)并調(diào)用其處理方法的是pcntl_signal_dispatch()函數(shù)。試試把// do something替換成下面這段代碼:
代碼如下:
for ($i = 0; $i < 1000000; $i++) {
echo $i . php_eol;
usleep(100000);
}
在終端下執(zhí)行這個(gè)腳本,當(dāng)它不停輸出數(shù)字的時(shí)候嘗試按下 ctrl+c 。看看程序有什么響應(yīng)?嗯……什么都沒(méi)有,除了屏幕可能多了個(gè)^c以外,程序一直在不停地輸出數(shù)字。因?yàn)槌绦蛞恢睕](méi)有執(zhí)行到pcntl_signal_dispatch(),所以就并沒(méi)有調(diào)用signalhandler(),所以就沒(méi)有輸出signal received。
4.3. 版本問(wèn)題
如果認(rèn)真看了php文檔,會(huì)發(fā)現(xiàn)pcntl_signal_dispatch()這個(gè)函數(shù)是php 5.3以上才支持的,如果你的php版本大于5.3,建議使用這個(gè)方法調(diào)用信號(hào)處理器。5.3以下的版本需要在注冊(cè)信號(hào)之前加一句:declare(ticks = 1);表示每執(zhí)行一條低級(jí)指令,就檢查一次信號(hào),如果檢測(cè)到注冊(cè)的信號(hào),就調(diào)用其信號(hào)處理器。想想就挺不爽的,干嘛一直都檢查?還是在我們指定的地方檢查一下就好。
4.4. 感受僵尸進(jìn)程
現(xiàn)在我們回到子進(jìn)程回收的問(wèn)題上(差點(diǎn)忘了= =)。當(dāng)你的一個(gè)子進(jìn)程掛了(或者說(shuō)是結(jié)束了),但是父進(jìn)程還在運(yùn)行中并且可能很長(zhǎng)一段時(shí)間不會(huì)退出。一個(gè)僵尸進(jìn)程從此站起來(lái)了!這時(shí),保護(hù)傘公司(內(nèi)核)發(fā)現(xiàn)它的地盤里出現(xiàn)了一個(gè)僵尸,這個(gè)僵尸是誰(shuí)兒子呢?看一下ppid就知道了。然后,內(nèi)核給ppid這個(gè)進(jìn)程(也就是僵尸進(jìn)程的父進(jìn)程)發(fā)送一個(gè)信號(hào):sigchld。然后,你知道怎么在父進(jìn)程中回收這個(gè)子進(jìn)程了么?提示一下,用pcntl_wait()函數(shù)。
4.5. 發(fā)送信號(hào)
希望剛剛有認(rèn)真man過(guò)kill命令。它其實(shí)就是向進(jìn)程發(fā)送信號(hào),在php中也可以調(diào)用posix_kill()函數(shù)來(lái)達(dá)到相同的效果。有了它就可以在父進(jìn)程中控制其他子進(jìn)程的運(yùn)行了。比如在父進(jìn)程結(jié)束之前關(guān)閉所有子進(jìn)程,那么fork的時(shí)候在父進(jìn)程記錄所有子進(jìn)程的pid,父進(jìn)程結(jié)束之前依次給子進(jìn)程發(fā)送結(jié)束信號(hào)即可。
5. 實(shí)踐
php的多進(jìn)程跟c還是挺像的,搞明白了以后用其他語(yǔ)言寫的話也大同小異差不多都是這么個(gè)情況。如果有空的話,嘗試寫一個(gè)小程序,切身體會(huì)一下個(gè)中滋味:
1.16歲的鳴人發(fā)送影分身,分出5個(gè)分身
2.每個(gè)分身隨機(jī)生存10到30秒,每秒都輸出點(diǎn)什么
3.保證原身能感受到分身的結(jié)束,然后開動(dòng)另一個(gè)分身,保證最多有5個(gè)分身
4.不使用nohup,讓原身在終端關(guān)閉后依舊能夠運(yùn)行
5.把分身數(shù)量(5)寫進(jìn)一個(gè)配置文件里,當(dāng)給原身發(fā)送信號(hào)(可以考慮用sigusr1或sigusr2)時(shí),原身讀取配置文件并更新允許的分身最大數(shù)量
6.如果分身多了,關(guān)閉幾個(gè);如果少了,再分出來(lái)幾個(gè)
提示:
1.用while循環(huán)保證進(jìn)程運(yùn)行,注意sleep以免100%的cpu占用
2.運(yùn)行進(jìn)程的終端被關(guān)閉時(shí),程序會(huì)收到一個(gè)sighup信號(hào)
3.可以用parse_ini_file()函數(shù)解析ini配置文件