Linux下檢測進程是否存在

這個問題看起來好像很簡單,"ps -ef | grep xx"一下就行啦!這樣作固然能夠,可是若是咱們考究起性能來,這恐怕不是個好辦法。python

假設咱們如今要監測某進程是否存活,每分鐘檢查一次,用上面的辦法就要每分鐘運行一次ps命令而且作一次grep正則查找。這點開銷在服務器上彷佛不算什麼,然而若是咱們要在同一節點上同時監測數十個、數百個這樣的進程又如何呢?因此,咱們有必要從性能的角度出發,發掘一些更好的辦法。
 
對於daemon進程,一般都會有本身的pid或者lock文件,咱們能夠檢查這些文件是否存在來判斷進程是否存在。然而有些異常狀況下,pid文件存在進程卻並不存在。所以並不能依賴進程的pid文件來檢測進程是否存活。
 
一種可靠的方法是使用"kill -0 pid",kill -0不會向進程發送任何信號,可是會進行錯誤檢查。若是進程存在,命令返回0,若是不存在返回1。
[sw@gentoo ~]$ ps
  PID TTY          TIME CMD
15091 pts/0    00:00:00 bash
15943 pts/0    00:00:00 ps
[sw@gentoo ~]$ kill -0 15091
[sw@gentoo ~]$ echo $?
0
[sw@gentoo ~]$ kill -0 15092
-bash: kill: (15092) - No such process
[sw@gentoo ~]$ echo $?
1
[sw@gentoo ~]$ 
可是,這種方法對於普通用戶來講只能用於檢查本身的進程,由於向其它用戶的進程發送信號會由於沒有權限而出錯,返回值也是1。
[sw@gentoo ~]$ kill 2993
-bash: kill: (2993) - Operation not permitted
[sw@gentoo ~]$ echo $?
1
[sw@gentoo ~]$ 
固然,若是你用特權用戶執行kill命令的話,就沒有權限問題啦。
 
另外一方面,咱們知道內核會經過/proc虛擬文件系統導出系統中正在運行的進程信息,每一個進程都有一個/proc/<pid>目錄。所以咱們能夠將檢測進程是否存在轉換爲檢測/proc/<pid>目錄是否存在,這樣就簡單多了。
 
最後,咱們怎麼獲得進程的pid呢?一般對於daemon進程咱們能夠從它的pid文件或者lock文件中讀取。若是沒有pid文件的話,在監控腳本中先用"ps | grep"、pgrep、pidof等命令獲得要監控的進程pid,再用上述方法檢測就好了。
 
References
1. How do you check in Linux with Python if a process is still running?  http://stackoverflow.com/questions/38056/how-do-you-check-in-linux-with-python-if-a-process-is-still-running