Python垃圾回收機制

引用計數Python默認的垃圾收集機制是「引用計數」,每一個對象維護了一個ob_ref字段。它的優勢是機制簡單,當新的引用指向該對象時,引用計數

引用計數

Python默認的垃圾收集機制是「引用計數」,每一個對象維護了一個ob_ref字段。它的優勢是機制簡單,當新的引用指向該對象時,引用計數加1,當一個對象的引用被銷燬時減1,一旦對象的引用計數爲0,該對象當即被回收,所佔用的內存將被釋放。它的缺點是須要額外的空間維護引用計數,不過最主要的問題是它不能解決「循環引用」。python

 

什麼是循環引用?A和B相互引用而再沒有外部引用A與B中的任何一個,它們的引用計數雖然都爲1,但顯然應該被回收,例子:算法

1
2
3
4
5
6
   =  { }  # a 的引用爲 1
   =  { }  # b 的引用爲 1
   a[ 'b' =  # b 的引用增 1,b的引用爲2
   b[ 'a' =  # a 的引用增 1,a的引用爲 2
   del  # a 的引用減 1,a的引用爲 1
   del  # b 的引用減 1, b的引用爲 1

在這個例子中,del語句減小了 a 和 b 的引用計數並刪除了用於引用的變量名,但是因爲兩個對象各包含一個對方對象的引用,雖然最後兩個對象都沒法經過名字訪問了,但引用計數並無減小到零。所以這個對象不會被銷燬,它會一直駐留在內存中,這就形成了內存泄漏。爲了解決循環引用問題,Python引入了標記-清除和分代回收兩種GC機制。函數

標記清除

標記——清除(Mark——Sweep)是一種基於追蹤(Tracing)回收技術實現的垃圾回收算法,對象之間經過引用(指針)連在一塊兒,構成一個有向圖,對象構成這個有向圖的節點,而引用關係構成這個有向圖的邊。從根對象(root object)出發,沿着有向邊遍歷對象,可達的對象標記爲有用的對象,不可達的對象就是要被清除的對象。所謂根對象就是一些全局引用對象和函數棧中的引用,這些引用所引用的對象是不可被刪除的。spa

 

標記清除算法做爲Python的輔助垃圾收集技術主要處理的是一些容器對象,好比list、dict、tuple,instance等,由於對於字符串、數值對象是不可能形成循環引用問題。Python使用一個雙向鏈表將這些容器對象組織起來。指針

分代回收

分代回收是一種以空間換時間的操做方式,Python將內存根據對象的存活時間劃分爲不一樣的集合,每一個集合稱爲一個代,Python將內存分爲了3「代」,分別爲年輕代(第0代)、中年代(第1代)、老年代(第2代),他們對應的是3個鏈表,它們的垃圾收集頻率與對象的存活時間的增大而減少。新建立的對象都會分配在年輕代,年輕代鏈表的總數達到上限時,Python垃圾收集機制就會被觸發,把那些能夠被回收的對象回收掉,而那些不會回收的對象就會被移到中年代去,依此類推,老年代中的對象是存活時間最久的對象,甚至是存活於整個系統的生命週期內。同時,分代回收是創建在標記清除技術基礎之上。code

 

分代回收一樣做爲Python的輔助垃圾收集技術處理那些容器對象對象