初學JVM-JVM內存結構

引言

我們都知道了JVM可以在各個系統上運行字節碼文件,那麼字節碼數據在 Java 虛擬機內存中是如何存放的 ?Java 虛擬機在爲類實例或成員變量分配內存是如何分配的 ?要解答上面這些問題,我們首先需要了解一下 Java 虛擬機的內存結構。
其實 Java 虛擬機的內存結構並不是官方的說法,在《Java 虛擬機規範》中用的是「運行時數據區」這個術語。但很多時候這個名詞並不是很形象,再加上日積月累的習慣,我們都習慣用虛擬機內存結構這個說法了。
在這裏插入圖片描述
根據《Java 虛擬機規範》中的說法,Java 虛擬機的內存結構可以分爲公有和私有兩部分。公有指的是所有線程都共享的部分,指的是 Java 堆、方法區、常量池。私有指的是每個線程的私有數據,包括:PC寄存器、Java 虛擬機棧、本地方法棧。
在這裏插入圖片描述

公有部分:Java堆、方法區、常量池

Java堆(Heap)

對於大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區域,在虛擬機啓動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這裏分配內存

Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做「GC堆」。如果從內存回收的角度看,由於現在收集器基本都是採用的分代收集算法,所以Java堆中還可以細分爲:新生代和老年代;再細緻一點的有Eden空間、From Survivor空間、To Survivor空間等。默認情況下年輕代按照8:1:1的比例來分配

爲什麼要分區呢?
虛擬機中的對象必然有存活時間長的對象,也有存活時間短的對象,這是一個普遍存在的正態分佈規律。如果我們將其混在一起,那麼因爲存活時間短的對象有很多,那麼勢必導致較爲頻繁的垃圾回收。而垃圾回收時不得不對所有內存都進行掃描,但其實有一部分對象,它們存活時間很長,對他們進行掃描完全是浪費時間。因此爲了提高垃圾回收效率,分區就理所當然了。

爲什麼是8:1:1呢?
這是 IBM 公司根據大量統計得出的結果。根據 IBM 公司對對象存活時間的統計,他們發現 80% 的對象存活時間都很短。於是他們將 Eden 區設置爲年輕代的 80%,這樣可以減少內存空間的浪費,提高內存空間利用率。

根據Java虛擬機規範的規定,Java堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。

如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出OutOfMemoryError異常。

方法區(Method Area)

方法區(Method Area)與Java堆一樣,是各個線程共享的內存區域,存儲 Java 類字節碼數據的一塊區域。它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。可以看到常量池其實是存放在方法區中的。雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區分開來。

Java虛擬機規範對這個區域的限制非常寬鬆,除了和Java堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行爲在這個區域是比較少出現的,但並非數據進入了方法區就如永久代的名字一樣「永久」存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收「成績」比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是有必要的。

根據Java虛擬機規範的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError異常。

私有部分:PC寄存器、Java 虛擬機棧、本地方法棧

程序計數器(Program Counter Register)

程序計數器(Program Counter Register)是一塊較小的內存空間,它的作用可以看做是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

由於Java虛擬機的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個內核)只會執行一條線程中的指令。因此,爲了線程切換後能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲,我們稱這類內存區域爲「線程私有」的內存。

如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Natvie方法,這個計數器值則爲空(Undefined)。

此內存區域是唯一一個在Java虛擬機規範中沒有規定任何OutOfMemoryError情況的區域。

JVM棧(JVM Stacks)

與程序計數器一樣,Java虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,它的生命週期與線程相同。虛擬機棧描述的是Java方法執行的內存模型:每個方法被執行的時候都會同時創建一個棧幀(Stack Frame)用於存儲局部變量表、操作棧、動態鏈接、方法出口等信息。每一個方法被調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中從入棧到出棧的過程。

局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不等同於對象本身,根據不同的虛擬機實現,它可能是一個指向對象起始地址的引用指針,也可能指向一個代表對象的句柄或者其他與此對象相關的位置)和returnAddress類型(指向了一條字節碼指令的地址)。

在Java虛擬機規範中,對這個區域規定了兩種異常狀況:如果線程請求的棧深度大於虛擬機所允許的深度,將拋出StackOverflowError異常;如果虛擬機棧可以動態擴展(當前大部分的Java虛擬機都可動態擴展,只不過Java虛擬機規範中也允許固定長度的虛擬機棧),當擴展時無法申請到足夠的內存時會拋出OutOfMemoryError異常。

本地方法棧(Native Method Stacks)

本地方法棧(Native Method Stacks)與虛擬機棧所發揮的作用是非常相似的,其區別不過是虛擬機棧爲虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則是爲虛擬機使用到的Native方法服務。虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二爲一。當 Java 虛擬機使用其他語言(例如 C 語言)來實現指令集解釋器時,也會使用到本地方法棧。如果 Java 虛擬機不支持 natvie 方法,並且自己也不依賴傳統棧的話,可以無需支持本地方法棧。

與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。