05-虚拟机栈
虛擬機棧
虛擬機棧概述
由于跨平臺性的設計,Java的指令都是根據棧來設計的。不同平臺CPU架構不同,所以不能設計為基于寄存器的。
優點是跨平臺,指令集小,編譯器容易實現,缺點是性能下降,實現同樣的功能需要更多的指令。
有不少Java開發人員一提到Java內存結構,就會非常粗粒度地將JVM中的內存區理解為僅有Java堆(heap)和Java棧(stack)?為什么?
首先棧是運行時的單位,而堆是存儲的單位
- 棧解決程序的運行問題,即程序如何執行,或者說如何處理數據。
- 堆解決的是數據存儲的問題,即數據怎么放,放哪里
Java虛擬機棧是什么
Java虛擬機棧(Java Virtual Machine Stack),早期也叫Java棧。每個線程在創建時都會創建一個虛擬機棧,其內部保存一個個的棧幀(Stack Frame),對應著一次次的Java方法調用。
是線程私有的
生命周期
生命周期和線程一致,也就是線程結束了,該虛擬機棧也銷毀了
作用
主管Java程序的運行,它保存方法的局部變量(八種基本數據類型、對象的引用地址)、部分結果,并參與方法的調用和返回。
局部變量,它是相比于成員變量來說的(或屬性)
基本數據類型變量 VS 引用類型變量(類、數組、接口)
棧的特點
棧是一種快速有效的分配存儲方式,訪問速度僅次于罹序計數器。JVM直接對Java棧的操作只有兩個:
- 每個方法執行,伴隨著進棧(入棧、壓棧)
- 執行結束后的出棧工作
對于棧來說不存在垃圾回收問題(棧存在溢出的情況)
- 不存在GC(因為只存在入棧和出棧操作)
- 存在OOM(存滿即會溢出)
開發中遇到哪些異常?
棧中可能出現的異常
-
Java 虛擬機規范允許Java棧的大小是動態的或者是固定不變的。
-
如果采用固定大小的Java虛擬機棧,那每一個線程的Java虛擬機棧容量可以在線程創建的時候獨立選定。如果線程請求分配的棧容量超過Java虛擬機棧允許的最大容量,Java虛擬機將會拋出一個StackoverflowError 異常,即棧溢出。
-
如果Java虛擬機棧可以動態擴展,并且在嘗試擴展的時候無法申請到足夠的內存,或者在創建新的線程時沒有足夠的內存去創建對應的虛擬機棧,那Java虛擬機將會拋出一個 outofMemoryError 異常,即內存不足。
-
當棧深度達到9803的時候,就出現棧內存空間不足
設置棧內存大小
我們可以使用參數 -Xss選項來設置線程的最大棧空間,棧的大小直接決定了函數調用的最大可達深度
-Xss1m -Xss1k棧的存儲單位
每個線程都有自己的棧,棧中的數據都是以棧幀(Stack Frame)的格式存在。
在這個線程上正在執行的每個方法都各自對應一個棧幀(Stack Frame)。
棧幀是一個內存區塊,是一個數據集,維系著方法執行過程中的各種數據信息。
棧中存儲什么?
每個線程都有自己的棧,棧中的數據都是以棧幀(Stack Frame)的格式存在。在這個線程上正在執行的每個方法都各自對應一個棧顏(Stack Frame)。棧幀是一個內存區塊,是一個數據集,維系著方法執行過程中的各種數據信息。
OOP的基本概念:類和對象
類中基本結構:field(屬性、字段、域)、method
棧運行原理
-
JVM直接對Java棧的操作只有兩個,就是對棧幀的壓棧和出棧,遵循“先進后出”/“后進先出”原則。
-
在一條活動線程中,一個時間點上,只會有一個活動的棧幀。即只有當前正在執行的方法的棧幀(棧頂棧幀)是有效的,這個棧幀被稱為當前棧幀(Current Frame),與當前棧幀相對應的方法就是當前方法(Current Method),定義這個方法的類就是當前類(Current Class)。
-
執行引擎運行的所有字節碼指令只針對當前棧幀進行操作。
-
如果在該方法中調用了其他方法,對應的新的棧幀會被創建出來,放在棧的頂端,成為新的當前幀。
下面寫一個簡單的代碼
/*** 棧幀*/ public class StackFrameTest {public static void main(String[] args) {method01();}private static int method01() {System.out.println("方法1的開始");int i = method02();System.out.println("方法1的結束");return i;}private static int method02() {System.out.println("方法2的開始");int i = method03();;System.out.println("方法2的結束");return i;}private static int method03() {System.out.println("方法3的開始");int i = 30;System.out.println("方法3的結束");return i;} }輸出結果為
方法1的開始 方法2的開始 方法3的開始 方法3的結束 方法2的結束 方法1的結束滿足棧先進后出的概念,通過Idea的 DEBUG,能夠看到棧信息
棧運行原理
不同線程中所包含的棧幀是不允許存在相互引用的,即不可能在一個棧幀之中引用另外一個線程的棧幀。
如果當前方法調用了其他方法,方法返回之際,當前棧幀會傳回此方法的執行結果給前一個棧幀,接著,虛擬機會丟棄當前棧幀,使得前一個棧幀重新成為當前棧幀。
Java方法有兩種返回函數的方式,一種是正常的函數返回,使用return指令;另外一種是方法執行中出現未捕獲處理的異常,以拋出異常的方式結束。不管使用哪種方式,都會導致棧幀被彈出。
棧幀的內部結構
每個棧幀中存儲著:
- 局部變量表(Local Variables)
- 操作數棧(operand Stack)(或表達式棧)
- 動態鏈接(DynamicLinking)(或指向運行時常量池的方法引用)
- 方法返回地址(Return Address)(或方法正常退出或者異常退出的定義)
- 一些附加信息
并行每個線程下的棧都是私有的,因此每個線程都有自己各自的棧,并且每個棧里面都有很多棧幀,棧幀的大小主要由局部變量表 和 操作數棧決定的
局部變量表
-
局部變量表:Local Variables,被稱之為局部變量數組或本地變量表
-
定義為一個數字數組,主要用于存儲方法參數和定義在方法體內的局部變量,這些數據類型包括各類基本數據類型、對象引用(reference),以及returnAddress類型。
-
由于局部變量表是建立在線程的棧上,是線程的私有數據,因此不存在數據安全問題
-
局部變量表所需的容量大小是在編譯期確定下來的,并保存在方法的Code屬性的maximum local variables數據項中。在方法運行期間是不會改變局部變量表的大小的。
-
方法嵌套調用的次數由棧的大小決定。一般來說,**棧越大,方法嵌套調用次數越多。**對一個函數而言,它的參數和局部變量越多,使得局部變量表膨脹,它的棧幀就越大,以滿足方法調用所需傳遞的信息增大的需求。進而函數調用就會占用更多的棧空間,導致其嵌套調用次數就會減少。
-
局部變量表中的變量只在當前方法調用中有效。在方法執行時,虛擬機通過使用局部變量表完成參數值到參數變量列表的傳遞過程。當方法調用結束后,隨著方法棧幀的銷毀,局部變量表也會隨之銷毀。
關于Slot的理解
-
參數值的存放總是在局部變量數組的index0開始,到數組長度-1的索引結束。
-
局部變量表,最基本的存儲單元是Slot(變量槽)
-
局部變量表中存放編譯期可知的各種基本數據類型(8種),引用類型(reference),returnAddress類型的變量。
-
在局部變量表里,32位以內的類型只占用一個slot(包括returnAddress類型、引用類型),64位的類型(long和double)占用兩個slot。
byte、short、char 、float在存儲前被轉換為int,boolean也被轉換為int,0表示false,非0表示true。均占一個slot。
long和double則占據兩個slot。(8個字節,8*8=64)
-
JVM會為局部變量表中的每一個Slot都分配一個訪問索引,通過這個索引即可成功訪問到局部變量表中指定的局部變量值
-
當一個實例方法被調用的時候,它的方法參數和方法體內部定義的局部變量將會按照順序被復制到局部變量表中的每一個slot上
-
如果需要訪問局部變量表中一個64bit的局部變量值時,只需要使用前一個索引即可,即第一個slot。(比如:訪問long或double類型變量)
-
如果當前幀是由構造方法或者實例方法(非靜態方法)創建的,那么該對象引用this將會存放在index為0的slot處,其余的參數按照參數表順序繼續排列。
- 因此,可解釋為什么靜態代碼塊中不能使用this,因為this變量不存在于當前方法的局部變量表中。
- 因此,可解釋為什么靜態代碼塊中不能使用this,因為this變量不存在于當前方法的局部變量表中。
Slot的重復利用
棧幀中的局部變量表中的槽位是可以重用的,如果一個局部變量過了其作用域,那么在其作用域之后申明的新的局部變就很有可能會復用過期局部變量的槽位,從而達到節省資源的目的。
靜態變量與局部變量的對比
變量的分類:
- 按數據類型分:基本數據類型、引用數據類型
- 按類中聲明的位置分:
- 成員變量:在使用前,都經歷過默認初始化賦值
- 類變量(又稱靜態變量,static修飾):linking的prepare階段,給類變量默認賦值,initial階段給類變量顯式賦值即靜態代碼塊賦值
- 實例變量(無static修飾)):隨著對象創建,會在堆空間中分配實例變量空間,并進行默認賦值
- 局部變量:在使用前必須進行顯式賦值,不然編譯不通過。
- 成員變量:在使用前,都經歷過默認初始化賦值
參數表分配完畢之后,再根據方法體內定義的變量的順序和作用域分配。
我們知道類變量表有兩次初始化的機會,第一次是在“準備階段”,執行系統初始化,對類變量設置零值,另一次則是在“初始化”階段,賦予程序員在代碼中定義的初始值。
和類變量初始化不同的是,局部變量表不存在系統初始化的過程,這意味著一旦定義了局部變量則必須人為的初始化,否則無法使用。
在棧幀中,與性能調優關系最為密切的部分就是前面提到的局部變量表。在方法執行時,虛擬機使用局部變量表完成方法的傳遞。
局部變量表中的變量也是重要的垃圾回收根節點,只要被局部變量表中直接或間接引用的對象都不會被回收。
操作數棧
概念
操作數棧:Operand Stack
- 棧:可用數組或者鏈表實現。這里的操作數棧即用數組實現,一個只能從尾部進入的數組。因此操作數棧既滿足棧的先進后出,也滿足數組的順序存放。
每一個獨立的棧幀除了包含局部變量表以外,還包含一個后進先出(Last - In - First -Out)的 操作數棧,也可以稱之為 表達式棧(Expression Stack)
操作數棧,在方法執行過程中,根據字節碼指令,往棧中寫入數據或提取數據,即入棧(push)和 出棧(pop)
- 某些字節碼指令將值壓入操作數棧,其余的字節碼指令將操作數取出棧。使用它們后再把結果壓入棧
- 比如:執行復制、交換、求和等操作
代碼舉例
操作數棧,主要用于保存計算過程的中間結果,同時作為計算過程中變量臨時的存儲空間。
操作數棧就是JVM執行引擎的一個工作區,當一個方法剛開始執行的時候,一個新的棧幀也會隨之被創建出來,這個方法的操作數棧是空的。.
這個時候數組是有長度的,因為數組一旦創建,那么就是不可變的
每一個操作數棧都會擁有一個明確的棧深度用于存儲數值,其所需的最大深度在編譯期就定義好了,保存在方法的Code屬性中,為maxstack的值。
棧中的任何一個元素都是可以任意的Java數據類型
- 32bit的類型占用一個棧單位深度
- 64bit的類型占用兩個棧單位深度
操作數棧并非采用訪問索引的方式來進行數據訪問的,而是只能通過標準的入棧和出棧操作來完成一次數據訪問
如果被調用的方法帶有返回值的話,其返回值將會被壓入當前棧幀的操作數棧中,并更新PC寄存器中下一條需要執行的字節碼指令。
操作數棧中元素的數據類型必須與字節碼指令的序列嚴格匹配,這由編譯器在編譯器期間進行驗證,同時在類加載過程中的類檢驗階段的數據流分析階段要再次驗證。|
另外,我們說Java虛擬機的解釋引擎是基于棧的執行引擎,其中的棧指的就是操作數棧。
代碼追蹤
我們給定代碼
public void testAddOperation() {byte i = 15;int j = 8;int k = i + j; }使用javap 命令反編譯class文件: javap -v 類名.class
byte、short、char、boolean 內部都是使用int型來進行保存的
從上面的代碼我們可以知道,我們都是通過bipush對操作數 15 和 8進行入棧操作
同時使用的是 iadd方法進行相加操作,i -> 代表的就是 int,也就是int類型的加法操作
執行流程如下所示:
首先執行第一條語句,PC寄存器指向的是0,也就是指令地址為0,然后使用bipush讓操作數15入棧。
執行完后,讓PC + 1,指向下一行代碼,下一行代碼就是將操作數棧的元素存儲到局部變量表1的位置,我們可以看到局部變量表的已經增加了一個元素
為什么局部變量表不是從0開始的呢?
其實局部變量表也是從0開始的,但是因為0號位置存儲的是this指針,所以說就直接省略了~
然后PC+1,指向的是下一行。讓操作數8也入棧,同時執行store操作,存入局部變量表中
然后從局部變量表中,依次將數據放在操作數棧中
然后將操作數棧中的兩個元素執行相加操作,并存儲在局部變量表3的位置
最后PC寄存器的位置指向10,也就是return方法,則直接退出方法
通俗地理解:局部變量表中存放局部變量,操作數棧對局部變量做操作,執行引擎將操作數棧的字節碼指令轉化為機器指令交給CPU執行。
常見面試題:i++和++i的區別
棧頂緩存技術
棧頂緩存技術:Top Of Stack Cashing
前面提過,基于棧式架構的虛擬機所使用的零地址指令更加緊湊,但完成一項操作的時候必然需要使用更多的入棧和出棧指令,這同時也就意味著將需要更多的指令分派(instruction dispatch)次數和內存讀/寫次數。
由于操作數是存儲在內存中的,因此頻繁地執行內存讀/寫操作必然會影響執行速度。為了解決這個問題,HotSpot JVM的設計者們提出了棧頂緩存(Tos,Top-of-Stack Cashing)技術,將棧頂元素全部緩存在物理CPU的寄存器中,以此降低對內存的讀/寫次數,提升執行引擎的執行效率。
寄存器:指令更少,執行速度快
動態鏈接(或指向運行時常量池的方法引用)
動態鏈接:Dynamic Linking
動態鏈接、方法返回地址、附加信息 : 有些地方被稱為幀數據區
每一個棧幀內部都包含一個指向運行時常量池中該棧幀所屬方法的引用包含這個引用的目的就是為了支持當前方法的代碼能夠實現動態鏈接(Dynamic Linking)。比如:invokedynamic指令
在Java源文件被編譯到字節碼文件中時,所有的變量和方法引用都作為符號引用(symbolic Reference)保存在class文件的常量池里。
比如:描述一個方法調用了另外的其他方法時,就是通過常量池中指向方法的符號引用來表示的,那么動態鏈接的作用就是為了將這些符號引用轉換為調用方法的直接引用。
為什么需要運行時常量池?
因為在不同的方法,都可能調用常量或者方法,所以只需要存儲一份即可,節省了空間
常量池的作用:就是為了提供一些符號和常量,便于指令的識別
方法調用:解析與分配
在JVM中,將符號引用轉換為調用方法的直接引用與方法的綁定機制相關
鏈接
靜態鏈接
當一個字節碼文件被裝載進JVM內部時,如果被調用的目標方法在編譯期可知,且運行期保持不變時,這種情況下將調用方法的符號引用轉換為直接引用的過程稱之為靜態鏈接
動態鏈接
如果被調用的方法在編譯期無法被確定下來,也就是說,只能夠在程序運行期將調用的方法的符號轉換為直接引用,由于這種引用轉換過程具備動態性,因此也被稱之為動態鏈接。
綁定機制
對應的方法的綁定機制為:早期綁定(Early Binding)和晚期綁定(Late Binding)。綁定是一個字段、方法或者類在符號引用被替換為直接引用的過程,這僅僅發生一次。
早期綁定
早期綁定就是指被調用的目標方法如果在編譯期可知,且運行期保持不變時,即可將這個方法與所屬的類型進行綁定,這樣一來,由于明確了被調用的目標方法究竟是哪一個,因此也就可以使用靜態鏈接的方式將符號引用轉換為直接引用。
晚期綁定
如果被調用的方法在編譯期無法被確定下來,只能夠在程序運行期根據實際的類型綁定相關的方法,這種綁定方式也就被稱之為晚期綁定。
早晚期綁定的發展歷史
隨著高級語言的橫空出世,類似于Java一樣的基于面向對象的編程語言如今越來越多,盡管這類編程語言在語法風格上存在一定的差別,但是它們彼此之間始終保持著一個共性,那就是都支持封裝、繼承和多態等面向對象特性,既然這一類的編程語言具備多態特悄,那么自然也就具備早期綁定和晚期綁定兩種綁定方式。
Java中任何一個普通的方法其實都具備虛函數的特征(多態),它們相當于C++語言中的虛函數(C++中則需要使用關鍵字virtual來顯式定義)。如果在Java程序中不希望某個方法擁有虛函數的特征時,則可以使用關鍵字final來標記這個方法。
方法的調用:虛方法和非虛方法
- 如果方法在編譯期就確定了具體的調用版本,這個版本在運行時是不可變的。這樣的方法稱為非虛方法。
- 靜態方法、私有方法、final方法、實例構造器、父類方法都是非虛方法。
- 其他方法稱為虛方法。
子類對象的多態的使用前提
- 類的繼承關系
- 方法的重寫
虛擬機中提供了以下幾條方法調用指令:
普通調用指令:
- invokestatic:調用靜態方法,解析階段確定唯一方法版本
- invokespecial:調用方法、私有及父類方法,解析階段確定唯一方法版本
- invokevirtual:調用所有虛方法
- invokeinterface:調用接口方法
動態調用指令:
- invokedynamic:動態解析出需要調用的方法,然后執行
前四條指令固化在虛擬機內部,方法的調用執行不可人為干預,而invokedynamic指令則支持由用戶確定方法版本。其中invokestatic指令和invokespecial指令調用的方法稱為非虛方法,其余的(final 修飾的除外)稱為虛方法。
invokednamic指令
JVM字節碼指令集一直比較穩定,一直到Java7中才增加了一個invokedynamic指令,這是Java為了實現【動態類型語言】支持而做的一種改進。
但是在Java7中并沒有提供直接生成invokedynamic指令的方法,需要借助ASM這種底層字節碼工具來產生invokedynamic指令。直到Java8的Lambda表達式的出現,invokedynamic指令的生成,在Java中才有了直接的生成方式。
Java7中增加的動態語言類型支持的本質是對Java虛擬機規范的修改,而不是對Java語言規則的修改,這一塊相對來講比較復雜,增加了虛擬機中的方法調用,最直接的受益者就是運行在Java平臺的動態語言的編譯器。
動態類型語言和靜態類型語言
動態類型語言和靜態類型語言兩者的區別就在于對類型的檢查是在編譯期還是在運行期,滿足前者就是靜態類型語言,反之是動態類型語言。
說的再直白一點就是,靜態類型語言是判斷變量自身的類型信息;動態類型語言是判斷變量值的類型信息,變量沒有類型信息,變量值才有類型信息,這是動態語言的一個重要特征。
Java:String info = “mogu blog”; (Java是靜態類型語言的,會先編譯就進行類型檢查)
JS:var name = “shkstart”; var name = 10; (運行時才進行檢查)
方法重寫的本質
Java 語言中方法重寫的本質:
- 找到操作數棧頂的第一個元素所執行的對象的實際類型,記作C。
- 如果在類型C中找到與常量中的描述符合簡單名稱都相符的方法,則進行訪問權限校驗,如果通過則返回這個方法的直接引用,查找過程結束;如果不通過,則返回java.lang.IllegalAccessError 異常。
- 否則,按照繼承關系從下往上依次對C的各個父類進行第2步的搜索和驗證過程。
- 如果始終沒有找到合適的方法,則拋出java.lang.AbstractMethodsrror異常。
IllegalAccessError介紹
程序試圖訪問或修改一個屬性或調用一個方法,這個屬性或方法,你沒有權限訪問。一般的,這個會引起編譯器異常。這個錯誤如果發生在運行時,就說明一個類發生了不兼容的改變。
方法的調用:虛方法表
在面向對象的編程中,會很頻繁的使用到動態分派,如果在每次動態分派的過程中都要重新在類的方法元數據中搜索合適的目標的話就可能影響到執行效率。因此,為了提高性能,JVM采用在類的方法區建立一個虛方法表
(virtual method table)(非虛方法不會出現在表中)來實現。使用索引表來代替查找。
每個類中都有一個虛方法表,表中存放著各個方法的實際入口。
虛方法表是什么時候被創建的呢?
虛方法表會在類加載的鏈接階段(解析環節)被創建并開始初始化,類的變量初始值準備完成之后,JVM會把該類的方法表也初始化完畢。
如上圖所示:如果類中重寫了方法,那么調用的時候,就會直接在虛方法表中查找,否則將會直接連接到Object的方法中。
方法返回地址
存放調用該方法的pc寄存器的值。一個方法的結束,有兩種方式:
-
正常執行完成
-
出現未處理的異常,非正常退出
無論通過哪種方式退出,在方法退出后都返回到該方法被調用的位置。方法正常退出時,調用者的pc計數器的值作為返回地址,即調用該方法的指令的下一條指令的地址。而通過異常退出的,返回地址是要通過異常表來確定,棧幀中一般不會保存這部分信息。
當一個方法開始執行后,只有兩種方式可以退出這個方法:
執行引擎遇到任意一個方法返回的字節碼指令(return),會有返回值傳遞給上層的方法調用者,簡稱正常完成出口;
- 一個方法在正常調用完成之后,究竟需要使用哪一個返回指令,還需要根據方法返回值的實際數據類型而定。
- 在字節碼指令中,返回指令包含ireturn(當返回值是boolean,byte,char,short和int類型時使用),lreturn(Long類型),freturn(Float類型),dreturn(Double類型),areturn(引用類型)。另外還有一個return指令聲明為void的方法,實例初始化方法,類和接口的初始化方法使用。
在方法執行過程中遇到異常(Exception),并且這個異常沒有在方法內進行處理,也就是只要在本方法的異常表中沒有搜索到匹配的異常處理器,就會導致方法退出,簡稱異常完成出口。
方法執行過程中,拋出異常時的異常處理,存儲在一個異常處理表,方便在發生異常的時候找到處理異常的代碼
本質上,方法的退出就是當前棧幀出棧的過程。此時,需要恢復上層方法的局部變量表、操作數棧、將返回值壓入調用者棧幀的操作數棧、設置PC寄存器值等,讓調用者方法繼續執行下去。
正常完成出口和異常完成出口的區別在于:通過異常完成出口退出的不會給他的上層調用者產生任何的返回值。
一些附加信息
棧幀中還允許攜帶與Java虛擬機實現相關的一些附加信息。例如:對程序調試提供支持的信息。
棧的相關面試題
- 舉例棧溢出的情況?(StackOverflowError)
- 通過 -Xss設置棧的大小(OOM:內存溢出)
- 調整棧大小,就能保證不出現溢出么?
- 不能保證不溢出
- 分配的棧內存越大越好么?
- 不是,一定時間內降低了OOM概率,但是會擠占其它的線程空間,因為整個空間是有限的。
- 垃圾回收是否涉及到虛擬機棧?
- 不會
- 方法中定義的局部變量是否線程安全?
- 具體問題具體分析
總結一句話就是:如果對象是在內部產生,并在內部消亡,沒有返回到外部,那么它就是線程安全的,反之則是線程不安全的。
運行時數據區,是否存在Error和GC?
| 程序計數器 | 否 | 否 |
| 虛擬機棧 | 是 | 否 |
| 本地方法棧 | 是 | 否 |
| 方法區 | 是(OOM) | 是 |
| 堆 | 是 | 是 |
總結
- 上一篇: 04-程序计数器(PC计数器)
- 下一篇: 543. 二叉树的直径