String s = new String(xyz)创建了几个实例你真的能答对吗?
String s = new String("xyz"); 創建了幾個實例?
這是一道很經典的面試題,在一本所謂的Java寶典上,我看到的“標準答案”是這樣的:
兩個,一個堆區的“xyz”,一個棧區指向“xyz”的s。
這個所謂的“標準答案”槽點更多,后面我們會慢慢分析。
雖然答案很離譜,但是我覺得這個問題本身也不具有什么意義,因為問題沒有既定義“創建”的具體含義,又沒有指定“創建”的時間,是運行時嗎?包不包括類加載的時候?有沒有上下文代碼語境?也沒有定義實例是指什么實例,是指Java實例嗎?還是單指String實例?包不包括JVM中的C++實例?
顯然,這個問題是一個“有問題的問題”。這個答案也是一個“有問題的答案”。
String結構
在分析之前,為了能更好的理解后面的知識點,我們需要對Java中的String結構有一個大致了解:
從上圖可以看出,String類有三個屬性:
value:char數組,用于用于存儲字符
hash:緩存字符串的哈希碼,默認為0
serialVersionUID:序列化用的
正常的問題與“合理的解釋”
在上面的題干上加上"String"限定詞,可以得到一個比較合理的問題:
String s = new String("xyz");創建幾個String實例?
對于這個問題,網上也有很多錯誤的答案和解析,我認為這個答案看起來比較合理:
兩個,一個是字符串字面量"xyz"所對應的、存在于全局共享的常量池中的實例,另一個是通過new關鍵字創建并初始化的、內容(字符)與"xyz"相同的實例。如果常量池中如果已經存在這個字符串,就只會創建一個。同時在棧區還會有一個對new出來的String實例的引用s。
考慮到了棧與堆,提到了常量池,我認為這已經達到大部分面試官對這個題目答案的期許了,或許這也是面試官想要考察的點。
但這個答案也僅是比較合理,并不完全正確。
首先,我不理解的是為什么很多答主總是用“常量池”來代替“字符串常量池”,在Java體系中,其實是有三個常量池的,三個常量池的概念和用處都不相同,混淆在一起容易給別人造成誤解。
其次,就算答主說的“常量池”就是“字符串常量池”,可“字符串常量池”中存的是String實例的引用,而不是字符串,這是有很大區別的。而且這個答案是沒有考慮代碼執行的環境。
這些問題,下面都會一一分析。
分清變量和實例
我們先回到開頭的問題與“標準答案” :
String s = new String("xyz"); 創建了幾個實例?
兩個,一個堆區的“xyz”,一個棧區指向“xyz”的s
很明顯寫答案的人沒有把變量和實例分清楚。在Java里,變量就是變量,類型的變量只是對某個對象實例或者null的,不是實例本身。聲明變量的個數跟創建實例的個數沒有必然關系。
舉個例子:
String?s1?=?"xyz";?? String?s2?=?s1.concat("");?? String?s3?=?null;?? new?String(s1);??這段代碼會涉及3個String類型的變量:?
s1,指向下面String實例的1?
s2,指向與s1相同?
s3,值為null,不指向任何實例?
以及3個String實例:
"xyz"字面量對應的駐留的字符串常量的String實例?
""空字符串字面量對應的駐留的字符串常量的String實例?
通過new String(String)創建的新String實例,沒有任何變量指向它
類加載
對于String s = new String("xyz");創建幾個String實例?這個問題。
似乎網上的所有答案都把類加載過程和實際執行過程合在一起分析的。看起來是沒有什么問題的,因為想要執行某個代碼片段,其所在的類必然要被加載,而且對于同一個類加載器,最多加載一次。
但是我們看一下這段代碼的字節碼:
字節碼中似乎只出現了一次new java/lang/String,也就是只創建了一個String實例。也就是說原問題中的代碼在每執行一次只會新創建一個String實例。
這里的ldc指令只是把先前在類加載過程中已經創建好的一個String實例("xyz")的一個引用壓到操作數棧頂而已,并沒有創建新的String實例。
不是應該有兩個實例嗎?還有一個String實例是在什么時候創建的呢?
還有一個String實例在類加載的時候創建。
我們都知道類加載的解析階段是Java虛擬機將常量池內的符號引用替換為直接引用的過程,根據JVM規范,符合規范的JVM實現應該在類加載的過程中創建并駐留一個String實例作為常量來對應"xyz"字面量,具體是在類加載的解析階段進行的。這個常量是全局共享的,只在先前尚未有內容相同的字符串駐留過的前提下才需要創建新的String實例。?
所以你可以理解成:
在類加載的解析階段,其實已經創建了一個String實例,執行代碼的時候,又new了一個String實例。
JVM的優化
以上討論都只是針對規范所定義的Java語言與Java虛擬機而言。概念上是如此,但實際的JVM實現可以做得更優化,原問題中的代碼片段有可能在實際執行的時候一個String實例也不會完整創建(沒有分配空間)。?
不結合上下文代碼來看就直接說是“標準答案”就是耍流氓。
我們看下這段代碼:
運行這段代碼,會不斷的創建String對象吃內存,然后頻繁的造成GC。對于這個結論相信大家都沒有意見。
我們加上-XX:+PrintGC打印日志;加上-XX:-DoEscapeAnalysis關閉逃逸分析(JDK8默認開啟此優化,我們先關閉)
運行一下看看:
結果確實如我們所料,不斷的創建String對象吃內存,造成頻繁GC。
我們現在將-XX:-DoEscapeAnalysis改成-XX:+DoEscapeAnalysis,重新跑一下這段代碼:
神奇的事情發生了,繼續跑下去也沒有再打出GC日志了。難道新創建String對象都不吃內存了么??
實際情況是:經過HotSpot VM的的優化后,newString()方法不會新創建String實例了。這樣自然不吃內存,也就不再觸發GC了。?
現在再來看開篇的那個問題,不結合具體情況,還能簡單的說String s = new String("xyz");會創建兩個String實例嗎?
我只是舉了一個逃逸分析的例子,HotSpot VM還有很多像這樣的優化,比如方法內聯、標量替換和無用代碼削除。這些都會影響對象的創建的。
klass-oop
如果題干上沒有加上“Java”實例的定語,那JVM中的oop實例我們也不應該忽略。
為了后面能更好的說清楚這一點,先大致的介紹一下klass-opp模型。先做一個約定,全文只要涉及JVM具體實現的內容都是基于Jdk8中HotSpot VM展開的。
HotSpot VM是基于C++實現,而C++是一門面向對象的語言,本身是具備面向對象基本特征的,所以Java中的對象表示,最簡單的做法是為每個Java類生成一個C++類與之對應。但HotSpot VM并沒有這么做,而是設計了一套klass-oop模型。
klass,它是Java類的元信息在JVM中的存在形式。一個Java類被JVM類加載器加載之后,就是以klass的形式存在于JVM之中。
oop,它是Java對象在JVM中的存在形式。每創建一個新的對象,在JVM內部就會相應地創建一個對應類型的OOP對象。
其中instanceOopDesc表示非數組對象;
arrayOopDesc表示數組對象;
而objArrayOopDesc表示引用類型數組對象;
typeArrayOopDesc表示基本類型數組對象。
舉個例子:Java中String類的一個實例,在JVM中會有一個對應的instanceOopDesc實例。
字符串常量池
在Java體系中,有三種常量池:
class字節碼中的常量池:存在于硬盤上。主要存放字面量和符號引用。
運行時常量池:方法區的一部分。我們常說的常量池,就是指這一塊區域。
字符串常量池:存在于堆區。這個常量池在JVM層面就是一個StringTable,只存儲對java.lang.String實例的引用,而不存儲String對象的內容。一般我們說一個字符串進入了字符串常量池其實是說在這個StringTable中保存了對它的引用,反之,如果說沒有在其中就是說StringTable中沒有對它的引用。
今天,我們要了解的是字符串常量池。
字符串常量池,即String Pool。在JVM中對應的類是StringTable,底層實現是一個Hashtable。利用的是哈希思想。
看一段往字符串常量池添加字符串引用的方法:
上面面這段代碼雖然是C++寫的,但我相信學過Java的人都能看懂,至少也能明白這段代碼干了什么事情。無非是通過String的內容+長度生成的hashValue值定位下標index,然后將Java的String類的實例對應的instanceOopDesc封裝成HashtableEntry作為存儲結構存儲到常量池。
補充完字符串常量池的知識之后,我們再回到文章開頭的那一題:
String s = new String("xyz");創建了幾個實例?
如果包括JVM中的C++實例的話,有兩個Java的String實例,兩個String實例對應的instanceOopDesc實例,還有一個char[]數組對應的typeArrayOopDesc實例,加一起一共是5個。也可以說2個String實例加上3個oop實例。
不理解的可以看下面這張內存圖(圖中省略了兩個String對應的instanceOopDesc實例)。
總結
String s = new String("xyz"); 創建了幾個實例?
通過以上的分析,我們會發現,每在這道題目的題干上每加一個定語,這道題目就會有不同的答案。是否考慮類加載過程,是否考慮JVM優化,是否包括對應的oop實例等等等等,都會有不同的答案。
如果下次有人問你這個問題,不妨把這篇的文章分享給他。
寫在最后
為了寫這一篇文章,我翻看了很多@RednaxelaFX前輩和周志明前輩的博客,過程中收益良多。在這里感謝前輩們為國內JVM的科普與發展做出的貢獻!
文中涉及代碼:https://github.com/xiaoyingzhi/blog
參考文章:
http://isfeasible.cn/posts/view/5b84b6ab3957bb300a5bca94
https://www.iteye.com/blog/rednaxelafx-774673
http://lovestblog.cn/blog/2014/06/28/hsdb-string/
有道無術,術可成;有術無道,止于術
歡迎大家關注Java之道公眾號
好文章,我在看??
總結
以上是生活随笔為你收集整理的String s = new String(xyz)创建了几个实例你真的能答对吗?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: windows 7 memcached报
- 下一篇: 又发现一款牛逼的 API 敏捷开发工具