Java 字符串拼接的各种玩法
java中字符串拼接各種方式與執行效率
由于String對象是不可變對象,因此在需要對字符串進行修改操作時(如字符串連接和替換),String對象總是會生成新的對象,所以其性能相對較差。
String常量的累加操作:對于靜態字符串的連接操作,Java在編譯時會進行徹底的優化,將多個連接操作的字符串在編譯時合成一個單獨的長字符串。
String變量的累加操作:底層使用了StringBuilder的功能。
StringBuffer和StringBuilder的擴容分析
當字符串緩沖區容量不足時,原有容量將會加倍,以新的容量來申請內存空間,建立新的char數組,然后將原數組中的內容復制到這個新的數組當中。因此,對于大對象的擴容會涉及大量的內存復制操作。所以,如果能夠預先評估StringBuilder或StringBuffer的大小,將能夠有效的節省這些操作,從而提高系統的性能。
JAVA的字符串拼接與性能
在JAVA中拼接兩個字符串的最簡便的方式就是使用操作符”+”了。如果你用”+”來連接固定長度的字符串,可能性能上會稍受影響,但是如果你是在循環中來”+”多個串的話,性能將指數倍的下降。假設有一個字符串,我們將對這個字符串做大量循環拼接操作,使用”+”的話將得到最低的性能。但是究竟這個性能有多差?
+, Join,StringBuffer,StringBuilder或String.concat()
1 . String 是final對象,不會被修改,每次使用 + 進行拼接都會創建新的對象,而不是改變原來的對象,也屬于線程安全的;
2 . StringBuffer可變字符串,主要用于字符串的拼接,屬于線程安全的;(StringBuffer的append操作用了synchronized)
3 . StringBuilder可變字符串,主要用于字符串的拼接,屬于線程不安全的;
1 循環操作:
特別注意
StringBuilder和StringBuffer循環的次數是其它的10倍,如果是一樣,那么可能返回0,可見StringBuilder和StringBuffer的速度之快。
性能分析
1 . StringBuilder性能比StringBuffer要好點。在1千萬的循環下, StringBuilder大約在500-600毫秒,而StringBuffer大約在700-800毫秒;
2 . StringUtils.join方式性能也是可以的,在循環不是很大的情況下,該種方式也是可以考慮的;
3 . 另外2種方式,在循環的情況下,盡量不要使用。
因此,即時在做最簡單的拼接時,如果我們不想創建StringBuffer或StringBuilder實例時,我們也應該使用concat。但是對于大量的字符串拼接操作,就不應該使用concat,因為concat會降低你程序的性能,消耗你的cpu。因此,在不考慮線程安全和同步的情況下,為了獲得最高的性能,我們應盡量使用StringBuilder。
總結
1.用+的方式效率最差,concat由于是內部機制實現,比+的方式好了不少。
2.Join和StringBuffer,相差不大,Join方式要快些,可見這種JavaScript中快速拼接字符串的方式在Java中也非常適用。
3.StringBuilder 的速度最快,但其有線程安全的問題,而且只有JDK5及以上的版本支持。
4.String對象串聯的效率最慢,單線程下字符串的串聯用StringBuilder,多線程下字符串的串聯用StrngBuffer。
5.在編譯階段就能夠確定的字符串常量,完全沒有必要創建String或StringBuffer對象。直接使用字符串常量的"+"連接操作效率最高(如:String str = “a” + “b” + “c”;)。
字符串拼接玩法分步深入探析
“+”號操作符
從實用方面來說,“+”號操作符必須是字符串拼接最常用的一種了,沒有之一。
String chenmo = "沉默"; String wanger = "王二"; System.out.println(chenmo + wanger);我們把這段代碼使用 JAD 反編譯一下。
String chenmo = "u6C89u9ED8"; // 沉默 String wanger = "u738Bu4E8C"; // 王二 System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());程序在編譯的時候把“+”號操作符替換成了 StringBuilder 的 append 方法。也就是說,“+”號操作符在拼接字符串的時候只是一種形式主義,讓開發者使用起來比較簡便,代碼看起來比較簡潔,讀起來比較順暢。
StringBuilder
除去“+”號操作符,StringBuilder 的 append 方法就是第二個常用的字符串拼接姿勢了。
先來看一下 StringBuilder 類的 append 方法的源碼:
public StringBuilder append(String str) { super.append(str); return this; }這 3 行代碼沒啥可看的,可看的是父類
AbstractStringBuilder 的 append 方法: public AbstractStringBuilder append(String str) { if (str == null) return appendNull(); int len = str.length(); ensureCapacityInternal(count + len); str.getChars(0, len, value, count); count += len; return this; }1 . 判斷拼接的字符串是不是 null,如果是,當做字符串“null”來處理。appendNull 方法的源碼如下:
private AbstractStringBuilder appendNull() { int c = count; ensureCapacityInternal(c + 4); final char[] value = this.value; value[c++] = 'n'; value[c++] = 'u'; value[c++] = 'l'; value[c++] = 'l'; count = c; return this; }2 . 拼接后的字符數組長度是否超過當前值,如果超過,進行擴容并復制。ensureCapacityInternal 方法的源碼如下:
private void ensureCapacityInternal(int minimumCapacity) { // overflow-conscious code if (minimumCapacity - value.length > 0) { value = Arrays.copyOf(value, newCapacity(minimumCapacity)); } }3 . 將拼接的字符串 str 復制到目標數組 value 中。
str.getChars(0, len, value, count)StringBuffer
先有 StringBuffer 后有 StringBuilder,兩者就像是孿生雙胞胎,該有的都有, StringBuffer 是線程安全的。
public synchronized StringBuffer append(String str) { toStringCache = null; super.append(str); return this; }StringBuffer 類的 append 方法比 StringBuilder 多了一個關鍵字 synchronized,可暫時忽略 toStringCache = null。
synchronized 是 Java 中的一個非常容易臉熟的關鍵字,是一種同步鎖。它修飾的方法被稱為同步方法,是線程安全的。
String 類的 concat 方法
String 類的 concat 方法就好像 StringBuilder 類的 append。
String chenmo = "沉默"; String wanger = "王二"; System.out.println(chenmo.concat(wanger));在這個時候,我突然產生了一個奇妙的想法。假如有這樣兩行代碼:
chenmo += wanger chenmo = chenmo.concat(wanger)它們之間究竟有多大的差別呢?
我們已經了解到,chenmo += wanger 實際上相當于 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。
要探究“+”號操作符和 concat 之間的差別,實際上要看 append 方法和 concat 方法之間的差別。
append 方法的源碼分析過了。我們來看一下 concat 方法的源碼。
public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true); }1 . 如果拼接的字符串的長度為 0,那么返回拼接前的字符串。
if (otherLen == 0) { return this; }2 . 將原字符串的字符數組 value 復制到變量 buf 數組中。
char buf[] = Arrays.copyOf(value, len + otherLen);3 . 把拼接的字符串 str 復制到字符數組 buf 中,并返回新的字符串對象。
str.getChars(buf, len); return new String(buf, true);通過分析我們大致可以得出以下結論
如果拼接的字符串是 null,concat 時候就會拋出 NullPointerException,“+”號操作符會當做是“null”字符串來處理。如果拼接的字符串是一個空字符串(""),那么 concat 的效率要更高一點。畢竟不需要 new StringBuilder 對象。如果拼接的字符串非常多,concat 的效率就會下降,因為創建的字符串對象越多,開銷就越大。注意
在JSP中, EL 表達式中是不允許使用“+”操作符來拼接字符串的,這時候就只能用 concat 了。
String 類的 join 方法
JDK 1.8 提供了一種新的字符串拼接姿勢:String 類增加了一個靜態方法 join。
String chenmo = "快樂"; String wanger = "王二"; String cmower = String.join("", chenmo, wanger); System.out.println(cmower);第一個參數為字符串連接符,比如說:
String message = String.join("-", "王二", "今天", "悶悶不樂的");輸出結果為:王二-今天-悶悶不樂的
我們來看一下 join 方法的源碼:
public static String join(CharSequence delimiter, CharSequence... elements) { Objects.requireNonNull(delimiter); Objects.requireNonNull(elements);StringJoiner joiner = new StringJoiner(delimiter); for (CharSequence cs: elements) { joiner.add(cs); } return joiner.toString(); }發現了一個新類 StringJoiner。StringJoiner 是 java.util 包中的一個類,用于構造一個由分隔符重新連接的字符序列。
StringUtils.join
實戰項目當中,我們處理字符串的時候,經常會用到這個類——org.apache.commons.lang3.StringUtils,該類的 join 方法是字符串拼接的一種新姿勢。
String chenmo = "快樂"; String wanger = "王二"; StringUtils.join(chenmo, wanger);該方法更善于拼接數組中的字符串,并且不用擔心
NullPointerException。 StringUtils.join(null) = null StringUtils.join([]) = "" StringUtils.join([null]) = "" StringUtils.join(["a", "b", "c"]) = "abc" StringUtils.join([null, "", "a"]) = "a"通過查看源碼我們可以發現,其內部使用的仍然是 StringBuilder。
public static String join(final Object[] array, String separator, final int startIndex, final int endIndex) { if (array == null) { return null; } if (separator == null) { separator = EMPTY; } final StringBuilder buf = new StringBuilder(noOfItems * 16); for (int i = startIndex; i if (i > startIndex) { buf.append(separator); } if (array[i] != null) { buf.append(array[i]); } } return buf.toString(); }我們看著這里可能會感到驚訝,字符串拼接足足有 6 種姿勢啊,我要好好試一下。
為什么不建議在 for 循環中使用”+”號操作符進行字符串拼接呢?
根據兩段代碼進行分析。
第一段,for 循環中使用”+”號操作符。
String result = ""; for (int i = 0; i result += "八八八"; }第二段,for 循環中使用 append。
StringBuilder sb = new StringBuilder(); for (int i = 0; i sb.append("八八八"); }這兩段代碼的耗時時間
第一段代碼執行完的時間為 6312 毫秒第二段代碼執行完的時間為 2毫秒差距為什么這么大呢?
第一段的 for 循環中創建了大量的 StringBuilder 對象,而第二段代碼至始至終只有一個 StringBuilder 對象。
總結
以上是生活随笔為你收集整理的Java 字符串拼接的各种玩法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Spring Boot html页面解析
- 下一篇: C++ vector,STL vect