當前位置：首頁 > 编程语言 > java >内容正文

java

Java CAS 原理分析

發布時間：2025/3/21 java 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java CAS 原理分析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.簡介

CAS 全稱是 compare and swap，是一種用于在多線程環境下實現同步功能的機制。CAS 操作包含三個操作數 – 內存位置、預期數值和新值。CAS 的實現邏輯是將內存位置處的數值與預期數值想比較，若相等，則將內存位置處的值替換為新值。若不相等，則不做任何操作。

在 Java 中，Java 并沒有直接實現 CAS，CAS 相關的實現是通過 C++ 內聯匯編的形式實現的。Java 代碼需通過 JNI 才能調用。關于實現上的細節，我將會在第3章進行分析。

前面說了 CAS 操作的流程，并不是很難。但僅有上面的說明還不夠，接下來我將會再介紹一點其他的背景知識。有這些背景知識，才能更好的理解后續的內容。

?2.背景介紹

我們都知道，CPU 是通過總線和內存進行數據傳輸的。在多核心時代下，多個核心通過同一條總線和內存以及其他硬件進行通信。如下圖：

圖片出處：《深入理解計算機系統》

上圖是一個較為簡單的計算機結構圖，雖然簡單，但足以說明問題。在上圖中，CPU 通過兩個藍色箭頭標注的總線與內存進行通信。大家考慮一個問題，CPU 的多個核心同時對同一片內存進行操作，若不加以控制，會導致什么樣的錯誤？這里簡單說明一下，假設核心1經32位帶寬的總線向內存寫入64位的數據，核心1要進行兩次寫入才能完成整個操作。若在核心1第一次寫入32位的數據后，核心2從核心1寫入的內存位置讀取了64位數據。由于核心1還未完全將64位的數據全部寫入內存中，核心2就開始從該內存位置讀取數據，那么讀取出來的數據必定是混亂的。

不過對于這個問題，實際上不用擔心。通過 Intel 開發人員手冊，我們可以了解到自奔騰處理器開始，Intel 處理器會保證以原子的方式讀寫按64位邊界對齊的四字（quadword）。

根據上面的說明，我們可總結出，Intel 處理器可以保證單次訪問內存對齊的指令以原子的方式執行。但如果是兩次訪存的指令呢？答案是無法保證。比如遞增指令inc dword ptr [...]，等價于DEST = DEST + 1。該指令包含三個操作讀->改->寫，涉及兩次訪存。考慮這樣一種情況，在內存指定位置處，存放了一個為1的數值。現在 CPU 兩個核心同時執行該條指令。兩個核心交替執行的流程如下：

核心1 從內存指定位置出讀取數值1，并加載到寄存器中

核心2 從內存指定位置出讀取數值1，并加載到寄存器中

核心1 將寄存器中值遞減1

核心2 將寄存器中值遞減1

核心1 將修改后的值寫回內存

核心2 將修改后的值寫回內存

經過執行上述流程，內存中的最終值時2，而我們期待的是3，這就出問題了。要處理這個問題，就要避免兩個或多個核心同時操作同一片內存區域。那么怎樣避免呢？這就要引入本文的主角 - lock 前綴。關于該指令的詳細描述，可以參考 Intel 開發人員手冊 Volume 2 Instruction Set Reference，Chapter 3 Instruction Set Reference A-L。我這里引用其中的一段，如下：

LOCK—Assert LOCK# Signal Prefix
Causes the processor’s LOCK# signal to be asserted during execution of the accompanying instruction (turns the instruction into an atomic instruction). In a multiprocessor environment, the LOCK# signal?ensures that the processor has exclusive use of any shared memory?while the signal is asserted.

上面描述的重點已經用黑體標出了，在多處理器環境下，LOCK# 信號可以確保處理器獨占使用某些共享內存。lock 可以被添加在下面的指令前：

ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, CMPXCHG16B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, and XCHG.

通過在 inc 指令前添加 lock 前綴，即可讓該指令具備原子性。多個核心同時執行同一條 inc 指令時，會以串行的方式進行，也就避免了上面所說的那種情況。那么這里還有一個問題，lock 前綴是怎樣保證核心獨占某片內存區域的呢？答案如下：

在 Intel 處理器中，有兩種方式保證處理器的某個核心獨占某片內存區域。第一種方式是通過鎖定總線，讓某個核心獨占使用總線，但這樣代價太大。總線被鎖定后，其他核心就不能訪問內存了，可能會導致其他核心短時內停止工作。第二種方式是鎖定緩存，若某處內存數據被緩存在處理器緩存中。處理器發出的 LOCK# 信號不會鎖定總線，而是鎖定緩存行對應的內存區域。其他處理器在這片內存區域鎖定期間，無法對這片內存區域進行相關操作。相對于鎖定總線，鎖定緩存的代價明顯比較小。關于總線鎖和緩存鎖，更詳細的描述請參考 Intel 開發人員手冊 Volume 3 Software Developer’s Manual，Chapter 8 Multiple-Processor Management。

?3.源碼分析

有了上面的背景知識，現在我們就可以從容不迫的閱讀 CAS 的源碼了。本章的內容將對 java.util.concurrent.atomic 包下的原子類 AtomicInteger 中的 compareAndSet 方法進行分析，相關分析如下：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

public class AtomicInteger extends Number implements java.io.Serializable {// setup to use Unsafe.compareAndSwapInt for updatesprivate static final Unsafe unsafe = Unsafe.getUnsafe();private static final long valueOffset;static {try {// 計算變量 value 在類對象中的偏移valueOffset = unsafe.objectFieldOffset(AtomicInteger.class.getDeclaredField("value"));} catch (Exception ex) { throw new Error(ex); }}private volatile int value;public final boolean compareAndSet(int expect, int update) {/** compareAndSet 實際上只是一個殼子，主要的邏輯封裝在 Unsafe 的 * compareAndSwapInt 方法中*/return unsafe.compareAndSwapInt(this, valueOffset, expect, update);}// ...... }public final class Unsafe {// compareAndSwapInt 是 native 類型的方法，繼續往下看public final native boolean compareAndSwapInt(Object o, long offset,int expected,int x);// ...... }

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63

// unsafe.cpp /** 這個看起來好像不像一個函數，不過不用擔心，不是重點。UNSAFE_ENTRY 和 UNSAFE_END 都是宏，* 在預編譯期間會被替換成真正的代碼。下面的 jboolean、jlong 和 jint 等是一些類型定義（typedef）：* * jni.h* typedef unsigned char jboolean;* typedef unsigned short jchar;* typedef short jshort;* typedef float jfloat;* typedef double jdouble;* * jni_md.h* typedef int jint;* #ifdef _LP64 // 64-bit* typedef long jlong;* #else* typedef long long jlong;* #endif* typedef signed char jbyte;*/ UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))UnsafeWrapper("Unsafe_CompareAndSwapInt");oop p = JNIHandles::resolve(obj);// 根據偏移量，計算 value 的地址。這里的 offset 就是 AtomaicInteger 中的 valueOffsetjint* addr = (jint *) index_oop_from_field_offset_long(p, offset);// 調用 Atomic 中的函數 cmpxchg，該函數聲明于 Atomic.hpp 中return (jint)(Atomic::cmpxchg(x, addr, e)) == e; UNSAFE_END// atomic.cpp unsigned Atomic::cmpxchg(unsigned int exchange_value,volatile unsigned int* dest, unsigned int compare_value) {assert(sizeof(unsigned int) == sizeof(jint), "more work to do");/** 根據操作系統類型調用不同平臺下的重載函數，這個在預編譯期間編譯器會決定調用哪個平臺下的重載* 函數。相關的預編譯邏輯如下：* * atomic.inline.hpp：* #include "runtime/atomic.hpp"* * // Linux* #ifdef TARGET_OS_ARCH_linux_x86* # include "atomic_linux_x86.inline.hpp"* #endif* * // 省略部分代碼* * // Windows* #ifdef TARGET_OS_ARCH_windows_x86* # include "atomic_windows_x86.inline.hpp"* #endif* * // BSD* #ifdef TARGET_OS_ARCH_bsd_x86* # include "atomic_bsd_x86.inline.hpp"* #endif* * 接下來分析 atomic_windows_x86.inline.hpp 中的 cmpxchg 函數實現*/return (unsigned int)Atomic::cmpxchg((jint)exchange_value, (volatile jint*)dest,(jint)compare_value); }

上面的分析看起來比較多，不過主流程并不復雜。如果不糾結于代碼細節，還是比較容易看懂的。接下來，我會分析 Windows 平臺下的 Atomic::cmpxchg 函數。繼續往下看吧。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

// atomic_windows_x86.inline.hpp #define LOCK_IF_MP(mp) __asm cmp mp, 0 \__asm je L0 \__asm _emit 0xF0 \__asm L0:inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {// alternative for InterlockedCompareExchangeint mp = os::is_MP();__asm {mov edx, destmov ecx, exchange_valuemov eax, compare_valueLOCK_IF_MP(mp)cmpxchg dword ptr [edx], ecx} }

上面的代碼由 LOCK_IF_MP 預編譯標識符和 cmpxchg 函數組成。為了看到更清楚一些，我們將 cmpxchg 函數中的 LOCK_IF_MP 替換為實際內容。如下：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {// 判斷是否是多核 CPUint mp = os::is_MP();__asm {// 將參數值放入寄存器中mov edx, dest // 注意: dest 是指針類型，這里是把內存地址存入 edx 寄存器中mov ecx, exchange_valuemov eax, compare_value// LOCK_IF_MPcmp mp, 0/** 如果 mp = 0，表明是線程運行在單核 CPU 環境下。此時 je 會跳轉到 L0 標記處，* 也就是越過 _emit 0xF0 指令，直接執行 cmpxchg 指令。也就是不在下面的 cmpxchg 指令* 前加 lock 前綴。*/je L0/** 0xF0 是 lock 前綴的機器碼，這里沒有使用 lock，而是直接使用了機器碼的形式。至于這樣做的* 原因可以參考知乎的一個回答：* https://www.zhihu.com/question/50878124/answer/123099923*/ _emit 0xF0 L0:/** 比較并交換。簡單解釋一下下面這條指令，熟悉匯編的朋友可以略過下面的解釋:* cmpxchg: 即“比較并交換”指令* dword: 全稱是 double word，在 x86/x64 體系中，一個 * word = 2 byte，dword = 4 byte = 32 bit* ptr: 全稱是 pointer，與前面的 dword 連起來使用，表明訪問的內存單元是一個雙字單元* [edx]: [...] 表示一個內存單元，edx 是寄存器，dest 指針值存放在 edx 中。* 那么 [edx] 表示內存地址為 dest 的內存單元* * 這一條指令的意思就是，將 eax 寄存器中的值（compare_value）與 [edx] 雙字內存單元中的值* 進行對比，如果相同，則將 ecx 寄存器中的值（exchange_value）存入 [edx] 內存單元中。*/cmpxchg dword ptr [edx], ecx} }

到這里 CAS 的實現過程就講完了，CAS 的實現離不開處理器的支持。以上這么多代碼，其實核心代碼就是一條帶lock 前綴的 cmpxchg 指令，即lock cmpxchg dword ptr [edx], ecx。

?4.ABA 問題

談到 CAS，基本上都要談一下 CAS 的 ABA 問題。CAS 由三個步驟組成，分別是“讀取->比較->寫回”。考慮這樣一種情況，線程1和線程2同時執行 CAS 邏輯，兩個線程的執行順序如下：

時刻1：線程1執行讀取操作，獲取原值 A，然后線程被切換走

時刻2：線程2執行完成 CAS 操作將原值由 A 修改為 B

時刻3：線程2再次執行 CAS 操作，并將原值由 B 修改為 A

時刻4：線程1恢復運行，將比較值（compareValue）與原值（oldValue）進行比較，發現兩個值相等。
然后用新值（newValue）寫入內存中，完成 CAS 操作

如上流程，線程1并不知道原值已經被修改過了，在它看來并沒什么變化，所以它會繼續往下執行流程。對于 ABA 問題，通常的處理措施是對每一次 CAS 操作設置版本號。java.util.concurrent.atomic 包下提供了一個可處理 ABA 問題的原子類 AtomicStampedReference，具體的實現這里就不分析了，有興趣的朋友可以自己去看看。

?5.總結

寫到這里，這篇文章總算接近尾聲了。雖然 CAS 本身的原理，包括實現都不是很難，但是寫起來真的不太好寫。這里面涉及到了一些底層的知識，雖然能看懂，但想說明白，還是有點難度的。由于我底層的知識比較欠缺，上面的一些分析難免會出錯。所以如有錯誤，請輕噴，當然最好能說明怎么錯的，感謝。

好了，本篇文章就到這里。感謝閱讀，再見。

?參考

Compare-and-swap - wikipedia
多核環境下的內存屏障指令 - 云風
Intel? 64 and IA-32 Architectures Software Developer’s Manual
一條C語言語句不一定是原子操作，但是一個匯編指令是原子操作嗎？- 知乎
下面這個宏中的emit指令是干什么的？- 知乎
消失的北橋 - txwm8905

?附錄

在前面源碼分析一節中用到的幾個文件，這里把路徑貼出來。有助于大家進行索引，如下：

文件名路徑

Unsafe.java	openjdk/jdk/src/share/classes/sun/misc/Unsafe.java
unsafe.cpp	openjdk/hotspot/src/share/vm/prims/unsafe.cpp
atomic.cpp	openjdk/hotspot/src/share/vm/runtime/atomic.cpp
atomic_windows_x86.inline.hpp	openjdk/hotspot/src/os_cpu/windows_x86/vm/atomic_windows_x86.inline.hpp

本文鏈接：?https://www.tianxiaobo.com/2018/05/15/Java-中的-CAS-原理分析/

from:?http://www.tianxiaobo.com/2018/05/15/Java-%E4%B8%AD%E7%9A%84-CAS-%E5%8E%9F%E7%90%86%E5%88%86%E6%9E%90/?

總結

以上是生活随笔為你收集整理的Java CAS 原理分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Java 重入锁 ReentrantLo
下一篇： Spring IOC 容器源码分析 -