當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[编程技巧] 巧用CPU缓存优化代码：数组 vs. 链表

發布時間：2025/6/15 编程问答 21 豆豆

生活随笔收集整理的這篇文章主要介紹了 [编程技巧] 巧用CPU缓存优化代码：数组 vs. 链表小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一個常見的編程問題：遍歷同樣大小的數組和鏈表，哪個比較快？如果按照大學教科書上的算法分析方法，你會得出結論，這2者一樣快，因為時間復雜度都是 O(n)。但是在實踐中，這2者卻有極大的差異。?? 通過下面的分析你會發現，其實數組比鏈表要快很多。首先介紹一個概念：memory hierarchy （存儲層次結構），電腦中存在多種不同的存儲器，如下表 CPU 寄存器 – immediate access (0-1個CPU時鐘周期)?
CPU L1 緩存? – fast access (3個CPU時鐘周期)?
CPU L2 緩存 – slightly slower access (10個CPU時鐘周期)?
內存 (RAM)?? – slow access (100個CPU時鐘周期)?
硬盤 (file system) – very slow (10,000,000個CPU時鐘周期)?
????? （數據來自?http://www.answers.com/topic/locality-of-reference）各級別的存儲器速度差異非常大，CPU寄存器速度是內存速度的100倍！這就是為什么CPU產商發明了CPU緩存。而這個CPU緩存，就是數組和鏈表的區別的關鍵所在。 CPU緩存會把一片連續的內存空間讀入，因為數組結構是連續的內存地址，所以數組全部或者部分元素被連續存在CPU緩存里面，平均讀取每個元素的時間只要3個CPU時鐘周期。?? 而鏈表的節點是分散在堆空間里面的，這時候CPU緩存幫不上忙，只能是去讀取內存，平均讀取時間需要100個CPU時鐘周期。這樣算下來，數組訪問的速度比鏈表快33倍！（這里只是介紹概念，具體的數字因CPU而異）因此，程序中盡量使用連續的數據結構，這樣可以充分發揮CPU緩存的威力。這種對緩存友好的算法稱為 Cache-oblivious algorithm，有興趣可以參考相關資料。再舉一個簡單例子：對比 for i in 0..n
? for j in 0..m
??? for k in 0..p
????? C[i][j] = C[i][j] + A[i][k] * B[k][j];
和 for i in 0..n for k in 0..p
??? for j in 0..m
????? C[i][j] = C[i][j] + A[i][k] * B[k][j]; 雖然兩者執行結果一樣，算法復雜度也一樣，但是你會發現第二種寫法要快很多。總結一下，各種存儲器的速度差異很大，在編程中絕對有必要考慮這個因素。比如，內存速度比硬盤快1萬倍，所以程序中應該盡量避免頻繁的硬盤讀寫；CPU緩存比內存快幾十倍，在程序中盡量多加利用。

本文轉自陳本峰 51CTO博客，原文鏈接：http://blog.51cto.com/wingeek/274006，如需轉載請自行聯系原作者

總結

以上是生活随笔為你收集整理的[编程技巧] 巧用CPU缓存优化代码：数组 vs. 链表的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：正态随机分布 C++实现
下一篇：升级Win10后windows.old删