怎么调试内存溢出的c++代码_【C/C++】内存对齐 到底怎么回事?
1 明確幾個概念
代碼分區:在使用C/C++編程時,我們定義的變量存在于內存中,而內存在C語言的角度上可以分為五大區。局部變量在棧區,靜態/全局變量在全局區,動態申請的變量存在于堆區,const修飾的變量/字符常量存在于只讀區。無論是什么樣的變量,終究在內存中。
CPU取指,譯碼,執行:存在于內存中的目的是為了CPU通過總線的進行尋址,取指令,譯碼,執行取數據,內存與寄存器交互,然后CPU運算,再輸出數據至內存。這個過程反復的,高速的執行。
CPU位數:在計算機中,最小的存儲單元為字節(Byte),理論上任意地址(比如0x20000002,0x20000003,0x2000011...)都可以通過總線進行訪問(CPU尋址),而每次尋址后,傳輸的數據大小跟CPU位數相關,常見的CPU位數有8位,16位,32位,64位。位數越高,單次操作執行的數據量越大,性能也就越強。
OS位數:操作系統一般與CPU位數相匹配,32位CPU可以尋址4GB內存空間,可以運行32位的OS。同樣,64位的CPU可以運行32位的OS,也可以運行64位的OS。
Compiler:雖然編譯器都是在翻譯/編譯代碼,進行預處理(宏展開,頭文件展開),編譯(語法檢查等),匯編(翻譯為機器碼),鏈接(重定位等)這四部分的工作。但是不同的編譯器的內部默認設置以及用法會有所差異,常用的有GCC,VS,Clang,MinGW等。
2 指定平臺
不談平臺,只談編碼,就是在耍流氓。---哈哈哈
這里的平臺指的是三大件:CPU + OS + Compiler
本文中實驗的平臺是:Intel i7 + ubuntu16.04 + gcc5.4
有了上面的基本概念了解,就可以進行分析了。
3 為什么要內存對齊?
原因有兩點:
CPU每次尋址都是要消費時間的,如果一次取不完數據就要取多次。比如int類型的變量a占4Byte,假設在內存中沒有對齊(所謂對齊,指的是內存中數據的首地址是CPU單次獲取數據大小的整數倍),且存放在0x00000003 - 0x00000006處(0x00000003不是4的整數倍)。那么每次取4字節(32位寬總線)的CPU第一次取到[0x00000000 - 0x00000003],只得到變量a的1/4數據,進而需要進行第二次取數[0x00000004 - 0x00000007],為了得到int類型的一個變量,卻需要兩次訪問內存,并且還需要拼接處理,性能較低,這是其一。
有些CPU(ARM架構的)在內存非對齊的情況下,執行二進制代碼會崩潰,因為不是所有的硬件平臺都能訪問任意地址上的任意數據的。倘若代碼移植到其他不支持的平臺上,不具有可移植性,這是其二。
若在編譯時,將分配的內存進行對齊,單次訪問內存就可以獲取數據,并且具有平臺可移植性。
那誰來把我們編寫的結構體,類中的成員變量進行對齊呢?
當然是編譯器(Compiler)。那對齊的規則又是如何呢?
4 內存對齊規則
編譯器提供手動指定對齊值的關鍵字 #pragma pack(N),可以手動設置對齊的字節數,比如#pragma pack(1),#pragma pack(4)等。這里即為N。
若沒有手動指定,那么編譯器就會默認將成員變量中最大的類型字節數設置為對齊值:m
1 整體對齊值:
首先計算對齊單位 n = min{N,m},然后整體對齊后的字節數應該為n的倍數,不夠的在最后面填補占位。
2 成員對齊值:
首個成員的偏置地址(offset) = 0。
假定該成員的類型占字節數 j,那么本成員的偏移地址(offset):min{n, j}的整數倍。
5 代碼實測
#include以上注釋為理論分析。
現在編譯,并執行輸出看看是否sizeof = 24。
這里使用的GCC中的g++進行編譯。
也可以用gcc,不過要鏈接c++的標準庫(-lstdc++),否則會鏈接失敗。
這里實驗結果與理論分析的一致。
另外:如果手動設置#pragma pack(4),后效果如何呢?
#pragma pack(4)查看結果是否為sizeof = 20呢?
顯然,是和分析的一致。
6 總結
這里以C++的類為例,進行內存對齊分析。關于C++的內存布局,以及含有virtual函數的類,實際上還會更復雜。簡單的就如最基本的類,這和C中的struct是非常類似的。
掌握C++中類的內存對齊,有助于進一步理解C++對象模型。
總結
以上是生活随笔為你收集整理的怎么调试内存溢出的c++代码_【C/C++】内存对齐 到底怎么回事?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python安装缺少api怎么办_请问缺
- 下一篇: 中国手游出海收入:《原神》遥遥领先 PU