c编译器内存对齐
1.?什么是對(duì)齊?
現(xiàn)代計(jì)算機(jī)中內(nèi)存空間都是按照字節(jié)(byte)劃分的,從理論上講似乎對(duì)任何類型的變量的訪問(wèn)可以從任何地址開始,但實(shí)際情況是在訪問(wèn)特定變量的時(shí)候經(jīng)常在特定的內(nèi)存地址訪問(wèn),這就需要各類型數(shù)據(jù)按照一定的規(guī)則在空間上排列,而不是順序地一個(gè)接一個(gè)地排放,這就是對(duì)齊。
2.?計(jì)算機(jī)為什么要對(duì)齊?
各個(gè)硬件平臺(tái)對(duì)存儲(chǔ)空間的處理上有很大的不同。一些平臺(tái)對(duì)某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取,其他平臺(tái)可能沒(méi)有這種情況。但是最常見(jiàn)的是,如果不按照適合其平臺(tái)的要求對(duì)數(shù)據(jù)存放進(jìn)行對(duì)齊,會(huì)在存取效率上帶來(lái)?yè)p失。比如有些平臺(tái)每次讀都是從偶地址開始,一個(gè)int型(假設(shè)為 32位)如果存放在偶地址開始的地方,那么一個(gè)讀周期就可以讀出,而如果存放在奇地址開始的地方,就可能會(huì)需要2個(gè)讀周期,并對(duì)兩次讀出的結(jié)果的高低字節(jié)進(jìn)行拼湊才能得到該int數(shù)據(jù),顯然在讀取效率上下降很多。這也是空間和時(shí)間的博弈。在網(wǎng)絡(luò)程序中,掌握這個(gè)概念可是很重要的:如果在不同平臺(tái)之間(比如在Windows 和Linux之間)傳遞2進(jìn)制流(比如結(jié)構(gòu)體),那么在這兩個(gè)平臺(tái)間必須要定義相同的對(duì)齊方式,不然莫名其妙地出了一些錯(cuò),可是很難排查的。
3. 一個(gè)對(duì)齊的例子
通常,我們寫程序的時(shí)候,不需要考慮對(duì)齊問(wèn)題,編譯器會(huì)替我們選擇適合目標(biāo)平臺(tái)的對(duì)齊策略。當(dāng)然,我們也可以通知給編譯器傳遞預(yù)編譯指令而改變對(duì)指定數(shù)據(jù)的對(duì)齊方法,比如寫入預(yù)編譯指令#pragma pack(2),即告訴編譯器按兩字節(jié)對(duì)齊。
但是,正因?yàn)槲覀円话悴恍枰P(guān)心這個(gè)問(wèn)題,所以,如果編輯器對(duì)數(shù)據(jù)存放做了對(duì)齊,而我們不了解的話,常常會(huì)對(duì)一些問(wèn)題感到迷惑。最常見(jiàn)的就是struct數(shù)據(jù)結(jié)構(gòu)的sizeof結(jié)果,比如以下程序:
#include <stdio.h>void main(){struct A{char a;short b;int c;};printf( "size of struct A = %d \n", sizeof(struct A) );}輸出結(jié)果為:8字節(jié)。
如果我們將結(jié)構(gòu)體中的變量聲明位置稍加改動(dòng)(并不改變變量本身),請(qǐng)?jiān)倏匆韵鲁绦?#xff1a;
#include <stdio.h>void main(){struct A{short b;int c;char a;};printf( "size of struct A = %d \n", sizeof(struct A) );}輸出結(jié)果為:12字節(jié)。
問(wèn)題出來(lái)了,他們都是同一個(gè)結(jié)構(gòu)體,為什么占用的內(nèi)存大小不同呢?為此,我們需要對(duì)對(duì)齊算法有所了解。
4.?對(duì)齊算法
由于各個(gè)平臺(tái)和編譯器的不同,現(xiàn)以32位,vc++6.0系統(tǒng)為例,來(lái)討論編譯器對(duì)struct數(shù)據(jù)結(jié)構(gòu)中的各成員如何進(jìn)行對(duì)齊的。
首先,我們給出四個(gè)概念:
1)數(shù)據(jù)類型自身的對(duì)齊值:就是基本數(shù)據(jù)類型的自身對(duì)齊值,比如char類型的自身對(duì)齊值為1字節(jié),int類型的自身對(duì)齊值為4字節(jié)。
2)指定對(duì)齊值:預(yù)編譯命令#pragma pack (value)指定的對(duì)齊值value。
3)結(jié)構(gòu)體或者類的自身對(duì)齊值:其成員中自身對(duì)齊值最大的那個(gè)值,比如以上的struct A的對(duì)齊值為4。
4)數(shù)據(jù)成員、結(jié)構(gòu)體和類的有效對(duì)齊值:自身對(duì)齊值和指定對(duì)齊值中較小的那個(gè)值。
設(shè)結(jié)構(gòu)體如下定義:
struct A{char a;short b;int c; };a是char型數(shù)據(jù),占用1字節(jié)內(nèi)存;short型數(shù)據(jù),占用2字節(jié)內(nèi)存;int型數(shù)據(jù),占用4字節(jié)內(nèi)存。因此,結(jié)構(gòu)體A的自身對(duì)齊值為4。于是,a和b要組成4個(gè)字節(jié),以便與c的4個(gè)字節(jié)對(duì)齊。而a只有1個(gè)字節(jié),a與b之間便空了一個(gè)字節(jié)。我們知道,結(jié)構(gòu)體類型數(shù)據(jù)是按順序存儲(chǔ)結(jié)構(gòu)一個(gè)接一個(gè)向后排列的,于是其存儲(chǔ)方式為:
其中空白方格無(wú)數(shù)據(jù),是浪費(fèi)的內(nèi)存空間,共占用8字節(jié)內(nèi)存。
實(shí)際上,為了更加明顯地表示“對(duì)齊”,我們可以將以上結(jié)構(gòu)想象為以下的行排列:
?
對(duì)于另一個(gè)結(jié)構(gòu)體定義:
struct A{short b;int c;char a;};其內(nèi)存存儲(chǔ)方式為:
同樣把它想象成行排列:
可見(jiàn),浪費(fèi)的空間更多。
其實(shí),除了結(jié)構(gòu)體之外,整個(gè)程序在給每個(gè)變量進(jìn)行內(nèi)存分配時(shí)都會(huì)遵循對(duì)齊機(jī)制,也都會(huì)產(chǎn)生內(nèi)存空間的浪費(fèi)。但我們要知道,這種浪費(fèi)是值得的,因?yàn)樗鼡Q來(lái)的是效率的提高。
以上分析都是建立在程序默認(rèn)的對(duì)齊值基礎(chǔ)之上的,我們可以通過(guò)添加預(yù)定義命令#pragma pack(value)來(lái)對(duì)對(duì)齊值進(jìn)行自定義,比如#pragma pack(1),對(duì)齊值變?yōu)?,此時(shí)內(nèi)存緊湊,不會(huì)出現(xiàn)內(nèi)存浪費(fèi),但效率降低了。效率之所以降低,是因?yàn)?#xff1a;如果存在更大字節(jié)數(shù)的變量時(shí)(比1大),比如int類型,需要進(jìn)行多次讀周期才能將一個(gè)int數(shù)據(jù)拼湊起來(lái)。
總結(jié)
- 上一篇: lisp提取长方形坐标_语义SLAM |
- 下一篇: c语言键盘按f1显示f1,windows