【精华文】C语言结构体特殊情况分析:结构体指针 / 基本数据类型指针,指向其他结构体
參考鏈接:Structure pointer pointing to different structure instance
注:可以查看此篇的問題和唯一的回復,那是相對正確的,不要看comment,有很多錯誤。
我是拒絕分析這種問題的,因為似乎沒有人會這么亂用,但是……在華保健老師的編譯原理示例代碼和Linux0.11內核中,就遇到了這么神奇的代碼,那就不得不研究一下了!畢竟是大神寫的代碼,我不知道應該是我渣。
1 測試代碼
#include <stdio.h> #include <stdlib.h>struct A {char a;int b; };struct B {int c;int d; };struct C {int e;char f; };int main() {struct A a = { 'a', 100 };struct B b = { 101, 300 };struct C c = { 200,'c' };// 根據字節對齊,都占據8字節printf("A: size %d %c %d\n", sizeof(a), a.a, a.b);printf("B: size %d %d %d\n", sizeof(b), b.c, b.d);printf("C: size %d %d %c\n", sizeof(c), c.e, c.f);struct A *ap = &b; // A結構體指針,指向結構體Bprintf("%d %d\n",ap->a, ap->b);printf("%c %d\n", ap->a, ap->b);char *chp = &b;chp[1] = 'b'; // 這塊區域其實是字節對齊導致的空閑空間printf("%d %d\n", ap->a, ap->b);printf("%c %d\n", ap->a, ap->b);/* 如何訪問這塊內存,取決于ap指針,能訪問多大地方,取決于內存區域本身 */ap->a = 'c'; // ap->a = 'c'就是相當于 char a = 'c';ap->a = 1000; // ap->a = 1000 就是相當于 char a = 1000; 1000過大會被截斷高位ap->b = 3000; // ap->b <=> int b ...struct C *cp = &b; // C結構體指針,指向結構體Bprintf("%d %d\n", cp->e, cp->f);printf("%d %c\n", cp->e, cp->f);cp->e = 3000;cp->f = 'e';cp->f = 1000;// 整形指針指向結構體Aint *bp = &a;bp[0] = 1000;bp[1] = 2000;printf("A: %c %d\n", a.a, a.b);printf("A: %d %d\n", a.a, a.b);bp[2] = 2000; // 可以修改內存,但是堆棧溢出,// 因為該空間沒有被分配(局部變量是保存在堆棧中的)return 0; }2 結構體占據空間問題 & 字節對齊
struct A {char a;int b; };struct B {int c;int d; };struct C {int e;char f; };... struct A a = { 'a', 100 }; struct B b = { 101, 300 }; struct C c = { 200,'c' };// 根據字節對齊,都占據8字節 printf("A: size %d %c %d\n", sizeof(a), a.a, a.b); printf("B: size %d %d %d\n", sizeof(b), b.c, b.d); printf("C: size %d %d %c\n", sizeof(c), c.e, c.f); ...運行以上程序,我們可以直到,三個結構體分別創建了一個變量,并且每個結構體占據的空間大小都是8字節。
至于為什么都是8字節,這是內存對齊問題,不展開說明了,我們看看這幾個結構體被分配的空間情況吧。
- 每個結構體都占8字節的內存空間
- 紅色部分表示實際占用的空間
- 藍色部分表示空閑空間
注意:這就意味著,凡是被分配的8字節空間,是可以任意訪問的,而空間外面是不允許訪問的。
讓結構體A的指針ap,指向結構體B的變量b
現在我們建立一個結構體A的指針,讓其指向b。
struct A *ap = &b; // A結構體指針,指向結構體B printf("%d %d\n",ap->a, ap->b); printf("%c %d\n", ap->a, ap->b);
我們看看內存的情況,再分析一下打印的結果。
上面是內存的分布情況,現在
- 訪問ap->a打印出來的是:101,e
- 訪問ap->b打印出來的是300
所以ap指針實際訪問的應該是下面重點標出的部分:
而這部分,是不是很熟悉?
所以,ap指針盡管指向了結構體B,但是實際還是按照結構體A的結構訪問內存的。
2.1 使用char指針指向結構體B
剛才我們發現,使用結構體A的指針,可以直接訪問結構體B,那么,如果是基本數據類型呢?我們試一下。
char *chp = &b; chp[1] = 'b'; // 這塊區域其實是字節對齊導致的空閑空間 printf("%d %d\n", ap->a, ap->b); printf("%c %d\n", ap->a, ap->b);
我們看到內存分布如上圖,現在執行chp[1] = 'b'(b的ASCII碼是62)
之后就變成了:
哦!這是令人驚訝的,char類型的指針指向了一塊內存區域,然后使用下標修改了內存的值!
還記得動態數組申請嗎?和內個是一樣的原理!
int *a = (int *)malloc(sizeof(int) * 10); a[0] = 1; // 使用下標訪問 a[1] = 2; ... free(a);告訴我們兩件事
所以上面的事情不難理解。
然后我們繼續執行程序
printf("%d %d\n", ap->a, ap->b); printf("%c %d\n", ap->a, ap->b);盡管之前的空閑空間改變了,但是結果依然不變,也就是說我們之前的說法是正確的。
再進一步驗證
/* 如何訪問這塊內存,取決于ap指針,能訪問多大地方,取決于內存區域本身 */ ap->a = 'c'; // ap->a = 'c'就是相當于 char a = 'c'; ap->a = 1000; // ap->a = 1000 就是相當于 char a = 1000; 1000過大會被截斷高位 ap->b = 3000; // ap->b <=> int b ...結果顯而易見,對于ap->a = 1000,盡管1000已經超過了1字節大小,但是最終只修改了第一個字節,這就好比char a = 1000一樣,a = 0xe8
是的,1000 = 0x3e8,但是只有一個字節,所以最高位的3被舍棄了。
2.2 用結構體C指針cp指向結構體B
struct C *cp = &b; // C結構體指針,指向結構體B printf("%d %d\n", cp->e, cp->f); printf("%d %c\n", cp->e, cp->f);cp->e = 3000; cp->f = 'e'; cp->f = 1000;我們再試一試!
最終結果顯而易見。
2.3 用int指針指向結構體A
// 整形指針指向結構體A int *bp = &a; bp[0] = 1000; bp[1] = 2000; printf("A: %c %d\n", a.a, a.b); printf("A: %d %d\n", a.a, a.b); bp[2] = 2000; // 可以修改內存,但是堆棧溢出,// 因為該空間沒有被分配(局部變量是保存在堆棧中的)其實這個事情我們之前干過了,之前用char,現在用int再干一下。
這個事情進一步說明了什么呢?
因為局部變量都是被分配在棧中的,現在這個局部變量訪問越界了,產生了錯誤,棧被破壞。
棧破壞這里情況非常復雜,先粗淺理解為,使用了未分配的空間導致了錯誤吧。
Linux0.11 內核中,使用上述方法,實現了GDT和IDT。
3 小結:精華在這里
分析了這么多,最終小結一下吧。
我們的眼中只有兩件事
- 已分配的內存空間
- 某數據類型的指針
現在,我們就讓指針指向內存空間的起始地址,然后就可以操作這個內存空間了。
再增加一些限制
- 內存空間就這么大,不能訪問外面
- 指針每次訪問的地址,是通過下標訪問的,一次只能移動數據類型大小的整數倍
這個時候你眼中的C語言,分配一塊內存,再創建一個指針,打遍天下無敵手!
當然了,除了特殊情況一般沒人這么干,你會瘋掉,看你代碼的人也會瘋掉!
4 補充:直接深入底層,看匯編代碼
之前我們的分析是基于C語言層級的,比較抽象,實際上,編譯完成之后的匯編語言,一看就明白了。
你可以看到ap->a直接訪問的是byte,而ap->b訪問的是dword,一個是字節,一個是雙字,大小自然清晰。
這也是編譯器的功能,把C語言提供的,方便人類使用的大量抽象,給翻譯成方便機器使用的少量指令的復雜排列組合。
5 什么叫打遍天下無敵手呢?
其實就是瞎玩兒吧……但是的確可以這么干的!我們試一試。
int main() {char aaa[4] = { 1,2,3,4 };char aaa2[4] = { 1,2,3,4 };int *bbb = &aaa;printf("\n\n%x\n\n\n", bbb[0]);return 0; }會打印什么呢?顯而易見的!內存是01 02 03 04,然后一個int *指針訪問了它,打印04030201。
我們可以使用bbb[0]或者*b都行,因為b指向起始地址。
那,能不能通過bbb[1]訪問aaa2的內存呢?
不行! 因為aaa1和aaa2是兩個數組變量,他們在內存中的位置不是連續的,是隨機的,如果你想達到內種效果,那就是前面提到的結構體了,把這兩個放進一個結構體里面,就是連續分配內存了,就能使用bbb[1]了。
最后,記住只有兩件事
- 一塊已分配的內存
- 一個指針
總結
以上是生活随笔為你收集整理的【精华文】C语言结构体特殊情况分析:结构体指针 / 基本数据类型指针,指向其他结构体的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 冰原守卫者手游佣兵怎么获得
- 下一篇: 40岁做试管婴儿成功率有多少