7. 从0学ARM-GNU伪指令、代码编译,lds使用
《嵌入式工程師到底要不要學(xué)習(xí)ARM匯編指令?arm學(xué)習(xí)文章匯總》
《到底什么是Cortex、ARMv8、arm架構(gòu)、ARM指令集、soc?一文幫你梳理基礎(chǔ)概念【科普】》
關(guān)于ARM指令用到的IDE開(kāi)發(fā)環(huán)境可以參考下面這篇文章
《1. 從0開(kāi)始學(xué)ARM-安裝Keil MDK uVision集成開(kāi)發(fā)環(huán)境》
《2. 從0開(kāi)始學(xué)ARM-CPU原理,基于ARM的SOC講解》
《3. 從0開(kāi)始學(xué)ARM-ARM模式、寄存器、流水線》
《4. 從0開(kāi)始學(xué)ARM-ARM指令,移位、數(shù)據(jù)處理、BL、機(jī)器碼》
《5. 從0開(kāi)始學(xué)ARM-MRS、MSR、尋址操作、原子操作原理》
《6. 從0開(kāi)始學(xué)ARM-異常及中斷處理、異常向量表、swi》
八、GNU偽指令、代碼編譯,lds使用
一、MDK和GNU偽指令區(qū)別
我們?cè)趯W(xué)習(xí)匯編代碼的時(shí)候經(jīng)過(guò)會(huì)看到以下兩種風(fēng)格的代碼:
gnu代碼開(kāi)頭是:
.global _start _start: @匯編入口ldr sp,=0x41000000 .end @匯編程序結(jié)束MDK代碼開(kāi)頭是:
AREA Example,CODE,READONLY ;聲明代碼段ExampleENTRY ;程序入口 Start MOV R0,#0 OVEREND這兩種風(fēng)格的代碼是要使用不同的編譯器,我們之前的實(shí)例代碼都是MDK風(fēng)格的。
那么多對(duì)于我們初學(xué)者來(lái)說(shuō)要學(xué)習(xí)哪種風(fēng)的呢?
答案是肯定的,學(xué)習(xí)GNU風(fēng)格的匯編代碼,因?yàn)樽鯨inux驅(qū)動(dòng)開(kāi)發(fā)必須掌握的linux內(nèi)核、uboot,而這兩個(gè)軟件就是GNU風(fēng)格的。
為了大家不要把過(guò)多精力浪費(fèi)在暫時(shí)沒(méi)用的知識(shí)上,下面我們只講GNU風(fēng)格匯編。
二、GNU匯編書(shū)寫(xiě)格式:
1. 代碼行中的注釋符號(hào):
‘@’ 整行注釋符號(hào):
‘#’ 語(yǔ)句分離符號(hào):
直接操作數(shù)前綴: ‘#’ 或 ‘$’
2. 全局標(biāo)號(hào):
標(biāo)號(hào)只能由a~z,A~Z,0~9,“.”,_等(由點(diǎn)、字母、數(shù)字、下劃線等組成,除局部標(biāo)號(hào)外,不能以數(shù)字開(kāi)頭)字符組成,標(biāo)號(hào)的后面加“:”。
段內(nèi)標(biāo)號(hào)的地址值在匯編時(shí)確定; 段外標(biāo)號(hào)的地址值在連接時(shí)確定。3. 局部標(biāo)號(hào):
局部標(biāo)號(hào)主要在局部范圍內(nèi)使用而且局部標(biāo)號(hào)可以重復(fù)出現(xiàn)。它由兩部組成開(kāi)頭是一個(gè)0-99直接的數(shù)字局部標(biāo)號(hào) 后面加“:”
F:指示編譯器只向前搜索,代碼行數(shù)增加的方向 / 代碼的下一句 B:指示編譯器只向后搜索,代碼行數(shù)減小的方向注意局部標(biāo)號(hào)的跳轉(zhuǎn),就近原則
舉例:
三、偽操作:
1. 符號(hào)定義偽指令
| .global | 使得符號(hào)對(duì)連接器可見(jiàn),變?yōu)閷?duì)整個(gè)工程可用的全局變量 |
| _start | 匯編程序的缺省入口是_ start標(biāo)號(hào),用戶也可以在連接腳本文件中用ENTRY標(biāo)志指明其它入口點(diǎn). |
| .local | 表示符號(hào)對(duì)外部不可見(jiàn),只對(duì)本文件可見(jiàn) |
2. 數(shù)據(jù)定義(Data Definition)偽操作
數(shù)據(jù)定義偽操作一般用于為特定的數(shù)據(jù)分配存儲(chǔ)單元,同時(shí)可完成已分配存儲(chǔ)單元的初始化。
常見(jiàn)的數(shù)據(jù)定義偽操作有如下幾種:
| .byte | 單字節(jié)定義 0x12,‘a(chǎn)’,23 【必須偶數(shù)個(gè)】 |
| .short | 定義2字節(jié)數(shù)據(jù) 0x1234,65535 |
| .long /.word | 定義4字節(jié)數(shù)據(jù) 0x12345678 |
| .quad | 定義8字節(jié) .quad 0x1234567812345678 |
| .float | 定義浮點(diǎn)數(shù) .float 0f3.2 |
| .string/.asciz/.ascii | 定義字符串 .ascii “abcd\0”, 注意:.ascii 偽操作定義的字符串需要每行添加結(jié)尾字符 ‘\0’,其他不需要 |
| .space/.skip | 用于分配一塊連續(xù)的存儲(chǔ)區(qū)域并初始化為指定的值,如果后面的填充值省略不寫(xiě)則在后面填充為0; |
| .rept | 重復(fù)執(zhí)行接下來(lái)的指令,以.rept開(kāi)始,以.endr結(jié)束 |
【舉例】
.word
val: .word 0x11223344 mov r1,#val ;將值0x11223344設(shè)置到寄存器r1中.space
label: .space size,expr ;expr可以是4字節(jié)以內(nèi)的浮點(diǎn)數(shù) a: space 8, 0x1.rept
.rept cnt ;cnt是重復(fù)次數(shù).endr注意:
3. if選擇
語(yǔ)法結(jié)構(gòu)
.if logical-expressing …… .else…… .endif類似c語(yǔ)言里的條件編譯 。
【舉例】
.if val2==1mov r1,#val2 .endif4. macro宏定義
.macro,.endm 宏定義類似c語(yǔ)言里的宏函數(shù) 。
macro偽操作可以將一段代碼定義為一個(gè)整體,稱為宏指令。然后就可以在程序中通過(guò)宏指令多次調(diào)用該段代碼。
語(yǔ)法格式:
.macro {$label} 名字{$parameter{,$parameter}…}……..code.endm其中,$標(biāo)號(hào)在宏指令被展開(kāi)時(shí),標(biāo)號(hào)會(huì)被替換為用戶定義的符號(hào)。
宏操作可以使用一個(gè)或多個(gè)參數(shù),當(dāng)宏操作被展開(kāi)時(shí),這些參數(shù)被相應(yīng)的值替換。
注意:先定義后使用
舉例:
【例1】:沒(méi)有參數(shù)的宏實(shí)現(xiàn)子函數(shù)返回
.macro MOV_PC_LRMOV PC,LR.endm 調(diào)用方式如下:MOV_PC_LR【例2】:帶參數(shù)宏實(shí)現(xiàn)子函數(shù)返回
.macro MOV_PC_LR ,parammov r1,\paramMOV PC,LR.endm調(diào)用方法如下:
MOV_PC_LR #12四、雜項(xiàng)偽操作
| .global/ | 用來(lái)聲明一個(gè)全局的符號(hào) |
| .arm | 定義一下代碼使用ARM指令集編譯 |
| .thumb | 定義一下代碼使用Thumb指令集編譯 |
| .section | .section expr 定義一個(gè)段。expr可以使.text .data. .bss |
| .text | .text {subsection} 將定義符開(kāi)始的代碼編譯到代碼段 |
| .data | .data {subsection} 將定義符開(kāi)始的代碼編譯到數(shù)據(jù)段,初始化數(shù)據(jù)段 |
| .bss | .bss {subsection} 將變量存放到.bss段,未初始化數(shù)據(jù)段 |
| .align | .align{alignment}{,fill}{,max} 通過(guò)用零或指定的數(shù)據(jù)進(jìn)行填充來(lái)使當(dāng)前位置與指定邊界對(duì)齊 |
| .align 4 — 16字節(jié)對(duì)齊 2的4次方 | |
| .align (4) — 4字節(jié)對(duì)齊 | |
| .org | .org offset{,expr} 指定從當(dāng)前地址加上offset開(kāi)始存放代碼,并且從當(dāng)前地址到當(dāng)前地址加上offset之間的內(nèi)存單元,用零或指定的數(shù)據(jù)進(jìn)行填充 |
| .extern | 用于聲明一個(gè)外部符號(hào),用于兼容性其他匯編 |
| .code 32 | 同.arm |
| .code 16 | 同.thumb |
| .weak | 用于聲明一個(gè)弱符號(hào),如果這個(gè)符號(hào)沒(méi)有定義,編譯就忽略,而不會(huì)報(bào)錯(cuò) |
| .end | 文件結(jié)束 |
| .include | .include “filename” 包含指定的頭文件, 可以把一個(gè)匯編常量定義放在頭文件中 |
| .equ | 格式:.equ symbol, expression把某一個(gè)符號(hào)(symbol)定義成某一個(gè)值(expression).該指令并不分配空間,類似于c語(yǔ)言的 #define |
| .set | 給一個(gè)全局變量或局部變量賦值,和.equ的功能一樣 |
舉例:
.set
舉例
.equ
等價(jià)于
.equ PI, 31415五、GNU偽指令
關(guān)鍵點(diǎn):偽指令在編譯時(shí)會(huì)轉(zhuǎn)化為對(duì)應(yīng)的ARM指令
該指令把標(biāo)簽所在的地址加載到寄存器中。
ADR偽指令為小范圍地址讀取偽指令,使用的相對(duì)偏移范圍:當(dāng)?shù)刂分凳亲止?jié)對(duì)齊 (8位) 時(shí),取值范圍為-255~255,當(dāng)?shù)刂分凳亲謱?duì)齊 (32位) 時(shí),取值范圍為-1020~1020。
語(yǔ)法格式:
將中等范圍地址讀取到寄存器中
ADRL偽指令為中等范圍地址讀取偽指令。使用相對(duì)偏移范圍:當(dāng)?shù)刂分凳亲止?jié)對(duì)齊時(shí),取值范圍為-64~64KB;當(dāng)?shù)刂分凳亲謱?duì)齊時(shí),取值范圍為-256~256KB
語(yǔ)法格式:
ADRL{cond} register,label ADRL R0,lableLDR偽指令裝載一個(gè)32位的常數(shù)和一個(gè)地址到寄存器。
語(yǔ)法格式:
注意:
(1)ldr偽指令和ldr指令區(qū)分
下面是ldr偽指令:
下面是ldr指令:
ldr r2,val @ r1 = *val 是arm指令,將標(biāo)號(hào)val地址里的內(nèi)容給r2 val: .word 0x11223344(2)如何利用ldr偽指令實(shí)現(xiàn)長(zhǎng)跳轉(zhuǎn)
ldr pc,=32位地址(3)編碼中解決非立即數(shù)的問(wèn)題
用arm偽指令ldr
六、GNU匯編的編譯
1. 不含lds文件的編譯
假設(shè)我們有以下代碼,包括1個(gè)main.c文件,1個(gè)start.s文件:
start.s
main.c
extern void mystrcopy(char *d,const char *s); int main(void) {const char *src ="yikoulinux";char dest[20]={};mystrcopy(dest,src);//調(diào)用匯編實(shí)現(xiàn)的mystrcopy函數(shù)while(1);return 0; }Makefile編寫(xiě)方法如下:
1. TARGET=start 2. TARGETC=main 3. all: 4. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o $(TARGETC).c 5. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s 6. #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s $(TARGETC).c 7. arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf 8. arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin 9. clean: 10. rm -rf *.o *.elf *.dis *.binMakefile含義如下:
【補(bǔ)充】
4級(jí) O0 – O3 數(shù)字越大,優(yōu)化程度越高。O3最大優(yōu)化
volatile修飾的變量,編譯器不再進(jìn)行優(yōu)化,每次都真正訪問(wèn)內(nèi)存地址空間。
2. 依賴lds文件編譯
實(shí)際的工程文件,段復(fù)雜程度遠(yuǎn)比我們這個(gè)要復(fù)雜的多,尤其Linux內(nèi)核有幾萬(wàn)個(gè)文件,段的分布及其復(fù)雜,所以這就需要我們借助lds文件來(lái)定義內(nèi)存的分布。
main.c和start.s和上一節(jié)一致。
map.lds
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") /*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/ OUTPUT_ARCH(arm) ENTRY(_start) SECTIONS {. = 0x40008000;. = ALIGN(4);.text :{.start.o(.text)*(.text)}. = ALIGN(4);.rodata : { *(.rodata) }. = ALIGN(4);.data : { *(.data) }. = ALIGN(4);.bss :{ *(.bss) } }解釋一下上述的例子:
指定輸出object檔案預(yù)設(shè)的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式;
連接器每讀完一個(gè)section描述后, 將定位器符號(hào)的值增加該section的大小。
來(lái)看下,Makefile應(yīng)該如何寫(xiě):
# CORTEX-A9 PERI DRIVER CODE # VERSION 1.0 # ATHUOR 一口Linux # MODIFY DATE # 2020.11.17 Makefile #=================================================# CROSS_COMPILE = arm-none-linux-gnueabi- NAME =start CFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin -fno-builtin-function -g -O0 -c LD = $(CROSS_COMPILE)ld CC = $(CROSS_COMPILE)gcc OBJCOPY = $(CROSS_COMPILE)objcopy OBJDUMP = $(CROSS_COMPILE)objdump OBJS=start.o main.o #================================================# all: $(OBJS)$(LD) $(OBJS) -T map.lds -o $(NAME).elf$(OBJCOPY) -O binary $(NAME).elf $(NAME).bin $(OBJDUMP) -D $(NAME).elf > $(NAME).dis %.o: %.S $(CC) $(CFLAGS) -c -o $@ $< %.o: %.s $(CC) $(CFLAGS) -c -o $@ $< %.o: %.c$(CC) $(CFLAGS) -c -o $@ $< clean:rm -rf $(OBJS) *.elf *.bin *.dis *.o編譯結(jié)果如下:
最終生成start.bin,改文件可以燒錄到開(kāi)發(fā)板測(cè)試,因?yàn)楸纠龥](méi)有直觀現(xiàn)象,后續(xù)文章我們加入其它功能再測(cè)試。
【注意】
讀者可以根據(jù)自己手里的開(kāi)發(fā)板對(duì)應(yīng)的soc手冊(cè)查找該地址。
1)linux內(nèi)核的異常向量表
linux內(nèi)核的內(nèi)存分布也是依賴lds文件定義的,linux內(nèi)核的編譯我們暫不討論,編譯好之后會(huì)再以下位置生成對(duì)應(yīng)的lds文件:
arch/arm/kernel/vmlinux.lds我們看下該文件的部分內(nèi)容:
同時(shí)我們也可以看到linux內(nèi)存的劃分更加的復(fù)雜,后續(xù)我們討論linux內(nèi)核,再繼續(xù)分析該文件。
3. elf文件和bin文件區(qū)別:
1) ELF
ELF文件格式是一個(gè)開(kāi)放標(biāo)準(zhǔn),各種UNIX系統(tǒng)的可執(zhí)行文件都采用ELF格式,它有三種不同的類型:
- 可重定位的目標(biāo)文件(Relocatable,或者Object File)
- 可執(zhí)行文件(Executable)
- 共享庫(kù)(Shared Object,或者Shared Library)
ELF格式提供了兩種不同的視角,鏈接器把ELF文件看成是Section的集合,而加載器把ELF文件看成是Segment的集合。
2) bin
BIN文件是直接的二進(jìn)制文件,內(nèi)部沒(méi)有地址標(biāo)記。bin文件內(nèi)部數(shù)據(jù)按照代碼段或者數(shù)據(jù)段的物理空間地址來(lái)排列。一般用編程器燒寫(xiě)時(shí)從00開(kāi)始,而如果下載運(yùn)行,則下載到編譯時(shí)的地址即可。
在Linux OS上,為了運(yùn)行可執(zhí)行文件,他們是遵循ELF格式的,通常gcc -o test test.c,生成的test文件就是ELF格式的,這樣就可以運(yùn)行了,執(zhí)行elf文件,則內(nèi)核會(huì)使用加載器來(lái)解析elf文件并執(zhí)行。
在Embedded中,如果上電開(kāi)始運(yùn)行,沒(méi)有OS系統(tǒng),如果將ELF格式的文件燒寫(xiě)進(jìn)去,包含一些ELF文件的符號(hào)表字符表之類的section,運(yùn)行碰到這些,就會(huì)導(dǎo)致失敗,如果用objcopy生成純粹的二進(jìn)制文件,去除掉符號(hào)表之類的section,只將代碼段數(shù)據(jù)段保留下來(lái),程序就可以一步一步運(yùn)行。
elf文件里面包含了符號(hào)表等。BIN文件是將elf文件中的代碼段,數(shù)據(jù)段,還有一些自定義的段抽取出來(lái)做成的一個(gè)內(nèi)存的鏡像。
并且elf文件中代碼段數(shù)據(jù)段的位置并不是它實(shí)際的物理位置。他實(shí)際物理位置是在表中標(biāo)記出來(lái)的。
更多嵌入式Linux干貨,請(qǐng)關(guān)注 【一口Linux】
總結(jié)
以上是生活随笔為你收集整理的7. 从0学ARM-GNU伪指令、代码编译,lds使用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 企业网络组建项目实训--交换机的配置与管
- 下一篇: 【中兴交换机MC-LAG配置】