剖析Linux系统启动过程
http://www.5dmail.net/html/2004-11-29/20041129102711.htm
內(nèi)容提要
本文以RedHat9.0和i386平臺為例,剖析了從用戶打開電源直到屏幕出現(xiàn)命令行提示符的整個Linux啟動過程。并且介紹了啟動中涉及到的各種文件。
閱讀Linux源代碼,無疑是深入學(xué)習(xí)Linux的最好方法。在本文對Linux啟動過程的介紹中,我們也嘗試從源代碼的視角來更深入的剖析Linux的啟動過程,所以其中也簡單涉及到部分相關(guān)的Linux源代碼,Linux啟動這部分的源碼主要使用的是C語言,也涉及到了少量的匯編。而啟動過程中也執(zhí)行了大量的shell(主要是bash shell)所寫腳本。為了方便讀者閱讀,筆者將整個Linux啟動過程分成以下幾個部分逐一介紹,大家可以參考下圖:
當(dāng)用戶打開PC的電源,BIOS開機自檢,按BIOS中設(shè)置的啟動設(shè)備(通常是硬盤)啟動,接著啟動設(shè)備上安裝的引導(dǎo)程序lilo或grub開始引導(dǎo)Linux,Linux首先進行內(nèi)核的引導(dǎo),接下來執(zhí)行init程序,init程序調(diào)用了rc.sysinit和rc等程序,rc.sysinit和rc當(dāng)完成系統(tǒng)初始化和運行服務(wù)的任務(wù)后,返回init;init啟動了mingetty后,打開了終端供用戶登錄系統(tǒng),用戶登錄成功后進入了Shell,這樣就完成了從開機到登錄的整個啟動過程。
??? 下面就將逐一介紹其中幾個關(guān)鍵的部分:
第一部分:內(nèi)核的引導(dǎo)(核內(nèi)引導(dǎo))
Red Hat9.0可以使用lilo或grub等引導(dǎo)程序開始引導(dǎo)Linux系統(tǒng),當(dāng)引導(dǎo)程序成功完成引導(dǎo)任務(wù)后,Linux從它們手中接管了CPU的控制權(quán),然后CPU就開始執(zhí)行Linux的核心映象代碼,開始了Linux啟動過程。這里使用了幾個匯編程序來引導(dǎo)Linux,這一步泛及到Linux源代碼樹中的“arch/i386/boot”下的這幾個文件:bootsect.S、setup.S、video.S等。
其中bootsect.S是生成引導(dǎo)扇區(qū)的匯編源碼,它完成加載動作后直接跳轉(zhuǎn)到setup.S的程序入口。setup.S的主要功能就是將系統(tǒng)參數(shù)(包括內(nèi)存、磁盤等,由BIOS返回)拷貝到特別內(nèi)存中,以便以后這些參數(shù)被保護模式下的代碼來讀取。此外,setup.S還將video.S中的代碼包含進來,檢測和設(shè)置顯示器和顯示模式。最后,setup.S將系統(tǒng)轉(zhuǎn)換到保護模式,并跳轉(zhuǎn)到 0x100000。
那么0x100000這個內(nèi)存地址中存放的是什么代碼?而這些代碼又是從何而來的呢?
0x100000這個內(nèi)存地址存放的是解壓后的內(nèi)核,因為Red Hat提供的內(nèi)核包含了眾多驅(qū)動和功能而顯得比較大,所以在內(nèi)核編譯中使用了“makebzImage”方式,從而生成壓縮過的內(nèi)核,在RedHat中內(nèi)核常常被命名為vmlinuz,在Linux的最初引導(dǎo)過程中,是通過"arch/i386/boot/compressed/"中的head.S利用misc.c中定義的decompress_kernel()函數(shù),將內(nèi)核vmlinuz解壓到0x100000的。
當(dāng)CPU跳到0x100000時,將執(zhí)行"arch/i386/kernel/head.S"中的startup_32,它也是vmlinux的入口,然后就跳轉(zhuǎn)到start_kernel()中去了。start_kernel()是"init/main.c"中的定義的函數(shù),start_kernel()中調(diào)用了一系列初始化函數(shù),以完成kernel本身的設(shè)置。start_kernel()函數(shù)中,做了大量的工作來建立基本的Linux核心環(huán)境。如果順利執(zhí)行完start_kernel(),則基本的Linux核心環(huán)境已經(jīng)建立起來了。
在start_kernel()的最后,通過調(diào)用init()函數(shù),系統(tǒng)創(chuàng)建第一個核心線程,啟動了init過程。而核心線程init()主要是來進行一些外設(shè)初始化的工作的,包括調(diào)用do_basic_setup()完成外設(shè)及其驅(qū)動程序的加載和初始化。并完成文件系統(tǒng)初始化和root文件系統(tǒng)的安裝。
當(dāng)do_basic_setup()函數(shù)返回init(),init()又打開了/dev/console設(shè)備,重定向三個標(biāo)準(zhǔn)的輸入輸出文件stdin、stdout和stderr到控制臺,最后,搜索文件系統(tǒng)中的init程序(或者由init=命令行參數(shù)指定的程序),并使用 execve()系統(tǒng)調(diào)用加載執(zhí)行init程序。到此init()函數(shù)結(jié)束,內(nèi)核的引導(dǎo)部分也到此結(jié)束了,
??? 第二部分:運行init
init的進程號是1,從這一點就能看出,init進程是系統(tǒng)所有進程的起點,Linux在完成核內(nèi)引導(dǎo)以后,就開始運行init程序,。init程序需要讀取配置文件/etc/inittab。inittab是一個不可執(zhí)行的文本文件,它有若干行指令所組成。在Redhat系統(tǒng)中,inittab的內(nèi)容如下所示(以“###"開始的中注釋為筆者增加的):
#
# inittab?????? This file describes how the INIT process should set up
#?????????????? the system in a certain run-level.
#
# Author:?????? Miquel van Smoorenburg,
#?????????????? Modified for RHS Linux by Marc Ewing and Donnie Barnes
#
# Default runlevel. The runlevels used by RHS are:
#?? 0 - halt (Do NOT set initdefault to this)
#?? 1 - Single user mode
#?? 2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
#?? 3 - Full multiuser mode
#?? 4 - unused
#?? 5 - X11
#?? 6 - reboot (Do NOT set initdefault to this)
#
###表示當(dāng)前缺省運行級別為5(initdefault);
id:5:initdefault:
###啟動時自動執(zhí)行/etc/rc.d/rc.sysinit腳本(sysinit)
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit
l0:0:wait:/etc/rc.d/rc 0
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
###當(dāng)運行級別為5時,以5為參數(shù)運行/etc/rc.d/rc腳本,init將等待其返回(wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6
###在啟動過程中允許按CTRL-ALT-DELETE重啟系統(tǒng)
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now
# When our UPS tells us power has failed, assume we have a few minutes
# of power left.? Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"
# If power was restored before the shutdown kicked in, cancel it.
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"
###在2、3、4、5級別上以ttyX為參數(shù)執(zhí)行/sbin/mingetty程序,打開ttyX終端用于用戶登錄,
###如果進程退出則再次運行mingetty程序(respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
###在5級別上運行xdm程序,提供xdm圖形方式登錄界面,并在退出時重新執(zhí)行(respawn)
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon
以上面的inittab文件為例,來說明一下inittab的格式。其中以#開始的行是注釋行,除了注釋行之外,每一行都有以下格式:
id:runlevel:action:process
對上面各項的詳細(xì)解釋如下:
1. id
id是指入口標(biāo)識符,它是一個字符串,對于getty或mingetty等其他login程序項,要求id與tty的編號相同,否則getty程序?qū)⒉荒苷9ぷ鳌?/p>
2. runlevel
runlevel是init所處于的運行級別的標(biāo)識,一般使用0-6以及S或s。0、1、6運行級別被系統(tǒng)保留:其中0作為shutdown動作,1作為重啟至單用戶模式,6為重啟;S和s意義相同,表示單用戶模式,且無需inittab文件,因此也不在inittab中出現(xiàn),實際上,進入單用戶模式時,init直接在控制臺(/dev/console)上運行/sbin/sulogin。在一般的系統(tǒng)實現(xiàn)中,都使用了2、3、4、5幾個級別,在Redhat系統(tǒng)中,2表示無NFS支持的多用戶模式,3表示完全多用戶模式(也是最常用的級別),4保留給用戶自定義,5表示XDM圖形登錄方式。7-9級別也是可以使用的,傳統(tǒng)的Unix系統(tǒng)沒有定義這幾個級別。runlevel可以是并列的多個值,以匹配多個運行級別,對大多數(shù)action來說,僅當(dāng)runlevel與當(dāng)前運行級別匹配成功才會執(zhí)行。
3. action
action是描述其后的process的運行方式的。action可取的值包括:initdefault、sysinit、boot、bootwait等:
initdefault是一個特殊的action值,用于標(biāo)識缺省的啟動級別;當(dāng)init由核心激活以后,它將讀取inittab中的initdefault項,取得其中的runlevel,并作為當(dāng)前的運行級別。如果沒有inittab文件,或者其中沒有initdefault項,init將在控制臺上請求輸入runlevel。
sysinit、boot、bootwait等action將在系統(tǒng)啟動時無條件運行,而忽略其中的runlevel。
其余的action(不含initdefault)都與某個runlevel相關(guān)。各個action的定義在inittab的man手冊中有詳細(xì)的描述。
4. process
process為具體的執(zhí)行程序。程序后面可以帶參數(shù)。
第三部分:系統(tǒng)初始化
在init的配置文件中有這么一行:
si::sysinit:/etc/rc.d/rc.sysinit
它調(diào)用執(zhí)行了/etc/rc.d/rc.sysinit,而rc.sysinit是一個bash shell的腳本,它主要是完成一些系統(tǒng)初始化的工作,rc.sysinit是每一個運行級別都要首先運行的重要腳本。它主要完成的工作有:激活交換分區(qū),檢查磁盤,加載硬件模塊以及其它一些需要優(yōu)先執(zhí)行任務(wù)。
rc.sysinit約有850多行,但是每個單一的功能還是比較簡單,而且?guī)в凶⑨?#xff0c;建議有興趣的用戶可以自行閱讀自己機器上的該文件,以了解系統(tǒng)初始化所詳細(xì)情況。由于此文件較長,所以不在本文中列出來,也不做具體的介紹。
當(dāng)rc.sysinit程序執(zhí)行完畢后,將返回init繼續(xù)下一步。
第四部分:啟動對應(yīng)運行級別的守護進程
在rc.sysinit執(zhí)行后,將返回init繼續(xù)其它的動作,通常接下來會執(zhí)行到/etc/rc.d/rc程序。以運行級別3為例,init將執(zhí)行配置文件inittab中的以下這行:
l5:5:wait:/etc/rc.d/rc 5
這一行表示以5為參數(shù)運行/etc/rc.d/rc,/etc/rc.d/rc是一個Shell腳本,它接受5作為參數(shù),去執(zhí)行/etc/rc.d/rc5.d/目錄下的所有的rc啟動腳本,/etc/rc.d/rc5.d/目錄中的這些啟動腳本實際上都是一些鏈接文件,而不是真正的rc啟動腳本,真正的rc啟動腳本實際上都是放在/etc/rc.d/init.d/目錄下。而這些rc啟動腳本有著類似的用法,它們一般能接受start、stop、restart、status等參數(shù)。
/etc/rc.d/rc5.d/中的rc啟動腳本通常是K或S開頭的鏈接文件,對于以以S開頭的啟動腳本,將以start參數(shù)來運行。而如果發(fā)現(xiàn)存在相應(yīng)的腳本也存在K打頭的鏈接,而且已經(jīng)處于運行態(tài)了(以/var/lock/subsys/下的文件作為標(biāo)志),則將首先以stop為參數(shù)停止這些已經(jīng)啟動了的守護進程,然后再重新運行。這樣做是為了保證是當(dāng)init改變運行級別時,所有相關(guān)的守護進程都將重啟。
至于在每個運行級中將運行哪些守護進程,用戶可以通過chkconfig或setup中的"System Services"來自行設(shè)定。常見的守護進程有:
amd:自動安裝NFS守護進程
apmd:高級電源管理守護進程
arpwatch:記錄日志并構(gòu)建一個在LAN接口上看到的以太網(wǎng)地址和IP地址對數(shù)據(jù)庫
autofs:自動安裝管理進程automount,與NFS相關(guān),依賴于NIS
crond:Linux下的計劃任務(wù)的守護進程
named:DNS服務(wù)器
netfs:安裝NFS、Samba和NetWare網(wǎng)絡(luò)文件系統(tǒng)
network:激活已配置網(wǎng)絡(luò)接口的腳本程序
nfs:打開NFS服務(wù)
portmap:RPC portmap管理器,它管理基于RPC服務(wù)的連接
sendmail:郵件服務(wù)器sendmail
smb:Samba文件共享/打印服務(wù)
syslog:一個讓系統(tǒng)引導(dǎo)時起動syslog和klogd系統(tǒng)日志守候進程的腳本
xfs:X Window字型服務(wù)器,為本地和遠(yuǎn)程X服務(wù)器提供字型集
Xinetd:支持多種網(wǎng)絡(luò)服務(wù)的核心守護進程,可以管理wuftp、sshd、telnet等服務(wù)
這些守護進程也啟動完成了,rc程序也就執(zhí)行完了,然后又將返回init繼續(xù)下一步。
??? 第五部分:建立終端
rc執(zhí)行完畢后,返回init。這時基本系統(tǒng)環(huán)境已經(jīng)設(shè)置好了,各種守護進程也已經(jīng)啟動了。init接下來會打開6個終端,以便用戶登錄系統(tǒng)。通過按Alt+Fn(n對應(yīng)1-6)可以在這6個終端中切換。在inittab中的以下6行就是定義了6個終端:
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
從上面可以看出在2、3、4、5的運行級別中都將以respawn方式運行mingetty程序,mingetty程序能打開終端、設(shè)置模式。同時它會顯示一個文本登錄界面,這個界面就是我們經(jīng)常看到的登錄界面,在這個登錄界面中會提示用戶輸入用戶名,而用戶輸入的用戶將作為參數(shù)傳給login程序來驗證用戶的身份。
第六部分:登錄系統(tǒng),啟動完成
對于運行級別為5的圖形方式用戶來說,他們的登錄是通過一個圖形化的登錄界面。登錄成功后可以直接進入KDE、Gnome等窗口管理器。而本文主要講的還是文本方式登錄的情況:
當(dāng)我們看到mingetty的登錄界面時,我們就可以輸入用戶名和密碼來登錄系統(tǒng)了。
Linux的賬號驗證程序是login,login會接收mingetty傳來的用戶名作為用戶名參數(shù)。然后login會對用戶名進行分析:如果用戶名不是root,且存在/etc/nologin文件,login將輸出nologin文件的內(nèi)容,然后退出。這通常用來系統(tǒng)維護時防止非root用戶登錄。只有/etc/securetty中登記了的終端才允許root用戶登錄,如果不存在這個文件,則root可以在任何終端上登錄。/etc/usertty文件用于對用戶作出附加訪問限制,如果不存在這個文件,則沒有其他限制。
在分析完用戶名后,login將搜索/etc/passwd以及/etc/shadow來驗證密碼以及設(shè)置賬戶的其它信息,比如:主目錄是什么、使用何種shell。如果沒有指定主目錄,將默認(rèn)為根目錄;如果沒有指定shell,將默認(rèn)為/bin/bash。
login程序成功后,會向?qū)?yīng)的終端在輸出最近一次登錄的信息(在/var/log/lastlog中有記錄),并檢查用戶是否有新郵件(在/usr/spool/mail/的對應(yīng)用戶名目錄下)。然后開始設(shè)置各種環(huán)境變量:對于bash來說,系統(tǒng)首先尋找/etc/profile腳本文件,并執(zhí)行它;然后如果用戶的主目錄中存在.bash_profile文件,就執(zhí)行它,在這些文件中又可能調(diào)用了其它配置文件,所有的配置文件執(zhí)行后后,各種環(huán)境變量也設(shè)好了,這時會出現(xiàn)大家熟悉的命令行提示符,到此整個啟動過程就結(jié)束了。
希望通過上面對Linux啟動過程的剖析能幫助那些想深入學(xué)習(xí)Linux用戶建立一個相關(guān)Linux啟動過程的清晰概念,進而可以進一步研究Linux接下來是如何工作的。
?
==============
http://chenguang.blog.51cto.com/350944/258774
深入理解Linux啟動過程 ? ??? 本文詳細(xì)分析了Linux桌面操作系統(tǒng)的啟動過程,涉及到BIOS系統(tǒng)、LILO 和GRUB引導(dǎo)裝載程序,以及bootsect、setup、vmlinux等映像文件,并結(jié)合引導(dǎo)、啟動原理和具體的代碼實現(xiàn)機制由淺入深地進行了分析。 ??? 初學(xué)者剛接觸Linux桌面系統(tǒng)會感覺系統(tǒng)啟動速度較慢,那么,為什么它的啟動速度慢呢?本文就桌面系統(tǒng)的引導(dǎo)和啟動過程展開分析,以期對初學(xué)者熟悉Linux有所幫助。 一、Linux系統(tǒng)的引導(dǎo)過程 ??? 簡單地說,系統(tǒng)的引導(dǎo)和啟動過程就是計算機加電以后所要發(fā)生的事情, 比如,加電自檢、引導(dǎo)程序的拷貝和執(zhí)行、內(nèi)核的拷貝和執(zhí)行及用戶程序的執(zhí)行等。這個過程就是常說的bootstrap,我們把這些歸納為5個過程, 下面來逐一分析。 ?? 1.BIOS執(zhí)行階段 ??? 現(xiàn)代計算機系統(tǒng)的存儲機制是“揮發(fā)”性的,一旦關(guān)機斷電, 存儲在內(nèi)存中的信息。連同操作系統(tǒng)本身的映射就丟失了。所以,必須把操作系統(tǒng)(內(nèi)核) 的映像存儲在某些不“揮發(fā)” 的介質(zhì)中,使得開機加電時由一個不“揮發(fā)”介質(zhì)加載操作系統(tǒng),并轉(zhuǎn)入運行的過程。這就是引導(dǎo),也稱自舉。這些不“揮發(fā)” 介質(zhì)通常是指硬盤或軟盤, 也可以是EPROM 或F1ash存儲器,還可以是網(wǎng)絡(luò)中別的節(jié)點。要想在開機時從不“揮發(fā)” 介質(zhì)裝入操作系統(tǒng)的映像,系統(tǒng)就要CPU在開機時能執(zhí)行一段程序,這段程序本身必須存儲在作為系統(tǒng)內(nèi)存一部分的EPROM 或Flash等存儲器中, 而且它們知道怎樣才能從不“揮發(fā)” 介質(zhì)裝入操作系統(tǒng)的映像。事實上,各種CPU 被設(shè)計成一個加電后就從某個特殊的地址開始執(zhí)行指令,所以這些不揮發(fā)存儲器就被安置在這個位置上。比如在i386CPU系統(tǒng)中,計算機在加電的那一刻,RAM 芯片中所包含的是隨機數(shù)據(jù),還沒有操作系統(tǒng),在此刻有一個特殊硬件電路在加電時會在C P U 的一個引腳上產(chǎn)生一個RESET邏輯值,硬件電路設(shè)置RESET邏輯值以后,代碼寄存器CS的內(nèi)容為0xffff,而指令寄存器的內(nèi)容為0。也就是說,CPU要從線性地址0xffff0開始處取第一條指令。硬件電路再把這個物理地址映射到RAM 芯片中,BIOS就存放在這里,這時候處理器就開始執(zhí)行BIOS代碼了。我們都知道BIOS中包含了幾個中斷驅(qū)動的低級程序,可以使用它們來初始化一些硬件設(shè)備,但它們是在實模式下工作的。其中實模式地址是由一個seg段和一個off偏移量組成的,相應(yīng)的物理地址可以使用“seg*16+off” 來計算。 接下來BIOS要做的就是執(zhí)行一系列的測試,看看到底系統(tǒng)中有什么設(shè)備,以及這些設(shè)備是否正常工作。在執(zhí)行這個過程時,會顯示一些如BIOS系統(tǒng)的版本號等信息。當(dāng)檢測到可用的設(shè)備后就進行一些初始化工作,比如初始化PCI設(shè)備以避免I RQ線與I/O端口的沖突,最后顯示系統(tǒng)中安裝的所有PCI設(shè)備的一個列表。 在早期的計算機系統(tǒng)中, 類似于BIOS功能的程序非常小,并且不同時期這段程序的設(shè)計也不相同。在PC發(fā)展早期, 由于當(dāng)時存儲芯片大小的限制,使得該段程序的目的和功能都很單一 再說,如此小的一段程序很難依靠自身的力量把龐大的操作系統(tǒng)的映像從磁盤里讀進來。于足,人們又提出了引導(dǎo)扇區(qū)的概念,使得存儲在引導(dǎo)扇區(qū)中的程序來協(xié)助BIOS完成操作系統(tǒng)的引導(dǎo)工作。但是,引導(dǎo)扇區(qū)的大小也不過5l2個字節(jié), 能夠容納的信息和代碼也很有限,所以說,操作系統(tǒng)的引導(dǎo)代碼是一個循序漸進的過程,它分布在不同的角落。當(dāng)BlOS根據(jù)設(shè)置將相應(yīng)的啟動設(shè)備的第一個扇區(qū)的內(nèi)容拷貝到RAM 中時, 這些內(nèi)容被放在物理地址0x0O007c00開始的地方。此后,系統(tǒng)就開始跳到這個地址,并開始執(zhí)行相應(yīng)的代碼。 ??? 2.Boot Loader階段 如此小的引導(dǎo)記錄要完成這么大的任務(wù),壓力是不小的,所以引導(dǎo)扇區(qū)的程序及輔助程序必須很簡練,它們都采用匯編語言編寫,這些源代碼都存放在arch/ 下具體CPU名下的boot目錄中,如bootsect.S、setup.S和video.S。其中bootsect.S是Linux引導(dǎo)扇區(qū)的源代碼。這樣,經(jīng)過編譯、匯編和連接以后,形成了3個組成部分,即引導(dǎo)扇區(qū)的映像bootsect、輔助程序setup及內(nèi)核映像本身(通常是vmlinux,有時也用uImage)。嚴(yán)格地說,bootsect和setup并不是內(nèi)核的一部分。 引導(dǎo)裝載程序就是由BIOS來把操作系統(tǒng)的內(nèi)核映像裝入到RAM 中所調(diào)用的一個程序。這里我們選擇用硬盤啟動來說明引導(dǎo)裝載程序的執(zhí)行過程。說起硬盤,大家都知道它是由許許多多的扇區(qū)和柱面組成,其中把第一個扇區(qū)稱為主引導(dǎo)記錄(Master Boot Record,MBR),在該扇區(qū)中包含了分區(qū)信息和一個小程序,這個小程序用來裝載被啟動的操作系統(tǒng)所在分區(qū)的第一個扇區(qū)。說到這里我們就要注意,這一段Windows系統(tǒng)和Linux系統(tǒng)是有區(qū)別的:Windows系統(tǒng)使用分區(qū)表中所包含的一個active標(biāo)志來標(biāo)識這個分區(qū),當(dāng)然這個分區(qū)也可以使用FDISK之類的程序進行設(shè)置,但有一個條件就是只有那些內(nèi)核映像存放在活動分區(qū)的操作系統(tǒng)才可以啟動。Linux系統(tǒng)的處理方法要更靈活些,它使用GRUB或是LILO程序把這個包含在MBR 中的不完善引導(dǎo)裝載程序給替掉。裝入程序在啟動過程中被執(zhí)行時,用戶可以選擇裝入哪個操作系統(tǒng)。但LILO和GRUB的工作原理又不盡相同,關(guān)于它們的詳細(xì)介紹可以查閱相關(guān)資料。LILO 引導(dǎo)裝入程序被分為兩部分,MBR 或分區(qū)引導(dǎo)扇區(qū)包括一個小的引導(dǎo)裝入程序,由BIOS把這個小程序裝入從地址0xO0007c00開始的RAM 中,這個小程序又把自己移到地址0x0009a000, 然后建立實模式棧。接著把LILO 的第二部分裝入到從地址0x0009b000開始的RAM 中, 第二部分又讀取可用操作系統(tǒng)的映射表,并給用戶一個提示符號。這個時候用戶可以從中選擇一個操作系統(tǒng)進行啟動,引導(dǎo)裝入程序就可以把相應(yīng)分區(qū)的引導(dǎo)扇區(qū)拷貝到RAM 中并執(zhí)行,或者是直接把內(nèi)核映像拷貝到RAM 中。在拷貝內(nèi)核的過程中,首先是把內(nèi)核映像所集成的引導(dǎo)裝入程序拷貝到地址0xO009000,然后把setup()代碼拷貝到地址0x00090200,最后把內(nèi)核映像的其余部分拷貝到地址0x00010000或0x00100000, 最終系統(tǒng)執(zhí)行跳到setup()代碼上。 ??? 3.Setup函數(shù)執(zhí)行階段 Setup()是匯編語言函數(shù)代碼,它在內(nèi)核的編譯鏈接過程中被放到內(nèi)核的引導(dǎo)裝入程序之后,也就是內(nèi)核映像文件的偏移量0x200地址處,實際物理地址0x00090200開始的RAM 中。因為內(nèi)核不依賴于BIOS, 雖然BIOS已經(jīng)初始化了大部分硬件設(shè)備,但Linux系統(tǒng)還要以自己的方式重新初始化設(shè)備,以增加可移植性和健壯性。還要注意的是,內(nèi)核是工作在保護模式下的。總的來說,setup()函數(shù)的作用就是初始化計算機中的硬件設(shè)備,并為內(nèi)核程序的執(zhí)行建立環(huán)境。比如,檢查系統(tǒng)中可用的RAM 數(shù)量、設(shè)置鍵盤重復(fù)延時速率、顯卡等其他設(shè)備的檢查,以及初始化和切換實模式到保護模式等。最后,系統(tǒng)執(zhí)行跳到startup_ 32匯編函數(shù)上。 二、Linux系統(tǒng)的啟動過程 當(dāng)內(nèi)核映像被裝載到RAM芯片后,就開始執(zhí)行內(nèi)核的代碼,這意味著引導(dǎo)完成,開始進入Linux系統(tǒng)的啟動過程。 ??? 1. Startup_32函數(shù)的執(zhí)行階段 在系統(tǒng)的啟動過程中有兩個startup_320()函數(shù),即位于arch/i386/boot/compressed/head.S文件中實現(xiàn)的。就是在setup()函數(shù)結(jié)束以后,該函數(shù)就被移動到物理地址0X00100000或0x00001000處,這取決于內(nèi)核映像是被裝到RAM 的高位還是底位。因為內(nèi)核映像文件在編譯連接時所產(chǎn)生的大小不同, 如zImage和bzImage大小相差很大,在裝載解壓時所使用的緩沖區(qū)也不同,所以他們所處的物理地址是不同的。不過解壓后的映像最終都處在物理地址0x00100000開始的位置。然后跳轉(zhuǎn)到這個地址處執(zhí)行解壓后的映像中的另一個startup_32()函數(shù),這個函數(shù)為第一個Linux進程(進程0)建立執(zhí)行環(huán)境,該函數(shù)初始化段寄存器、為進程0建立內(nèi)核態(tài)堆棧等一系列活動。最后識別處理器模式,并跳轉(zhuǎn)到start_kernel()函數(shù)。將Linux內(nèi)核的映像裝入內(nèi)存,并且setup()函數(shù)做了一些必要的準(zhǔn)備,就該startup_32函數(shù)開始干活了。CPU通過一條長程轉(zhuǎn)移指令轉(zhuǎn)到映像代碼段開頭的入口startup_32處,對于SMP結(jié)構(gòu)的系統(tǒng)來說,這個時候運行的只是其中的一個處理器,就是所謂的主CPU。其他的次CPU 處于停機狀態(tài), 等待主CPU 的啟動。次CPU在受到啟動進入內(nèi)核時,同樣也要從startup_32開始執(zhí)行,所以從startup_32開始的代碼是公共的。但有些操作僅由主CPU來執(zhí)行,另一些操作由次CPU執(zhí)行, 這并不意味著主CPU 和次CPU 并發(fā)地執(zhí)行這段程序。實際上,主CPU 是開路先鋒,首先執(zhí)行這段程序,完成以后逐個啟動次CPU執(zhí)行,并且等待其完成。所以,在同一時間系統(tǒng)中最多只有一個處理器在執(zhí)行這段程序。不管是主CPU還是次CPU,進入startup_32時都運行在保護模式下的段式尋址方式,等到第二個startup_32函數(shù)執(zhí)行到最后時, 就開始執(zhí)行start_kernel函數(shù)。 ??? 2. Start_kernel函數(shù)執(zhí)行階段 到了這個階段才是真正的內(nèi)核初始化階段,幾乎內(nèi)核每個部分的初始化工作都是由這個函數(shù)來完成,如頁表的初始化、系統(tǒng)日期和時間的初始化等。從某種意義上說,函數(shù)Start_kernel就好像一般可執(zhí)行程序中的主函數(shù)main(),系統(tǒng)在進入這個函數(shù)之前已經(jīng)進行了一些最底限度的初始化,為這個函數(shù)的執(zhí)行建立起了一個環(huán)境,創(chuàng)造了必要的條件。當(dāng)然,這個函數(shù)還要繼續(xù)進行內(nèi)核的初始化,甚至可以說內(nèi)核的初始化在這里才真正開始,但它是較高層次的初始化。這個函數(shù)的代碼在init/main.C中,從現(xiàn)在開始初始化流程不與CPU 類型和系統(tǒng)啟動;方式相關(guān)了。此時系統(tǒng)運行在CPU的特權(quán)級,也就是我們常說的內(nèi) 核模式下。start_ kernel函數(shù)主要完成一些數(shù)據(jù)結(jié)構(gòu)的初始化,主要包括 如下: printk(linux_banner) 輸出 Linux版本信息; Setup_arch()(arch/i386/kernel/traps.C)執(zhí)行與體系結(jié)構(gòu)相關(guān)的設(shè)置,如內(nèi)存分析分配內(nèi) 核頁表, 處理啟動命令行等; Trap_init() 設(shè)置各種人口地址,如異常事件處理程序入口, 系統(tǒng)調(diào)用人口, IniLIRQ() 初始化IRQ 中斷處理機制; Sched_init() 設(shè)置并啟動第一個進程ini_task0 l Softirq_init() 對軟中斷子系統(tǒng)進行初始化; Time_initO 讀取實時時間,重新設(shè)置時鐘中斷irq0的中斷服務(wù)程序入口等; Console__init() 初始化控制臺和顯示器; Init_modules() 初始化 kernel__m odule l Kmem_cache_init0 對內(nèi)存的slab分配機制初始化{ Mem_init() 虛擬內(nèi)存計算以及初始化; Kmem_cache_size_jnit() 初始化slab分配器中的內(nèi)部cashe和全局cashel Fork_init() 定義了系統(tǒng)的最大進程數(shù)目。此外,還有一些對其他支持的初始化。 隨后,進入reset—init0函數(shù)調(diào)用kernel__thread()函數(shù)為進程1創(chuàng)建init內(nèi)核線程,這個內(nèi)核線程又會創(chuàng)建其他的內(nèi)核線程程序,并執(zhí)行/sbin/init程序。此后start_kernel進入一個空閑等待循環(huán)(cpu_idle()), 使用系統(tǒng)初始化后CPU 的空閑時間片,init內(nèi)核線程首先要鎖定內(nèi)核,然后調(diào)用do_basic_setup()來初始化外部設(shè)備及加載驅(qū)動程序。在do_basic_setup()函數(shù)調(diào)用完之后,init()函數(shù)會釋放初始化函數(shù)所用的內(nèi)存,并且打開/dev/console設(shè)備重新定向控制臺,使用系統(tǒng)調(diào)用execve來執(zhí)行用戶態(tài)程序/sbin/init。 到目前為止,Linux內(nèi)核的初始化工作完成,此時系統(tǒng)中已經(jīng)存在5個運行實體:init線程、kflushd核心線程、kupdate核心線程、kswapd核心線程和keventd核心線程。本身所在的執(zhí)行體其實就是一個線程,不過是由手工創(chuàng)建的。它在創(chuàng)建了init0線程以后就進入cpu_idle循環(huán), 不會在進程列表中出現(xiàn)。如果使用pstree命令,則不能列出該線程。 最后,init程序會根據(jù)inittab文件中的設(shè)置信息啟動相應(yīng)的用戶程序。當(dāng)init得到控制并啟動mingetty顯示登錄界面及提示后,系統(tǒng)啟動完成。 三、小結(jié) 從加電自檢開始, 引導(dǎo)過程要經(jīng)歷數(shù)十個回合來拷貝執(zhí)行,使用不同的引導(dǎo)裝載程序所使角的流程也不同。當(dāng)把內(nèi)核映像拷貝到RAM中展開后, 內(nèi)核開始掌管主權(quán),開始了自己的 “事業(yè)”。內(nèi)核線程init()的任務(wù)仍然還是初始化,當(dāng)然是進一步的、更高層次上的初始化。 事實上,從引導(dǎo)結(jié)束、CPU轉(zhuǎn)入內(nèi)核映像開始,一共有三個階段的初始化:第一階段是從進入startup_32()開始, 到進入start_kernel()或start_ secondary()。這個階段主要是對CPU 自身的初始化,主CPU和次CPU 都要經(jīng)歷這種初始化,但是主CPU要多一些貢獻。第二階段是從進入start_kernel()開始,到進入cpu_idle()。這個階段主要是對系統(tǒng)的寶貴資源的初始化, 僅由主CPU進行。第三階段是init()的執(zhí)行,這是對系統(tǒng)接近用戶層的初始化, 這個時候表面上看已經(jīng)沒:有主CPU和次CPU之分,但誰執(zhí)行init()取決于競爭調(diào)度的結(jié)果。事實上,由于主CPU預(yù)先留了一手, 實際上還是由它來執(zhí)行。?
總結(jié)
以上是生活随笔為你收集整理的剖析Linux系统启动过程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Changing the sharing
- 下一篇: Spring事务TransactionP