内核中的page fault copy_from_user
內核態的page fault?
前段時間有同事問了個問題:內核中是否可能發生page fault?
一時沒能給出準確答案,當即有種感覺:難道是對內核內存管理的理解還不夠,之前在這方面還是比較自信的~
問題看似很簡單,從之前的理解來看,以經典的32位X86為例,內核態低端地址都是線性映射的,頁表都是事先(內核初始化時)創建好的,對于這段地址,應該不會發生page fault;但對于vmalloc區,是通過頁表動態映射的,這部分顯然是可能發生缺頁的。
看似問題有答案了,但TX問的不是針對內核態地址發送的缺頁,而是:在內核態下,對用戶態地址的訪問,是否發生page fault?
我追問了一句:什么情況下,內核態需要訪問用戶態地址? 回答:比如copy_from_user.
問題清晰了,這種情況下,可能發生缺頁嗎?
硬件層面
從硬件層面上來說,當CPU做訪問操作時,MMU硬件會遍歷頁表,查找匹配的映射條目,如果沒有找到,就會自動觸發page fault。
所以,從這個角度看,只要copy_from_user參數中的用戶態地址對應的頁表項不存在,就會產生page fault。
不應該發生吧?
換個角度,內核要使用copy_from_user從用戶態拷貝數據時,按理數據應該都已經準備好了吧,也就是說相應的內存(物理)應該都已經分配好了把,不應該發生page fault了吧?
正常情況下,的確如此,但萬一內核非要訪問未映射的用戶態地址呢?萬一用戶態數據此時沒有準備好呢?誰能保證?
所以,雖然不應該發生,但還是可能發送的。
有什么不一樣么?
這種情況下,在內核中發生的page fault,與平常我們見到的在用戶態發生的page fault有什么不同么?
在用戶態時,發生缺頁時,CPU硬件會切換到到特權模式(內核態),進行異常處理;在內核態時發生缺頁,由于當前本來就出于內核態,所以處理方式肯定會有不同。這也許只是一方面,應該還有其它不同~
如何處理的?
在page fault的流程中針對Vmalloc區發生的缺頁有專門的處理,可以參見vmalloc_fault函數。
那對于copy_from_user的情況呢?
肯定的。其實就是do_page_fault流程中exception table相關的處理,之前對這里的代碼沒有仔細理解清楚,原來就是用來處理這種情況的。
為什么要用copy_from_user?
還是回到老問題,為什么要用copy_from_user,按理解,拷貝數據,不就是從一個地址搬移數據到另一個地址,用memcpy不就好了?
就是因為可能發生page fault的情況,memcpy對這種情況沒有任何的處理措施,可能引發不可知的后果。
而copy_from_user對這種情況進行了處理,處理方式就是在代碼中增加了一個.fixup的段,該段在do_page_fault中會被讀取,結合exception table進行相應的修正,具體修正方式,沒時間深入研究了,感興趣可以繼續看看。
copy_from_user代碼如下:
static unsigned long __copy_user_intel(void __user *to, const void *from, unsigned long size) {int d0, d1;__asm__ __volatile__(" .align 2,0x90\n""1: movl 32(%4), %%eax\n"" cmpl $67, %0\n"" jbe 3f\n""2: movl 64(%4), %%eax\n"" .align 2,0x90\n""3: movl 0(%4), %%eax\n""4: movl 4(%4), %%edx\n""5: movl %%eax, 0(%3)\n""6: movl %%edx, 4(%3)\n""7: movl 8(%4), %%eax\n""8: movl 12(%4),%%edx\n""9: movl %%eax, 8(%3)\n""10: movl %%edx, 12(%3)\n""11: movl 16(%4), %%eax\n""12: movl 20(%4), %%edx\n""13: movl %%eax, 16(%3)\n""14: movl %%edx, 20(%3)\n""15: movl 24(%4), %%eax\n""16: movl 28(%4), %%edx\n""17: movl %%eax, 24(%3)\n""18: movl %%edx, 28(%3)\n""19: movl 32(%4), %%eax\n""20: movl 36(%4), %%edx\n""21: movl %%eax, 32(%3)\n""22: movl %%edx, 36(%3)\n""23: movl 40(%4), %%eax\n""24: movl 44(%4), %%edx\n""25: movl %%eax, 40(%3)\n""26: movl %%edx, 44(%3)\n""27: movl 48(%4), %%eax\n""28: movl 52(%4), %%edx\n""29: movl %%eax, 48(%3)\n""30: movl %%edx, 52(%3)\n""31: movl 56(%4), %%eax\n""32: movl 60(%4), %%edx\n""33: movl %%eax, 56(%3)\n""34: movl %%edx, 60(%3)\n"" addl $-64, %0\n"" addl $64, %4\n"" addl $64, %3\n"" cmpl $63, %0\n"" ja 1b\n""35: movl %0, %%eax\n"" shrl $2, %0\n"" andl $3, %%eax\n"" cld\n""99: rep; movsl\n""36: movl %%eax, %0\n""37: rep; movsb\n""100:\n"".section .fixup,\"ax\"\n""101: lea 0(%%eax,%0,4),%0\n"" jmp 100b\n"".previous\n"_ASM_EXTABLE(1b,100b)_ASM_EXTABLE(2b,100b)_ASM_EXTABLE(3b,100b)_ASM_EXTABLE(4b,100b)_ASM_EXTABLE(5b,100b)_ASM_EXTABLE(6b,100b)_ASM_EXTABLE(7b,100b)_ASM_EXTABLE(8b,100b)_ASM_EXTABLE(9b,100b)_ASM_EXTABLE(10b,100b)_ASM_EXTABLE(11b,100b)_ASM_EXTABLE(12b,100b)_ASM_EXTABLE(13b,100b)_ASM_EXTABLE(14b,100b)_ASM_EXTABLE(15b,100b)_ASM_EXTABLE(16b,100b)_ASM_EXTABLE(17b,100b)_ASM_EXTABLE(18b,100b)_ASM_EXTABLE(19b,100b)_ASM_EXTABLE(20b,100b)_ASM_EXTABLE(21b,100b)_ASM_EXTABLE(22b,100b)_ASM_EXTABLE(23b,100b)_ASM_EXTABLE(24b,100b)_ASM_EXTABLE(25b,100b)_ASM_EXTABLE(26b,100b)_ASM_EXTABLE(27b,100b)_ASM_EXTABLE(28b,100b)_ASM_EXTABLE(29b,100b)_ASM_EXTABLE(30b,100b)_ASM_EXTABLE(31b,100b)_ASM_EXTABLE(32b,100b)_ASM_EXTABLE(33b,100b)_ASM_EXTABLE(34b,100b)_ASM_EXTABLE(35b,100b)_ASM_EXTABLE(36b,100b)_ASM_EXTABLE(37b,100b)_ASM_EXTABLE(99b,101b): "=&c"(size), "=&D" (d0), "=&S" (d1): "1"(to), "2"(from), "0"(size): "eax", "edx", "memory");return size; }代碼整體上跟memcpy實現差不多,主要差別就是fixup段了,感興趣的TX可以對比看看。
原文地址:?http://happyseeker.github.io/kernel/2016/12/30/page-fault-in-kernel.html
總結
以上是生活随笔為你收集整理的内核中的page fault copy_from_user的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Mips KVM TrapEmulate
- 下一篇: Mips TLB miss异常