09 | 基础篇:怎么理解Linux软中断?
生活随笔
收集整理的這篇文章主要介紹了
09 | 基础篇:怎么理解Linux软中断?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
上一期,我用一個不可中斷進程的案例,帶你學習了 iowait(也就是等待 I/O 的 CPU 使用率)升高時的分析方法。這里你要記住,進程的不可中斷狀態是系統的一種保護機制,可以保證硬件的交互過程不被意外打斷。所以,短時間的不可中斷狀態是很正常的。但是,當進程長時間都處于不可中斷狀態時,你就得當心了。這時,你可以使用 dstat、pidstat 等工具,確認是不是磁盤 I/O 的問題,進而排查相關的進程和磁盤設備。關于磁盤 I/O 的性能問題,你暫且不用專門去背,我會在后續的 I/O 部分詳細介紹,到時候理解了也就記住了。其實除了 iowait,軟中斷(softirq)CPU 使用率升高也是最常見的一種性能問題。接下來的兩節課,我們就來學習軟中斷的內容,我還會以最常見的反向代理服務器 Nginx 的案例,帶你分析這種情況。
主題:軟中斷中斷:系統用來響應硬件設備請求的一種機制,會打斷進程的正常調度和執行,通過調用內核中的中斷處理程序來響應設備的請求。1.中斷是一種異步的事件處理機制,能提高系統的并發處理能力2.為了減少對正常進程運行進行影響,中斷處理程序需要盡快運行。3.中斷分為上下兩個部分(1)上部分用來快速處理中斷,在中斷禁止模式下,主要處理跟硬件緊密相關的或時間敏感的工作(2)下部分用來延遲處理上半部分未完成的工作,通常以內核線程的方式運行。小結:上半部分直接處理硬件請求,即硬中斷,特點是快速執行下部分由內核觸發,即軟中斷,特點是延遲執行軟中斷除了上面的下部分,還包括一些內核自定義的事件,如:內核調度 RCU鎖 網絡收發 定時等軟中斷內核線程的名字:ksoftirq/cpu編號4.proc文件系統是一種內核空間和用戶空間進行通信的機制,可以同時用來查看內核的數據結構又能用了動態修改內核的配置,如:/proc/softirqs 提供軟中斷的運行情況/proc/interrupts 提供硬中斷的運行情況
從“取外賣”看中斷
說到中斷,我在前面關于“上下文切換”的文章,簡單說過中斷的含義,先來回顧一下。中斷是系統用來響應硬件設備請求的一種機制,它會打斷進程的正常調度和執行,然后調用內核中的中斷處理程序來響應設備的請求。你可能要問了,為什么要有中斷呢?我可以舉個生活中的例子,讓你感受一下中斷的魅力。比如說你訂了一份外賣,但是不確定外賣什么時候送到,也沒有別的方法了解外賣的進度,但是,配送員送外賣是不等人的,到了你這兒沒人取的話,就直接走人了。所以你只能苦苦等著,時不時去門口看看外賣送到沒,而不能干其他事情。不過呢,如果在訂外賣的時候,你就跟配送員約定好,讓他送到后給你打個電話,那你就不用苦苦等待了,就可以去忙別的事情,直到電話一響,接電話、取外賣就可以了。這里的“打電話”,其實就是一個中斷。沒接到電話的時候,你可以做其他的事情;只有接到了電話(也就是發生中斷),你才要進行另一個動作:取外賣。這個例子你就可以發現,中斷其實是一種異步的事件處理機制,可以提高系統的并發處理能力。由于中斷處理程序會打斷其他進程的運行,所以,為了減少對正常進程運行調度的影響,中斷處理程序就需要盡可能快地運行。如果中斷本身要做的事情不多,那么處理起來也不會有太大問題;但如果中斷要處理的事情很多,中斷服務程序就有可能要運行很長時間。特別是,中斷處理程序在響應中斷時,還會臨時關閉中斷。這就會導致上一次中斷處理完成之前,其他中斷都不能響應,也就是說中斷有可能會丟失。那么還是以取外賣為例。假如你訂了 2 份外賣,一份主食和一份飲料,并且是由 2 個不同的配送員來配送。這次你不用時時等待著,兩份外賣都約定了電話取外賣的方式。但是,問題又來了。當第一份外賣送到時,配送員給你打了個長長的電話,商量發票的處理方式。與此同時,第二個配送員也到了,也想給你打電話。但是很明顯,因為電話占線(也就是關閉了中斷響應),第二個配送員的電話是打不通的。所以,第二個配送員很可能試幾次后就走掉了(也就是丟失了一次中斷)。軟中斷
如果你弄清楚了“取外賣”的模式,那對系統的中斷機制就很容易理解了。事實上,為了解決中斷處理程序執行過長和中斷丟失的問題,Linux 將中斷處理過程分成了兩個階段,也就是上半部和下半部:- 上半部用來快速處理中斷,它在中斷禁止模式下運行,主要處理跟硬件緊密相關的或時間敏感的工作。
- 下半部用來延遲處理上半部未完成的工作,通常以內核線程的方式運行。
- 上半部直接處理硬件請求,也就是我們常說的硬中斷,特點是快速執行;
- 而下半部則是由內核觸發,也就是我們常說的軟中斷,特點是延遲執行。
查看軟中斷和內核線程
不知道你還記不記得,前面提到過的 proc 文件系統。它是一種內核空間和用戶空間進行通信的機制,可以用來查看內核的數據結構,或者用來動態修改內核的配置。其中:- /proc/softirqs 提供了軟中斷的運行情況;
- /proc/interrupts 提供了硬中斷的運行情況。
- 第一,要注意軟中斷的類型,也就是這個界面中第一列的內容。從第一列你可以看到,軟中斷包括了 10 個類別,分別對應不同的工作類型。比如 NET_RX 表示網絡接收中斷,而 NET_TX 表示網絡發送中斷。
- 第二,要注意同一種軟中斷在不同 CPU 上的分布情況,也就是同一行的內容。正常情況下,同一種中斷在不同 CPU 上的累積次數應該差不多。比如這個界面中,NET_RX 在 CPU0 和 CPU1 上的中斷次數基本是同一個數量級,相差不大。
小結
Linux 中的中斷處理程序分為上半部和下半部:- 上半部對應硬件中斷,用來快速處理中斷。
- 下半部對應軟中斷,用來異步處理上半部未完成的工作。
思考
最后,我想請你一起聊聊,你是怎么理解軟中斷的?你有沒有碰到過因為軟中斷出現的性能問題?你又是怎么分析它們的瓶頸的呢?你可以結合今天的內容,總結自己的思路,寫下自己的問題。歡迎在留言區和我討論,也歡迎把這篇文章分享給你的同事、朋友。我們一起在實戰中演練,在交流中進步。主題:軟中斷中斷:系統用來響應硬件設備請求的一種機制,會打斷進程的正常調度和執行,通過調用內核中的中斷處理程序來響應設備的請求。1.中斷是一種異步的事件處理機制,能提高系統的并發處理能力2.為了減少對正常進程運行進行影響,中斷處理程序需要盡快運行。3.中斷分為上下兩個部分(1)上部分用來快速處理中斷,在中斷禁止模式下,主要處理跟硬件緊密相關的或時間敏感的工作(2)下部分用來延遲處理上半部分未完成的工作,通常以內核線程的方式運行。小結:上半部分直接處理硬件請求,即硬中斷,特點是快速執行下部分由內核觸發,即軟中斷,特點是延遲執行軟中斷除了上面的下部分,還包括一些內核自定義的事件,如:內核調度 RCU鎖 網絡收發 定時等軟中斷內核線程的名字:ksoftirq/cpu編號4.proc文件系統是一種內核空間和用戶空間進行通信的機制,可以同時用來查看內核的數據結構又能用了動態修改內核的配置,如:/proc/softirqs 提供軟中斷的運行情況/proc/interrupts 提供硬中斷的運行情況
總結
以上是生活随笔為你收集整理的09 | 基础篇:怎么理解Linux软中断?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 08 | 案例篇:系统中出现大量不可中断
- 下一篇: 10 | 案例篇:系统的软中断CPU使用