OpenCV进阶篇
sss
OpenCV進階篇
第10章 模板匹配
模板匹配是一種最原始、最基本的識別方法,可以在原始圖像中尋找特定圖像的位置。模板匹配經常應用于簡單的圖像查找場景中,例如,在集體合照中找到某個人的位置。本章將介紹如何利用OpenCV實現模板匹配。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8Qunwp3k-1639056667651)(OpenCV進階篇.assets/image-20211122082012339.png)]
10.1 模板匹配方法
模板是被查找目標的圖像,查找模板在原始圖像中的哪個位置的過程就叫模板匹配。OpenCV提供的matchTemplate()方法就是模板匹配方法,其語法如下:
result = cv2.matchTemplate(image, templ, method, mask)參數說明:
image:原始圖像。
templ:模板圖像,尺寸必須小于或等于原始圖像。
method:匹配的方法,可用參數值如表10.1所示。
表10.1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yTgvDiwC-1639056667652)(OpenCV進階篇.assets/image-20211122082047351.png)]
匹配方法的參數值
mask:可選參數。掩模,只有cv2.TM_SQDIFF和cv2.TM_CCORR_NORMED支持此參數,建議采用默認值。
返回值說明:
result:計算得出的匹配結果。如果原始圖像的寬、高分別為W、H,模板圖像的寬、高分別為w、h,result就是一個W-w+1列、H-h+1行的32位浮點型數組。數組中每一個浮點數都是原始圖像中對應像素位置的匹配結果,其含義需要根據method參數來解讀。
在模板匹配的計算過程中,模板會在原始圖像中移動。模板與重疊區域內的像素逐個對比,最后將對比的結果保存在模板左上角像素點索引位置對應的數組位置中。計算過程如圖10.1所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-q6lurtRV-1639056667652)(OpenCV進階篇.assets/image-20211122082229394.png)]
? 圖10.1 模板在原始圖像中移動并逐個匹配
使用cv2.TM_SQDIFF(平方差匹配)方法計算出的數組格式如下(其他方法計算出的數組格式相同,僅數值不同):
[[0.10165964 0.10123613 0.1008469 ... 0.10471864 0.10471849 0.10471849][0.10131165 0.10087635 0.10047968 ... 0.10471849 0.10471834 0.10471849][0.10089004 0.10045089 0.10006084 ... 0.10471849 0.10471819 0.10471849]...[0.16168603 0.16291814 0.16366465 ... 0.12178455 0.12198001 0.12187888][0.15859096 0.16000605 0.16096526 ... 0.12245651 0.12261643 0.12248362][0.15512456 0.15672517 0.15791312 ... 0.12315679 0.1232616 0.12308815]]模板將原始圖像中每一塊區域都覆蓋一遍,但結果數組的行、列數并不等于原始圖像的像素的行、列數。假設模板的寬為w,高為h,原始圖像的寬為W,高為H,如圖10.2所示。
模板移動到原始圖像的邊緣之后就不會繼續移動了,所以模板的移動區域如圖10.3所示,該區域的邊長為“原始圖像邊長-模板邊長+1”,最后加1是因為移動區域內的上下、左右的2個邊都被模板覆蓋到了,如果不加1會丟失數據。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-egJKRmNg-1639056667653)(OpenCV進階篇.assets/image-20211122085327267.png)]
? 圖10.2 模板和原始圖像的寬、高
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-vEnbCYJW-1639056667653)(OpenCV進階篇.assets/image-20211122085350483.png)]
? 圖10.3 模板移動的范圍
10.2 單模板匹配
匹配過程中只用到一個模板場景叫單模板匹配。原始圖像中可能只有一個和模板相似的圖像,也可能有多個。如果只獲取匹配程度最高的那一個結果,這種操作叫作單目標匹配。如果需要同時獲取所有匹配程度較高的結果,這種操作叫作多目標匹配。
10.2.1 單目標匹配
單目標匹配只獲取一個結果即可,就是匹配程度最高的結果(如果使用平方差匹配,則為計算出的最小結果;如果使用相關匹配或相關系數匹配,則為計算出的最大結果)。本節以平方差匹配為例介紹。
matchTemplate()方法的計算結果是一個二維數組,OpenCV提供了一個minMaxLoc()方法專門用來解析這個二維數組中的最大值、最小值以及這2個值對應的坐標,minMaxLoc()方法的語法如下:
參數說明:
src:matchTemplate()方法計算得出的數組。
mask:可選參數,掩模,建議使用默認值。
返回值說明:
minValue:數組中的最小值。
maxValue:數組中的最大值。
minLoc:最小值的坐標,格式為(x, y)。
maxLoc:最大值的坐標,格式為(x, y)。
平方差匹配的計算結果越小,匹配程度越高。minMaxLoc()方法返回的minValue值就是模板匹配的最優結果,minLoc就是最優結果區域左上角的點坐標,區域大小與模板大小一致。
【實例10.1】 為原始圖片中匹配成功的區域繪制紅框。
將圖10.4作為模板,將圖10.5作為原始圖像,使用cv2.TM_SQDIFF_NORMED方式進行模板匹配,在原始圖像中找到與模板一樣的圖案,并在該圖案上繪制紅色方框。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-rar15A3x-1639056667654)(OpenCV進階篇.assets/image-20211122085451979.png)]
? 圖10.4 模板
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gEC0AtkX-1639056667654)(OpenCV進階篇.assets/image-20211122085539068.png)]
? 圖10.5 原始圖片
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2A0hJfRU-1639056667655)(OpenCV進階篇.assets/image-20211122085602382.png)]
上述代碼的運行結果如圖10.6所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-nO5y7aFc-1639056667655)(OpenCV進階篇.assets/image-20211122085749850.png)]
? 圖10.6 模板匹配的效果
在許多綜藝節目里,導演組給選手們一幅圖像,讓選手在指定區域內尋找圖像中的某一靜物。為了增加游戲難度,導演組可能會讓選手們從2個或者多個相似的場景中選擇最佳的匹配結果。接下來,使用模板匹配的相應方法模擬這個游戲。
【實例10.2】 從2幅圖像中選擇最佳的匹配結果。
將圖10.7作為模板,將圖10.8和圖10.9作為原始圖像,使用cv2.TM_SQDIFF_NORMED方式進行模板匹配,在2幅原始圖像中找到與模板匹配結果最好的圖像,并在窗口中顯示出來。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-kAeDADkx-1639056667656)(OpenCV進階篇.assets/image-20211122085811909.png)]
? 圖10.7 模板
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-6Y2C8Uz6-1639056667656)(OpenCV進階篇.assets/image-20211122085837681.png)]
? 圖10.8 原始圖像221
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-F0efgzCT-1639056667656)(OpenCV進階篇.assets/image-20211122085907444.png)]
? 圖10.9 原始圖像222
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Iun44Nij-1639056667657)(OpenCV進階篇.assets/image-20211122085934422.png)]
上述代碼的運行結果如圖10.10所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2okGh7GG-1639056667657)(OpenCV進階篇.assets/image-20211122090014973.png)]
? 圖10.10 從2幅圖像中選擇最佳的匹配結果
網速的提升讓容量較大的文件更容易在互聯網上傳播,最明顯結果就是現在用戶計算機里被堆滿了各種各樣的圖像文件。
圖像文件與其他文件不同,相同內容的圖像可能保存在不同大小、不同格式的文件中,這些文件的二進制字節碼差別較大,很難用簡單的程序識別。在沒有高級識別軟件的情況下想要找出內容相同的圖像就只能一個一個打開用肉眼識別了。
OpenCV能夠打破圖像文件規格、格式的限制來識別圖像內容。
【實例10.3】 查找重復的圖像。
圖10.11所示的文件夾中有10幅圖像,這些圖像不僅有JPG格式的,還有PNG格式的,而且這些圖像的分辨率也各不相同。接下來將編寫一個程序,在該文件夾中找出哪些是重復的照片。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-bny5k3Mh-1639056667657)(OpenCV進階篇.assets/image-20211122090116485.png)]
? 圖10.11 文件夾中的所有照片文件
想要解決這個問題,可以使用OpenCV提供的matchTemplate()方法來判斷2幅圖像的相似度,如果相似度大于0.9,就認為這2幅圖像是相同的。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0MWgYl4D-1639056667658)(OpenCV進階篇.assets/image-20211122090219888.png)]
上述代碼的運行結果如下:
相同的照片:10.png, 4.jpg,相同的照片:2.jpg, 5.jpg, 9.png,10.2.2 多目標匹配
多目標匹配需要將原始圖像中所有與模板相似的圖像都找出來,使用相關匹配或相關系數匹配可以很好地實現這個功能。如果計算結果大于某值(例如0.999),則認為匹配區域的圖案和模板是相同的。
【實例10.4】 為原始圖片中所有匹配成功的圖案繪制紅框。
將圖10.12作為模板,將圖10.13作為原始圖像。原始圖像中有很多重復的圖案,每一個與模板相似的圖案都需要被標記出來。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sPJngqiS-1639056667658)(OpenCV進階篇.assets/image-20211122090300666.png)]
? 圖10.12 模板
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-z3YHi9fS-1639056667658)(OpenCV進階篇.assets/image-20211122090321173.png)]
? 圖10.13 包含重復內容的原始圖像
使用cv2.TM_CCOEFF_NORMED方法進行模板匹配,使用for循環遍歷matchTemplate()方法返回的結果,找到所有大于0.99的計算結果,在這些結果的對應區域位置繪制紅色矩形邊框。編寫代碼時要注意:數組的列數在圖像坐標系中為橫坐標,數組的行數在圖像坐標系中為縱坐標。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9AHVz1kN-1639056667658)(OpenCV進階篇.assets/image-20211122090346039.png)]
上述代碼的運行結果如圖10.14所示,程序找到了3處與模板相似的圖案。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Z1Eg2Ozz-1639056667659)(OpenCV進階篇.assets/image-20211122090426271.png)]
? 圖10.14 匹配結果
多目標匹配在實際生活中有很多應用場景。例如,統計一條快軌線路的站臺總數;同一地點附近有2個地鐵站,優先選擇直線距離最短的地鐵站等。
【實例10.5】 統計一條快軌線路的站臺總數。
將圖10.15作為模板,圖10.16作為原始圖像,在原始圖像中標記快軌線路各個站臺,統計這條快軌線路的站臺總數。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qnkqoHAG-1639056667659)(OpenCV進階篇.assets/image-20211122090450906.png)]
? 圖10.15 模板
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-TKvqjLpo-1639056667659)(OpenCV進階篇.assets/image-20211122090516424.png)]
? 圖10.16 原始圖像
使用cv2.TM_CCOEFF_NORMED方法進行模板匹配,使用for循環遍歷matchTemplate()方法返回的結果,找到所有大于0.99的計算結果,在這些結果的對應區域位置繪制藍色矩形邊框,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-PcXPP4GV-1639056667660)(OpenCV進階篇.assets/image-20211122090545588.png)]
上述代碼的運行結果如圖10.17所示。
實例10.5第6行中的results包含所有藍色矩形邊框左上角的橫、縱坐標。利用這一特點,還可以模擬“同一地點附近有2個地鐵站,優先選擇直線距離最短的地鐵站”這一生活場景,模板如圖10.18所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-FOlMVoCl-1639056667660)(OpenCV進階篇.assets/image-20211122090628716.png)]
? 圖10.17 統計一條快軌線路的站臺總數
【實例10.6】 優先選擇直線距離最短的地鐵站。
如圖10.19所示,坐標為(62, 150)的地點附近有人民廣場和解放大路兩個地鐵站,如何優先選擇直線距離最短的地鐵站呢?首先將圖10.18作為模板,將圖10.19作為原始圖像,然后在原始圖像中標記出這兩個地鐵站,最后計算并比較坐標為(62, 150)這個地點與這兩個地鐵站的直線距離。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sZTp2jPj-1639056667660)(OpenCV進階篇.assets/image-20211122090830746.png)]
? 圖10.18 模板
? 圖10.19 原始圖像
使用cv2.TM_CCOEFF_NORMED方法進行模板匹配,使用for循環遍歷matchTemplate()方法返回的結果,找到所有大于0.99的計算結果,在這些結果的對應區域位置繪制藍色矩形邊框,分別計算(62,150)到藍色矩形邊框左上角的距離,用綠色線段標記出直線距離最短的地鐵站,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0DHd3yX7-1639056667660)(OpenCV進階篇.assets/image-20211122091313117.png)]
上述代碼的運行結果如圖10.20所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-v9DG7tnQ-1639056667661)(OpenCV進階篇.assets/image-20211122091347963.png)]
? 圖10.20 優先選擇直線距離最短的地鐵站
10.3 多模板匹配
匹配過程中同時查找多個模板的操作叫多模板匹配。多模板匹配實際上就是進行了n次“單模板多目標匹配”操作,n的數量為模板總數。【實例10.7】 同時匹配3個不同的模板。
將圖10.21~圖10.23作為模板,將圖10.24(a)作為原始圖像。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-3YCOPde6-1639056667661)(OpenCV進階篇.assets/image-20211122091419764.png)]
? 圖10.21 模板1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-r9yUEVDC-1639056667661)(OpenCV進階篇.assets/image-20211122091440162.png)]
? 圖10.22 模板2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-m1bOnojo-1639056667662)(OpenCV進階篇.assets/image-20211122091458891.png)]
? 圖10.23 模板3
每一個模板都要做一次“單模板多目標匹配”,最后把所有模板的匹配結果匯總到一起。“單模板多目標匹配”的過程可以封裝成一個方法,方法參數為模板和原始圖像,方法內部將計算結果再加工一下,直接返回所有紅框左上角和右下角兩點橫縱坐標的列表。在方法之外,將所有模板計算得出的坐標匯總到一個列表中,按照這些匯總的坐標一次性將所有紅框都繪制出來。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9ElkKc33-1639056667662)(OpenCV進階篇.assets/image-20211122091539261.png)]
上述代碼的運行效果如圖10.24(b)所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Uph18qmS-1639056667662)(OpenCV進階篇.assets/image-20211122091621151.png)]
? 圖10.24 多模板匹配效果
使用多模板匹配能夠解決很多生活中的實際問題。例如,一個收費停車場有4個車位,車位上陸續地停放了4輛車,通過多模板匹配,能夠知曉這4輛車分別停在了哪個車位上。接下來將模擬這一生活場景。
【實例10.8】 使用多模板匹配讓控制臺判斷4輛車分別停在了哪個車位上。
有4輛車按圖10.25~圖10.28的順序陸續駛入停車場,這4輛車停在4個車位上的效果如圖10.29所示。將圖10.25~圖10.28作為模板,將圖10.29作為原始圖像,使用cv2. TM_CCOEFF_NORMED方式進行模板匹配,在原始圖像中找到與4個模板一樣的圖像后,在控制臺上輸出這4輛車分別停在了哪個車位上。
說明
在圖10.29中,1號車位水平像素的取值范圍是0200,2號車位水平像素的取值范圍是200433,3號車位水平像素的取值范圍是433656,4號車位水平像素的取值范圍是656871。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dnthllJ8-1639056667662)(OpenCV進階篇.assets/image-20211122091712450.png)]
? 圖10.25 模板1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Yj96pba2-1639056667663)(OpenCV進階篇.assets/image-20211122091731718.png)]
? 圖10.26 模板2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-jvSXLJN1-1639056667663)(OpenCV進階篇.assets/image-20211122091750330.png)]
? 圖10.27 模板3
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-p9XHjoRB-1639056667663)(OpenCV進階篇.assets/image-20211122091808719.png)]
? 圖10.28 模板4
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-H2QimGeQ-1639056667663)(OpenCV進階篇.assets/image-20211122091825529.png)]
? 圖10.29 原始圖像
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xUmuJe8T-1639056667664)(OpenCV進階篇.assets/image-20211122091850011.png)]
上述代碼的運行結果如下:
車位編號: 4車位編號: 3車位編號: 2車位編號: 1上面的結果可以得出以下結論:圖10.25所示的車輛停在了4號車位上,圖10.26所示的車輛停在了3號車位上,圖10.27所示的車輛停在了2號車位上,圖10.28所示的車輛停在了1號車位上。
10.4 小結
模板匹配包括單模板匹配和多模板匹配,單模板匹配又包括單目標匹配和多目標匹配。實現這些內容的基礎方法就是模板匹配方法,即matchTemplate()方法。其中,重點掌握模板匹配方法的6個參數值。此外,為了實現單目標匹配,除了需要使用模板匹配方法matchTemplate()外,還要使用minMaxLoc()方法,這個方法返回的就是單目標匹配的最優結果。對于多目標匹配,要將它和多模板匹配區分開:多目標匹配只有一個模板,而多模板匹配則有多個模板。
第11章 濾波器
在盡量保留原圖像信息的情況下,去除圖像內噪聲、降低細節層次信息等一系列過程,叫作圖像的平滑處理(或圖像的模糊處理)。實現平滑處理最常用的工具就是濾波器。通過調節濾波器的參數,可以控制圖像的平滑程度。OpenCV提供了種類豐富的濾波器,每種濾波器使用的算法均不同,但都能對圖像中的像素值進行微調,讓圖像呈現平滑效果。本章將介紹均值濾波器、中值濾波器、高斯濾波器和雙邊濾波器的使用方法。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-vSWZ4Fzw-1639056667664)(OpenCV進階篇.assets/image-20211122092213657.png)]
11.1 均值濾波器
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xl2LLuQr-1639056667664)(OpenCV進階篇.assets/image-20211122092621030.png)]
? 圖11.1 噪聲圖像
圖像中可能會出現這樣一種像素,該像素與周圍像素的差別非常大,導致從視覺上就能看出該像素無法與周圍像素組成可識別的圖像信息,降低了整個圖像的質量。這種“格格不入”的像素就是圖像的噪聲。如果圖像中的噪聲都是隨機的純黑像素或者純白像素,這樣的噪聲稱作“椒鹽噪聲”或“鹽噪聲”。例如如圖7.1所示的就是一幅只有噪聲的圖像,常稱為“雪花點”。
以一個像素為核心,其周圍像素可以組成一個n行n列(簡稱n×n)的矩陣,這樣的矩陣結構在濾波操作中被稱為“濾波核”。矩陣的行、列數決定了濾波核的大小,如圖11.2所示的濾波核大小為3×3,包含9個像素;圖11.3所示的濾波核大小為5×5,包含25個像素。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-A7X4TOAK-1639056667665)(OpenCV進階篇.assets/image-20211122092605201.png)]
? 圖11.2 3×3的濾波核
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-pYkMEF6M-1639056667665)(OpenCV進階篇.assets/image-20211122092712502.png)]
? 圖11.3 5×5的濾波核
均值濾波器(也稱為低通濾波器)可以把圖像中的每一個像素都當成濾波核的核心,然后計算核內所有像素的平均值,最后讓核心像素值等于這個平均值。
例如,圖11.4就是均值濾波的計算過程。濾波核大小為3×3,核心像素值是35,顏色較深,周圍像素值都為110~150,因此可以認為核心像素是噪聲。將濾波核中的所有像素值相加,然后除以像素個數,就得出了平均值123(四舍五入取整)。將核心像素的值改成123,其顏色就與周圍顏色差別不大,圖像就變得平滑了。這就是均值濾波去噪的原理。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-U0Y6zVrq-1639056667665)(OpenCV進階篇.assets/image-20211122092745945.png)]
? 圖11.4 均值濾波的計算過程
OpenCV將均值濾波器封裝成blur()方法,其語法如下:
參數說明:
src:被處理的圖像。
ksize:濾波核大小,其格式為(高度,寬度),建議使用如(3, 3)、(5, 5)、(7, 7)等寬、高相等的奇數邊長。濾波核越大,處理之后的圖像就越模糊。
anchor:可選參數,濾波核的錨點,建議采用默認值,可以自動計算錨點。
borderType:可選參數,邊界樣式,建議采用默認值。
返回值說明:
dst:經過均值濾波處理之后的圖像。
【實例11.1】 對花朵圖像進行均值濾波操作。
分別使用大小為3×3、5×5和9×9的濾波核對花朵圖像進行均值濾波操
作,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-iSHWrz2c-1639056667665)(OpenCV進階篇.assets/image-20211122094217442.png)]
上述代碼的運行結果如圖11.5所示,從這個結果可以看出,濾波核越大,處理之后的圖像就越模糊。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5tDKOosJ-1639056667666)(OpenCV進階篇.assets/image-20211122092914325.png)]
? 圖11.5 圖像均值濾波效果
11.2 中值濾波器
中值濾波器的原理與均值濾波器非常相似,唯一的不同就是不計算像素的平均值,而是將所有像素值排序,把最中間的像素值取出,賦值給核心像素。
例如,圖11.6就是中值濾波的計算過程。濾波核大小為3×3,核心像素值是35,周圍像素值都為110~150。將核內所有像素值按升序排列,9個像素值排成一行,最中間位置為第5個位置,這個位置的像素值為131。不需再做任何計算,直接把131賦值給核心像素,其顏色就與周圍顏色差別不大,圖像就變得平滑了。這就是中值濾波去噪的原理。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ggPwhx8h-1639056667666)(OpenCV進階篇.assets/image-20211122095233594.png)]
圖11.6 中值濾波的計算過程
OpenCV將中值濾波器封裝成medianBlur()方法,其語法如下:
參數說明:
src:被處理的圖像。
ksize:濾波核的邊長,必須是大于1的奇數,如3、5、7等。該方法根據此邊長自動創建一個正方形的濾波核。
返回值說明:
dst:經過中值濾波處理之后的圖像。
注意
中值濾波器的ksize參數是邊長,而其他濾波器的ksize參數通常為(高,寬)。
【實例11.2】 對花朵圖像進行中值濾波操作.
分別使用邊長為3、5、9的濾波核對花朵圖像進行中值濾波操作,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gRpNOjqx-1639056667666)(OpenCV進階篇.assets/image-20211122095347319.png)]
上述代碼的運行結果如圖11.7所示,濾波核的邊長越長,處理之后的圖像就越模糊。中值濾波處理的圖像會比均值濾波處理的圖像丟失更多細節。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-nvL2Le6F-1639056667666)(OpenCV進階篇.assets/image-20211122095440078.png)]
? 圖11.7 圖像中值濾波效果
11.3 高斯濾波器
高斯濾波也被稱為高斯模糊或高斯平滑,是目前應用最廣泛的平滑處理算法。高斯濾波可以很好地在降低圖片噪聲、細節層次的同時保留更多的圖像信息,經過處理的圖像呈現“磨砂玻璃”的濾鏡效果。
進行均值濾波處理時,核心周圍每個像素的權重都是均等的,也就是每個像素都同樣重要,所以計算平均值即可。但在高斯濾波中,越靠近核心的像素權重越大,越遠離核心的像素權重越小,例如5×5大小的高斯濾波卷積核的權重示意圖如圖11.8所示。像素權重不同不能取平均值,要從權重大的像素中取較多的信息,從權重小的像素中取較少的信息。簡單概括就是“離誰更近,跟誰更像”。
高斯濾波的計算過程涉及卷積運算,會有一個與濾波核大小相等的卷積核。本節僅以3×3的濾波核為例,簡單地描述一下高斯濾波的計算過程。
卷積核中保存的值就是核所覆蓋區域的權重值,其遵循圖11.8的規律。卷積核中所有權重值相加的結果為1。例如,3×3的卷積核可以是如圖11.9所示的值。隨著核大小、σ標準差的變化,卷積核中的值也會發生較大變化,圖11.9僅是一種最簡單的情況。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-bUJTJIJq-1639056667667)(OpenCV進階篇.assets/image-20211122095530857.png)]
? 圖11.8 5×5的高斯濾波卷積核的權重示意圖
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-4h3BuqBO-1639056667667)(OpenCV進階篇.assets/image-20211122095559972.png)]
? 圖11.9 簡化的3×3的卷積核
進行高斯濾波的過程中,濾波核中像素與卷積核進行卷積計算,最后將計算結果賦值給濾波核的核心像素。其計算過程如圖11.10所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-f24HEXuv-1639056667667)(OpenCV進階篇.assets/image-20211122095620790.png)]
? 圖11.10 像素與卷積核進行卷積計算
在圖11.10的計算過程中,濾波核中的每個像素值都與卷積核對應位置的權重值相乘,最后計算出9個值,計算過程如下:
讓這9個值相加,再四舍五入取整,計算過程如下:
6.85 + 15 + 6.25 + 14.1 + 14 + 13.1 + 5.95 + 11.8 + 7.5 = 94.55 ≈ 95最后得到的這個結果就是高斯濾波的計算結果,濾波核的核心像素值從35改為95。
OpenCV將高斯濾波器封裝成了GaussianBlur()方法,其語法如下:
參數說明:
src:被處理的圖像。
ksize:濾波核的大小,寬高必須是奇數,如(3, 3)、(5, 5)等。
sigmaX:卷積核水平方向的標準差。
sigmaY:卷積核垂直方向的標準差。 修改sigmaX或sigmaY的值都可以改變卷積核中的權重比例。如果不知道如何設計這2個參數值,就直接把這2個參數的值寫成0,該方法就會根據濾波核的大小自動計算合適的權重比例。
borderType:可選參數,邊界樣式,建議使用默認值。
返回值說明:
dst:經過高斯濾波處理之后的圖像。
【實例11.3】 對花朵圖像進行高斯濾波操作。
分別使用大小為5×5、9×9和15×15的濾波核對花朵圖像進行高斯濾波操作,水平方向和垂直方向的標準差參數值全部為0,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-tbfymlO2-1639056667667)(OpenCV進階篇.assets/image-20211122095728517.png)]
上述代碼的運行結果如圖11.11所示,濾波核越大,處理之后的圖像就越模糊。和均值濾波、中值濾波處理的圖像相比,高斯濾波處理的圖像更加平滑,保留的圖像信息更多,更容易辨認。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-zXsixYC9-1639056667668)(OpenCV進階篇.assets/image-20211122095747712.png)]
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qobIEi1N-1639056667668)(OpenCV進階篇.assets/image-20211122095856218.png)]
? 圖11.11 圖像的高斯濾波效果
11.4 雙邊濾波器
不管是均值濾波、中值濾波還是高斯濾波,都會使整幅圖像變得平滑,圖像中的邊界會變得模糊不清。雙邊濾波是一種在平滑處理過程中可以有效保護邊界信息的濾波操作方法。
雙邊濾波器自動判斷濾波核處于“平坦”區域還是“邊緣”區域:如果濾波核處于“平坦”區域,則會使用類似高斯濾波的算法進行濾波;如果濾波核處于“邊緣”區域,則加大“邊緣”像素的權重,盡可能地讓這些像素值保持不變。
例如,圖11.12是一幅黑白拼接圖像,對這幅圖像進行高斯濾波,黑白交界處就會變得模糊不清,效果如圖11.13所示,但如果對這幅圖像進行雙邊濾波,黑白交界處的邊界則可以很好地保留下來,效果如圖11.14所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9NOGA35w-1639056667668)(OpenCV進階篇.assets/image-20211122095927108.png)]
? 圖11.12 原圖
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9Wt7UHEi-1639056667668)(OpenCV進階篇.assets/image-20211122095943849.png)]
? 圖11.13 高斯濾波效果
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-cERKh8Ud-1639056667669)(OpenCV進階篇.assets/image-20211122100141070.png)]
? 圖11.14 雙邊濾波效果
OpenCV將雙邊濾波器封裝成bilateralFilter()方法,其語法如下:
參數說明:
src:被處理的圖像。
d:以當前像素為中心的整個濾波區域的直徑。如果d<0,則自動根據sigmaSpace參數計算得到。該值與保留的邊緣信息數量成正比,與方法運行效率成反比。
sigmaColor:參與計算的顏色范圍,這個值是像素顏色值與周圍顏色值的最大差值,只有顏色值之差小于這個值時,周圍的像素才進行濾波計算。值為255時,表示所有顏色都參與計算。
sigmaSpace:坐標空間的σ(sigma)值,該值越大,參與計算的像素數量就越多。
borderType:可選參數,邊界樣式,建議默認。
返回值說明:
dst:經過雙邊濾波處理之后的圖像。
【實例11.4】 對比高斯濾波和雙邊濾波的處理效果。
使用大小為(15, 15)的濾波核對花朵圖像進行高斯濾波處理,同樣使用15作為范圍直徑對花朵圖像進行雙邊濾波處理,觀察兩種濾波處理之后的圖像邊緣有什么差別,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-o1vvrKgX-1639056667669)(OpenCV進階篇.assets/image-20211122100239643.png)]
上述代碼的運行結果如圖11.15所示,可以看出高斯濾波模糊了整個畫面,但雙邊濾波保留了較清晰的邊緣信息。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-iL70Jm9W-1639056667669)(OpenCV進階篇.assets/image-20211122100319332.png)]
? 圖11.15 兩種濾波方法效果對比
11.5 小結
噪聲指的是一幅圖像內部的、高亮度的像素點。圖像平滑處理是指在盡量保留原圖像信息的情況下,去除圖像內部的這些高亮度的像素點(也就是“噪聲”)。為了實現圖像平滑處理,需要的工具就是濾波器。本章主要講解了OpenCV中的4種濾波器,雖然每種濾波器的實現原理都不同,但是每種濾波器都能對圖像進行圖像平滑處理。讀者朋友在掌握這4種濾波器的實現方法的同時,也要熟悉這4種濾波器的實現原理。
第12章 腐蝕與膨脹
腐蝕和膨脹是圖像形態學中的兩種核心操作,通過這兩種操作可以清除或強化圖像中的細節。合理使用腐蝕和膨脹,還可以實現圖像開運算、閉運算、梯度運算、頂帽運算和黑帽運算等極具特點的操作。下面將對腐蝕、膨脹以及其他形態學操作進行詳細的介紹。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-BU9Hvg54-1639056667669)(OpenCV進階篇.assets/image-20211125193906728.png)]
12.1 腐蝕
腐蝕操作可以讓圖像沿著自己的邊界向內收縮。OpenCV通過“核”來實現收縮計算。“核”的英文名為kernel,在形態學中可以理解為“由n個像素組成的像素塊”,像素塊包含一個核心(核心通常在中央位置,也可以定義在其他位置)。像素塊在圖像的邊緣移動,在移動過程中,核會將圖像邊緣那些與核重合但又沒有越過核心的像素點都抹除,效果類似圖12.1所示的過程,就像削土豆皮一樣,將圖像一層一層地“削薄”。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-TcHfD008-1639056667670)(OpenCV進階篇.assets/image-20211125193959328.png)]
? 圖12.1 核腐蝕圖像中的像素
OpenCV將腐蝕操作封裝成erode()方法,該方法的語法如下:
dst = cv2.erode(src, kernel, anchor, iterations, borderType, borderValue)參數說明:
src:原始圖像。
kernel:腐蝕使用的核。
anchor:可選參數,核的錨點位置。
iterations:可選參數,腐蝕操作的迭代次數,默認值為1。
borderType:可選參數,邊界樣式,建議默認。
borderValue:可選參數,邊界值,建議默認。
返回值說明:
dst:經過腐蝕之后的圖像。
圖像經過腐蝕操作之后,可以抹除一些外部的細節,如圖12.2所示是一個卡通小蜘蛛,如果用一個5×5的像素塊作為核對小蜘蛛進行腐蝕操作,可以得到如圖12.3所示的結果。小蜘蛛的腿被當成外部細節抹除了,同時小蜘蛛的眼睛變大了,因為核從內部也“削”了一圈。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-GQuX4pYe-1639056667670)(OpenCV進階篇.assets/image-20211125194100364.png)]
? 圖12.2 原圖
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LO9YgMC8-1639056667670)(OpenCV進階篇.assets/image-20211125194124001.png)]
? 圖12.3 腐蝕之后的圖像
在OpenCV做腐蝕或其他形態學操作時,通常使用numpy模塊來創建核數組,例如:
這兩行代碼就是通過numpy模塊的ones()方法創建了一個5行5列(簡稱5×5)、數字類型為無符號8位整數、每一個數字的值都是1的數組,這個數組作為erode()方法的核參數。除了5×5的結構,還可以使用3×3、9×9、11×11等結構,行列數越大,計算出的效果就越粗糙,行列數越小,計算出的效果就越精細。
【實例12.1】 將仙人球圖像中的刺抹除。
仙人球的葉子呈針狀,莖呈深綠色,如圖12.4所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-iwTvCycU-1639056667670)(OpenCV進階篇.assets/image-20211125194225098.png)]
? 圖12.4 仙人球
使用3×3的核對仙人球圖像進行腐蝕操作,可以將圖像里的刺抹除,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-DnkLOVsV-1639056667671)(OpenCV進階篇.assets/image-20211125194308740.png)]
上述代碼的運行結果如圖12.5所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-B3Eqc3hN-1639056667671)(OpenCV進階篇.assets/image-20211125194341145.png)]
? 圖12.5 圖像腐蝕操作效果
12.2 膨脹
膨脹操作與腐蝕操作相反,膨脹操作可以讓圖像沿著自己的邊界向內擴張。同樣是通過核來計算,當核在圖像的邊緣移動時,核會將圖像邊緣填補新的像素,效果類似圖12.6所示的過程,就像在一面墻上反反復復地涂水泥,讓墻變得越來越厚。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0jW88y9z-1639056667671)(OpenCV進階篇.assets/image-20211125194443041.png)]
? 圖12.6 核填補圖像中的像素
OpenCV將膨脹操作封裝成dilate()方法,該方法的語法如下:
參數說明:
src:原始圖像。
kernel:膨脹使用的核。
anchor:可選參數,核的錨點位置。
iterations:可選參數,腐蝕操作的迭代次數,默認值為1。
borderType:可選參數,邊界樣式,建議默認。
borderValue:可選參數,邊界值,建議默認。
返回值說明:
dst:經過膨脹之后的圖像。
圖像經過膨脹操作之后,可以放大一些外部的細節,如圖12.7(a)所示的卡通小蜘蛛,如果用一個5×5的像素塊作為核對小蜘蛛進行膨脹操作,可以得到如圖12.7(b)所示的結果,小蜘蛛不僅腿變粗了,而且連眼睛都胖沒了。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5Tq4mt3A-1639056667672)(OpenCV進階篇.assets/image-20211125194535307.png)]
? 圖12.7 圖像膨脹操作效果
【實例12.2】 將圖像加工成“近視眼”效果。
近視眼由于聚焦不準,看東西都需要放大并且模模糊糊的,利用膨脹操作可以將正常畫面處理成近視眼看到的畫面。采用9×9的數組作為核,對圖12.8(a)進行膨脹操作。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-QnG9jkmB-1639056667672)(OpenCV進階篇.assets/image-20211125194619331.png)]
上述代碼的運行結果如圖12.8所示
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-6jRECH46-1639056667672)(OpenCV進階篇.assets/image-20211125194637143.png)]
? 圖12.8 圖像膨脹操作“近視眼”效果
12.3 開運算
開運算是將圖像先進行腐蝕操作,再進行膨脹操作。開運算可以用來抹除圖像外部的細節(或者噪聲)。
例如,圖12.9是一個簡單的二叉樹,父子節點之間都有線連接。如果對此圖像進行腐蝕操作,可以得出如圖12.10所示的圖像,連接線消失了,節點也比原圖節點小一圈。此時再執行膨脹操作,讓縮小的節點恢復到原來的大小,就得到了如圖12.11所示的效果。
這3幅圖就是開運算的過程,從結果中可以明顯地看出:經過開運算之后,二叉樹中的連接線消失了,只剩下光禿禿的節點。因為連接線被核當成“細節”抹除了,所以利用檢測輪廓的方法可以統計二叉樹節點數量,也就是說在某些情況下,開運算的結果還可以用來做數量統計。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-YkrJfgHY-1639056667672)(OpenCV進階篇.assets/image-20211125194659165.png)]
? 圖12.9 簡單的二叉樹
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-t738eTGY-1639056667673)(OpenCV進階篇.assets/image-20211125194754294.png)]
? 圖12.10 二叉樹圖像腐蝕之后的效果
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xWsGyhUT-1639056667673)(OpenCV進階篇.assets/image-20211125194813564.png)]
? 圖12.11 對腐蝕的圖像做膨脹操作
【實例12.3】 抹除黑種草圖像中的針狀葉子。
黑種草如圖12.12(a)所示,花呈藍色,葉子像針一樣又細又長,呈羽毛狀。要抹除黑種草圖像中的葉子,可以使用5×5的核對圖像進行開運算。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qeCn3dVD-1639056667674)(OpenCV進階篇.assets/image-20211125194832293.png)]
上述代碼的運行結果如圖12.12(b)所示,經過開運算后黑種草圖像雖然略為模糊,但葉子都不見了。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-U09O1HA7-1639056667674)(OpenCV進階篇.assets/image-20211125194853964.png)]
? 圖12.12 圖像開運算效果
12.4 閉運算
閉運算是將圖像先進行膨脹操作,再進行腐蝕操作。閉運算可以抹除圖像內部的細節(或者噪聲)。
例如,圖12.13(a)是一個身上布滿斑點的小蜘蛛,這些斑點就是圖像的內部細節。先將圖像進行膨脹操作,小蜘蛛身上的斑點(包括眼睛)被抹除,效果如圖12.13(b)所示。然后再將圖像進行腐蝕操作,膨脹的小蜘蛛恢復到原來的大小,效果如圖12.13(c)所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dJY1W62q-1639056667674)(OpenCV進階篇.assets/image-20211125194952165.png)]
? 圖12.13 圖像閉運算效果
這3幅圖就是閉運算的過程,從結果中可以明顯地看出:經過閉運算后,小蜘蛛身上的花紋都被抹除了,就連眼睛也被當成“細節”抹除了。
閉運算除了會抹除圖像內部的細節,還會讓一些離得較近的區域合并成一塊區域。
【實例12.4】 對漢字圖片進行閉運算。
使用15×15的核對圖12.14(a)做閉運算。因為使用的核比較大,很容易導致一些間隔較近的區域合并到一起,觀察閉運算對漢字圖片造成了哪些影響。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-OT67bYso-1639056667675)(OpenCV進階篇.assets/image-20211125195012305.png)]
上述代碼的運行結果如圖12.14(b)所示,“田”字經過閉運算之后沒有多大變化,但是“野”字經過閉運算之后,許多獨立的區域因膨脹操作合并到一起,導致文字很難辨認。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-IJSR1zTJ-1639056667675)(OpenCV進階篇.assets/image-20211125195103765.png)]
? 圖12.14 漢字圖片閉運算效果
12.5 形態學運算
腐蝕和膨脹是形態學的基礎操作,除了開運算和閉運算以外,形態學中還有幾種比較有特點的運算。OpenCV提供了一個morphologyEx()形態學方法,包含所有常用的運算,其語法如下:
dst = cv2.morphologyEx(src, op, kernel, anchor, iterations, borderType, borderValue)參數說明:
src:原始圖像。
op:操作類型,具體值如表12.1所示。
? 表12.1 形態學函數的操作類型參數
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-c0vMUxGs-1639056667675)(OpenCV進階篇.assets/image-20211125195140684.png)]
kernel:操作過程中使用的核。
anchor:可選參數,核的錨點位置。
iterations:可選參數,迭代次數,默認值為1。
borderType:可選參數,邊界樣式,建議默認。
borderValue:可選參數,邊界值,建議默認。
返回值說明:
dst:操作之后得到的圖像。
morphologyEx()方法實現的腐蝕、膨脹、開運算和閉運算效果與前文中介紹的效果完全一致,本節不再贅述,下面將介紹3個特點鮮明的操作:梯度運算、頂帽運算和黑帽運算。
12.5.1 梯度運算
這里的梯度是指圖像梯度,可以簡單地理解為像素的變化程度。如果幾個連續的像素,其像素值跨度越大,則梯度值越大。
梯度運算的運算過程如圖12.15所示,讓原圖的膨脹圖減原圖的腐蝕圖。因為膨脹圖比原圖大,腐蝕圖比原圖小,利用腐蝕圖將膨脹圖掏空,就得到了原圖的輪廓圖。說明
梯度運算中得到的輪廓圖只是一個大概輪廓,不精準。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9RG8msPp-1639056667675)(OpenCV進階篇.assets/image-20211125195234243.png)]
? 圖12.15 梯度運算過程
梯度運算的參數為cv2.MORPH_GRADIENT,下面通過一段代碼實現圖12.15的效果。
【實例12.5】 通過梯度運算畫出小蜘蛛的輪廓。
使用5×5的核對小蜘蛛圖像進行形態學梯度運算,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-SSqR60Jr-1639056667676)(OpenCV進階篇.assets/image-20211125195253240.png)]
上述代碼的運行結果如圖12.16所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8CM681z9-1639056667676)(OpenCV進階篇.assets/image-20211125195322974.png)]
? 圖12.16 圖像梯度運算效果
12.5.2 頂帽運算
頂帽運算的運算過程如圖12.17所示,讓原圖減原圖的開運算圖。因為開運算抹除圖像的外部細節,“有外部細節”的圖像減去“無外部細節”的圖像,得到的結果就只剩外部細節了,所以經過頂帽運算之后,小蜘蛛就只剩蜘蛛腿了。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-RoatuBnE-1639056667676)(OpenCV進階篇.assets/image-20211125195410644.png)]
? 圖12.17 頂帽運算過程
頂帽運算的參數為cv2.MORPH_TOPHA,下面通過一段代碼實現圖12.18的效果。
【實例12.6】 通過頂帽運算畫出小蜘蛛的腿。
使用5×5的核對小蜘蛛圖像進行頂帽運算,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yaO8QMaA-1639056667676)(OpenCV進階篇.assets/image-20211125195435250.png)]
上述代碼的運算結果如圖12.18所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-FR02XNbh-1639056667677)(OpenCV進階篇.assets/image-20211125195455237.png)]
? 圖12.18 圖像開運算效果
12.5.3 黑帽運算
黑帽運算的運算過程如圖12.19所示,讓原圖的閉運算圖減去原圖。因為閉運算抹除圖像的內部細節,“無內部細節”的圖像減去“有內部細節”的圖像,得到的結果就只剩內部細節了,所以經過黑帽運算之后,小蜘蛛就只剩下斑點、花紋和眼睛了。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-1t8NX17P-1639056667677)(OpenCV進階篇.assets/image-20211125195549507.png)]
? 圖12.19 黑帽運算過程
黑帽運算的參數為cv2.MORPH_BLACKHAT,下面通過一段代碼實現圖12.19的效果。
【實例12.7】 通過黑帽運算畫出小蜘蛛身上的花紋。
使用5×5的核對小蜘蛛圖像進行黑帽運算,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ltjMfK0C-1639056667677)(OpenCV進階篇.assets/image-20211125195624673.png)]
上述代碼的運行結果如圖20所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xWZgHmTZ-1639056667678)(OpenCV進階篇.assets/image-20211125195644815.png)]
? 圖12.20 圖像黑帽運算效果
12.6 小結
本章介紹的基礎內容是腐蝕和膨脹。讀者掌握了其用法,就能輕而易舉地實現開運算和閉運算。其中,開運算是對圖像先進行腐蝕操作,再進行膨脹操作,其作用是抹除圖像外部的細節;而閉運算是對圖像先進行膨脹操作,再進行腐蝕操作,其作用是抹除圖像內部的細節。此外,形態學運算也是構建在腐蝕和膨脹的基礎上的。其中,梯度運算是讓原圖的膨脹圖減原圖的腐蝕圖,得到的結果是原圖的輪廓;頂帽運算是讓原圖減原圖的開運算圖,得到的結果是圖像的外部細節;黑帽運算是讓原圖的閉運算圖減去原圖,得到的結果是圖像的內部細節。
第13章 圖形檢測
圖形檢測是計算機視覺的一項重要功能。通過圖形檢測可以分析圖像中可能存在的形狀,然后對這些形狀進行描繪,如搜索并繪制圖像的邊緣,定位圖像的位置,判斷圖像中有沒有直線、圓形等。雖然圖形檢測涉及非常深奧的數學算法,但OpenCV已經將這些算法封裝成簡單的方法,開發者只要學會如何調用方法、調整參數即可很好地實現檢測功能。
本章將介紹如何檢測圖像的形狀、圖像所占的區域,以及如何查找圖像中出現的幾何圖形等。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-JYC0QiOt-1639056667678)(OpenCV進階篇.assets/image-20211125195758972.png)]
13.1 圖像的輪廓
輪廓是指圖像中圖形或物體的外邊緣線條。簡單的幾何圖形輪廓是由平滑的線構成的,容易識別,但不規則圖形的輪廓可能由許多個點構成,識別起來比較困難。
OpenCV提供的findContours()方法可以通過計算圖像梯度來判斷圖像的邊緣,然后將邊緣的點封裝成數組返回。findContours()方法的語法如下:
參數說明:
image:被檢測的圖像,必須是8位單通道二值圖像。如果原始圖像是彩色圖像,必須轉為灰度圖像,并經過二值化處理。
mode:輪廓的檢索模式,具體值如表13.1所示。
? 表13.1 輪廓的檢索模式參數值
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qNkaxOlL-1639056667678)(OpenCV進階篇.assets/image-20211125195942347.png)]
methode:
檢測輪廓時使用的方法,具體值如表13.2所示。
? 表13.2 檢測輪廓時使用的方法
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-FtXHcMFq-1639056667679)(OpenCV進階篇.assets/image-20211125200003759.png)]
返回值說明:
contours:檢測出的所有輪廓,list類型,每一個元素都是某個輪廓的像素坐標數組。
hierarchy:輪廓之間的層次關系。
通過findContours()方法找到圖像輪廓后,為了方便開發人員觀測,最好能把輪廓畫出來,于是OpenCV提供了drawContours()方法用來繪制這些輪廓。drawContours()方法的語法如下:
參數說明:
image:被繪制輪廓的原始圖像,可以是多通道圖像。
contours:findContours()方法得出的輪廓列表。
contourIdx:繪制輪廓的索引,如果為-1則繪制所有輪廓。
color:繪制顏色,使用BGR格式。
thickness:可選參數,畫筆的粗細程度,如果該值為-1則繪制實心輪廓。
lineTypee:可選參數,繪制輪廓的線型。
hierarchy:可選參數,findContours()方法得出的層次關系。
maxLevel:可選參數,繪制輪廓的層次深度,最深繪制第maxLevel層。
offse:可選參數,偏移量,可以改變繪制結果的位置。
返回值說明:
image:同參數中的image,執行后原始圖中就包含繪制的輪廓了,可以不使用此返回值保存結果。
【實例13.1】 繪制幾何圖像的輪廓。
將如圖13.1所示的幾何圖像轉換成二值灰度圖像,然后通過findContours()方法找到出現的所有輪廓,再通過drawContours()方法將這些輪廓繪制成紅色。輪廓的檢索模式采用cv2.RETR_LIST,檢測方法采用cv2.CHAIN_APPROX_NONE。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qoQuxdG7-1639056667679)(OpenCV進階篇.assets/image-20211125200104772.png)]
? 圖13.1 簡單的幾何圖像
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-GVu7lQDW-1639056667679)(OpenCV進階篇.assets/image-20211125200222796.png)]
上述代碼的運行結果如圖13.2所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-zu2xuce4-1639056667680)(OpenCV進階篇.assets/image-20211125200313470.png)]
? 圖13.2 繪制全部輪廓
如果使用cv2.RETR_EXTERNAL做參數則只繪制外輪廓,關鍵代碼如下:
contours, hierarchy = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)cv2.drawContours(img, contours, -1, (0, 0, 255), 5)繪制輪廓的效果如圖13.3所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-uJDxZ11d-1639056667680)(OpenCV進階篇.assets/image-20211125200347818.png)]
? 圖13.3 只繪制外輪廓的效果
drawContours()方法的第3個參數可以指定繪制哪個索引的輪廓。索引的順序由輪廓的檢索模式決定,例如cv2.RETR_CCOMP模式下繪制索引為0的輪廓的關鍵代碼如下:
contours, hierarchy = cv2.findContours(binary, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_NONE)cv2.drawContours(img, contours, 0, (0, 0, 255), 5)在同樣的檢索模式下,繪制索引為1的輪廓的關鍵代碼如下:
cv2.drawContours(img, contours, 1, (0, 0, 255), 5)繪制索引為2的輪廓的關鍵代碼如下:
cv2.drawContours(img, contours, 2, (0, 0, 255), 5)繪制索引為3的輪廓的關鍵代碼如下:
cv2.drawContours(img, contours, 3, (0, 0, 255), 5)繪制的效果如圖13.4~圖13.7所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-joBl7KiJ-1639056667680)(OpenCV進階篇.assets/image-20211125200419734.png)]
? 圖13.4 繪制索引為0的輪廓
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Uo0Ak2Rq-1639056667680)(OpenCV進階篇.assets/image-20211125200519831.png)]
? 圖13.5 繪制索引為1的輪廓
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Imm4zAV7-1639056667681)(OpenCV進階篇.assets/image-20211125200538416.png)]
? 圖13.6 繪制索引為2的輪廓
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LqxeG8sq-1639056667681)(OpenCV進階篇.assets/image-20211125200557884.png)]
? 圖13.7 繪制索引為3的輪廓
【實例13.2】 繪制花朵的輪廓。
為圖13.8(a)所示的花朵圖像繪制輪廓,首先要降低圖像中的噪聲干擾,進行濾波處理,然后將圖像處理成二值灰度圖像,并檢測出輪廓,最后利用繪制輪廓的方法在原始圖像中繪制輪廓。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-tZT13iZD-1639056667681)(OpenCV進階篇.assets/image-20211125200623625.png)]
上述代碼的運行結果如圖13.8(b)和圖13.8(c)所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-6jKwXXgp-1639056667681)(OpenCV進階篇.assets/image-20211125200704091.png)]
? 圖12.8 繪制花朵輪廓效果
13.2 輪廓擬合
擬合是指將平面上的一系列點,用一條光滑的曲線連接起來。輪廓的擬合就是將凹凸不平的輪廓用平整的幾何圖形體現出來。本節將介紹如何按照輪廓繪制矩形包圍框和圓形包圍框。
13.2.1 矩形包圍框
矩形包圍框是指圖像輪廓的最小矩形邊界。OpenCV提供的boundingRect()方法可以自動計算輪廓最小矩形邊界的坐標、寬和高。boundingRect()方法的語法如下:
retval = cv2.boundingRect (array)參數說明:
array:輪廓數組。
返回值說明:
retval:元組類型,包含4個整數值,分別是最小矩形包圍框的:左上角頂點的橫坐標、左上角頂點的縱坐標、矩形的寬和高。所以也可以寫成x, y, w, h = cv2.boundingRect (array)的形式。
【實例13.3】 為爆炸圖形繪制矩形包圍框。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-33Gu2NPs-1639056667682)(OpenCV進階篇.assets/image-20211125200758268.png)]
? 圖13.9 爆炸圖形
為圖13.9所示的爆炸圖形繪制矩形包圍框,首先判斷圖形的輪廓,使用cv2.RETR_LIST檢索所有輪廓,使用cv2.CHAIN_APPROX_SIMPLE檢索圖形所有的端點,然后利用cv2.boundingRect()方法計算最小矩形包圍框,并通過cv2.rectangle()方法將這個矩形繪制出來,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-tWLwMjpH-1639056667682)(OpenCV進階篇.assets/image-20211125200901021.png)]
上述代碼的運行結果如圖13.10所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-etKSYUkz-1639056667682)(OpenCV進階篇.assets/image-20211125200917139.png)]
? 圖13.10 爆炸圖形的最小矩形包圍框
13.2.2 圓形包圍框
圓形包圍框與矩形包圍框一樣,是圖像輪廓的最小圓形邊界。OpenCV提供的minEnclosingCircle ()方法可以自動計算輪廓最小圓形邊界的圓心和半徑。minEnclosingCircle()方法的語法如下:
center, radius = cv2.minEnclosingCircle(points)參數說明:
points:輪廓數組。
返回值說明:
center:元組類型,包含2個浮點值,是最小圓形包圍框圓心的橫坐標和縱坐標。
radius:浮點類型,最小圓形包圍框的半徑。
【實例13.4】 為爆炸圖形繪制圓形包圍框。
為圖13.9所示的爆炸圖形繪制矩形包圍框,首先判斷圖形的輪廓,使用cv2.RETR_LIST檢索所有輪廓,使用cv2.CHAIN_APPROX_SIMPLE檢索圖形所有的端點,然后利用cv2. minEnclosingCircle()方法計算最小圓形包圍框,并通過cv2.circle()方法將這個矩形繪制出來。繪制過程中要注意:圓心坐標和圓半徑都是浮點數,在繪制之前要將浮點數轉換成整數。
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-YzrmTuZM-1639056667682)(OpenCV進階篇.assets/image-20211125201112737.png)]
上述代碼的運行結果如圖13.11所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-AtkeyrKl-1639056667683)(OpenCV進階篇.assets/image-20211125201129231.png)]
? 圖13.11 爆炸圖形的最小圓形包圍框
13.3 凸包
之前介紹了矩形包圍框和圓形包圍框,這2種包圍框雖然已經逼近了圖形的邊緣,但這種包圍框為了保持幾何形狀,與圖形的真實輪廓貼合度較差。如果能找出圖形最外層的端點,將這些端點連接起來,就可以圍出一個包圍圖形的最小包圍框,這種包圍框叫凸包。
凸包是最逼近輪廓的多邊形,凸包的每一處都是凸出來的,也就是任意3個點組成的內角均小于180°。例如,圖13.12就是凸包,而圖13.13就不是凸包。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mNC1DLll-1639056667683)(OpenCV進階篇.assets/image-20211125205558522.png)]
? 圖13.12 凸包
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-unNcebF6-1639056667683)(OpenCV進階篇.assets/image-20211125205619316.png)]
? 圖13.13 不是凸包
OpenCV提供的convexHull()方法可以自動找出輪廓的凸包,該方法的語法如下:
參數說明:
points:輪廓數組。
clockwise:可選參數,布爾類型。當該值為True時,凸包中的點按順時針排列,為False時按逆時針排列。
returnPoints:可選參數,布爾類型。當該值為True時返回點坐標,為False時返回點索引。默認值為True。
返回值說明:
hull:凸包的點陣數組。
下面通過一個例子演示如何繪制凸包。
【實例13.5】 為爆炸圖形繪制凸包。
為圖13.9所示的爆炸圖形繪制凸包,首先要先判斷圖形的輪廓,使用cv2.RETR_LIST檢索出圖形的輪廓,然后使用convexHull()方法找到輪廓的凸包,最后通過polylines()方法將凸包中各點連接起來,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-fXnYMX4E-1639056667683)(OpenCV進階篇.assets/image-20211125205730374.png)]
上述代碼的運行結果如圖13.14所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mYOH2dGc-1639056667684)(OpenCV進階篇.assets/image-20211125205746309.png)]
? 圖13.14 爆炸圖形的凸包
13.4 Canny邊緣檢測
Canny邊緣檢測算法是John F. Canny于1986年開發的一個多級邊緣檢測算法,該算法根據像素的梯度變化尋找圖像邊緣,最終可以繪制十分精細的二值邊緣圖像。
OpenCV將Canny邊緣檢測算法封裝在Canny()方法中,該方法的語法如下:
參數說明:
image:檢測的原始圖像。
threshold1:計算過程中使用的第一個閾值,可以是最小閾值,也可以是最大閾值,通常用來設置最小閾值。
threshold2:計算過程中使用的第二個閾值,通常用來設置最大閾值。
apertureSize:可選參數,Sobel算子的孔徑大小。
L2gradient:可選參數,計算圖像梯度的標識,默認值為False。值為True時采用更精準的算法進行計算。
返回值說明:
edges:計算后得出的邊緣圖像,是一個二值灰度圖像。
在開發過程中可以通過調整最小閾值和最大閾值控制邊緣檢測的精細程度。當2個閾值都較小時,檢測出較多的細節;當2個閾值都較大時,忽略較多的細節。
【實例13.6】 使用Canny算法檢測花朵邊緣。
利用Canny()方法檢測圖13.15(a)所示的花朵圖像,分別使用10和50、100和200、400和600作為最低閾值和最高閾值檢測3次,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-VlzQPJtu-1639056667684)(OpenCV進階篇.assets/image-20211125205855069.png)]
上述代碼的運行結果如圖13.15所示,閾值越小,檢測出的邊緣越多;閾值越大,檢測出的邊緣越少,只能檢測出一些較明顯的邊緣。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-HhX1WPA5-1639056667684)(OpenCV進階篇.assets/image-20211125205918990.png)]
? 圖13.15 圖像Canny檢測效果
13.5 霍夫變換
霍夫變換是一種特征檢測,通過算法識別圖像的特征,從而判斷圖像中的特殊形狀,例如直線和圓。本節將介紹如何檢測圖像中的直線和圓。
13.5.1 直線檢測
霍夫直線變換是通過霍夫坐標系的直線與笛卡兒坐標系的點之間的映射關系來判斷圖像中的點是否構成直線。OpenCV將此算法封裝成兩個方法,分別是cv2.HoughLines()和cv2.HoughLinesP(),前者用于檢測無限延長的直線,后者用于檢測線段。本節僅介紹比較常用的HoughLinesP()方法。
HoughLinesP()方法名稱最后有一個大寫的P,該方法只能檢測二值灰度圖像,也就是只有兩種像素值的黑白圖像。該方法最后把找出的所有線段的兩個端點坐標保存成一個數組。
HoughLinesP()方法的語法如下:
參數說明:
image:檢測的原始圖像。
rho:檢測直線使用的半徑步長,值為1時,表示檢測所有可能的半徑步長。
theta:搜索直線的角度,值為π/180°時,表示檢測所有角度。
threshold:閾值,該值越小,檢測出的直線就越多。
minLineLength:線段的最小長度,小于該長度的線段不記錄到結果中。
maxLineGap:線段之間的最小距離。
返回值說明:
lines:一個數組,元素為所有檢測出的線段,每條線段是一個數組,代表線段兩個端點的橫、縱坐標,格式為[[[x1, y1, x2, y2], [x1, y1, x2, y2]]]。注意
使用該方法前應該為原始圖像進行降噪處理,否則會影響檢測結果。
【實例13.7】 檢測筆圖像中出現的直線。
檢測如圖13.16所示的中性筆照片,先將圖像降噪,再對圖像進行邊緣檢測,然后利用HoughLinesP()方法找出邊緣圖像中的直線線段,最后用cv2.line()方法將找出的線段繪制成紅色。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-HFJnv0up-1639056667684)(OpenCV進階篇.assets/image-20211125210047560.png)]
? 圖13.16 筆圖像
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-F9KRDuUR-1639056667685)(OpenCV進階篇.assets/image-20211126130401949.png)]
上述代碼的運行結果如圖13.17和圖13.18所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-NvCq8Qur-1639056667685)(OpenCV進階篇.assets/image-20211126130420890.png)]
? 圖13.17 筆圖像的邊緣檢測結果
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-EVYlpSW6-1639056667685)(OpenCV進階篇.assets/image-20211126130515954.png)]
? 圖13.18 將筆圖像中檢測出的線段描紅
13.5.2 圓環檢測
霍夫圓環變換的原理與霍夫直線變換類似。OpenCV提供的HoughCircles()方法用于檢測圖像中的圓環,該方法在檢測過程中進行兩輪篩選:第一輪篩選找出可能是圓的圓心坐標,第二輪篩選計算這些圓心坐標可能對應的半徑長度。該方法最后將圓心坐標和半徑封裝成一個浮點型數組。
HoughCircles()方法的語法如下:
參數說明:
image:檢測的原始圖像。
method:檢測方法,OpenCV 4.0.0及以前版本僅提供了cv2.HOUGH_GRADIENT作為唯一可用方法。
dp:累加器分辨率與原始圖像分辨率之比的倒數。值為1時,累加器與原始圖像具有相同的分辨率;值為2時,累加器的分辨率為原始圖像的1/2。通常使用1作為參數。
minDist:圓心之間的最小距離。
param1:可選參數,Canny邊緣檢測使用的最大閾值。
param2:可選參數,檢測圓環結果的投票數。第一輪篩選時投票數超過該值的圓環才會進入第二輪篩選。值越大,檢測出的圓環越少,但越精準。
minRadius:可選參數,圓環的最小半徑。
maxRadius:可選參數,圓環的最大半徑。
返回值說明:
circles:一個數組,元素為所有檢測出的圓環,每個圓環也是一個數組,內容為圓心的橫、縱坐標和半徑長度,格式為:[[[x1 ,y1, r1], [x2 ,y2, r2]]]。
注意
使用該方法前應該為原始圖像進行降噪處理,否則會影響檢測結果。
【實例13.8】 檢測硬幣圖像中出現的圓環。
檢測如圖13.19所示的硬幣照片,先將圖像降噪,再將圖像變成單通道灰度圖像,然后利用HoughCircles()方法檢測圖像中可能是圓環的位置,最后通過cv2.circle()方法在這些位置上繪制圓環和對應的圓心。在繪制圓環之前,要將HoughCircles()方法返回的浮點數組元素轉換成整數。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-vSo6G25X-1639056667685)(OpenCV進階篇.assets/image-20211126130634358.png)]
? 圖13.19 硬幣圖像
具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-871ibjzo-1639056667686)(OpenCV進階篇.assets/image-20211126130715358.png)]
上述代碼的運行結果如圖13.20所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LLHdzygi-1639056667686)(OpenCV進階篇.assets/image-20211126130658457.png)]
? 圖13.20 檢測出的圓環位置
13.6 小結
圖像輪廓指的是將圖像的邊緣連接起來形成的一個整體,它是圖像的一個重要的特征信息,通過對圖像的輪廓進行操作,能夠得到這幅圖像的大小、位置和方向等信息,用于后續的計算。為此,OpenCV提供了findContours()方法,通過計算圖像的梯度,判斷圖像的輪廓。為了繪制圖像的輪廓,OpenCV又提供了drawContours()方法。但需要注意的是,Canny()方法雖然能夠檢測出圖像的邊緣,但這個邊緣是不連續的。
總結
- 上一篇: OpenCV进阶篇视频
- 下一篇: React Axios的定义,以及使用方