图像五值化与基于三值图像的车牌识别(1)
慶祝2011年新年
?
張忠義
海口愚佬會(huì)教育科技有限公司?
全文下載 www.yulaohui.com/color5_2/摘?要:????? 圖像五值化是通過(guò)公式Y(jié) =(R+G)/2,將RGB空間映射到Y(jié)B空間,再將YB空間簡(jiǎn)化成黑、藍(lán)、灰、黃、白五種值的圖像簡(jiǎn)化方法。針對(duì)中國(guó)車(chē)牌,通過(guò)黑、藍(lán)合并,白、黃合并,圖像可進(jìn)一步簡(jiǎn)化成三值。基于三值圖像的車(chē)牌識(shí)別包括基于三值圖像的字符識(shí)別和基于三值圖像按分割反推的車(chē)牌定位。三值圖像保留的中間灰色可根據(jù)識(shí)別的車(chē)牌底色視同字符識(shí)別所需的車(chē)牌底色或字符色,從而能彌補(bǔ)受光照不均勻或車(chē)牌“臟”影響按閾值選取進(jìn)行圖像二值化可能導(dǎo)致的圖像信息缺失,有利于提高字符識(shí)別的正確率。基于三值圖像按分割反推的車(chē)牌定位是指在確保圖像遍歷高效的前提下,通過(guò)基于三值圖像的投影如果可以進(jìn)行字符分割則得到一個(gè)候選車(chē)牌定位。其好處是可以先按照第三方關(guān)于車(chē)牌的規(guī)定檢測(cè)字符間距,排除偽車(chē)牌,做到車(chē)牌定位不誤,還可以使車(chē)牌定位不再依賴(lài)車(chē)牌特征,可以不再理會(huì)圖像中對(duì)車(chē)牌特征所謂的干擾,做到車(chē)牌定位不漏。
?
1??? 問(wèn)題
目前普遍的觀點(diǎn)認(rèn)為車(chē)牌識(shí)別分為車(chē)牌定位、字符分割和字符識(shí)別三步。車(chē)牌定位是車(chē)牌識(shí)別中最為關(guān)鍵的一步,它決定著字符分割和字符識(shí)別的效果,是影響整個(gè)車(chē)牌識(shí)別率的主要因素。
1.1??車(chē)牌定位的主要問(wèn)題
車(chē)牌定位一般是根據(jù)車(chē)牌特征,如紋理、角點(diǎn)、邊緣、顏色等。根據(jù)單一車(chē)牌特征進(jìn)行車(chē)牌定位的主要問(wèn)題是圖像背景復(fù)雜或圖像受光照不均勻影響容易發(fā)生定位遺漏。根據(jù)多車(chē)牌特征融合進(jìn)行車(chē)牌定位與減少定位遺漏并無(wú)必然聯(lián)系,且會(huì)增加定位時(shí)間。
另一方面,根據(jù)車(chē)牌特征定位只能是一個(gè)大致的范圍,候選區(qū)域左右邊界不能完全確定。這是因?yàn)?#xff0c;邊界是背景與前景或前景與背景的過(guò)渡,當(dāng)圖像受到較大干擾或前景與背景較“接近”時(shí),邊界就容易變“模糊”。此種情況下,在邊界進(jìn)行二值化和投影就容易出錯(cuò)。車(chē)牌中漢字和數(shù)字、英文字符結(jié)構(gòu)不同。有些漢字是可以分割的,比如“瓊”就可以被分割成“王”和“京”。當(dāng)候選區(qū)域左右邊界的不確定性與車(chē)牌中首字符可分割同時(shí)出現(xiàn)時(shí),就有可能造成車(chē)牌首字符分割錯(cuò)誤,比如把“瓊”分割成“京”,導(dǎo)致車(chē)牌首字符不能正確識(shí)別,即“瓊”有可能最終被識(shí)別成“京”。
1.2??字符分割的主要問(wèn)題
車(chē)牌定位選定候選區(qū)域后,一般的做法是:
一、對(duì)候選區(qū)域進(jìn)行二值化;
二、通過(guò)縱向投影和橫向投影將二值化的候選區(qū)域分割成若干個(gè)單個(gè)的字符區(qū)域;
三、對(duì)單個(gè)字符區(qū)域逐個(gè)進(jìn)行字符識(shí)別;
四、若字符識(shí)別符合預(yù)設(shè)的可信度要求,則候選區(qū)域?yàn)榇_定車(chē)牌,推出車(chē)牌識(shí)別結(jié)果,否則,輪換下一個(gè)候選區(qū)域繼續(xù)進(jìn)行上述步驟。
這里的問(wèn)題是,一般而言,圖像二值化的困難在于閾值選取。閾值屬于圖像處理領(lǐng)域內(nèi)的經(jīng)典難題,事實(shí)上,沒(méi)有一個(gè)方法可以得到一個(gè)通用的閾值,也沒(méi)有一個(gè)方法可以評(píng)估得到的閾值對(duì)于要處理的圖像是否適當(dāng)。另一方面,所謂“二值化”就是根據(jù)選定閾值將候選區(qū)域分類(lèi)為“黑”或“白”。隨著車(chē)牌識(shí)別應(yīng)用場(chǎng)合越來(lái)越廣泛,應(yīng)用環(huán)境越來(lái)越復(fù)雜,獲得的受光照不均勻或車(chē)牌“臟”影響的圖像也越來(lái)越多。候選區(qū)域受光照不均勻或車(chē)牌“臟”影響的像素點(diǎn)往往表現(xiàn)為“灰”,其灰度值與選定閾值相差不大,有可能不被正確分類(lèi)到“黑”或“白”中,從而影響投影計(jì)算,導(dǎo)致字符分割或無(wú)法分割或分割錯(cuò)誤。也就是說(shuō),投影與分割建立在候選區(qū)域二值化基礎(chǔ)上,不能正確處理“灰”像素,這一處理方法自身是有缺陷的。
還有,根據(jù)投影進(jìn)行字符分割,其分割是不嚴(yán)格的。圖像中“廣告用電話號(hào)碼”等偽車(chē)牌有可能被當(dāng)成車(chē)牌號(hào)識(shí)別。事實(shí)上,中國(guó)車(chē)牌必須滿足公安部有關(guān)車(chē)牌的國(guó)家標(biāo)準(zhǔn),字符之間的間距應(yīng)符合相關(guān)規(guī)定。由于車(chē)牌定位得到的候選區(qū)域其左右邊界的不確定性,即候選區(qū)域的寬度不一定是車(chē)牌寬度,所以,既不能根據(jù)候選區(qū)域的寬度按照公安部規(guī)定計(jì)算字符間距的方式來(lái)分割候選區(qū)域,反過(guò)來(lái),既然無(wú)法得到一個(gè)確定的車(chē)牌寬度也就不能根據(jù)車(chē)牌寬度對(duì)投影得到的分割結(jié)果進(jìn)行驗(yàn)證。沒(méi)有分割字符的間距驗(yàn)證,車(chē)牌識(shí)別只是字符串識(shí)別,圖像中“廣告用電話號(hào)碼”等偽車(chē)牌也就自然不能被杜絕。
1.3??字符識(shí)別的主要問(wèn)題
圖像二值化的根本問(wèn)題是不能反映圖像的中間狀態(tài),即中間“灰”。中間“灰”是客觀存在的。車(chē)牌圖像在感光成像時(shí),除了車(chē)牌底色和字符色外,一定存在位于字符邊緣的由車(chē)牌底色向字符色過(guò)渡的中間色。由于閾值選取原因,中間色可能被過(guò)多保留,表現(xiàn)為字符筆劃變粗,中間色也可能被過(guò)多丟棄,表現(xiàn)為筆劃變細(xì)。受光照不均勻或車(chē)牌“臟”影響的“灰”像素也有可能由于閾值選取原因被過(guò)多保留,呈現(xiàn)為干擾。筆劃變粗、筆劃變細(xì)或圖像被干擾,對(duì)字符識(shí)別都是不利的。
圖像二值化完全可以理解為將圖像的所有像素點(diǎn)分類(lèi)為車(chē)牌底色和字符色。這種簡(jiǎn)單的分類(lèi)方法是明顯不適合中間“灰”或圖像的“灰”像素。字符Q,字符D,字符B等角上像素往往呈現(xiàn)為中間“灰”。中間“灰”或圖像的“灰”像素應(yīng)作為中間狀態(tài)保留,這樣才不會(huì)造成圖像信息損害,不會(huì)影響字符識(shí)別。
字符識(shí)別的關(guān)鍵不在于選用神經(jīng)網(wǎng)絡(luò)方法,還是模板匹配方法,關(guān)鍵是應(yīng)控制二值化對(duì)圖像的損害。如果二值化對(duì)圖像的損害太大,不管用什么方法都不可能得到良好的字符識(shí)別效果。
2??? 解決上述問(wèn)題的方法
車(chē)牌識(shí)別技術(shù)產(chǎn)生于20世紀(jì)90年代,盡管經(jīng)過(guò)20年的發(fā)展,車(chē)牌識(shí)別仍然只能針對(duì)成像條件較好的圖像進(jìn)行,對(duì)受光照不均勻或車(chē)牌“臟”影響的圖像,其識(shí)別率仍低。尤其是近年來(lái)圖像高清化趨勢(shì)越來(lái)越明顯,圖像中車(chē)牌受到的干擾越來(lái)越多,原有針對(duì)車(chē)牌定位、字符分割和字符識(shí)別的算法越來(lái)越不適應(yīng)這一變化。原有算法概括一句話就是一個(gè)比一個(gè)好。隨著圖像越來(lái)越復(fù)雜,新的算法總能找到圖像的差異所在,總能在原有基礎(chǔ)上做到一些改進(jìn)。問(wèn)題是算法在不斷改進(jìn),而車(chē)牌識(shí)別率卻沒(méi)有得到大的提高。
這是因?yàn)?#xff0c;算法的基礎(chǔ)是顏色、灰度、二值化。圖像越來(lái)越復(fù)雜,是說(shuō)中間“灰”或圖像“灰”像素越來(lái)越多。就此要找到一個(gè)恰當(dāng)?shù)拈撝?#xff0c;使這些中間“灰”或圖像“灰”像素都分類(lèi)正確是不容易的。相反可能會(huì)更多地被分類(lèi)錯(cuò)。一旦中間“灰”或圖像“灰”像素被分類(lèi)錯(cuò)就呈現(xiàn)為干擾。原有算法沒(méi)有關(guān)注這些最基本的問(wèn)題,而是想方設(shè)法去解決這些基本問(wèn)題的表現(xiàn)形式:干擾。結(jié)果是算法的魯棒性越來(lái)越差。
因此,對(duì)上述問(wèn)題的解決需要從最基本的顏色、灰度、二值化著手,重新建立直接基于彩色圖像的算法體系,使算法能在圖像無(wú)損的基礎(chǔ)上,針對(duì)性更強(qiáng),確定性更高。
2.1??直接基于彩色圖像
原有算法主要是在圖像灰度化和二值化基礎(chǔ)上,通過(guò)車(chē)牌特征和投影進(jìn)行車(chē)牌定位和字符分割。盡管在直接基于彩色模式的車(chē)牌識(shí)別方法上進(jìn)行了很多努力,但是,迄今為止基于彩色模式進(jìn)行車(chē)牌識(shí)別的各種方法都沒(méi)有針對(duì)彩色模式的計(jì)算復(fù)雜性找到有效的解決辦法。所謂彩色模式,不論是通過(guò)紅色、綠色、藍(lán)色三原色表示,還是通過(guò)其他方式表示,都是三維空間。因此,如果不能降維,其計(jì)算復(fù)雜性就不能降低。客觀上,車(chē)牌識(shí)別往往需要在一個(gè)較短的時(shí)間內(nèi)完成。因此,由于耗時(shí)基于彩色模式的車(chē)牌識(shí)別都只是停留在理論上,或者說(shuō),一直沒(méi)有可以進(jìn)入工程意義上的實(shí)用的成果出現(xiàn)。
圖像五值化是通過(guò)公式Y(jié)=(R+G)/2,將RGB空間映射到Y(jié)B空間,再將YB空間簡(jiǎn)化成黑、藍(lán)、灰、黃、白五種值的圖像簡(jiǎn)化方法。圖像五值化首先將圖像由RGB三維降成YB二維,進(jìn)而將YB二維簡(jiǎn)化成五個(gè)離散值,極大地降低了直接基于彩色圖像進(jìn)行車(chē)牌識(shí)別的計(jì)算復(fù)雜性。經(jīng)五值化簡(jiǎn)化后,盡管圖像的色彩值只有五種,但其色彩屬性被最大限度地保留下來(lái),黑、藍(lán)、灰、黃、白仍能完整表達(dá)中國(guó)車(chē)牌識(shí)別所需的色彩信息。就中國(guó)車(chē)牌識(shí)別而言,圖像五值化簡(jiǎn)化對(duì)原圖像是無(wú)損的。
針對(duì)中國(guó)車(chē)牌,藍(lán)牌的白字可以視為是黃色,黃牌的黑字也可以視為藍(lán)色,通過(guò)黑、藍(lán)合并,白、黃合并,圖像可進(jìn)一步簡(jiǎn)化成三值。藍(lán)底黃字可以表示藍(lán)牌和黑牌,黃底藍(lán)字可以表示黃牌和白牌。因此,就中國(guó)車(chē)牌識(shí)別而言,將圖像簡(jiǎn)化成三值不僅具有合理性,同樣對(duì)圖像的色彩屬性也是無(wú)損的。
無(wú)論是五值圖像,還是三值圖像,都完整保留了圖像的中間“灰”,回避了圖像二值化對(duì)中間“灰”可能出現(xiàn)的分類(lèi)錯(cuò)誤。只要在算法中增加一點(diǎn)“技巧”,保留的中間“灰”就可根據(jù)識(shí)別的車(chē)牌底色動(dòng)態(tài)地視同字符識(shí)別所需的車(chē)牌底色或字符色,從而能彌補(bǔ)受光照不均勻或車(chē)牌“臟”影響按閾值選取進(jìn)行圖像二值化可能導(dǎo)致的圖像信息缺失,有利于提高字符識(shí)別的正確率。
2.2??將投影與分割建立在三值圖像基礎(chǔ)上
對(duì)于投影與分割,克服二值化缺陷的關(guān)鍵同樣是要考慮呈現(xiàn)為干擾的受光照不均勻或車(chē)牌“臟”影響的像素點(diǎn)“灰”化。解決辦法仍然是要保留中間“灰”或圖像“灰”像素,將投影與分割建立在圖像三值化基礎(chǔ)上。圖像二值化后,原有中間“灰”或圖像“灰”像素,如果被錯(cuò)誤分類(lèi),就可能或表現(xiàn)為“損害”,或表現(xiàn)為“干擾”。“損害”是圖像信息缺失,不利于字符分割,也不利于字符識(shí)別。“干擾”是圖像中不必要的信息過(guò)多,同樣不利于字符分割,也不利于字符識(shí)別。將中間“灰”或圖像“灰”像素保留為中間狀態(tài),區(qū)別于“黑”或“白”,就可以為程序判斷提供依據(jù),使程序可以根據(jù)已通過(guò)判斷得到的車(chē)牌底色,對(duì)于中間狀態(tài)或保留,或丟棄。
2.3??通過(guò)分割反推進(jìn)行車(chē)牌定位
對(duì)于解決車(chē)牌遺漏和車(chē)牌定位候選區(qū)域左右邊界的不確定性,就是要先進(jìn)行字符分割,再按分割反推進(jìn)行車(chē)牌定位。所謂分割反推是指在確保圖像遍歷高效的前提下,通過(guò)圖像遍歷如果可以進(jìn)行字符分割則得到一個(gè)候選車(chē)牌定位。
按分割反推進(jìn)行車(chē)牌定位的好處是:不僅可以先按照公安部的規(guī)定檢測(cè)字符間距,排除偽車(chē)牌,做到車(chē)牌定位不誤;還可以使車(chē)牌定位不再依賴(lài)車(chē)牌特征,可以不再理會(huì)圖像中對(duì)車(chē)牌特征所謂的干擾,做到車(chē)牌定位不漏。
2.4??算法復(fù)雜性控制
直接基于彩色圖像并通過(guò)圖像遍歷按分割反推進(jìn)行車(chē)牌定位,在圖像已經(jīng)被簡(jiǎn)化成三值后,關(guān)鍵是必須有效控制圖像遍歷的計(jì)算復(fù)雜性。否則,算法會(huì)因?yàn)樘幚砥髫?fù)荷過(guò)重而不具有實(shí)用性。
與二值圖像不同,三值圖像具有中間“灰”。顯然,定位只需要針對(duì)藍(lán)色和黃色,三值圖像中的中間“灰”是不需要定位的。因此,可以跳開(kāi)大量的中間“灰”,使基于三值圖像的算法復(fù)雜性能得到有效控制。具體的控制方法是:
(1)???????? 在圖像行上可通過(guò)定位候選點(diǎn)標(biāo)記,跳開(kāi)非定位候選點(diǎn),實(shí)現(xiàn)圖像的橫向加速;
(2)???????? 在圖像列上可通過(guò)大小跨機(jī)制,改變圖像行的執(zhí)行順序,快速到達(dá)車(chē)牌所在的圖像行,實(shí)現(xiàn)圖像的縱向加速;
(3)???????? 結(jié)合回溯與隔行查找,放棄部分圖像行的定位。
因此,綜合圖像橫向、縱向兩個(gè)方向的二維加速,圖像遍歷的高效是可以保證的。
3??? 目的
基于三值圖像的車(chē)牌識(shí)別從字符分割開(kāi)始,按分割反推進(jìn)行車(chē)牌定位。傳統(tǒng)的車(chē)牌識(shí)別是從車(chē)牌定位開(kāi)始。基于字符分割并按分割反推進(jìn)行車(chē)牌定位有別于傳統(tǒng)車(chē)牌定位,目的是為了減少影響車(chē)牌識(shí)別結(jié)果正確的因素,將確保車(chē)牌識(shí)別結(jié)果正確的前提單一到圖像三值化質(zhì)量上,克服傳統(tǒng)車(chē)牌識(shí)別在車(chē)牌定位、字符分割、字符識(shí)別各環(huán)節(jié)上的識(shí)別率瓶頸。
?
基于三值圖像的車(chē)牌識(shí)別過(guò)程是:
圖像三值化→字符分割→分割反推→字符識(shí)別
?
傳統(tǒng)的車(chē)牌識(shí)別過(guò)程是:
圖像灰度化→特征定位→二值化→形態(tài)學(xué)處理→字符分割→字符識(shí)別
?
基于三值圖像的車(chē)牌識(shí)別僅僅依賴(lài)圖像三值化質(zhì)量,相對(duì)于傳統(tǒng)車(chē)牌識(shí)別的圖像二值化,其質(zhì)量更能得到保證。傳統(tǒng)的車(chē)牌識(shí)別依賴(lài)圖像灰度化、車(chē)牌特征提取、圖像二值化閾值選取、形態(tài)學(xué)處理,每個(gè)環(huán)節(jié)都可能是影響最終車(chē)牌識(shí)別效果的識(shí)別率瓶頸。
字符分割在基于三值圖像的車(chē)牌識(shí)別過(guò)程中是先計(jì)算字符間距,然后對(duì)定位候選點(diǎn)進(jìn)行字符分割符合性檢測(cè),字符分割可驗(yàn)證;字符分割在傳統(tǒng)車(chē)牌識(shí)別過(guò)程中是在圖像二值化基礎(chǔ)上投影得到,是不嚴(yán)格且不可驗(yàn)證的,容易出現(xiàn)字符分割錯(cuò)誤。圖像二值化實(shí)質(zhì)上是把三值圖像的中間狀態(tài)強(qiáng)行分類(lèi)到背景或前景中,導(dǎo)致背景膨脹或前景膨脹。膨脹會(huì)影響分割,因此,傳統(tǒng)二值化后有可能需要進(jìn)行形態(tài)學(xué)處理。實(shí)際上,這是兩難的。如果不進(jìn)行形態(tài)學(xué)處理,由于背景或前景有可能是膨脹的,因此分割的正確性無(wú)法保證。而進(jìn)行形態(tài)學(xué)處理,其處理結(jié)果未必恰當(dāng)。
車(chē)牌定位在基于三值圖像的車(chē)牌識(shí)別過(guò)程中是基于字符分割并按分割反推,采用圖像遍歷方式,車(chē)牌定位既不會(huì)遺漏,也不會(huì)錯(cuò)誤。而車(chē)牌定位在傳統(tǒng)車(chē)牌識(shí)別過(guò)程中是根據(jù)各種各樣的車(chē)牌特征,甚至是融合的車(chē)牌特征,在車(chē)牌特征受到較大干擾的情況下,車(chē)牌定位既可能遺漏,也可能錯(cuò)誤。
在基于三值圖像的車(chē)牌識(shí)別過(guò)程中可以將中間“灰”或圖像的“灰”像素根據(jù)識(shí)別的車(chē)牌底色動(dòng)態(tài)地視同字符識(shí)別所需的車(chē)牌底色或字符色。而在傳統(tǒng)的車(chē)牌識(shí)別過(guò)程中字符識(shí)別只能根據(jù)二值圖像進(jìn)行,字符識(shí)別結(jié)果的正確性受圖像二值化閾值問(wèn)題制約。
即在傳統(tǒng)車(chē)牌識(shí)別過(guò)程中,各環(huán)節(jié)算法所依賴(lài)的前提是不完全確定的,必須架構(gòu)在對(duì)錯(cuò)誤一定程度容忍的基礎(chǔ)上,否則,該環(huán)節(jié)就成為識(shí)別率瓶頸。不確定性和錯(cuò)誤容忍會(huì)最終累積到車(chē)牌識(shí)別結(jié)果,因此造成車(chē)牌識(shí)別結(jié)果在理論上一定會(huì)處于一定的誤差范圍。
4??? 圖像五值化
4.1??圖像五值化簡(jiǎn)化方法
圖像五值化簡(jiǎn)化方法是通過(guò)公式:黃色 =(紅色+綠色)/ 2 ,依此將紅色、綠色、藍(lán)色三原色構(gòu)成的色彩空間映射到由黃色、藍(lán)色兩種顏色構(gòu)成的色彩空間,映射后的色彩值有黑色、藍(lán)色、灰色、黃色和白色五種。
具體的簡(jiǎn)化過(guò)程:
(1)???????? 建立公式:黃色 =(紅色+綠色)/ 2 ;
(2)???????? 建立公式:灰度 =(黃色+藍(lán)色)/ 2 ;
(3)???????? 將黃色和藍(lán)色都大于187的視同白色;
(4)???????? 將黃色和藍(lán)色都小于153的視同黑色;
(5)???????? 去除白色和黑色剩下的中間色中,若黃色<0.9×藍(lán)色,則繼續(xù)進(jìn)行藍(lán)色細(xì)分,若藍(lán)色<0.9×黃色,則繼續(xù)進(jìn)行黃色細(xì)分,否則,則繼續(xù)進(jìn)行灰色細(xì)分;
(6)???????? 藍(lán)色細(xì)分:若黃色<0.8×藍(lán)色,視同藍(lán)色,否則,若灰度<187,視同藍(lán)色,反之視同灰色;
(7)???????? 黃色細(xì)分:若藍(lán)色<0.8×黃色,視同黃色,否則,若灰度>153,視同黃色,反之視同灰色;
(8)???????? 灰色細(xì)分:若灰度<153,視同黑色,若灰度>187,視同白色,否則,視同灰色。
?
?
?????????????????????????????????????????
待續(xù)。
轉(zhuǎn)載于:https://www.cnblogs.com/zhangzhongyi/archive/2011/01/01/1923934.html
總結(jié)
以上是生活随笔為你收集整理的图像五值化与基于三值图像的车牌识别(1)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 强大Jquery插件,table排序之二
- 下一篇: STM32程序设计心得以及易错点