Pupil dynamics for iris liveness detection 瞳孔活体检测论文翻译
Pupil dynamics for iris liveness detection
Abstract
本文的主要目的是提出一種基于瞳孔動力學的完整的眼睛活性檢測方法。這種方法可以作為虹膜識別系統中呈現攻擊檢測的一個組成部分,使它們更加安全。由于缺乏支持這項研究的公共數據庫,我們建立了自己的虹膜捕捉設備來記錄可見光刺激下的瞳孔大小變化,并記錄了26名受試者(52種不同的虹膜)的204次觀察,每組包含每40毫秒拍攝的750張虹膜圖像。每次測量都記錄了可見光強度突然增加后自發的瞳孔振蕩及其反應。Kohn和Clynes瞳孔動力學模型用于描述這些變化;因此,我們將每個觀察值轉換為由模型參數定義的特征空間。為了回答眼睛是活的(也就是說,如果它像人眼一樣對光的變化做出反應)還是呈現是可疑的(也就是說,如果它做出奇怪的反應或沒有觀察到反應),我們使用線性和非線性支持向量機來對自然反應和自發振蕩進行分類,同時研究擬合優度以拒絕不良建模。我們的實驗表明,這種方法可以為我們收集的數據實現完美的性能:所有正常反應都與自發振蕩正確區分開來。我們研究了模擬瞳孔反應所需的最短觀察時間,發現不超過3秒的時間足以提供完美的表現。
I. INTRODUCTION
十多年來,活性檢測一直是生物識別安全國際討論的重要內容。根據國際標準化組織/國際電工委員會,它涉及“解剖特征或非自愿或自愿反應的檢測,以確定生物測定樣本是否是從捕獲點存在的活體中捕獲的”[1]。檢查活性的能力對任何生物傳感器都至關重要。甚至它的名字,生物識別,也是處理活的和真實的生物特征的同義詞,非生物制品。一旦生物傳感器接受了人工制品或非活體部分,部署這種傳感器的整個系統就變得毫無意義。
活性檢測指的是對活體癥狀的檢測,因此是旨在檢測任何呈現攻擊的更廣泛技術類別的特例。國際標準化組織/國際電工委員會將展示攻擊定義為“以可能干擾生物識別系統預期策略的方式向生物識別捕獲子系統展示人工制品或人體特征”。這意味著任何顛覆行為(即意圖顛覆生物識別系統)都應被檢測為演示攻擊。然而,攻擊者的意圖無法推斷。因此,呈現攻擊成為一個非常廣泛的領域,包括呈現假對象,以及尸體部分,不協調或強迫的呈現,甚至零努力冒名頂替的嘗試。這種未知意圖還通過將一些可疑動作分類為潛在的呈現攻擊,例如,由于疾病、疲勞或出于美容或健康原因的人造物體的呈現而導致的不一致呈現,來引起錯誤警報。這使得攻擊的分類變得復雜,并刺激了在如何有效地處理呈現攻擊檢測(進一步縮寫為PAD)領域正在進行的科學討論。
在這項工作中,我們專注于虹膜活性檢測,即識別活性癥狀,可以證明眼睛的真實性和受試者愿意被傳感器記錄。我們使用在可見光刺激下記錄的瞳孔動態,而不是更常用的眼睛或其組織的靜態特性。由于當光強變化時,瞳孔會不由自主地做出反應,因此很難掩蓋這種現象。正如將在論文中顯示的那樣,瞳孔動力學并不是微不足道的,這使得很難為人造物體模仿它們。在我們的測試中,我們決定不使用靜態對象,如虹膜紙打印輸出或圖案化隱形眼鏡,因為在這種情況下,我們將確保成功(除了一些測量噪聲之外,靜態對象不呈現顯著的動態,因此當動態是關鍵時,很容易識別)。相反,為了評估所提出的方法性能,我們將自發瞳孔振蕩(通常稱為hippus)和正常瞳孔對可見光正浪涌的反應進行了分類,從而使測試更加真實。據我們所知,這是唯一的一項采用瞳孔動力學進行活性檢測的工作,并且是在動態真實物體上而不是靜態偽影上進行評估的。
論文組織如下:第二部分給出了論文中使用的錯誤度量的簡要總結。第三部分引用和分類了過去最重要的虹膜識別相關的PAD工作。第四部分描述了為這項研究收集的眼部圖像數據庫。在第五部分中,我們提供了數據預處理的理論背景和瞳孔動力學建模。第六節介紹了第七節中討論的實驗結果。
II. ERROR METRICS USED
虛假拒絕和虛假接受是生物識別中常見的錯誤。這些指的是錯誤地拒絕或接受聲稱的身份。理論上,我們可以通過簡單地將聲明從“身份”更改為“活性”,在活性檢測的上下文中使用相同的術語。然而,該領域的國際討論建議將與呈現攻擊檢測相關的誤差估計器與描述生物識別的誤差估計器區分開來。因此,我們遵循最后一個國際標準化組織/國際電工委員會的建議[1],并通過以下估算器描述PAD級別的系統性能:
a) Attack Presentation Classification Error Rate (APCER): proportion of attack presentations that were
incorrectly classified as authentic presentations.
APCER:表示攻擊樣本被錯誤分類為真實樣本的比例
b) Normal Presentation Classification Error Rate (NPCER): proportion of authentic presentations incorrectly classified as attacks.
NPCER:真實樣本被錯誤分類為表示攻擊樣本的比例。
c) Equal Error Rate (EER): the value of APCER and NPCER when they are equal (analogous to the recognition performance analysis which employs equality of false rejections and false acceptances in the definition of EER).
當APCER和NPCER在數值上相等時的值。(類似于在EER定義中使用錯誤拒絕和錯誤接受相等的識別性能分析)。
EER(平均錯誤概率)是一種生物識別安全系統算法,用于預先確定其錯誤接受率及其錯誤拒絕率的閾值。當速率相等時,公共值稱為相等錯誤率。該值表明錯誤接受的比例等于錯誤拒絕的比例。等錯誤率值越低,生物識別系統的準確度越高。
III. PRESENTATION ATTACK DETECTION IN IRIS RECOGNITION: PAST WORK
A. First demonstrations of vulnerabilities
自從Daugman首次提出虹膜識別系統如何被眼睛打印輸出欺騙以來,15年已經過去了。三年后,由于Thalheim等人首次對商用虹膜識別系統進行了安全性評估,這一想法得到了證實。在這些測試中,使用了簡單的虹膜打印輸出,用一個孔代替瞳孔。這個噱頭使得在被測設備中實現虹膜檢測方法成為可能。測試虹膜編碼(低頻)和打印過程(高頻)中使用的不相交頻率范圍使得打印偽像對虹膜特征提取過程“不可見”。這使得他們能夠打印、出示并確認給定的虹膜。Thalheim等人的先鋒研究激發了其他人提出他們自己對額外的、以前未經測試的硬件的安全評估,并再次顯示出在商業設備中缺乏有效的對策[4],[5]。
B. Scientific papers
從這些初步發現中,我們觀察到PAD方法的不斷發展,其特征是觀察眼睛時可以分析的信號的復雜程度和種類不同。為了總結現有技術,我們介紹了四類以被觀察物體的測量和動態為特征的PAD方法:靜態或動態物體的被動或主動測量。在接下來的段落中,我們提供了每個類別最突出的研究結果。
靜態物體的被動測量。這種方法采用只能顯示靜態眼睛特征的靜態圖像。不執行額外的主動測量步驟。通常,與識別中使用的圖片相同的圖片被用于活性檢測。這些方法仍然非常有吸引力,因為即使以有限的可靠性為代價,也沒有在虹膜捕獲硬件上進行額外的投資。最早的想法來自道格曼[2],他注意到印出的虹膜的振幅譜包含假的圖案,這與真實眼睛獲得的平滑譜相反。關于如何在振幅譜中自動找到這些“假頻率”的第一個建議可能是由Pacut和Czajka提出的[5],并涉及后續調查[6],[7],最終報告了超過95%的虹膜打印輸出的正確識別(當沒有遇到活樣本的錯誤拒絕時)。
Wei等人[8]可能是第一批分析虹膜圖像三種特性以檢測圖案化隱形眼鏡的作者:圖像清晰度、基于Gabor的濾波和二階虹膜區域統計。作者報告了后兩種方法的良好性能(相應地,正確識別率為98.3%和100%),盡管承認它們對印刷隱形眼鏡圖案類型的高度依賴性。在推廣這些結果時,應考慮使用少量(20個)人工虹膜。何等[9]利用小波包分析計算徑向基核的SVM(支持向量機)分類的活性特征。作者報道了虹膜紙打印輸出的正確識別,即使由于運動故意模糊。他等人[10]使用AdaBoost學習來選擇最佳的基于LBP(局部二進制模式)的活性特征,并且高斯核密度估計被用于推廣AdaBoost分類器。作者報告了99.33%的假貨正確識別率,活拒絕率為2.64%,計算評估數據庫收集了20種不同類型的隱形眼鏡的300幅圖像,一些打印輸出和玻璃眼睛。張等人[11]使用在LBP特征空間內對真實虹膜圖像和圖案化隱形眼鏡進行分類。作者報告了對72名受試者佩戴的55種不同類型的接觸物計算的CCR=99.14%(正確分類率),并通過四種不同的捕捉設備進行平均。在交叉驗證場景中(對不同攝像機捕獲的樣本進行訓練和測試),這一有希望的CCR下降到88.05%。
這些有前途但單一的圖像屬性后來被聯合使用,以形成多維的、基于圖像質量的活躍度指標。Galbally等[12]應用特征選擇方法,在22個提出的簡單虹膜幾何或頻率描述符中找到活性特征的最佳組合。盡管他們報告了對打印輸出和活體眼睛的完美識別,但這可能是所應用的打印輸出的低質量所特有的,因為該結果僅基于分割結果(關于與瞳孔半徑比融合的遮擋的信息)。如果在真實攻擊中使用假樣本,我們更應該期待它們能導致正確的分割。然而,合并不同質量協變量的想法具有很高的潛力,Galbally等人[13]后來將其與二次判別分析一起應用于檢測99.75%的虹膜打印輸出,同時錯誤地拒絕了4.2%的真實眼睛。他們選擇了25個在檢測不同攻擊類型方面互補的質量度量,這些度量可以實時有效地計算。該方法還能夠在NPCER=3.4%時檢測到99.2%的合成虹膜。
靜態物體的主動測量。這種方法實現了主動測量(除了正常的虹膜識別過程之外),揭示了眼睛的一些結構特性,但不使用眼睛動力學。典型的例子是浦肯野反射的檢測,即由角膜和眼睛晶狀體的內外邊界處的照明產生的鏡面斑點。道格曼[2]最初提出的想法后來被李等人[14]詳細闡述,他們使用兩個準直的近紅外光源(除了用于虹膜識別的光源之外)來產生和測量浦肯野斑點。對30個人(包括10個戴眼鏡和10個戴隱形眼鏡的人)、10個紙打印件樣本、2個打印隱形眼鏡樣本和2個3D眼睛模型樣本的眼睛圖像所做的實驗導致有希望的EER=0.33%。應該注意的是,浦肯野反射的檢測需要很高的圖像清晰度,遠遠好于虹膜識別方法通常需要的清晰度。
Connell等人[15]利用了真實虹膜(低分辨率)大致平坦的事實,這與顯示凸形的印刷隱形眼鏡相反。因此,作者使用微型投影儀產生的結構光(在3D面部成像中很流行)來捕捉眼球前部的三維屬性。這種方法只對一個對象拍攝的圖像進行了測試,六個不同的隱形眼鏡呈現出對假貨的完美識別。
當放大虹膜來觀察它的肌肉纖維時,我們最終會看到一個不再平坦的結構。當以更高的分辨率觀察時,當被來自不同方向的光照射時,小梁產生陰影。當觀察到平滑的仿制品(如紙張打印輸出)時,這種陰影不應該出現,因此一些研究人員使用這種方法來區分平坦的偽像和粗糙的、活躍的虹膜肌肉。關于如何利用虹膜的三維來確定其真實性,我們知道的第一種方法來自Lee等人[16]。作者利用小波分解尋找SVM分類的三維活性特征。為60名志愿者(其中一些人戴著眼鏡或隱形眼鏡)收集的600個現場樣本和為不同人工制品類型(打印輸出、照片、帶有隱形眼鏡的打印輸出、由硅或丙烯酸制成的人造圖像以及圖案化隱形眼鏡)準備的600個假樣本的報告EER=0.33%。Hughes等人[17]注意到,戴有圖案的隱形眼鏡會使觀察到的虹膜圖案更加凸起(即,位于鏡片表面),這與無遮擋的真實虹膜形成對比,真實虹膜的圖案大致位于一個平面上。因此,他們將活性檢測問題轉化為對虹膜區域內觀察到的表面形狀進行分類的問題。作者在可見光下為4個人拍攝了虹膜的立體圖像,并另外要求這四名志愿者中的兩人在拍攝圖像時戴上隱形眼鏡(透明的和有圖案的)。他們報告說,佩戴有圖案的隱形眼鏡的人可以完美識別未佩戴隱形眼鏡的虹膜(或佩戴透明鏡片時)。
Park等人[18]提出了一個有趣的解決方案,即使用幾幅多光譜虹膜圖像來代替典型應用的近紅外單幅圖像。作者使用了一種專門的可調晶體濾波器,提供從650納米到1100納米的高選擇性(10納米波段)照明。識別中使用的圖像導致基于梯度的圖像融合,并且如果圖像是打印輸出,則不呈現虹膜結構,這與提供有用虹膜特征的真實圖像不同。作者聲稱表現完美,但測試只針對4只不同的眼睛。Lee等人[19]還利用了眼睛組織對多光譜光吸收的差異。作者首先計算虹膜-鞏膜圖像強度的比率(在預選的虹膜和鞏膜小區域)。由于虹膜和鞏膜根據照明光的波長具有不同的光吸收特性,所以當光波長改變時,該比率不同。事實上,人們可以通過計算兩種不同發光波長(文中使用750納米和850納米)的比值來判斷樣品的真實性。作者展示了2800張真實虹膜圖像、400張紙質打印輸出圖像和30張塑料眼睛圖像的零APCER和小NPCER=0.28%。然而,不足為奇的是,這種方法錯誤地接受了40%的有色隱形眼鏡,因為它們對本研究中應用的多光譜光是透明的。
動態物體的被動測量。在這個組中,我們檢測被測對象的動態特性,但沒有它的刺激。一個自然的例子是檢測hippus,即自發的瞳孔大小振蕩[2]。盡管使用hippus進行活性檢測的想法已經存在多年,并且經常在論文中引用,但迄今為止很難找到可靠的實現。此外,Pacut等人(在觀察他們自己的測量結果后)認為,hippus的可見性受個體的影響,因此當應用于更大的人群時,其可靠性可能會受到限制。Fabiola等人[20]展示了hippus的成功部署,但是是在用戶認證的背景下,而不是在活性檢測中。作者在分析50人的hippus時得出的EER=0.23%表明,瞳孔的自發運動可能表現出個體特征。當添加到虹膜生物特征模板中時,它們可以作為活性指示器。然而,這篇論文沒有包括任何用假眼睛來證明這個假設的測試。如果虹膜圖像也包含眼瞼,可以采用自發的眨眼檢測,這在面部識別和面部活性檢測中很流行。據報道,眨眼識別的準確率很高(Cohn等人[21]聲稱10名志愿者的準確率為98%,潘等人[22]報告的20名受試者的準確率為88.8%)。然而,應該注意的是,自發眨眼每隔幾秒鐘就會發生一次;它們是不規則的,它們的頻率取決于主題。因此,當虹膜捕獲時間起重要作用時,檢測受刺激的眨眼(而不是自發的)似乎是更合適的方法。
動態物體的主動測量。最后一組方法包括刺激物體和分析其動力學。人眼提供至少兩種類型的動態特征:與整個眼球相關的特征和描述瞳孔大小的刺激變化。Komogortsev等人觀察眼睛的水平掃視軌跡,以區分真實的眼球和機械復制品的模擬行為。這個刺激是一個跳躍點,必須有32名志愿者參與實驗。當眼睛運動模型不為攻擊者所知時,EER=5%最小,當眼動植物特征可用于模仿眼睛的掃視時,EER=20%由作者聲明。一些研究人員利用了變化光照下的虹膜肌肉變形,如Kanematsu等人[23],他們計算了預定義虹膜區域中光刺激后的虹膜圖像亮度變化。他們報告了活虹膜的完美識別和一些紙打印輸出。Puhan等人[24]計算了擴張和收縮虹膜的虹膜紋理差異,聲稱這些差異對于真眼來說應該很大,對于印刷隱形眼鏡來說應該很小。這種說法雖然在原則上是正確的,但在論文中沒有概念證明,因為作者只展示了兩只真實眼睛的結果,而沒有展示人工制品的結果。
科學文獻經常提到使用液晶面板作為成功模仿眼睛動態的候選攻擊,盡管到目前為止還不知道這種偽造的成功實現。虹膜采集設備通過近紅外光照亮眼睛(根據國際標準化組織/IEC 29794-6的建議,典型的工作波長從700納米開始,到900納米結束),并使用濾光器將光線切斷在該范圍之外。另一方面,液晶顯示器旨在向用戶呈現內容,因此必須在可見光(波長不超過700納米)下工作。這導致虹膜識別攝像頭對液晶顯示器顯示的內容“視而不見”。因此,這種流行的攻擊想法對于現成的液晶顯示器是不切實際的。我們不知道有哪種近紅外光下的液晶顯示器可以用來播放眼部圖像。
應該注意的是,在上述研究中沒有計算瞳孔動力學。盡管使用瞳孔動態特征進行活性檢測的顯而易見的想法已經存在多年,但是只有少量的研究給出了這個概念的證明以及足夠的實驗結果。Pacut等人[5]使用動態瞳孔反應模型和神經分類器,基于為29名志愿者收集的圖像序列數據庫和500多張紙偽影,完美地識別真實的眼睛和虹膜打印輸出。同時,作者在波蘭申請了一項專利[25],該專利后來擴展到美國[26]。由于他們在研究中使用了虹膜打印輸出,這可以通過更簡單的方法來識別,因此該方法的潛力既沒有得到重視,也沒有被展示出來。Czajka擴展了這項研究,展示了這種方法如何識別眼睛的奇怪(或沒有)反應[27],本文對這些發現進行了全面的描述。
C. Supporting activities
除了科學努力之外,值得注意的是與虹膜活性檢測相關的一些其他舉措。克拉克森大學(美國)、圣母大學(美國)和華沙理工大學(波蘭)在2013年組織了第一屆國際虹膜活性競賽[28]。這次比賽是之前三次活動比賽的后續,都是關于指紋生物識別的。比賽使用了紙質虹膜打印輸出(共815張圖片)和打印隱形眼鏡(共2240張圖片)。大約62%的隱形眼鏡圖像和25%的紙質打印圖像已作為培訓集提供給參與者,其余數據用于評估交付的方法。三所大學決定發送他們的算法。比賽結果展示了一些有趣的現象。首先,很明顯,與紙張打印輸出的識別相比,圖案化隱形眼鏡更難檢測(紙張打印輸出接受率為0.65%,而獲勝方法獲得的打印隱形眼鏡平均接受率為9.32%)。第二,競賽結果顯示,大多數科學論文呈現的實驗室結果(通常顯示對假貨和活體樣本的完美或幾乎完美的識別)與第三方評估報告的獲勝解決方案的平均分類誤差在10%的水平之間明顯不一致。這些發現加強了獨立評估的重要性。
人們也可能對TABULA RASA [29]感興趣,這是一個專門致力于活性檢測的歐洲項目。一些令人印象深刻的項目成果致力于虹膜識別,例如,已經引用的偽像檢測中虹膜圖像質量特征的部署[12]。生物識別研究所是生物識別脆弱性評估專家組[30]的發起者,該專家組是一個國際專家組,旨在提高對生物識別脆弱性評估重要性的認識,并交流與主題相關的經驗。國際標準化組織/國際電工委員會JTC分會第37號(生物測定學)也即將發布一個單獨的國際標準,完全致力于演示攻擊檢測。這些例子表明,生物特征識別中的活性檢測并不是一個完全解決的問題,或者迄今為止獲得的結果不能滿足科學和工業的要求。
IV. DATABASE OF IRIS MOVIES
A. Collection stand
據我們所知,目前還沒有公開的虹膜圖像收藏來進行瞳孔動力學的研究。我們決定建造合適的測量設備,并收集我們自己的一組在近紅外光下拍攝的眼部圖像。收集架的核心是嵌入成像源DMK-4002-紅外b/w相機的IrisCUBE相機[31],該相機配備了索尼ICX249AL 1/2英寸電荷耦合器件夾層傳感器,提高了紅外靈敏度。場景由兩個近紅外光源(λ = 850 nm)照亮,這兩個光源水平放置并與鏡頭等距。我們的設備采用近紅外濾光器來阻擋波長低于800納米的任何光線。IrisCUBE相機每秒可拍攝25幅虹膜圖像,圖像質量大大超過了與成像對象無關的ISO/IEC 19794-6和ISO/IEC 29794-6相關的最低建議。因為我們希望在整個實驗中保證可重復的拍攝條件,所以我們將相機封裝在一個大的陰影框中,并在其中放置受試者的眼睛用于獲取圖像。我們使用可見的發光二極管,嵌入相機外殼的前部,以幫助用戶定位頭部,作為可見光刺激。這種配置保證了受試者頭部在每次嘗試中的固定位置以及受試者頭部和攝像機之間的穩定距離(大約30厘米)。它允許我們在完全黑暗的情況下(不考慮外部照明條件)以及在可見光階躍刺激期間測量瞳孔的反應。然而,人們應該意識到,當在明亮的環境光下觀察眼睛時,瞳孔反應可能不太明顯(由于在施加刺激之前瞳孔收縮較大)。
B. Database statistics
我們收集了26名受試者的52個不同虹膜的圖像。對于50個虹膜,我們拍攝了4部圖像,對于一個人只拍攝了2部圖像,總共拍攝了204部眼睛圖像。每部圖像持續30秒,呈現瞳孔大小的自發振蕩(前15秒)和對光強階躍增加的反應(后5秒),以及對照明負階躍變化的反應(后10秒)。由于我們每秒捕獲25幀,數據庫容量總計為204×30×25 = 153,000張虹膜圖像,顯示瞳孔擴張和收縮過程。圖1給出了示例幀,并說明了可見發光二極管的開啟和關閉時刻。
C. Representation of actual and odd pupil reactions
在所有致力于呈現攻擊檢測的研究中,我們在找到將我們的活性特征空間劃分為兩個子空間(真實和虛假)的分類函數方面有一個共同的困難。因為我們通常通過一些學習過程來構建這些分類器,所以我們需要代表這些類的樣本。不幸的是,這讓我們想到了一些特定于某些假物體的方法。泛化幾乎是不可能的,因為我們無法預測造假者的幻想。尤其是在第三部分中總結的過去的工作。第三階段致力于靜態偽影的檢測,通常是虹膜打印輸出、隱形眼鏡或義眼模型。先前將瞳孔動力學應用于演示攻擊檢測[5],[26],證明了完美的性能,也對紙張打印輸出進行了評估,但在這種情況下,我們應該期待完美的性能,因為靜態對象沒有表現出動態。
在這項工作中,我們超越了這一限制,開發了一種方法,可以識別正確的瞳孔動態,并拒絕任何模仿真實瞳孔運動的行為,或者呈現一些奇怪的、意想不到的振蕩。在這項研究中,我們決定只分析活著的眼睛,并將瞳孔的自發振蕩視為對假設的(在這種情況下不存在的)光刺激的奇怪反應。這種方法完全符合我們在“活性”項下的理解,即檢測被分析對象的重要癥狀。只有活的、真實的眼睛才能表現出人體器官特有的正確動態。如果在一個突然的可見光脈沖之后,我們只觀察到希普斯,這可能表示我們觀察到了一只沒有生命的眼睛。為了根據我們的假設組織我們的數據,我們因此從數據庫中的每一部眼睛圖像中裁剪出兩個五秒的子圖像。第一個裁剪的子影片,代表奇怪的眼睛反應,在測量開始時開始,在測量的第五秒后結束。第二子圖像開始于第十六秒(正好是眼睛被可見光刺激的時候),結束于第二十秒(正好是可見光被關閉的時候),見圖1。這導致204部圖像持續5秒并代表奇怪的反應,204部圖像代表預期的瞳孔動態,也是5秒長。
我們應該意識到,在完全黑暗或非常明亮的環境光下觀察到的瞳孔自發振蕩,與在常規環境光下捕獲的振蕩相比,可能具有較低的振幅。后一種情況允許瞳孔在沒有明顯限制的情況下收縮和擴張,而完全黑暗或非常明亮的環境光導致瞳孔已經過度收縮或擴張,因此只允許其大小的有限變化。
V. RECOGNITION OF PUPIL DYNAMICS
A. Data pre-processing
1)瞳孔檢測、分割及其大小的計算:瞳孔動態通過其大小的變化來表示。然而,瞳孔大小是一個不精確的一般尺寸,可以用各種方法計算。在這項工作中,我們決定使用其最常見的圓形近似——可能是不規則的——形狀。這是有意為之的,因為三個因素:a)圓形分割的速度快,b)在已經部署的虹膜識別方法中圓形建模的共性,以及c)在描述動態時非圓形偏差的重要性。
圖1:瞳孔大小(黑點)在光刺激下的單個實驗中自動測量(藍色實線)。請注意,由于眨眼(黑點偏離預期順序)、閉眼(零坐標的紅點表示沒有檢測到瞳孔)或分割過程的波動(顯示為序列中的“噪聲”),真實對象的捕捉導致瞳孔大小的非理想序列。圖解樣本顯示在頂部,并與序列的相應時刻相關聯。
由于沒有與虹膜位置相關的基本事實,我們在每一幀中獨立地檢測和定位瞳孔。雖然檢測指的是瞳孔是否存在于框架內的陳述,但是定位傳遞其位置。為了定位瞳孔和虹膜之間的邊界,我們應用了對方向圖像進行操作的霍夫變換(估計傳遞梯度值及其方向的圖像梯度)。我們參數化了變換,使其對暗圓形敏感,對其他暗圓形和亮圓形幾乎沒有反應,比如鏡面反射。使用漸變和對圓形形狀的敏感度使得這種方法令人驚訝地健壯,即使瞳孔50%被眼瞼覆蓋。因此,每個眼睛圖像被轉換成瞳孔半徑的時間序列,圖1。我們不使用不超過最小閾值的梯度值(根據我們采用的硬件設置進行實驗設置)。如果沒有超過閾值的單個梯度值,則該方法報告沒有檢測到瞳孔。后者實現瞳孔檢測,有助于識別眼睛被眼瞼完全遮蓋的時間瞬間。
由于沒有與虹膜位置相關的基本事實,我們在每一幀中獨立地檢測和定位瞳孔。雖然檢測指的是瞳孔是否存在于框架內的陳述,但是定位傳遞其位置。為了定位瞳孔和虹膜之間的邊界,我們應用了對方向圖像進行操作的霍夫變換(估計傳遞梯度值及其方向的圖像梯度)。我們參數化了變換,使其對暗圓形敏感,對其他暗圓形和亮圓形幾乎沒有反應,比如鏡面反射。使用漸變和對圓形形狀的敏感度使得這種方法令人驚訝地健壯,即使瞳孔50%被眼瞼覆蓋。因此,每個眼睛圖像被轉換成瞳孔半徑的時間序列,圖1。我們不使用不超過最小閾值的梯度值(根據我們采用的硬件設置進行實驗設置)。如果沒有超過閾值的單個梯度值,則該方法報告沒有檢測到瞳孔。后者實現瞳孔檢測,有助于識別眼睛被眼瞼完全遮蓋的時間瞬間。
2)偽像去除:由于分割不準確,瞳孔半徑的原始序列并不完美。一般來說,我們會遇到兩種干擾:a)瞳孔檢測錯誤(通常是由于眨眼完全遮住了眼睛)和b)瞳孔分割噪聲(通常是由于眨眼時瞳孔被部分遮住,眼睛運動,離軸凝視,高度非圓形瞳孔形狀導致的估計的瞳孔大小,或者僅僅是算法錯誤)。第一種錯誤由瞳孔檢測過程識別。當對瞳孔動力學建模時,這些錯誤點可以容易地被忽略(在圖1中標記為位于水平軸上的紅點)。然而,當瞳孔半徑與其相鄰值相比明顯發散時,分割誤差只能在一定程度上被識別。瞳孔半徑的這些突然收縮主要是由部分眨眼引起的,并且由于眨眼的速度相對于每秒25幀,它們通常占據幾個(甚至是孤立的)值。因此,我們應用了中值濾波,其中一秒水平(即25幀)被應用為滑動窗口。
B. Modeling of pupil dynamics
光強波動產生明顯的瞳孔收縮和擴張。Kohn和Clynes [32]注意到瞳孔反應的不對稱性取決于閃光是正的(從暗到亮)還是負的,并提出了一個反應模型,該模型可以圖形化地想象為復雜自變量s的雙通道傳遞函數,如圖2。
圖2:瞳孔動力學模型部署在這項工作中,并從科恩和克萊因的原始提案[32]中導出。圖表轉載自[26]。
上通道由具有時間常數T1和T2的二階慣性和以τ1為特征的滯后元件組成。它只對正面的光刺激模擬瞳孔的瞬態行為,這是由放置在滯后元件之后的非線性函數保證的,并且減少了負面刺激的通道響應。通道增益由Kr控制。反過來,下通道負責模擬瞳孔大小的長期和持續變化,并通過在負或正光刺激后設置新的瞳孔半徑來回答。它包含一階慣性(其速度由T3控制)和以τ2為特征的滯后元素。下部通道增益由Ki獨立于上部通道控制。
計算拉普拉斯逆變換,我們可以很容易地獲得模型響應y(t;φ),作為上和下通道響應之和,yupper(t;φ1)和y lower(t;φ2),分別為:
是活性特征,即設置模型響應的七個參數的向量。因此,通過解決模型擬合問題,觀察到的瞳孔動態(時間序列)被轉換為七維活性特征空間中的單個點。
C. Searching for liveness features: fitting the model
通過求解以下形式的非線性最小二乘曲線擬合問題來識別每個眼睛圖像的最佳模型參數bφ = [Kr,T1,T2,τ1,Ki,T3τ2]T:
其中φ是φ的一組可能值,y(t)是瞳孔大小的真實(觀察到的)變化,乘以(t;φ)是給定參數φ和給定y(t)估計的模型響應,t = 0。。。,天貓。我們發現tmax ≤ 1.5秒。使得這個模型無用;因此,在這項工作中,我們分析了從tmax = 1.6秒開始的多個優化范圍。并以最大tmax = 5秒結束。如圖3。
圖3為圖1所示的預處理測量(黑點)計算的Kohn和Clynes模型響應(實線和粗綠線)。在每種情況下,建模從t = 0開始。左上圖顯示了5秒鐘觀察后的模型輸出,bφ = [62.82,0.10,4.27,0.17,47.97,0.84,0.14]T。其余三個圖說明了優化范圍減小時建模精度的下降。
D. Goodness of fit
為了評估擬合優度,我們使用歸一化均方根誤差,即
其中y是y的平均值,k表示向量的2范數。GoF限制從0(當by并不比直線擬合y好時)到1(完美擬合)。
E. Classification of the liveness features
圖4中所示的活性特征的樣本值表明了它們的異質辨別能力。然而,由于特征空間的低維度,我們沒有應用任何特征選擇方法。此外,在識別模型時,我們需要設置所有七個參數。
圖4。活躍度特征bφ的v值是針對正光刺激和五秒鐘觀察時間的預期(藍色十字)和奇數(紅色圓圈)瞳孔反應計算的。顯示了所有204部眼部圖像的結果。歸一化均方根誤差(NRMSE)也顯示在右下方的圖表中,這表明與奇數瞳孔反應相比,正常瞳孔反應更適合。
因此,縮小特征集沒有實際的理由。為了構建分類函數,我們使用支持向量機作為在低維特征空間中表現良好的最佳現成分類器之一(如我們的例子)。為了逼近線性和非線性分類邊界,我們部署了線性SVM以及徑向基函數和多項式核。
VI. EXPERIMENTS AND RESULTS
A. Generating gallery and probe samples
為了最小化低估性能錯誤的風險,我們將數據集分成兩個不相交的子集,用于訓練和評估給定的方法。訓練子集通常被稱為圖庫,而用于評估訓練算法的子集被稱為探針。在理想情況下,我們有足夠大小的圖庫和探針子集,以提供滿足我們需求的計算誤差的統計保證。然而,在典型情況下,這些集合的大小遠低于理想值,并且——取決于原始數據庫的大小——使用不同的交叉驗證技術來回答特定結果如何在獨立和未知數據上進行歸納。在生物測定學中,我們通常使用k折疊和省略n交叉驗證,前者設置k = 2(兩個折疊,可能大小相等,對應于圖庫和探針子集),后者設置n = 1(圖庫) 由n-1個樣本組成,而剩余的一個樣本形成探針組)。在這項工作中,使用了遺漏交叉驗證,但遺漏了給定人員的所有樣本,而不是使用單個樣本(即單個時間序列)。該場景生成n = 26次訓練測試實驗(等于不同受試者的數量),而不是204次(即所有樣本的數量),但是由于同一個人的樣本之間的統計依賴性,我們相信通過個人依賴性獲得無偏的評估結果。
B. Decision making
僅僅依靠分類器輸出是不夠的,因為眼睛的一些奇怪反應可能導致模型參數落入表示真實眼睛反應的子空間。與分類器輸出同時分析擬合優度是一個好主意,因為錯誤接受的樣本可能是由于模型識別不良造成的。這建立了一個二維決策平面,一個軸上有分類器響應,另一個軸上有擬合優度,提供了四個決策區域,如圖5。只有當分類器決策是肯定的并且模型擬合是準確的時,我們才認為觀察到的對象是活的。
C. Assessment of the method performance
當執行實驗時,我們有兩個目標:a)評估該方法的性能并選擇最可靠的SVM核,以及b)找到提供合理精度所必需的最小瞳孔觀察時間。前者回答了這個方法是否有理論潛力的問題。后者估計了在生物識別系統中實際部署的機會,因為預期的虹膜捕獲時間應該很短(不超過幾秒鐘)。省去一個程序的應用(省去給定人的所有樣本)導致我們進行n = 26個估計評估實驗。也就是說,在每個實驗中,我們使用n-1個受試者的所有樣本訓練三個不同的支持向量機(線性、多項式和徑向基),以及最終的參數優化(特別是:多項式核的階和徑向基核的衰減參數)。然后,我們在剩余受試者的未知樣本上評估這些支持向量機。在每個估計實驗中,我們還設置了擬合優度閾值,供以后用剩余樣本評估分類器時使用。我們決定設置GoF閾值,以免由于活性檢測而增加錯誤拒絕,即我們最小化了NPCER。這種方法背后有一個重要的理論基礎,而不是將理論和實踐中對非活體眼睛的錯誤接受降到最低。理論上的討論表明,預測所有可能的攻擊的性質——以及由此產生的相關統計數據——是不可能的。另一方面,為真實的生物特征樣本開發統計模型更容易。因此,當逼近分類函數時,關注真實數據是合理的,并且接受該分類器可能為贗品產生一些錯誤是合理的。這種方法比相反的方法更穩健,在相反的方法中,我們將緊緊圍繞特定的假樣本來固定分類函數,因為其他類型的假樣本的通用性較弱,并且會降低真實樣本的準確性。這與實踐相對應,因為系統開發人員對增加的錯誤拒絕概率更有抵抗力,并且他們更有可能接受假貨的更高概率(這在沒有活躍度檢測的情況下非常高,并且當甚至應用弱PAD方法時總是降低)。
因此,我們進行了n = 26次獨立評估。作為最終結果,給出了每個SVM和每個觀察時間的平均誤差率(見圖6、7和8)。結果顯示了一些有趣的結果。首先,如果我們允許5秒鐘的觀察(所有26次評估的NPCER=APCER=0),所有的分類器都能夠完美地區分瞳孔的奇怪和自然反應。其次,似乎我們可以將觀察時間縮短到3秒以內,因為所有的支持向量機在略超過2秒的時間范圍內表現良好。第三,三個不同的支持向量機的性能是相似的,這表明構建一個線性分類器將是一個足夠的解決方案,以獲得建議的活性特征的可接受的性能。
VII. MERITS AND LIMITATIONS: DISCUSSION
上一節顯示的結果表明,當短時間觀察眼睛時(相對于虹膜識別中幾秒鐘的典型采集時間),瞳孔動力學可能會提供有趣的活性特征。模仿瞳孔動態是困難的,隱藏自己的瞳孔反應是不可能的,因為它是不自覺的。醫學文獻還報道,在壓力下,瞳孔反應可能會改變。因此,我們甚至可以提出這樣的假設,即這是少數能夠識別脅迫下的捕獲的方法之一。
實施提議的方法可能會產生額外的積極副作用。眾所周知,虹膜識別的準確性可能會受到瞳孔不一致的影響。特別是當瞳孔放大在注冊和認證過程中顯著不同時。矛盾的是,本文提出的方法可以免費補償這種現象,特別是不引入額外的采集時間。即一旦虹膜圖像被捕獲,生物測定系統可以選擇具有不同瞳孔大小的一個(或幾個)虹膜圖像來執行生物測定識別(不需要額外的捕獲)。如果相同的系統記錄了在注冊時觀察到的瞳孔大小以及參考模板,它可以在認證階段選擇具有相似瞳孔大小的幀。如果沒有瞳孔大小數據連接到參考模板,系統可以部署呈現不同瞳孔大小的多個認證圖像,并選擇模板和認證樣本之間的最小距離。這將顯著降低虹膜比較分數分布的類內方差。
為了完成我們的結論,我們還應該分析硬幣的陰暗面。首先,動態特征的測量需要時間。并非所有應用程序在捕獲虹膜時都允許額外的兩秒鐘。第二,局限性可能來自不同人群動態特征的可變性以及老年人瞳孔大小的更細微變化。由于本研究中使用的數據庫不包含老年人的任何測量值,因此在他們的情況下,報告的誤差可能被低估。第三個限制可能是指由于攝入不同的物質(例如,藥物或酒精)、改變的心理狀態(例如,壓力、放松、困倦或精神負荷)而導致的瞳孔動態可能的不穩定。我們不知道會徹底討論這些因素對瞳孔動態的影響的科學結果,但是很容易想象它們不是不重要的。由于這項工作為沒有壓力和沒有攝入任何可以改變瞳孔反應的物質的人提供了研究結果,我們不能保證在這些異常情況下瞳孔動力學沒有改變。以免我們也忘記周圍的環境,因為起始瞳孔大小(以及反應的幅度)取決于環境光的強度。這項研究使用了施加光刺激前在黑暗中收集的數據。
總之,這種方法似乎是魯棒活性檢測的一個很好的候選方法,具有很高的實際應用潛力。記住它的局限性,人們可能會獲得PAD實現的一個有趣的元素,它對檢測靜態偽像的方法沒有提供的特性很敏感。
ACKNOWLEDGMENTS
作者要感謝Rafal Brize先生,他在本作者領導的碩士學位項目下收集了本工作中使用的虹膜圖像數據庫。作者衷心感謝華沙理工大學安杰伊·帕庫特教授對本研究做出的寶貴貢獻。Kohn和Clynes模型的應用受到Marcin Chochowski先生的研究的啟發,他在生物識別中使用該模型的參數作為個體特征。這位作者和教授Pacut和Chochowski先生,已經被授予美國專利第8,061,842號,該專利部分地涵蓋了在這項工作中采用的思想。最后但并非最不重要的是,作者衷心感謝芭芭拉·曼喬內對英語語法和單詞用法的更正。
總結
以上是生活随笔為你收集整理的Pupil dynamics for iris liveness detection 瞳孔活体检测论文翻译的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开发“抽屉新热榜”
- 下一篇: medusa 使用教程