人脸检测:MTCNN
論文:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
下載:https://arxiv.org/abs/1604.02878
代碼:https://github.com/kpzhang93/MT
人臉檢測(cè)是計(jì)算機(jī)視覺中的一個(gè)問題,即在照片中定位一張或多張人臉。
在照片中定位人臉是指在圖像中找到人臉的坐標(biāo),并通過人臉周圍的邊界框來劃分人臉的范圍。
人臉是動(dòng)態(tài)的,其外觀具有高度的可變性,使得人臉檢測(cè)成為計(jì)算機(jī)視覺中的一個(gè)難題。如檢測(cè)人臉,受其其朝向或角度、光線水平、服裝、配飾、頭發(fā)顏色、面部毛發(fā)、化妝、年齡等等影響。
人臉檢測(cè)是人臉識(shí)別系統(tǒng)中必不可少的第一步,其目的是在背景中定位和提取人臉區(qū)域。
有兩種主要的人臉識(shí)別方法:
- 基于特征的方法,使用手工過濾器來搜索和檢測(cè)人臉。可以使用OpenCV庫級(jí)聯(lián)分類器(cascade classifiers)進(jìn)行。
- 基于圖像的方法,從整體上學(xué)習(xí)如何從整個(gè)圖像中提取人臉。可以通過MTCNN庫使用多任務(wù)級(jí)聯(lián)CNN來實(shí)現(xiàn)。
MTCNN是一個(gè)深度級(jí)聯(lián)多任務(wù)框架。該框架用來解決由于各種姿勢(shì)、照明和遮擋,在不受約束的環(huán)境中進(jìn)行人臉檢測(cè)和對(duì)齊的問題。
該框架利用檢測(cè)和對(duì)齊之間的內(nèi)在相關(guān)性來提高它們的性能。框架利用級(jí)聯(lián)架構(gòu)和精心設(shè)計(jì)的深度卷積網(wǎng)絡(luò)的三個(gè)階段以粗到細(xì)的方式預(yù)測(cè)人臉和landmark位置。此外,提出了一種新的online hard sample mining策略,進(jìn)一步提高了實(shí)踐中的性能。
注:人臉對(duì)齊 face alignment:是許多人臉應(yīng)用中必要的前處理,目的是減少輸入影像的旋轉(zhuǎn)(Rotation)、平移(Translation)、縮放(Scale)變化而造成的精度損失。
參考資料:
人臉檢測(cè) MTCNN 簡(jiǎn)介
人臉?biāo)惴ㄏ盗?#xff1a;MTCNN人臉檢測(cè)詳解
MTCNN工作原理
總結(jié)
以上是生活随笔為你收集整理的人脸检测:MTCNN的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 每天学点心理学
- 下一篇: 用c 语言做课程表系统代码,[计算机]C