人工智能 | 人脸识别研究报告(概念篇)
博主github:https://github.com/MichaelBeechan
博主CSDN:https://blog.csdn.net/u011344545
============================================
概念篇:https://blog.csdn.net/u011344545/article/details/89737370
技術篇:https://blog.csdn.net/u011344545/article/details/89737573
人才篇:https://blog.csdn.net/u011344545/article/details/89883884
應用篇:
下載鏈接:https://download.csdn.net/download/u011344545/11147085
============================================
清華AMiner團隊 AMiner.org
摘要
自20世紀下半葉,計算機視覺技術逐漸地發展壯大。同時,伴隨著數字圖像相關的軟硬
件技術在人們生活中的廣泛使用,數字圖像已經成為當代社會信息來源的重要構成因素,各種圖像處理與分析的需求和應用也不斷促使該技術的革新。
人臉識別概述:人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。報告首先介紹了人臉識別區別于其他生物特征識別方法的五項優勢,包括非侵擾性、便捷性、友好性、非接觸性、可擴展性等;其次我們對人臉識別技術的發展歷程進行梳理;接下來,報告介紹了當代中國政府對人臉識別技術發展的相關政策支持,這是人臉識別技術在我國得以蓬勃發展的有利宏觀背景;第四,通過對遺忘人臉識別領域論文的挖掘,我們總結出人臉識別領域的研究熱點;最后,我們介紹了與人臉識別相關的國際著名會議,以幫助讀者更好獲取人臉識別熱點渠道。
1、概念
人類視覺系統的獨特魅力驅使著研究者們試圖通過視覺傳感器和計算機軟硬件模擬出人類對三維世界圖像的采集、處理、分析和學習能力,以便使計算機和機器人系統具有智能化的視覺功能。在過去 30 年間,眾多不同領域的科學家們不斷地嘗試從多個角度去了解生物視覺和神經系統的奧秘,以便借助其研究成果造福人類。自 20 世紀下半葉,計算機視覺技術就在此背景下逐漸地發展壯大。同時,伴隨著數字圖像相關的軟硬件技術在人們生活中的廣泛使用,數字圖像已經成為當代社會信息來源的重要構成因素,各種圖像處理與分析的需求和應用也不斷促使該技術的革新。
計算機視覺技術的應用十分廣泛。數字圖像檢索管理、醫學影像分析、智能安檢、人機交互等領域都有計算機視覺技術的涉足。該技術是人工智能技術的重要組成部分,也是當今計算機科學研究的前沿領域。經過近年的不斷發展,已逐步形成一套以數字信號處理技術。計算機圖形圖像、信息論和語義學相互結合的綜合性技術,并具有較強的邊緣性和學科交叉性。其中,人臉檢測與識別當前圖像處理、模式識別和計算機視覺內的一個熱門研究課題,也是目前生物特征識別中最受人們關注的一個分支。
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。通常采用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉。根據中國報告網發布《2018 年中國生物識別市場分析報告-行業深度分析與發展前景預測》中內容,2017年生物識別技術全球市場規模上升到了 172 億美元,到 2020 年,預計全世界的生物識別市場規模有可能達到 240 億美元。自 2015 年到 2020 年,人臉識別市場規模增長了 166.6%,在眾多生物識別技術中增幅居于首位,預計到 2020 年人臉識別技術市場規模將上升至 24 億美元。
在不同的生物特征識別方法中,人臉識別有其自身特殊的優勢,因而在生物識別中有著重要的地位。
(1) 非侵擾性
人臉識別無需干擾人們的正常行為就能較好地達到識別效果,無需擔心被識別者是否愿意將手放在指紋采集設備上,他們的眼睛是否能夠對準虹膜掃描裝置等等。只要在攝像機前自然地停留片刻,用戶的身份就會被正確識別。
(2) 便捷性
采集設備簡單,使用快捷。一般來說,常見的攝像頭就可以用來進行人臉圖像的采集,不需特別復雜的專用設備。圖像采集在數秒內即可完成。
(3) 友好性
通過人臉識別身份的方法與人類的習慣一致,人和機器都可以使用人臉圖片進行識別。而指紋,虹膜等方法沒有這個特點,一個沒有經過特殊訓練的人,無法利用指紋和虹膜圖像對其他人進行身份識別。
(4) 非 接觸性
人臉圖像信息的采集不同于指紋信息的采集,利用指紋采集信息需要用手指接觸到采集設備,既不衛生,也容易引起使用者的反感,而人臉圖像采集,用戶不需要與設備直接接觸。
(5) 可擴展性
在人臉識別后,下一步數據的處理和應用,決定著人臉識別設備的實際應用,如應用在出入門禁控制、人臉圖片搜索、上下班刷卡、恐怖分子識別等各個領域,可擴展性強。
正是因為人臉識別擁有這些良好的特性,使其具有非常廣泛的應用前景,也正引起學術界和商業界越來越多的關注。人臉識別已經廣泛應用于身份識別、活體檢測、唇語識別、創意相機、人臉美化、社交平臺等場景中。
早在 20 世紀 50 年代,認知科學家就已著手對人臉識別展開研究。20 世紀 60 年代,人臉識別工程化應用研究正式開啟。當時的方法主要利用了人臉的幾何結構,通過分析人臉器官特征點及其之間的拓撲關系進行辨識。這種方法簡單直觀,但是一旦人臉姿態、表情發生變化,精度則嚴重下降。
2、人臉識別的發展史
20 世紀 90 年代
1991 年,著名的“特征臉”(Eigenface)方法第一次將主成分分析和統計特征技術引入人臉識別,在實用效果上取得了長足的進步。這一思路也在后續研究中得到進一步發揚光大,例如,Belhumer 成功將 Fisher 判別準則應用于人臉分類,提出了基于線性判別分析的Fisherface 方法。
2000–2012 年
21 世紀的前十年,隨著機器學習理論的發展,學者們相繼探索出了基于遺傳算法、支持向量機(Support Vector Machine,SVM)、boosting、流形學習以及核方法等進行人臉識別。2009 年至 2012 年,稀疏表達(Sparse Representation)因為其優美的理論和對遮擋因素的魯棒性成為當時的研究熱點。與此同時,業界也基本達成共識:基于人工精心設計的局部描述子進行特征提取和子空間方法進行特征選擇能夠取得最好的識別效果。
Gabor 及 LBP 特征描述子是迄今為止在人臉識別領域最為成功的兩種人工設計局部描述子。這期間,對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點,比如人臉光照歸一化、人臉姿態校正、人臉超分辨以及遮擋處理等。也是在這一階段,研究者的關注點開始從受限場景下的人臉識別轉移到非受限環境下的人臉識別。LFW 人臉識別公開競賽(LFW 是由美國馬薩諸塞大學發布并維護的公開人臉數集,測試數據規模為萬)在此背景下開始流行,當時最好的識別系統盡管在受限的 FRGC 測試集上能取得 99%以上的識別精度,但是在 LFW 上的最高精度僅僅在 80%左右,距離實用看起來距離頗遠。
2013 年
2013 年,微軟亞洲研究院的研究者首度嘗試了 10 萬規模的大訓練數據,并基于高維LBP 特征和 Joint Bayesian 方法在 LFW 上獲得了 95.17%的精度。這一結果表明:大訓練數據集對于有效提升非受限環境下的人臉識別很重要。然而,以上所有這些經典方法,都難以處理大規模數據集的訓練場景。
2014 年
2014 年前后,隨著大數據和深度學習的發展,神經網絡重受矚目,并在圖像分類、手寫體識別、語音識別等應用中獲得了遠超經典方法的結果。香港中文大學的 Sun Yi 等人提出將卷積神經網絡應用到人臉識別上,采用 20 萬訓練數據,在 LFW 上第一次得到超過人類水平的識別精度,這是人臉識別發展歷史上的一座里程碑。
自此之后,研究者們不斷改進網絡結構,同時擴大訓練樣本規模,將 LFW 上的識別精度推到 99.5%以上。人臉識別發展過程中一些經典的方法及其在 LFW 上的精度,都有一個
基本的趨勢:訓練數據規模越來越大,識別精度越來越高。
3、發展熱點
研究通過對以往人臉識別領域論文的挖掘,總結出人臉識別領域的研究關鍵詞主要集中在人臉識別、特征提取、稀疏表示、圖像分類、神經網絡、目標檢測、人臉圖像、人臉檢測、圖像表示、計算機視覺、姿態估計、人臉確認等領域。
圖 2 是對人臉識別研究趨勢的分析,旨在基于歷史的科研成果數據的基礎上,對技術來源、熱度甚至發展趨勢進行研究。圖 2 中,每個彩色分支代表一個關鍵詞領域,其寬度表示該關鍵詞的研究熱度,各關鍵詞在每一年份的位置是按照這一時間上所有關鍵詞的熱度高度進行排序。起初,Computer Vision(計算機視覺)是研究的熱點,在 20 世紀末期,FeatureExtraction(特征提取)超越 CV,成為研究的新熱點,其后在 21 世紀初期被 Face Recognition超過,至今一直處在第二的位置上。
此外,研究根據最近兩年發表于 FG(International Conference on Automatic Face and Gesture Recognition)的論文中提取出來的關鍵詞發現,Face Recognition 出現頻率最高,為118 次,Object Detection 排在第二位,為 41 次,Image Classification 和 Object Recognition 以36 次并列第三,出現次數超過十次的詞匯還有 Image Segmentation(32)、Action Recognition(32)、Sparse Representation(28)、Image Retrieval(27)、Visual Tracking(24)、Single Image(23)。詞云圖如下所示:
4、相關會議
計算機視覺(CV)界三大頂級國際會議
ICCV :IEEE International Conference on Computer Vision
該會議由美國電氣和電子工程師學會(IEEE,Institute of Electrical & Electronic Engineers)主辦,主要在歐洲、亞洲、美洲的一些科研實力較強的國家舉行。作為世界頂級的學術會議,首屆國際計算機視覺大會于 1987 年在倫敦揭幕,其后兩年舉辦一屆。ICCV 是計算機視覺領域最高級別的會議,會議的論文集代表了計算機視覺領域最新的發展方向和水平。論文接受率在 20%左右。方向為計算機視覺、模式識別、多媒體計算等。
近年來,全球學界愈來愈關注中國人在計算機視覺領域所取得的科研成就,這是因為由中國人主導的相關研究已取得了長足的進步——2007 年大會共收到論文 1200 余篇,而獲選論文僅為 244 篇,其中來自中國大陸,香港及臺灣的論文有超過 30 篇,超過大會獲選論文總數的 12%。作為最早投入深度學習技術研發的華人團隊,在多年布局的關鍵技術基礎之上,香港中文大學教授湯曉鷗率領的團隊迅速取得技術突破。2012 年國際計算視覺與模式識別會議(CVPR)上僅有的兩篇深度學習文章均出自湯曉鷗實驗室,而在 2013 年國際計算機視覺大會(ICCV)上全球學者共發表的 8 篇深度學習領域的文章中,有 6 篇出自湯曉鷗實驗室。
CVPR :IEEE Conference on Computer Vision and Pattern Recognition
該會議是由 IEEE 舉辦的計算機視覺和模式識別領域的頂級會議。每年召開一次,錄取率在 25%左右。方向為計算機視覺、模式識別、多媒體計算等。
香港中文大學教授湯曉鷗率領的團隊在全球范圍內做出了大量深度學習原創技術突破:2012 年國際計算視覺與模式識別會議(CVPR)上僅有的兩篇深度學習文章均出自其實驗室;2011—2013 年間在計算機視覺領域兩大頂級會議 ICCV 和 CVPR 上發表了 14 篇深度學習論文,占據全世界在這兩個會議上深度學習論文總數(29 篇)的近一半。他在 2009 年獲得計算機視覺領域兩大最頂尖的國際學術會議之一 CVPR 最佳論文獎,這是 CVPR 歷史上來自亞洲的論文首次獲獎。
ECCV :European Conference on Computer Vision
ECCV 是一個歐洲的會議,每次會議在全球范圍錄用論文 300 篇左右,主要的錄用論文都來自美國、歐洲等頂尖實驗室及研究所,中國大陸的論文數量一般在 10-20 篇之間。ECCV2010 的論文錄取率為 27%。兩年召開一次,論文接受率在 20%左右。方向為計算機視覺、模式識別、多媒體計算等。2018 年的 ECCV 于 2018 年 9 月 8 日-14 日在德國慕尼黑舉辦。
亞洲計算機視覺會議
ACCV :Asian Conference on Computer Vision
ACCV 即亞洲計算機視覺會議,是 AFCV(Asian Federation of Computer Vision,亞洲計算機視覺聯盟)自 1993 年以來官方組織的兩年一度的會議,旨在為研究者、開發者和參與者提供一個良好的平臺來展示和討論計算機視覺領域和相關領域的新問題、新方案和新技術。2018 年第 14 屆亞洲計算機視覺會議將于 2018 年 12 月 4 日-6 日在澳大利亞舉辦。
人臉和手勢識別專門的會議
FG :IEEE International Conference on Automatic Face and Gesture Recognition
“International Conference on Automatic Face and Gesture Recognition”是全球范圍內人臉與手勢識別領域的權威學術會議。會議方向有人臉檢測、人臉識別、表情識別、姿勢分析、心理行為分析等。
總結
以上是生活随笔為你收集整理的人工智能 | 人脸识别研究报告(概念篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人工智能 | 自然语言处理(NLP)(国
- 下一篇: 计算机视觉与深度学习 | 视觉里程计综述