【杂谈】一本书同时学分类,检测,分割,三维重建,GAN,难道它不香吗?文末送两本
如果你想快速系統地串聯計算機視覺領域的知識,人臉圖像應該是最佳選擇,其相關研究覆蓋底層圖像特征,目標檢測與跟蹤,圖像分類和檢索,圖像濾波,圖像分割,三維重建,風格遷移等方向,并且能夠做到相互融合從而進行工業界落地。如果你還不知道人臉圖像能做什么,不如看一看上面的1分鐘視頻,然后我們接下來細看到底都有些什么。
底層圖像特征
或許很多經典的底層圖像特征已經PK不過現在的深度學習模型學習到的特征,但是思想是永恒的,在人臉這個領域,有一些特征理解起來非常直觀。
特征通??梢苑譃轭伾卣?、紋理特征、形狀特征,下面我們看看在人臉方向有哪些很經典的東西。
第一個是膚色高斯模型,它是顏色特征。盡管人有白、黃、黑三種膚色,但研究證明,膚色在某些顏色空間上的差異性主要體現在亮度上,在色度上具有較好的聚類表現。因此根據膚色屬性所具有的規律和分布情況對膚色建模,便可以將膚色與非膚色區域區分開。膚色高斯模型在早期可以常用人臉檢測,現在也常用于輔助一些模型進行人臉區域的快速定位。
第二個是haar特征,它是紋理特征。臉部有一些固有的屬性,比如眼睛要比臉頰顏色要深,鼻梁兩側比鼻梁顏色要深,嘴巴比周圍顏色要深等。Haar特征通過對相鄰圖像塊進行灰度比較,并使用積分圖像進行快速計算,在大名鼎鼎的V-J算法中被使用。如果研究過OpenCV人臉檢測算法的,不可能不知道。
第三個是形狀特征,基于人臉特征關鍵點就可以計算出一系列的形狀特征,因為人臉關鍵點是眉毛、眼睛、鼻子、嘴巴、臉部等有語義的特征點,每個人臉都通用卻有獨特性,對于光照姿態等有很強的不變性。
目標檢測與跟蹤
目標檢測可以說是計算機視覺方向中從業者最多的了,不然也不會出現千篇一律的簡歷中寫著跑過Yolo算法,人臉檢測就是目標檢測的一個子領域。
盡管通用的目標檢測算法可以用于人臉檢測,但是人臉檢測依然有它的特點,比如早期的時候一些方法會挨個檢測人臉的各個部位,然后組合成最終人臉。以MTCNN為代表的框架會把人臉檢測和關鍵點檢測問題進行聯合處理。
而如今,在目標檢測領域中的一些難題在人臉檢測領域同樣廣泛存在,比如大姿態人臉、遮擋人臉、模糊小臉,甚至是偽造人臉,搞明白了人臉檢測,目標檢測還會是問題嗎?
另一方面,工業界應用的時候不僅要做檢測,還需要做跟蹤平滑,此時常常需要應用卡爾曼濾波等傳統算法,而不僅僅是一個模型就能搞定,更復雜完整的項目,才能更好地鍛煉能力。
圖像分類和檢索
沒有人不知道圖像分類問題,而為我們所熟悉的人臉識別系統,其中一條典型的技術路線就是圖像分類+驗證+檢索模型的組合。
以上圖DeepFace為例,它首先對輸入人臉經過3D對齊,然后使用數據集訓練一個人臉分類器得到人臉特征提取網絡,最后使用Siamese網絡訓練人臉驗證網絡。這樣一來,就解決了人臉特征的問題,即將高維的人臉表達成了一個低維的特征,接下來就是進行人臉的聚類與檢索。
如今人臉識別系統雖然已經大規模商業化,但并不意味著這里面就沒有事情可以做了。遮擋人臉識別,跨姿態人臉識別,跨年齡人臉識別,妝造不變人臉識別,光照不變人臉識別,少樣本人臉識別,3D人臉識別,視頻人臉識別等都是現實存在的難題。
解決上面這些問題,不僅需要新的技術,也需要對分類檢索等老技術的改進。
圖像濾波
圖像濾波是一類很底層的圖像處理方法,在圖像降噪,圖像去模糊,圖像修復等底層圖像處理領域中是核心技術。那么在人臉圖像中,又用在了哪里呢?大家或許不知道技術,但是不可能沒有接觸過,那就是人像美顏,熟的不能在熟的磨皮美白大法。
其中常見的方法包括均值濾波,雙邊濾波,引導濾波,以及針對這些方法的改進。掌握了核心技術,從人臉美顏遷移到其他的圖像增強領域,就很自然了。
三維重建
三維重建即3D Reconstruction,在計算機視覺中,三維重建是指根據單視圖或者多視圖的圖像重建三維信息的過程,通常需要從二維的圖像投影恢復出物體的三維形狀和紋理信息,這是接下來計算機視覺會取得突破的重點領域,而人臉的三維重建問題,實在是太典型了。
從基于單張圖的3DMM等人臉通用模型與Shape from Shading(SfS)等優化方法,到基于多張圖的立體視覺,基于視頻的Structure from Motion(SfM),端到端的與端到端的模型,傳統的與深度學習方法,這個領域涉及的算法非常多,而且難度較高。
另外,如何逼真地重建出人臉的細節信息,如何在二維的人臉被遮擋后還能進行重建,都是當前人臉重建領域要解決的難題,研究起來有足夠的技術深度,一旦攻克也有大量商用場景。
另外3D與圖形學有非常緊密的聯系,使得這些技術在內容創作上有非常大的商業價值,難道你不想加入其中嗎?
圖像編輯與風格化
隨著生成對抗網絡等技術的發展,當前圖像編輯與風格化正在成為計算機視覺領域的新熱點,其中尤其是人臉圖像落地能力最強,在人機交互,娛樂社交,內容創作等領域應用非常廣泛。
從人臉年齡編輯、人臉卡通頭像生成、換臉等全局性質的編輯,到人臉表情編輯,人臉發型,人臉化妝去妝等局部性質等編輯,幾乎覆蓋了圖像編輯與風格化的所有關鍵技術。當前交互式,可控的編輯模型也是研究重點。
怎么規劃學習路線
上面說了這么多,無非就是想告訴大家,作為打算長期在計算機視覺有所建樹的同學,人臉圖像是非常值得研究的,也是不可能繞過的,那么如何長期學習相關知識呢?下面介紹我們的兩個內容。
(1) 2020年7月,有三的新書《深度學習之人臉圖像處理:核心算法與案例實踐》在機械工業出版社出版,這是一本講述在人臉各個方向中的深度學習算法的書籍,同時配套有大量實戰案例。
言有三新書來襲,業界首次深入全面講解深度學習人臉圖像算法
書中各章節內容如下:
第1章 人臉圖像和特征基礎
第2章 深度學習基礎?
第3章 人臉數據集
第4章 人臉檢測
第5章 人臉關鍵點檢測
第6章 人臉識別
第7章 人臉屬性識別
第8章 人臉屬性分割
第9章 人臉美顏和美妝
第10章 人臉三維重建
第11章 人臉屬性編輯
這是市面上唯一一本將人臉各領域這幾年的核心算法講清楚的書,而且在可預見的幾年內都可能如此。
(2) 有三AI秋季劃人臉算法組和GAN組,這是集教材,圖文代碼實踐,視頻課程和直播,知識星球社區,線上微信群,線下活動為一體的終身有效學習小組,詳細可以閱讀以下文章。
【通知】如何讓你的2020年秋招CV項目經歷更加硬核,可深入學習有三秋季劃4大領域32個方向
福利
國慶長假剛剛結束,是時候收收心學習了,給大家贈送本書兩本,留言點贊高者可得,2020年10月9日(今晚)22:00揭曉。
另外如果你想購買簽名版留作紀念,可以到有三的小店,簽名版示意圖和小店二維碼如下:
最后總結一句,人臉圖像算法領域,技術成熟,又有許多需要長期研究的內容,學習它,難道不香嗎?
往期相關
【技術綜述】基于3DMM的三維人臉重建技術總結
【技術綜述】人臉妝造遷移核心技術總結
【技術綜述】人臉風格化核心技術與數據集總結
【總結】最全1.5萬字長文解讀7大方向人臉數據集v2.0版,搞計算機視覺怎能不懂人臉
【技術綜述】人臉年齡估計研究現狀
【技術綜述】人臉表情識別研究
【技術綜述】人臉顏值研究綜述
【技術綜述】人臉臉型分類研究現狀
總結
以上是生活随笔為你收集整理的【杂谈】一本书同时学分类,检测,分割,三维重建,GAN,难道它不香吗?文末送两本的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【杂谈】新手如何掌握深度学习模型?赠书2
- 下一篇: 【直播回放】新手如何入门并学习计算机视觉