21世纪初最有影响力的20篇计算机视觉期刊论文 及 邓亚峰老师关于人脸识别方面总结
http://www.cnblogs.com/youth0826/archive/2012/12/04/2801481.html
選取論文的原則:
(1)期刊論文,主要來源于以下期刊:TPAMI,IJCV,TIP,CVIU,IVC,MVA,PR,JMIV,IJPRAI…
(2)發表在2000年以后
(3)SCI檢索次數大于1000,來源于Web of Science數據庫,2012年12月初的檢索結果
?
Top 20 榜單如下:
[1] D. G. Lowe, “Distinctive image features from scale-invariant keypoints,”?International Journal of Computer Vision,?vol. 60, no. 2, pp. 91-110, Nov, 2004. (Cited=5663)
[2] J. B. Shi, and J. Malik, “Normalized cuts and image segmentation,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 8, pp. 888-905, Aug, 2000. (Cited=2165)
[3] T. F. Chan, and L. A. Vese, “Active contours without edges,”?IEEE Transactions on Image Processing,?vol. 10, no. 2, pp. 266-277, Feb, 2001. (Cited=2153)
[4] D. Comaniciu, and P. Meer, “Mean shift: A robust approach toward feature space analysis,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 24, no. 5, pp. 603-619, May, 2002. (Cited=1910)
[5] Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, “Image quality assessment: From error visibility to structural similarity,”?IEEE Transactions on Image Processing,vol. 13, no. 4, pp. 600-612, Apr, 2004. (Cited=1879)
[6] A. W. M. Smeulders, M. Worring, S. Santini, A. Gupta, and R. Jain, “Content-based image retrieval at the end of the early years,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 12, pp. 1349-1380, Dec, 2000. (Cited=1697)
[7] P. Viola, and M. J. Jones, “Robust real-time face detection,”?International Journal of Computer Vision,?vol. 57, no. 2, pp. 137-154, May, 2004. (Cited=1634)
[8] A. K. Jain, R. P. W. Duin, and J. C. Mao, “Statistical pattern recognition: A review,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 1, pp. 4-37, Jan, 2000. (Cited=1546)
[9] Z. Y. Zhang, “A flexible new technique for camera calibration,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 11, pp. 1330-1334, Nov, 2000. (Cited=1516)
[10] B. Zitova, and J. Flusser, “Image registration methods: a survey,”?Image and Vision Computing,?vol. 21, no. 11, pp. 977-1000, Oct, 2003. (Cited=1422)
[11] S. Belongie, J. Malik, and J. Puzicha, “Shape matching and object recognition using shape contexts,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 24, no. 4, pp. 509-522, Apr, 2002. (Cited=1321)
[12] P. J. Phillips, H. Moon, S. A. Rizvi, and P. J. Rauss, “The FERET evaluation methodology for face-recognition algorithms,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 10, pp. 1090-1104, Oct, 2000. (Cited=1298)
[13] Y. Boykov, O. Veksler, and R. Zabih, “Fast approximate energy minimization via graph cuts,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 23, no. 11, pp. 1222-1239, Nov, 2001. (Cited=1197)
[14] D. Scharstein, and R. Szeliski, “A taxonomy and evaluation of dense two-frame stereo correspondence algorithms,”?International Journal of Computer Vision,?vol. 47, no. 1-3, pp. 7-42, Apr-Jun, 2002. (Cited=1174)
[15] K. Mikolajczyk, and C. Schmid, “A performance evaluation of local descriptors,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 27, no. 10, pp. 1615-1630, Oct, 2005. (Cited=1166)
[16] D. Comaniciu, V. Ramesh, and P. Meer, “Kernel-based object tracking,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 25, no. 5, pp. 564-577, May, 2003. (Cited=1109)
[17] T. Ojala, M. Pietikainen, and T. Maenpaa, “Multiresolution gray-scale and rotation invariant texture classification with local binary patterns,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 24, no. 7, pp. 971-987, Jul, 2002. (Cited=1076)
[18] C. Stauffer, and W. E. L. Grimson, “Learning patterns of activity using real-time tracking,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 22, no. 8, pp. 747-757, Aug, 2000. (Cited=1070)
[19] M. H. Yang, D. J. Kriegman, and N. Ahuja, “Detecting faces in images: A survey,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 24, no. 1, pp. 34-58, Jan, 2002. (Cited=1032)
[20] T. F. Cootes, G. J. Edwards, and C. J. Taylor, “Active appearance models,”?IEEE Transactions on Pattern Analysis and Machine Intelligence,?vol. 23, no. 6, pp. 681-685, Jun, 2001. (Cited=989)
補充2篇TPAMI,山老師推薦的,南理工楊健老師的2DPCA和浙大何曉飛老師的LPP。
[1] J. Yang, D. Zhang, A. Frangi, and J. Yang, “Two-dimensional PCA: a new approach to appearance-based face representation and recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, no. 1, pp. 131-137, Jan, 2004. (Cited=625)
[2] X. He, S. Yan, Y. Hu, P. Niyogi, and H. Zhang, “Face recognition using Laplacianfaces,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 27, no. 3, pp. 328-340, Mar, 2005. (Cited=724)
?
簡單小結:
3篇IJCV,14篇TPAMI,2篇TIP,1篇IVC倒是有些意外,不過是綜述性質的文章,也是情理之中。
歡迎各位大牛對每篇文章進行點評。
http://blog.sina.com.cn/s/blog_6ae183910101cdq8.html
今天在微博看到一篇博客“21世紀初最有影響力的20篇計算機視覺期刊論文”,原文請見:http://www.cnblogs.com/youth0826/archive/2012/12/04/2801481.html
首先感謝博主的分享精神,博主的選取原則也很明確,如博文最開始所寫:
選取論文的原則:
(1)期刊論文,主要來源于以下期刊:TPAMI,IJCV,TIP,CVIU,IVC,MVA,PR,JMIV,IJPRAI…
(2)發表在2000年以后
(3)SCI檢索次數大于1000,來源于Web of Science數據庫,2012年12月初的檢索結果看了一下這20篇博文,總體上感覺很熟悉,很多文章確實是視覺領域2000年以來的重要工作,于是就很想聊一下自己的看法,和大家交流。
我簡單按照所屬領域劃分統計了一下,其中: ? ? ? ? 1. 與人臉檢測識別直接相關的有3篇,間接相關的1篇,直接相關的包括:7(基于adaboost的人臉檢測),19(人臉檢測的綜述),12(經典的人臉識別測試集FERET的說明),間接相關的是AAM,AAM是人臉alignment的最經典文章,但是由于其提出時并沒有現定于人臉,所以劃分為間接相關; ? ? ? ? 2. 與局部描述子直接相關的有3篇,分別是1(sift),15(local descriptor的綜述),17(LBP); ? ? ? ? 3. 與立體視覺相關的有3篇:9(攝像機標注方法),10(圖像配準綜述),14(這篇文章我不熟悉,所以這樣劃分是否合理也不是很確信); ? ? ? ? 4. 與圖像分割直接相關的有2篇,間接相關的有1篇,直接相關的包括:2(normlized cut),13(graph-cut的應用),間接相關的是4(mean-shift),mean-shfit可以應用于圖像分割,也可以應用于目標跟蹤,算是間接相關; ? ? ? ?5. 與物體檢測跟蹤(為了簡單,把檢測和跟蹤劃分到一起,其實這兩類方法在思路上差別很大,單獨劃分更合理,但是從功能角度確實很相似)直接相關的2篇,間接相關的有1篇:3(基于輪廓的物體檢測方法),16(基于kernel的tracking方法)一篇是檢測,一篇是跟蹤,而基于mean-shift的跟蹤方法是particle filter之前最經典的方法,算是間接相關; ? ? ? ?6. 與圖像檢索匹配相關的文章2篇:6(綜述),11(shape context); ? ? ? ?7. 此外還包括一篇統計模式識別的綜述(8); ? ? ? ?8. 一篇圖像質量評估的方法(5); ? ? ? ?9. 行為識別:18(一篇關于行為識別的系統的文章,用到了跟蹤、攝像機標定、行為識別等); ? ??(其中mean-shift被計算了兩次,所以和是21篇)
按照每個領域的文章數量由多到少的順序我講一下自己的觀點:
- 人臉識別領域的論文出現次數最多(這可能和我自己重點關注人臉識別領域有關),是讓我比較意外的,不過這說明從2000年開始,人臉識別方法得到了大家的重點關注,是視覺領域的一個熱點。這幾篇文章中,viola的基于adaboost+haar的人臉檢測方法是經典中的經典,其思想不僅被廣泛應用于物體檢測領域,同時,在啟發了狠多特征選擇領域的工作,同時,也幫助adaboost一躍成為和svm并列的兩大machine learning利器,我一直認為這篇文章和和lowe的sift都是視覺領域工程方面的經典之作;而AAM方法,也是十分重要的模型,尤其是對于臉部特征點定位而言,基于aam的改進工作極大促進了特征點定位的精度,其實這種全局形狀約束+局部表觀模型的思路在其他如物體檢測領域也有很多類似思路;
- 局部描述子,基本上是視覺領域表示方面十年來最大的一個亮點和趨勢。我們知道模式識別包含兩個方面的內容,一個是特征提取,用于提供更有鑒別力的表示,一個是機器學習,用來對于特征表示之后的數據上學習得到分類模型。而局部描述子已經成為特征表示的一個共識,無論是物體匹配檢索、物體檢測識別,采用多種局部描述子表示已經成為基本選擇。而這其中,sift無疑是影響最大的工作之一,其在物體匹配、物體檢索、物體檢測、物體識別等領域都有大量應用。而LBP特征,作為一種局部描述特征,是繼Gabor之后最重要的紋理描述特征(當然,sift的變種hog也是之一),其有很多變種,在人臉識別、物體檢測、目標分類領域也得到了大量應用;
- 立體視覺我不熟悉,我就不獻丑了。對于9和14兩篇文章有這么高的引用率,不知道誰能講講背后的背景?
- 圖像分割可以通過將分割問題看作是一個分組問題,然后定義一個優化目標,通過最優化這個目標來得到最優的模型參數。而graph-cut,是將每個pixel看作圖中的一個節點,將圖像分割轉化為一個圖分割問題。而graph-cut是通過最小分割和最小流來得到一個最優模型,2(normlized-cut)是為了克服graph-cut的缺點的一種改進,第2高的引用率應該說明這種方法可以應用于很多領域,包括圖像分割和聚類。
- 物體檢測跟蹤領域是一個十分活躍的領域,而3和16有這么高的引用率很出乎我的意料,因為這兩種思路在最近基本都不算是主流思路,也許是當年曾經火過一段時間吧;物體檢測識別的經典思路應該有兩種,一種是基于滑動窗口搜索的,就是viola人臉檢測文章中使用過的,后來,有基于hog+svm的行人檢測的經典論文也是相近的框架,還有一種是基于圖像全局表示的,經典的方法是基于bag of word的方法,在圖像檢測、圖像分類、圖像檢索等領域都有重要應用;而跟蹤的方法,比較經典的包括基于mean shift的方法,基于particle filter的方法,以及基于online-learning的方法,而后來的發展,也越來越將detection和tracking結合到一起,將二者結合到一個框架,其本質思想就是把tracking看作是一個區分前景目標和背景目標的分類問題,而detection提供了前景目標的off-line模型,tracking提供了on-line模型。這個領域論文很多,有一篇綜述寫得還不錯。
- 圖像檢索是當前視覺領域一個十分熱的方向,在搜索引擎、購物等領域受到很多關注;而6和11遠遠不能涵蓋這個領域的經典。11是早期物體匹配的經典方法,但是,現在用的已經很少。而這方面的最經典工作還應該是基于bag of word的工作。這個工作借鑒了文字搜索領域的工作,通過視覺詞將圖像轉化為類似文字中的文章,視覺特征用視覺詞頻表示,然后通過倒排的方式,使得大規模圖像檢索成為可能。
- ?其它的三篇文章,8作為綜述,確實沒有什么疑問。5有這么高的引用,我有點迷惑。圖像質量評估雖然在實際中十分重要,但是是個不太活躍的領域,有這么高的應用有點意外。18的工作比較早,當時能提出基于跟蹤、攝像機標定、行為識別和事件檢測這樣的框架,確實有很棒的前瞻性,可能是因為近幾年智能視頻監控應用火熱之后,做這個方向的工作多起來的原因吧。
一點建議: 1,建議將綜述排除出去,20篇論文里面有5篇綜述,雖然綜述很重要,5篇也不是很多,但是在引用次數上綜述確實會占很大便宜,建議將綜述排除出去,只對提出新方法的文章單獨排名,才能讓大家對哪些新方法的影響力最廣更了解; 2,我不知道這個排名方法是否存在瑕疵,或者是數據是否完全正確,因為我覺得從目前的結論來看,這20篇文章還不能算是最有影響力的20篇;
以上觀點如果有錯誤,請大家拍磚提醒。
鄧亞峰
總結
以上是生活随笔為你收集整理的21世纪初最有影响力的20篇计算机视觉期刊论文 及 邓亚峰老师关于人脸识别方面总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机视觉方面代码和论文
- 下一篇: 笔记:Matrix completion