计算机视觉应用培训心得体会,计算机视觉专题分享总结(附PPT)
機器學習讀書會,嘉賓分享第一期圍繞計算機視覺方向,邀請中科院自動化所模式識別國家重點實驗室的趙朝陽博士與王宇航博士,圍繞計算機視覺中的核心問題,目標檢測以及圖像語義分割問題開展分享。
目標檢測主題分享
目標檢測任務作為計算機視覺領域中的基本問題之一,有著廣泛的研究基礎。近年來,隨著深度學習技術的快速普及,目標檢測任務有了長足的發展,并在智能化交通、監控、軍事、醫療等多個領域有著廣泛的應用。
報告首先對目標檢測任務的經典處理流程進行回顧,從候選框獲取,到特征提取,再到目標分類,后處理。接下來,報告對特征提取以及目標分類的相關經典工作進行了系統介紹。特征提取方法從哈爾特征到梯度直方圖特征,再到積分圖特征,特征表述能力不斷增強,識別性能取得不斷進步。而目標檢測領域分類器多采用adaboost框架,為進一步加速檢測速度,級聯方法得到了廣泛應用。
傳統方法在人臉檢測,行人檢測等方面取得了較好的性能,但是受限于傳統特征的表述能力的局限性,傳統檢測方法在通用目標檢測領域性能一直不理想。近些年來,深度學習方法,尤其是卷積神經網絡,在圖像分類,目標檢測等方向得到了廣泛應用,相比于傳統方法,深度學習方法可以獲得更有判別力的特征表示。基于深度學習的目標檢測方法性能得到明顯提升。報告對深度學習方法在目標檢測領域的發展歷程做了清晰的梳理,包括 RCNN, Fast RCNN,Faster RCNN的發展歷程及不同模型解決的問題。 報告同時對YOLO以及SSD方法做了詳細介紹,并對不同方法的特點進行了詳細對比。
報告最后,介紹了嘉賓參加BOT大賽歷程,BOT大賽的視覺任務非常具有挑戰性,賽題數據具有很強的多樣性,數據中包含非實體動物圖片,如素描,卡通形象,布偶等,目標具有很強的形變,部分目標只具有局部信息,同時具有人為偽造的照片,類內差異性大。報告給出了參賽的最優解決方案,該方案取得了決賽第一名的優異成績,并榮獲最佳算法獎。
圖像語義分割主題分享
圖像語義分割作為一種像素級的圖像識別任務,正獲得越來越廣泛的關注。圖像語義分割在網絡多媒體、智能醫療、自動駕駛等多個領域有著廣泛的應用前景。
報告首先對語義分割的基本概念進行介紹,語義分割根據監督信息的不同可以分為,全監督方法,弱監督方法以及半監督方法。本報告集中在全監督語義分割方法。報告指出,全監督語義分割方法本質是像素級分類問題,而基于深度學習的圖像語義分割方法是將圖像分類方法延伸到像素級分類問題,報告深入地探討了為什么像素級分類可以實現,盡管層級特征具有較大的感受野,但是依舊攜帶了足夠多的局部像素點信息,從而可以完成像素級分類。
報告對語義分割典型工作FCN方法做了詳細介紹,并從以下幾個方面指明了優化方向,包括調整網絡感受野,多尺度融合,更好的上采樣方法以及后處理,融合更多的上下文信息。
為了獲得更好的語義分割效果,報告嘉賓提出了輕量級反卷積網絡方法Light-DCNN。Light-DCNN采用了更合理的參數初始化方案,去掉全連接層,更好地利用空間位置信息,并且采用了更加精細的上采樣方法,該方法在受限數據集上取得了PASCAL VOC 2012最優性能,并且模型更容易收斂,模型更小。隨后嘉賓介紹了最新優化方案,基于堆疊的層級語義分割方法,該方法在PASCAL VOC 2012任務上取得了第一名的優異成績。
最后嘉賓指出了語義分割的近期研究熱點,Instance Segmentation, 并對最新研究成果進行了詳細介紹。
活動組織及文章出處:機器學習讀書會 (微信公眾號:machinelearning)
嘉賓分享ppt鏈接(或點擊閱讀原文): https://pan.baidu.com/s/1mi2vKVI
總結
以上是生活随笔為你收集整理的计算机视觉应用培训心得体会,计算机视觉专题分享总结(附PPT)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 调用bat失败_死机、卡顿
- 下一篇: 因子动量与动量因子