01计算机视觉引论
博客已遷移至自建網站,此博客已廢棄
請移步至:https://blog.ours1984.top
歡迎大家訪問。
計算機視覺概念
類比人類視覺處理流程,計算機視覺研究這些
- 圖像采集模擬人類眼睛對畫面的感知;
- 圖像預處理模擬視網膜對畫面的采集和處理;
- 特征提取、邊緣檢測、圖像分割模擬人類對畫面中物體的認識;
- 位置估計、運動估計、相機標定模擬人類對畫面中物體行為的理解;
- 三維視覺則模擬人類對整個畫面的內在聯系的理解
推薦書籍
- 數字圖像處理:岡薩雷斯著,阮秋琦譯,《數字圖像處理》
- 計算機視覺:R. Szeliski著,艾海舟等譯,《計算機視覺——算法與應用》
- 機器視覺:C. Steger著,楊少榮等譯,《機器視覺算法與應用》
視覺技術發展史
-
起源: 20世紀50年代統計模式識別,二維圖像分析。
-
誕生:1974 Minsky ->David Marr 暑期,1981 人工智能“計算機視覺”專輯。計算機視覺的早期圖像表示模型是 Part-based,這樣就可以通過 Part 這種組合式的方法表示物體。但很多自然場景的物體沒有這么強的結構
-
發展:80年代以后,(1) 隨著計算能力的迅速增長,視覺計算成本極大降低(2) 以Marr理論為基礎的視覺理論廣泛研究。視覺技術得到迅速發展,并在視頻監控、工業分析等領域得到廣泛應用,特征檢測和機器學習同時也開始組合應用,但對物體結構有嚴格限制(指定對象類型)
-
2000 - 2012 年,局部特征描述得到迅速發展,如SIFT/HOG。特征描述具有通用性,結合SVM等機器學習方法。但效果有限。2006年,Hinton提出深度學習;2010年,微軟使用深度學習在語音方面取得突破進展
-
從2012年后,深度學習方法興起。特征->自動提取;層數->很深
-
2015年后,深度學習在視覺各應用領域取得突破
- 2015年,在ImageNet上的識別準確率首次超越人類
- 2016年,Tesla創造了56億公里的自動駕駛路測數據
- 2017年,iPhone X宣布引入Face ID高精度人臉識別技術
- 2018年,OpenAI 2:1戰勝人類DOTA2高手隊
Marr視覺計算理論
- 目的:通過視覺系統,重建三維物體的形狀和位置
- 2維:過零點(zero-crossing)、短線段、端元等基本特征
- 2.5維:對物體形狀的一些粗略描述
- 3維:對物體的三維描述
計算機視覺系統構成
照明設備:光源
-
通過適當的光源照明設計,使圖像中的目標信息與背景信息得到最佳分離,可以大大降低圖像處理算法分割、識別的難度,同時提高系統的定位、測量精度,使系統的可靠性和綜合性能得到提高。
-
如果光源設計不當,會導致在圖像處理算法設計和成像系統設計中事倍功半。因此,光源及光學系統設計的成敗是決定系統成敗的首要因素
-
常見光源包括室內光線,日光,路燈,補光燈,紅外,可見光,補光LED(白光,紅外)等
-
在機器視覺系統中,光源的作用至少有以下幾種作用
- 照亮目標,提高目標亮度;
- 形成最有利于圖像處理的成像效果;
- 克服環境光干擾,保證圖像的穩定性;
- 用作測量的工具或參照;
成像設備:相機
機器視覺相機的目的是將通過鏡頭投影到傳感器的圖像傳送到能夠儲存、分析和(或者)顯示的機器設備上
- 按照芯片類型可以分為CCD相機、CMOS相機;
- 按照傳感器的結構特性可以分為線陣相機、面陣相機;
- 按照掃描方式可以分為隔行掃描相機、逐行掃描相機;
- 按照分辨率大小可以分為普通分辨率相機、高分辨率相機;
- 按照輸出信號方式可以分為模擬相機、數字相機;按照輸出色彩可以分為單色(黑白)相機、彩色相機;
- 按照輸出信號速度可以分為普通速度相機、高速相機;
- 按照響應頻率范圍可以分為可見光(普通)相機、紅外相機、紫外相機等。
處理設備:主機
人工智能主要的處理器分為:CPU、GPU、FPGA、ASIC等。隨著這幾年人工智能技術的發展,各大廠家都在大力研發人工智能處理器,由于GPU非常適合機器學習算法的計算,目前各大廠商都推出性能強悍的GPU處理器,甚至推出人工智能專用芯片,以適應人工智能計算的高性能要求。
算法軟件:視覺處理系統
使用C++或其它語言編寫的視覺識別算法及程序,運行在SoC/VxWorks/后端主機上
- 學習的方式分類:監督式學習、非監督式學習、半監督式學習和強化學習。
- 算法的功能和形式的類似性分類:回歸算法、基于實例的算法、正則化方法、決策樹學習、貝葉斯方法、基于核的算法、聚類算法、關聯規則學習、人工神經網絡、深度學習、降低維度算法、集成算法。
- 其中,計算機視覺常用的算法有:半監督式學習、人工神經網絡、深度學習等。
總結
- 上一篇: 六年级计算机教学进度计划,六年级下册信息
- 下一篇: c语言程序的框架以及内容