第一章计算机视觉引论
一、基礎作業
機械臂視覺控制系統:光源(室內光線或專用光源)、相機(放在機械臂前端的單相機)、主機(臺式計算機或嵌入式處理器)、視覺處理系統(用C++或其他語言編寫的視覺識別算法及程序)。
2.嘗試從模仿人類視覺處理流程的角度,闡述本對課程內容組織的理解。進一步在網上搜索,找到自己認為學習過程中最值得參考的1-2本書(不要太厚)
以Marr視覺計算理論為基礎,從2維最基本的基元特征的提取開始,過度到2.5維對三維特征的粗略描述,再到三維視覺的重建,步步深入。
老師課中推薦的前兩本:谷口慶治的數字圖像處理 基礎篇、岡薩雷斯的數字圖像處理,之所以選這兩本是因為內容比較基礎,并且一本厚一本薄可以相互補充的使用。等到基礎掌握以后可以找幾本著作來看。
3.什么是光通量和輻照度?說明幾個常見光源的光通量,以及幾個常見照明環境的輻照度。
光通量(luminous flux)指人眼所能感覺到的輻射功率,它等于單位時間內某一波段的輻射能量和該波段的相對視見率的乘積。白熾燈和鹵鎢燈為12~24lm/W、熒光燈和HID燈(氣體放電燈)為50~120lm/W、LED燈目前在110lm/W左右。
輻射照度又稱輻照度,是受照面單位面積上的輻射通量,單位為瓦每平方米(W/㎡)。與太陽垂直的平面上的輻照度(太陽常數)為1535W/m2,白光 LED 光源照射的輻照度為 600W/m2)
結合顏色空間示意圖,簡述HSI顏色空間中各通道的物理意義,并結合圖像實例說明。
HSI(Hue-saturation-intensity)分別表示
色調:是指圖像的相對明暗程度。圖中點與圓錐中心連線在圓錐底面角度的投影,決定不同的色彩區別
飽和度:是指色彩的鮮艷程度,飽和度取決于該色中含色成分和消色成分的比例,圖中點與圓錐中心線的距離,越往外越鮮艷
光強:是指通過該點的平均能流密度,圖中沿著圓錐母線的點的高度,越往上越明亮。
如圖,從做到右為色調的變化,從上到下為飽和度的減小。
如圖,在HSI中,從上往下亮度越來越大。
說明彩色圖像傳感器及γ校正的基本原理。
圖像傳感器:圖像傳感器是指利用光電器件的光電轉換功能。將感光面上的光像轉換為與光像成相應比例關系的電信號。色彩傳感器分為三層,第一層收集圖像的灰度信息,第二層為彩色紅黃藍單色薄膜,其中綠色為其他顏色的兩倍,第三層為小透鏡組成,確保光線匯集到下部的刻度中心。采集以后有Bayer格式顯示色彩,即通過插值的方法分別確定每個格子的三原色數據
伽馬校正:目的:在通常的照明(既不是漆黑一片,也不是令人目眩的明亮)的情況下,人類的視覺大體有伽馬或者是冪函數的性質。如果不將圖像進行伽馬編碼,那么數據位或者帶寬的利用就會分布不均勻——會有過多的數據位或者帶寬用來表示人類根本無法察覺到的差異,而用于表示人類非常敏感的視覺感知范圍的數據位或者帶寬又會不足。
原理:針對影片或是影像系統里對于光線的亮度或是三色刺激值(三色系統中,與待測光達到顏色匹配所需的三種原色刺激的量)所進行非線性的運算或反運算.
二、進階作業
在計算機上安裝OpenCV 3.0以上版本,為后續作業準備。開發語言可采用C++或Python。
在安裝過程中遇到了網址文件下載不了的情況,仔細檢查過后發現是因為沒有用谷歌內核瀏覽器,換瀏覽器后解決
創建第一個視覺程序“Hello,world!”,顯示Lena圖片。具體效果參看課程PPT。
3. 對Lena圖像,分解得到RGB分量及HSV分量,顯示各分量,并對結果進行比較說明。
RGB分量顯示
顯示結果:
HSV分量顯示
對比:BGR顯示的三張圖分別為Red、Green、Blue的成分多少,越亮表示成分越多。越暗表示相應的成分越少。
HSV顯示的三張圖分別為Value、Hue、Saturation的成分。
由HSV分量范圍(如下圖)可知,在Hue分量中紫色值較高,黑灰白紅分布較廣,與lena原圖中分布吻合。在Value分量中,原圖中亮的部分比較明顯。在saturation分量中,色彩鮮艷的部分比較明顯,原圖中灰白色部分顯得暗淡。
總結
以上是生活随笔為你收集整理的第一章计算机视觉引论的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言程序——常见的错误集合
- 下一篇: linux中提示没有unzip命令解决方