模式识别:绪论
模式識別(pattern recognition):輸入原始數據并根據其類別采取相應行為的能力。
具體實例:人臉識別、語音識別、文字識別、指紋識別、DNA序列分析。
要區分不同類別的個體,需要利用其一些物理特性上的差異,成為模式分類的特征。仔細選擇特征十分必要。
如果要區分的類別缺失存在某種差異,我們稱之為具有不同的模型(model)–即可以用數學形式描述特征。獲得一個好的模式表達,是幾乎所有的模式識別系統的一個中心任務。在一些情況下,模式常被表達為實數向量的形式,而另外的情況,可能以有序的屬性列表方式來表達。如何構造或學習一個恰當的表達,以及如何定量刻畫“接近”和“遠離”的能力(能夠產生同樣行為的模式樣本之間的距離盡可能接近,而將導致不同行為的模式樣本之間距離盡量遠離)將決定一個分類器的成敗。我們十分傾向于運用比較少的特征,因為這會導致(a)更簡單的分類區域,(b)更易訓練的分類器。此外特征還應對噪聲或其他干擾不敏感。在實際應用中,我們希望分類器能夠快速響應,只需很少的電子部件、內存容量或處理步驟。
有時候單一的特征不足以完美分類,需要引入特征向量x,其中x處于d維歐幾里得空間Rd,稱為特征空間。除此之外,還有類別集,行為集,風險函數(描述類別狀態為w時采取行動a的風險)。
模式分類作為決策理論最重要的子領域,其中心任務是使分類的“總體代價”函數最小。
模式識別系統需要嵌入特定問題領域的背景知識。
模式識別系統
3種基本操作:預處理、特征提取、分類。其模塊圖如下:
設計模式識別系統包含如下一個設計循環:
總結
- 上一篇: OpenCV与图像处理学习九——连通区域
- 下一篇: C++四种类型转换